3500个常用汉字,可以作为爬虫的数据。 汉字(拼音:hàn zì,注音符号:ㄏㄢˋ ㄗˋ),又称中文、中国字,别称方块字,是汉语的记录符号,属于表意文字的词素音节文字。世界上最古老的文字之一,已有六千多年的历史。在形体上逐渐由图形变为笔画,象形变为象征,复杂变为简单;在造字原则上从表形、表意到形声。除极个别汉字外(如瓩、兛、兣、呎、嗧等),都是一个汉字一个音节 [1] 。 现代汉字是指楷化后的汉字正楷字形,包括繁体字和简化字。现代汉字即从甲骨文、金文、大篆(籀文)、小篆,至隶书、草书、楷书、行书等演变而来。汉字为汉民族先民发明创制并作改进,是维系汉族各方言区不可或缺的纽带。现存最早的汉字是约公元前1300年殷商的甲骨文和稍后的金文 [1] ,西周时演变成籀文 [2] ,再到秦朝的小篆 [3] 和隶书,至汉魏隶书盛行,到了汉末隶书楷化为正楷。楷书盛行于魏晋南北朝,通行 [4] 。 汉字是迄今为止持续使用时间最长的文字,也是上古时期各大文字体系中唯一传承者,中国历代皆以汉字为主要的官方文字。
2022-08-06 09:07:24 25KB 数据
1
HZK16字库是符合GB2312国家标准的16×16点阵字库,HZK16的GB2312-80支持的汉字有6763个,符号682个。其中一级汉字有 3755个,按声序排列,二级汉字有3008个,按偏旁部首排列。 HZK16字库里的16×16汉字一共需要256个点来显示,即使用32个字节显示一个普通汉字。 一个GB2312汉字是由两个字节编码的,范围为0xA1A1~0xFEFE。A1-A9为符号区,B0-F7为汉字区。每一个区有94个字符(注意:这只是编码的许可范围,不一定都有字型对应,比如符号区就有很多编码空白区域) 一个汉字占两个字节,这两个中前一个字节为该汉字的区号,后一个字节为该字的位号。其中,每个区记录94个汉字,位号为该字在该区中的位置。所以要找到「我」在hzk16库中的位置就必须得到它的区码和位码。 区码:汉字的第一个字节-0xA0,因为汉字编码是从0xA0区开始的,所以文件最前面就是从0xA0区开始,要算出相对区码 位码:汉字的第二个字节-0xA0 这样我们就可以得到汉字在HZK16中的绝对偏移位置:offset = (94*(区码-1)+(位码-1))*32
2022-08-06 09:01:18 137KB 字库
1
SQL_SERVER常用sql语句集锦SQL_SERVER常用sql语句集锦SQL_SERVER常用sql语句集锦SQL_SERVER常用sql语句集锦SQL_SERVER常用sql语句集锦SQL_SERVER常用sql语句集锦SQL_SERVER常用sql语句集锦SQL_SERVER常用sql语句集锦SQL_SERVER常用sql语句集锦SQL_SERVER常用sql语句集锦SQL_SERVER常用sql语句集锦
2022-08-05 21:04:27 85KB SQL_SERVER常用sql语句集锦
1
语言:C++
2022-08-05 18:05:51 153.44MB qt
1
1、常用的Git命令 2、对象库操作相关命令 3、引用操作相关命令 4、版本库管理相关命令
2022-08-05 18:00:58 321KB git
1
所有符号+常用3500汉字字符。用于生成字体贴图. 例如,textmeshpro等可使用此文档生成字库
2022-08-05 09:24:40 18KB 3500汉字 textmesh 汉字 字体贴图
1
一、 Git 命令初识 二、 Git 常用命令 三、 Git 命令详解
2022-08-04 18:00:18 734KB git
1
1. .* 2. .* 3. .+
2022-08-04 17:00:58 393KB python scrapy
1
1.1API概述【理解】 1.2如何使用API帮助文档【应用】 2.2String类的特点【理解】 2.3String类的构造方法【记忆】 2.4创建字符串对象
2022-08-04 17:00:35 669KB java
1
vc++ 常用图标 icon
2022-08-04 11:36:37 933KB vc++图标库 icon
1