3500个常用汉字,可以作为爬虫的数据。
汉字(拼音:hàn zì,注音符号:ㄏㄢˋ ㄗˋ),又称中文、中国字,别称方块字,是汉语的记录符号,属于表意文字的词素音节文字。世界上最古老的文字之一,已有六千多年的历史。在形体上逐渐由图形变为笔画,象形变为象征,复杂变为简单;在造字原则上从表形、表意到形声。除极个别汉字外(如瓩、兛、兣、呎、嗧等),都是一个汉字一个音节 [1] 。
现代汉字是指楷化后的汉字正楷字形,包括繁体字和简化字。现代汉字即从甲骨文、金文、大篆(籀文)、小篆,至隶书、草书、楷书、行书等演变而来。汉字为汉民族先民发明创制并作改进,是维系汉族各方言区不可或缺的纽带。现存最早的汉字是约公元前1300年殷商的甲骨文和稍后的金文 [1] ,西周时演变成籀文 [2] ,再到秦朝的小篆 [3] 和隶书,至汉魏隶书盛行,到了汉末隶书楷化为正楷。楷书盛行于魏晋南北朝,通行 [4] 。
汉字是迄今为止持续使用时间最长的文字,也是上古时期各大文字体系中唯一传承者,中国历代皆以汉字为主要的官方文字。
2022-08-06 09:07:24
25KB
数据
1