汉字字频统计 1. 给出前100个汉字高频字的频率统计结果; 2. 分别给出前1、20、100、600、2000、3000、6000汉字的字频总和; 3. 计算汉字的熵值; 4. 针对不同规模语料重复上述实验; 5. 以图表的形式表示上述结果; 6. 提交实验报告,给出详细实验过程和结果;提交源代码和可执行程序。
1
本程序用于对汉字的识别和统计,统计文件针对txt文本
2020-05-11 00:01:37 10KB 汉字 字频 统计
1