本文实例讲述了Python文本统计功能之西游记用字统计操作。分享给大家供大家参考,具体如下: 一、数据 xyj.txt,《西游记》的文本,2.2MB 致敬吴承恩大师,4020行(段) 二、目标 统计《西游记》中: 1. 共出现了多少个不同的汉字; 2. 每个汉字出现了多少次; 3. 出现得最频繁的汉字有哪些。 三、涉及内容: 1. 读文件; 2. 字典的使用; 3. 字典的排序; 4. 写文件 四、效果 五、源代码 # coding:utf8 import sys reload(sys) sys.setdefaultencoding("utf8") fr = open('xyj.txt',
2023-03-25 22:07:41 92KB line python python
1
此小程序用于检测分析输入的字符串,统计字符数,字母数,单词书,单词平均长度。
2021-12-25 10:15:52 6KB 文本统计
1
主要介绍了Python文本统计功能之西游记用字统计操作,结合实例形式分析了Python文本读取、遍历、统计等相关操作技巧,需要的朋友可以参考下
2021-10-21 09:35:56 91KB Python 文本统计 西游记 用字统计
1
主要为大家详细介绍了C语言实现英文文本词频统计,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
1
java实现的一个接收从命令行读入一段英文文本,统计总次数,统计词频的程序,统计结果以txt文件格式保存,使用了正则表达式,个人感觉不错!
2020-01-03 11:28:10 4KB java 命令行 统计字符
1
文本: a b c a c a d b a c d a b a a c b a b a 传统表示方法:a: 00, b: 01, c: 10, d: 11 传统表示未压缩时: 0001100010001101001011001000001001001000 统计次数:a:9, b:5, c:4, d:2 前缀码表示:a: 0, b: 10, c:110, d:111 压缩后: 0101100110011110011011101000110100100
2019-12-21 19:44:29 2KB 哈夫曼编码压缩文本 C
1
文本统计工具,将一个文件夹内部所有的txt文件按照制定的字段进行统计,可以用于软件日志日常运行统计,使用Excel将统计结果输出(需要安装office),并且添加了log4net日志记录组件使用方法,同时生成多个文件夹记录日志。
2019-12-21 18:56:09 314KB 文本统计 log4net
1