文本预处理:分词,取出停用词,过滤低频词汇,编码归一化等; 文本向量化:如使用向量空间模型VSM(Vector Space Model)或者概率统计模型对文本进行表示,使计算机能够理解计算,用的方法基于集合论模型。基于代数轮模型。基于频率统计模型等等; 文本特征提取和选择:特征提取对应着特征项的选择和特征权重的计算。
2022-11-06 10:26:20 115KB NLP
1
让VC 的文本框智能匹配输入内容,当你输入一两个字符的时候,输入框会出现与此内容相关的文字,就像百度搜索的下拉提示那样,从而很好的匹配用户的输入,省去用户的麻烦,也就提升了用户体验。
2022-11-06 00:26:23 30KB VC 源码-界面窗体
1
基于Qt的多文本编辑器论文,包含部分代码,图示等,详细描写了设计过程等.
2022-11-05 21:17:57 1.06MB Qt 多文本编辑器
1
对各个国家的语言识别,文本文件进行编码识别和编码转换,utf-8转gb18030 , utf-8转gb2312等等,常见的编码格式都是可以转换的,使用的是ICU的库,比较权威
2022-11-04 23:23:41 14.89MB ICU 编码识别 编码转换 源码
1
最常用的是utf-8和gb2312之间的转换,其它编码转换都可以
2022-11-04 23:21:52 507KB 编码 批量处理
1
一个好用的文本文件编码转换器,可以实现文本文件的编码转换,支持常用编码转换,例如Unicode,utf-8,ANSI之间相互转化
2022-11-04 23:20:53 365KB 文本文件 编码转换 TXT Unicode
1
各种文本转到 unicode utf-8 gb2312 编码 unicode utf-8 gb2312 编码转换到文字。
1
rar包里直接打开exe文件,在界面批量选择文本文件,转换成你想要的编码文件,绝对的神器...
2022-11-04 23:05:46 115KB 文本文件 编码格式 转换
1
软件介绍: 本编码转换专家能够将源编码转换为目标编码,支持以下编码格式:自动识别编码 UTF-8 (有BOM)  UTF-8 (无BOM)ANSI(GB2312) Unicode  Unicode Big Endian文本编码转换专家界面简洁易操作,能够自动识别文件编码,有效转换成目标编码。真正的多线程管理,效率更高,可控性更好。
2022-11-04 22:33:30 330KB 其他资源
1
软件介绍: 文本编码转换专家自动识别文件编码,有效转换成目标编码。真正的多线程管理效率更高,可控性更好。选择要编码文件所在路径,及源编码格式和目标编码格式,转换即可。支持的编码格式有:UTF-8 (有BOM)UTF-8(无BOM)UnicodeUnicode Big Endian
2022-11-04 22:28:46 330KB 其他资源
1