用程序生成的ChatGLM分词词典,有助于帮助研发人员更直接的了解ChatGLM的分词原理
2024-06-11 14:57:28 930KB
1
中文分词词典。按照长度分成2/3/4/5四个文件,剔除稀有冷门的词,适合常规的项目开发使用。本人项目中就在使用。好用不贵!
2022-11-29 11:42:33 1.97MB 词典 字典
1
人民日报统计出来的用于自然语言处理的中文词典
2022-10-02 19:02:52 626KB 自然语言处理 词性标注 中文分词
1
30W+中文分词词典,覆盖广,新增金融词典
2022-07-30 01:29:28 1.86MB 分词 中文 词典 中文分词词典
1
jieba青春有你2自定义分词词典,青春有你2评论爬取,青春有你2视频饭圈自定义分词词典,jieba分词Python分词词典
2022-03-28 09:45:31 499B jieba 分词词典 自定义 Python
1
盘古分词 词典 包含 1.ChsDoubleName1.txt 2.ChsDoubleName2.txt 3.ChsSingleName.txt 4.Dict.dct 5.Stopword.txt 6.Synonym.txt 7.Wildcard.txt
2021-11-06 22:17:35 1.21MB 盘古 分词 词典 dct
1
这份代码是我们专业的一个实验,内容包含了文本分词和文本分类。分别使用了正向最大匹配算法和KNN算法。分词速度平均153295词/秒,189100字符/秒。文本分类使用tf-idf计算单词权重进行特征选择,我测试时选择前100个特征词,根据k的不同取值,分类的准确度平均为75%。
2021-06-25 09:04:28 15KB 分词算法 KNN文本分类算法 python
这是前一段时间我在研究中文分词时在网上找到的一个词典,TXT格式的,拿出来分享一下。
2021-06-02 18:19:49 2.2MB 中文分词 词典
1
中文分词词典,Python 作业 中文 分词 词典
2021-04-17 17:05:43 4.20MB 中文 分词
1