人民日报统计出来的用于自然语言处理的中文词典
2022-10-02 19:02:52 626KB 自然语言处理 词性标注 中文分词
1
大约94000个单词。文档为txt格式,例子: #单词$[音标1][音标2]>词性1^解释1;解释2;>词性2^解释1;(回车) #单词2.....@end(文档结尾) 数据库格式和Excel格式联系我
2022-01-30 12:19:52 10.14MB 英语单词 单词 单词表 单词数据库
1
文件内包含 jieba 百度60万+分词词库(带词性权重和不带词性权重的文件各一份),附带停用词词库,词性和权重由机器学习等技术手段生成,持续优化中,欢迎私信提供宝贵意见。
2021-12-27 16:04:54 5.78MB python nlp jieba 分词
资源为1998年人民日报1-6月份带词性标注的语料库中的1998年3月份的语料,其他月份的语料可以到我的主页下载,亦可私信我获取。
2021-08-10 15:32:53 11.35MB 人民日报 词性标注 语料库 nlp
1
统计的一部分带词性的常用词库,csv格式,可以直接导入数据库
2021-03-24 21:41:03 1.67MB 常用词库 带词性常用词
1
带词性和tf-idf词频统计小巧中文分词词库.rar
2021-03-16 17:00:20 772KB 带词性
1
搜狗的词库 带词语 词性 词频 自然语言处理之必备良药
2019-12-21 18:56:00 1.11MB 词库 自然语言处理
1
仅供学习和研究使用,禁止用于商业行为
2019-12-21 18:53:29 4.64MB 中文分词
1
用于开发分词所使用的词库,自整理,后续还有更新,词根带词性以及排序
2019-12-21 18:51:45 8.3MB 中文词库 词性
1