jieba分词支持关键词带空格和特殊字符
2021-08-02 20:46:40 19KB jieba分词 空格
1
jieba snownlp bs4 等包的使用,包括tf-idf算法等,具体方法见代码注释部分。练习数据也在文件夹中 11111111111
2021-08-01 10:42:07 5.34MB 分词 jieba python
1
主要介绍了python同义词替换的实现(jieba分词),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
1
jieba-0.42版集合包.rar,本人亲试,保证能用。
2021-07-24 20:11:00 36.65MB jieba 包能用
1
搜索引擎 爬虫 python实现 scrapy+jieba+whoosh,具体看我的blog scrapy分布式爬虫+jieba+whoosh实现搜索引擎
2021-07-19 16:39:55 17.01MB 爬虫 搜索引擎 jieba+whoosh
1
机器学习算法中自然语言处理常用数据集(新闻数据集news.csv)及jieba_dict字典、停用词等相关文件,包括以下文件 data/news.csv jieba_dict/dict.txt.big jieba_dict/stopwords.txt jieba_dict/stopwords_s.txt
2021-07-19 15:41:33 3.94MB 新闻数据集 自然语言处理数据集
1
统计《水浒传》常用词语使用频率,且对于频率高的无效词语或无意义词语做停用词处理,对于不同称谓的同一对象需要能做同一化处理。
2021-07-13 16:04:40 793KB python 词频
1
中文停用词表, 哈工大停用词表, 百度停用词表, 四川大学机器智能实验室停用词库四份停用词表进行了合并去重
2021-07-10 09:10:01 16KB 数据分析 jieba分词 情感分析
1
列举出常用的汉字3550个,还有生僻字
2021-07-10 09:10:01 12KB jieba分词 评论分析 情感分析
1
最新的TensorFlow 中文数据集 基于 jieba 的中文处理工具 模型训练,模型保存,模型估计的完整实现