本资料来自互联网,是北京大学计算机系研究生教程,由杨建武授课,课程共有15章,包括特征提取、检索、分类、聚类、摘要、情感分析等。非常不错的入门学习资料,适合相关专业大三到研一的学生自学。推荐学习!
2021-10-19 09:29:35 14.47MB 文本挖掘资料
1
文本挖掘原理》 全本,非2.74M的15页预览版。由于没有书可卖了,上传供学习参考!
2021-10-14 09:52:36 20.94MB 文本挖掘原理 程显毅
1
达观数据是中国知名的文本智能处理企业,利用先进的文字语义自动分析技术,提供文本自动抽取、审核、纠错、搜索、推荐、写作等智能软件系统,让计算机代替人工完成业务流程自动化,大幅度提高企业效率
1
文本挖掘系统 系统说明 集成了文本过滤,去重及邮件实时通知的功能 集成了文本关键字提取的功能 集成了文本分类即打标签的功能 集成了文本推荐即景点评价的功能 支持中英文 系统架构图 关于分词 英文分词,采用nltk工具包进行分词 pip install nltk 中文分词,采用jieba工具包进行分词 pip install jieba jieba分词 dict 主词典文件 user_dict 用户词典文件,即分词白名单 user_dict为分词白名单 如果添加的过滤词(包括黑名单和白名单)无法正确被jieba正确分词,则需要添加的单词和词频加入到主字典dict文件中或者用户词典user_dict,一行一个(词频也可省略) 关于停用词,黑名单,白名单 stopwords为停用词 可以随时添加重启的单词,一行一个 blackwords为过滤词黑名单 可以随时添加过滤的单词,一行一个 writ
2021-10-04 14:35:20 3.29MB 系统开源
1
北京大学计算机科学技术研究所文本挖掘研究生课程,包含17个子文件,有特征提取、检索、分类、聚类、TDT、过滤、关联等
2021-10-01 23:09:33 37.06MB 文本挖掘
1
基于SO-PMI算法的情感极性判别代码,有注释容易理解。针对2元词组共现频率为0的情况,参照论文设置了goodturing平滑和laplace平滑方法。论文可以自己去知网搜索。运行速度慢,建议训练数据不要超过80000条。
1
教授的文本挖掘技术课程ppt 包含文本情感分析 特征提取
2021-09-22 11:16:30 23.62MB 自然语言处理 nlp 文本挖掘
1
行业制造-电动装置-基于余弦相似度文本挖掘算法的客服重复来电处理方法.zip
文本挖掘与社会网络分析课程教材,内容包括文本处理、文本分析、信息检索系统、文本分类、文本聚类、矩阵分解与话题模型、文本情感分析、知识图谱、社会网络分析理论、Gephi可视化、社会网络分析实践与案例。
2021-09-03 22:38:12 6.53MB 文本挖掘 社会网络分析
1
2021泰迪杯C2-基于文本挖掘的旅游目的地印象分析.pdf