第一章:引言 第二章:文本特征提取技术 第三章:文本检索技术 第四章:文本自动分类技术 第五章:文本自动聚类技术 第六章:话题检测跟踪技术 第七章:文本过滤技术 第八章:关联分析技术 第九章:文档自动摘要技术 第十章:信息抽取 第十一章:智能问答(QA)技术 第十二章:文本情感分析技术 第十三章:Ontology 第十四章:半结构化文本挖掘方法 第十五章:文本挖掘工具与应用
2022-01-21 17:22:15 12.78MB  文本挖掘
1
基于LSTM的文本挖掘
2021-12-30 13:07:11 5KB 人工智能 LSTM
1
领域自适应文本挖掘工具(新词发现、情感分析、实体链接等),基于少量种子词和背景知识
2021-12-29 16:49:58 2.6MB 文本挖掘
1
文本挖掘工具,用于分析文本语境微博等。文本挖掘
2021-12-29 16:48:43 8.6MB 文本挖掘
1
日语文本挖掘示例代码这是使用报纸文章的日语文本挖掘的示例代码。您可以从 Internet 下载报纸文章并尝试使用朴素贝叶斯分类器进行分类、聚类等。 要执行示例代码,您需要单独安装“Simple Text Miner for Japanese”。 “Simple Text Miner for Japanese”可以从 MATLAB Central 下载。
2021-12-28 13:34:28 9KB matlab
1
对于文本挖掘的阅读笔记详细内容。社交媒体是一个自由表达自己观点和意见的平台,使交流比以前更加容易。这也为人们故意传播假新闻打开了机会。容易在网上获得各种新闻来源也带来了人们接触虚假新闻和可能相信这种新闻的问题。这使得我们在社交媒体上检测和标记此类内容变得非常重要。以目前社交媒体上生成新闻的速度,在不知道消息来源的情况下,很难区分真正的新闻和恶作剧。本文讨论了仅使用新闻文本的特征而不使用任何其他相关元数据来检测虚假新闻的方法。我们观察到通过集成方法将风格特征和基于文本的词向量表示相结合可以预测假新闻,准确率高达95.49%。
2021-12-08 16:57:19 57KB ieee论文
1
R 语言环境下的文本挖掘,文本挖掘被描述为 “自动化或半自动化处理文本的过程”,包含了文档聚类、文档分类、自 然语言处理、文体变化分析及网络挖掘等领域内容。 对于文本处理过程首先要拥有分析的语料(text corpus),比如报告、信函、出版物等。而 后根据这些语料建立半结构化的文本库(text database)。而后生成包含词频的结构化的词条 -文档矩阵(term-document matrix)。
2021-12-06 00:22:00 302KB NLP r语言 挖掘
1
本文实例讲述了Python实现购物评论文本情感分析操作。分享给大家供大家参考,具体如下: 昨晚上发现了snownlp这个库,很开心。先说说我开心的原因。我本科毕业设计做的是文本挖掘,用R语言做的,发现R语言对文本处理特别不友好,没有很多强大的库,特别是针对中文文本的,加上那时候还没有学机器学习算法。所以很头疼,后来不得已用了一个可视化的软件RostCM,但是一般可视化软件最大的缺点是无法调参,很死板,准确率并不高。现在研一,机器学习算法学完以后,又想起来要继续学习文本挖掘了。所以前半个月开始了用python进行文本挖掘的学习,很多人都推荐我从《python自然语言处理》这本书入门,学习了半个月
2021-12-04 22:25:33 101KB lp nl nlp
1
基于MATLAB的文本挖掘 - 英文版,适合搞自然语言处理的人看。
2021-11-17 21:00:54 38.53MB 文本挖掘
1
自动文摘 定义: 就是利用计算机自动地从原始文档中提取全面准确地反映该文档中心内容的简单连贯的短文。 自动文摘系统 自动文摘系统应能将原文的主题思想或中心内容自动提取出来。 文摘应具有概况性、客观性、可理解性和可读性。 系统适用于任意领域。 1995年自动文摘系统评测 ⑴ 3个系统都可以按指定的比率从原文中摘取一部分语句。 ⑵ 抽取的文摘都是原文中的语句,只有单位2的文摘中剔除了一些中文数字。 ⑶ 三个系统的文摘几乎完全不相重合。 与专家的文摘完全不同
2021-11-16 16:00:12 406KB 文本挖掘
1