2021年2月,中国互联网络信息中心(CNNIC)发布了第47次《中国互联网络发展 状况统计报告》。报告指出,截止至2020年12月,我国手机网民的规模达到9.86亿, 其中使用手机上网的网民占比99.7%,而网络新闻用户规模为7.43亿,占网民总体的 75.1%。网络逐渐成为了人民生活中不可或缺的一部分 2020年是极度不平凡的一年,新冠肺炎疫情的发生影响着我们生活的方方面面, 互联网作为人民生活必不可缺的一部分,在疫情期间也发挥了独一无二的作用。网民 通过互联网了解疫情变化,在互联网平台发布消息。其中微博作为中国最大的社交媒 体平台,承担着来自各方网民的声音。对于微博的文本数据挖掘一方面可以了解舆情 发展趋势,另一方面还可以充分发挥政府和国家对于网络舆论的引导与监管力量,避 免舆论导向走偏。 本文以2020年发生的新冠肺炎疫情为研究案例,以微博平台为数据来源,针对 微博文本与微博评论的特点,从舆情分析的角度出发,基于snowNLP情感分析与改 进的LDA主题提取模型进行舆情分析。本文的研究内容主要分三部分,首先是與情 数据的获取与处理,其次是舆情主题提取与分析,最后是对本文的研究总
2022-05-02 11:06:55 5.72MB 文档资料 网络 人工智能
安全技术-网络信息-文本挖掘技术研究及其在综合风险信息网络中的应用.pdf
2022-04-30 17:01:14 5.13MB 文档资料 安全 网络
TensorClus TensorClus(张量聚类)是第一个Python库,旨在对张量数据进行聚类和共聚。 它允许轻松地进行张量聚类,变形分解或张量学习和张量代数。 TensorClus允许与其他python软件包(例如NumPy,Tensorly,TensorFlow或TensorD)轻松交互,并在CPU或GPU上大规模运行方法。 它支持主要的操作系统,即Microsoft Windows,macOS和Ubuntu 。 源代码: : Jupyter笔记本: : 简要描述;简介 TensorClus库提供了多种功能: 几个数据集 张量与各种数据类型的共聚 张量分解和聚类 可视化 要求 numpy == 1.18 . 3 pandas == 1.0 . 3 scipy == 1.4 . 1 matplotlib == 3.0 . 3 scikit - learn == 0.
2022-04-22 11:38:31 21.33MB tensor datasets tensor-decomposition tensor-data
1
文字挖掘 此代码可用于为文档分配关键字,并从文档数据库中查找单词之间的关联规则。 此外,只需稍加修改,就可以使用搜索关键字创建文档建议系统。 入门 克隆此存储库 执行textMining.py 系统将要求您提供支持和信心。 输入那些,您将获得关联规则作为输出。 就是这样。 做得好! 先决条件 需要在计算机上安装python 3.6。 运行测试 编写代码的方式是,当您执行TextMining.py时,它将检查名为documentDatabase的文件夹并读取其中的所有.txt文件。 每个文本文件都充当一个单独的文档。 由于代码的输入应该是文档数据库,因此我们在documentDatabase文件夹中有多个文档。 读取所有文档,然后通过删除停用词来对其进行清洁。 使用词干进一步清除单词。 停用词列表可以在listOfStopWords.txt中找到 Example of stemmin
2022-04-14 18:09:34 37KB python text-mining tf-idf data-mining-algorithms
1
IBM SPSS Modeler数据与文本挖掘实战----数据和程序
2022-04-13 13:45:31 2.1MB SPSS Modeler 挖掘实战 程序
1
面向财经新闻的文本挖掘系统设计与实现 面向财经新闻的文本挖掘系统设计与实现面向财经新闻的文本挖掘系统设计与实现面向财经新闻的文本挖掘系统设计与实现
2022-03-26 15:14:15 3.58MB 人工智能
1
中科院计算所,讲述“信息检索”比较全的讲义,值得参考.
2022-03-18 11:28:31 12.53MB 信息检索 搜索引擎 中文分词 文本挖掘
1
Twitter情绪分析 这是一种自然语言处理问题,其中通过使用机器学习模型对消极消息中的消极消息进行归类来进行情感分析,以进行分类,文本挖掘,文本分析,数据分析和数据可视化 介绍 如今,自然语言处理(NLP)成为数据科学研究的温床,而NLP的最常见应用之一就是情感分析。 从民意测验到制定完整的营销策略,该领域已完全重塑了企业的运作方式,这就是为什么这是每个数据科学家都必须熟悉的领域。 与一组人手动完成相同任务所需的时间相比,可以在几秒钟内处理成千上万个文本文档的情感(以及其他功能,包括命名实体,主题,主题等)。 我们将按照解决一般情感分析问题所需的一系列步骤进行操作。 我们将从预处理和清理
1
ROST CM 6是武汉大学沈阳教授研发编码的国内目前唯一的以辅助人文社会科学研究的大型免费社会计算平台。该软件可以实现微博分析、聊天分析、全网分析、网站分析、浏览分析、分词、词频统计、英文词频统计、流量分析、聚类分析等一系列文本分析,用户量超过7000,遍布海内外100多所大学
2022-03-03 17:19:39 10.82MB rost 文本挖掘
1
Law Crime Mining Based on Corpus build and content analysis by NLP methods. 基于领域语料库构建与NLP方法的裁判文书与犯罪案例文本挖掘项目
2022-03-02 10:09:03 33MB Python开发-自然语言处理
1