基于文本数据挖掘的区域性网络舆情监控引导策略综述研究.pdf
由于词汇敏感之类的原因,每次发布都审核失败,于是转为图片上传了!相关代码在文末附录中。 数据来源:2020记忆:报道、非虚构与个人叙述(持续更新) 附录: t1.py: #!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2020/2/12 13:02 # @Author : ystraw # @Site : # @File : t1.py # @Software: PyCharm Community Edition # @function: 从github指定链接中进行数据获取 #
2021-07-10 16:08:19 2.29MB 数据 数据分析
1
Python文本数据分析:新闻分类任务 【软件包】 jieba pandas wordcloud matplotlib sklearn 【概念】 IDF:逆文档频率逆文档频率TF-IDF=词(TF)X逆文档频率(IDF)词频(TF)=某词该在文章中出现次数/文出现次数最多的词的出现次数 逆文档频率(IDF) = log(语料库的文档总数/(包含该词的文档数+1)) 【步骤】1、去剥词2、TF-IDF关键词提取3、LDA算法建模4、贝叶斯
2021-07-08 15:02:40 9.2MB 新闻分类任务 Python 数据分析
实验要求 文本类别数:>=10类。 训练集文档数:>=500000篇;每类平均50000篇。 测试机文档数:>=500000篇;每类平均50000篇。 实验内容 利用朴素贝叶斯算法实现对文本的数据挖掘,主要包括: 语料库的构建,主要包括利用爬虫收集Web文档等。 语料库的数据预处理,包括文档建模,如去噪,分词,建立数据字典。 自行实现朴素贝叶斯,训练文本分类器。 对测试集的文本进行分类 对测试集的分类结果利用正确率和召回率进行分析评价。
2021-07-08 15:02:40 94.13MB 朴素贝叶斯 文本数据
可以直接将txt excel文本文件直接转为shp格式的点、线、面数据。
2021-07-08 10:05:51 79KB Arcgis 文本数据
1
已分类好的新闻文本数据,内含十个类别,财经、股票、教育、科技、社会、游戏等等,共约10W篇文本,是一个非常好的数据集。
2021-07-07 19:44:36 147.25MB 分类 聚类 文本数据 新闻
1
在游戏中经常需要动态地载入一些数据。例如让玩家定制角色外貌时,需要从数据文件读取各种身体部位的信息;或者玩家访问NPC购买装备时,需要从数据文件读取装备信息等等。为了减少游戏程序的大小,我们往往采用最简单的文本文件来保存这些信息。所以本文总结一下Unity常用的读取文本数据的方法。
2021-07-06 13:18:31 16KB Unity3d 动态加载文本
1
python提取文本数据,经验不足,欢迎指正
2021-06-23 10:06:35 536B python
1
两表中的数据共包含应用数据10841行,评论数据64163行。 APP数据表包含列:软件名、软件类别、评分、评论数、软件大小、安装数、收费类型、价格、类型标签、最近更新日期、当前版本号、安卓版本号(系统最低要求)。 评论数据表包含列:软件名、评论内容、情感倾向、情感极性、情感主体性。
1
这是对很棒的 NF2FF 脚本的改编,用于从近场数据集给出天线的远场特性。 该改编不会对计算进行任何更改,但会使用基于文本的输入文件替换复杂的数据集。 这允许以下格式的两个文本文件(共面和跨平面): x(mm) y(mm) 实数(数据) 图像(数据) -700 -700 0.00004 -0.00009 -700 -690 0.00012 0.00016 用作输入数据集。 在使用它们之前,需要删除标题行,因此它们将变为: -700 -700 0.00004 -0.00009 -700 -690 0.00012 0.00016 脚本期望的文件名是: '共极 - MATLAB.txt' 'Xpolar - MATLAB.txt' 您将需要原始脚本中的其余文件,它们可以在以下位置找到: http://www.mathworks.com/matlabcentral/fileexchang
2021-06-01 16:03:27 11KB matlab
1