微博文本分析和可视化 0.数据来源和结构 新浪微博,爬虫链接: 微博内容数据结构(mongo数据库导出的json文档) content_example: [ {'_id': '1177737142_H4PSVeZWD', 'keyword': 'A股', 'crawl_time': '2019-06-01 20:31:13', 'weibo_url': 'https://weibo.com/1177737142/H4PSVeZWD', 'user_id': '1177737142', 'created_at': '2018-11-29 03:02:30', 'tool': 'Android'
2021-04-05 21:18:15 66.36MB visualization nlp weibo pyecharts
1
里面有900+个英文停用词,可用于词云图的制作,去除无意义的干扰词汇。 版权声明:资源下载只能自己学习使用,切勿用于商业用途,违者必究。
2021-04-04 00:57:39 8KB 文本分析 停用词
1
(粉丝可下载)为了研究某分院教师的学术成果、研究兴趣、研究方向,我们以广西师范大学的两个分院教师在知网所发表论文的摘要数据分析学术成果、关键词数据分析研究方向、研究方向文本数据分析研究方向,具体用textrank算法计算出研究方向词权重,根据词权重绘制词云图进行文本分析。具体绘制教师论文摘要数据权重最高的40个词的词云图,并输出各教师的基本信息,根据结果我们发现各教授的基本信息与词云图文本高度一致,可见分词的效果非常好,可以分析出各分院教师的学术成果、研究兴趣、研究方向。
2021-03-13 09:10:55 9.79MB 文本分析 自然语言处理 词云图 循环
1
该资源是2020参加美赛所用代码,主要是做的文本分析,LDA,词云,分类统计,时间序列。内含原始数据和代码说明。
2021-03-12 18:11:15 21.15MB R语言 文本分析 LDA 词云
1
ROST CM 6是武汉大学沈阳教授研发编码的国内目前唯一的以辅助人文社会科学研究的大型免费社会计算平台。该软件可以实现微博分析、聊天分析、全网分析、网站分析、浏览分析、分词、词频统计、英文词频统计、流量分析、聚类分析等一系列文本分析,用户量超过7000,遍布海内外100多所大学,包括剑桥大学、日本北海道大学、北京大学、清华大学、香港城市大学、澳门大学众多高校。
2021-03-06 19:29:33 13.85MB ROST 论文 网络文本分析 ROST
1
德语句子的自动复杂度评估 团队成员 里奥·阮·拉乌尔·贝格·康拉德·斯特劳布·蒂尔·诺彻 邮件地址 现有代码片段 利用的图书馆 运行代码(稍后将设置主入口点) 下载数据集: python download_data.py 项目状态 数据分析 我们的主要数据源是TextComplexityDE 19数据集( ),其中包含1000个德语句子,由外语学习者在7点Likert量表上标记为A级和B级,其中1表示低复杂度,高可读性句子,而7则相反。 其中900个句子来自23篇德国Wikipedia文章,其余100则来自Leichte Sprache。 数据集中的每个句子至少由5个人标记,数据集中提供了它们的平均评分。 除了复杂性/可读性之外,还收集了句子的可理解性和词汇难度得分。 图:饼图显示(四舍五入的)评级分布。 评级不是平均分配的,因为平均没有句子收到7,而很少有人得到6。在句子的
2021-02-25 10:02:38 148KB Python
1
基于Python的京东评论爬虫.zip
2021-02-04 09:09:11 96KB Python 爬虫 文本分析
1
情感分析、文本挖掘分析中文停用词大全
1
金庸武侠文本分析。搜狗词库大全,包括金融全部武侠小说地名、人名、武功、门派等……
2021-01-28 04:54:26 150KB 情感分析 文本分析 金庸武侠 词典
1
具有情感文本分析的中英文语料库,词语全面
2020-03-07 03:08:41 82KB 情感文本分析
1