2021年2月,中国互联网络信息中心(CNNIC)发布了第47次《中国互联网络发展
状况统计报告》。报告指出,截止至2020年12月,我国手机网民的规模达到9.86亿,
其中使用手机上网的网民占比99.7%,而网络新闻用户规模为7.43亿,占网民总体的
75.1%。网络逐渐成为了人民生活中不可或缺的一部分
2020年是极度不平凡的一年,新冠肺炎疫情的发生影响着我们生活的方方面面,
互联网作为人民生活必不可缺的一部分,在疫情期间也发挥了独一无二的作用。网民
通过互联网了解疫情变化,在互联网平台发布消息。其中微博作为中国最大的社交媒
体平台,承担着来自各方网民的声音。对于微博的文本数据挖掘一方面可以了解舆情
发展趋势,另一方面还可以充分发挥政府和国家对于网络舆论的引导与监管力量,避
免舆论导向走偏。
本文以2020年发生的新冠肺炎疫情为研究案例,以微博平台为数据来源,针对
微博文本与微博评论的特点,从舆情分析的角度出发,基于snowNLP情感分析与改
进的LDA主题提取模型进行舆情分析。本文的研究内容主要分三部分,首先是與情
数据的获取与处理,其次是舆情主题提取与分析,最后是对本文的研究总