摘要:随着大数据时代的日益发展,数据的获取与分析成为热点。本文通过利用Python抓取豆瓣TOP250的相关数据,并将数据存储在Excel文件中,借助Python功能完备的标准库、Requests、BeautifulSoup等第三方库编写程序实现豆瓣电影TOP250数据的抓取,后利用Jieba、NumPy等第三方库对所需数据进行数据预处理,再借助PyEcharts等第三方库对已处理好的数据进行数据可视化,最终得到词云图、网页动态图等图表,分别在电影类型、发行时间、导演、发行地区、评分及评价人数方面加以分析理解,从而得出数据之间的相关性、国内人群喜爱的电影类型等相关结论。
1