数据分析组合
此portofolio是Web抓取,数据清理和数据分析的集合。 每个项目都在单独的存储库中,并且到每个项目的链接都添加到此投资组合中。
使用Scrapy收集票房信息
到抓取项目
这显示了如何在Python中使用Scrapy刮除Boxofficemojo网站。 我检查了在特定时间段内在美国发行的所有电影,并提取了有关各个电影的有用信息。 对于每部电影,我在这里介绍的要素都是国内收入,全球收入,发行商,开幕,预算,MPAA,类型和发行中。 详细说明在。
电影及其预告片发布日期分析
到项目
这是基于使用“使用Scrapy刮取票房信息”中的方法刮取的电影信息的基础。 我检查促销期间的变化是否是宣传电影的策略之一。 为了测试这一点,我研究了有关促销期限长短决定的因素。 要测试的因素是预算,发行商,MPAA和类型。 详细说明在。
在回归模型中使用交叉验证和网格搜索预测房价
到项目
在这个
1