酒店评论的情感分析和方面分类
这是MonkeyLearn系列文章的源代码,这些文章与使用机器学习模型分析酒店评论中的情绪和方面有关。 此代码在python2.7中运行。
(2018年5月更新-自从编写了这些蜘蛛以来,TripAdvisor和Booking.com对其网站进行了很大的更改,因此它们不再起作用。博客文章和代码对于作为如何构建Scrapy蜘蛛的示例仍然非常有用,但可悲的是,示例本身已不再起作用。我们将来可能会修复蜘蛛程序,因为它可能足以更新所有选择器以使所有功能再次正常工作。)
代码组织
该项目本身是一个Scrapy项目,用于从TripAdvisor和Booking等不同站点收集培训和测试数据。 此外,还有一系列Python脚本和Jupyter笔记本实现了一些必要的脚本。
TripAdvisor(hotel_sentiment / spider / tripadvisor_sp
2022-07-14 21:03:53
22KB
Python
1