前段时间参加的一个大创项目,要求爬取携程网桂林龙脊的网上评论数据,直接进携程网一搜,还是龙脊梯田的评论居多,后面直接选择爬取龙脊梯田的评论数据作为参考了,哈哈。 下面是具体实现: 分析网页数据 参考链接:https://you.ctrip.com/sight/longjititian970/14892.html 打开链接找到评论数据如下: 打开 开发者工具后点击网页的下一页可以获得下面网页请求信息,这便是获取网页评论的URL了 下面把这些信息搬进python就好了~~ 代码实现 代码我先用python的requests第三方网页请求类库,结合re正则表达式筛选需要的评论信息。 导入包 imp
2021-07-04 19:21:39 629KB python python3 python爬虫
1
20210702-天风证券-携程集团~S-9961.HK-“携”品牌优势引领复苏,“程”平台东风放眼全球.pdf
2021-07-03 10:02:29 1.48MB 行业
打开携程网,查询机票,如广州到成都。 这时网址为:http://flights.ctrip.com/booking/CAN-CTU-day-1.html?DDate1=2018-06-15 其中,CAN 表示广州,CTU 表示成都,日期 “2018-06-15”就比较明显了。一般的爬虫,只有替换这几个值,就可以遍历了。但观察发现,有个链接可以看到当前网页的所有json格式的数据。如下 http://flights.ctrip.com/domesticsearch/search/SearchFirstRouteFlights?DCity1=CAN&ACity1=CTU&SearchType=S&
2021-07-02 10:17:03 192KB data mozilla python
1
Sequential Event Experiment based on Travel note crawled from XieCheng,基于50W携程出行游记的采集与顺承事件图谱构建
2021-06-27 15:44:22 6.08MB Python开发-机器学习
1
输入城市名称在携程中获取酒店信息(python爬虫 可用)
2021-06-22 15:04:17 6KB 携程 爬虫
Code Gen的最新版本。 修改了C#模板相关的bug
2021-06-21 21:57:16 25.64MB DAL
1
携程酒店技术微服务实践.pdf
2021-06-21 14:02:06 1.65MB 微服务
1
本网页属于移动端布局,一些常见的基础样式集合成一个项目...........................
2021-06-21 13:03:30 182KB 移动端 html5 css3
携程酒店浏览客户流失概率预测 广告 vs. 新闻推荐 基于Hadoop EcoSystem的数据分析平台 CTR预估建模过程 用户兴趣建模 用户兴趣建模流程 Spark带来的改善
2021-06-18 23:19:48 1.25MB 算法 流失率 推荐 spark
1
Python携程铁路爬虫,统计长三角铁路车站的互通班次数据,分G、D/C、KTZX三类,最终结果用EXCEL表格展示。
2021-06-18 19:01:43 892KB 携程