共2556条数据,爬取时间的为2018年3月18日,数据包括爬取时间,爬取链接,微博url,用户id,用户昵称,用户头像,关注数,粉丝数,发布时间,微博内容, 微博内容txt,发自,转发数,评论数,点赞数,是否长微博,微博配图,视频地址,视频封面,是否转发,原微博,转发,热门评论,评论
2019-12-21 21:04:27 782KB 故宫微博数据 故宫博物院
1
内含三个文件,分别是:爬取微博、数据预处理、爬取并处理。基于python3,实现了高效爬取微博数据,并结合正则表达式对数据进一步处理。其中亦包含对微博评论和点赞等其他信息的爬取,小小修改一下代码即可。
2019-12-21 20:47:41 6KB 爬虫 python3 微博 数据
1
微博数据-详细的微博数据,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
2019-12-21 20:15:48 5.8MB 微博 爬虫
1
微博最新数据集,包含以下字段发表时间 所用设备 微博内容 点赞数 评论数 转发数 用户id 用户名称 vip等级 关注数 粉丝数 性别 微博认证(简介) 等级 阳光信用 注册时间
2019-12-21 19:46:49 220KB 微博数据
1
数据概述:本数据集为63641个用户的新浪微博数据集,包括以下内容: 63641个新浪微博用户信息 数据格式:用户uid,用户昵称,用户姓名,用户所在地,用户主页url,用户性别,用户粉丝数,用户关注数,用户微博数,用户收藏数,用户创建时间; 84168条在2014-05-03至2014-05-11采的关于12个主题的微博信息 数据格式:微博mid,发布时间,微博内容,微博来源,微博转发数,微博评论数,微博被赞数,发表用户uid,微博所属主题。 12个主题包括魅族,小米,火箭队,林书豪,恒大,韩剧,雾霾,房价,同桌的你,公务员,贪官,转基因。 1391718条用户好友关系 每条记录由suid和tuid两个字段组成,表示suid关注tuid,由于新浪微博的限制,每个用户最多只能获取到200个关注人的信息,故好友关系不是很全; 27759条微博转发关系 每条记录由smid和tmid两个字段组成,表示smid微博转发tmid微博。
2019-12-21 19:27:15 131.78MB 微博数据集 话题聚类
1
8万多条在2014-05-03至2014-05-11采集的关于12个主题的微博信息数据。包含63641个用户,文件为sql脚本,可直接导入数据库。
2019-12-21 19:27:15 16.06MB 微博数据集 话题聚类
1
爬虫采集的微博用户关系数据,经过自己的精心整理、处理,做成了方便用python导入的格式。
2019-12-21 18:56:33 22.7MB 微博 数据
1