爬虫脚本项目源码-微博信息爬取
2021-02-27 11:02:44 678KB 微博 爬虫脚本项目源码 Python
基于多特征融合的中文微博评价对象抽取方法
2021-02-26 13:04:28 568KB 研究论文
1
对于网络微博用户可信任性的问题,通过对爬取的所有源语料进行有目的的预处理,得到具有规范格式的用户数据,并从用户信息数据中,选择性的提取用户信息的完整度、活跃度、交际广度、传播力度四项指标组成指标体系;然后利用设计的层次分析法(AHP)结构模型,实现了对指标的权重系数数值确定,进而计算与统计用户的权威性。最终完成对用户可信度模型的构建。实验表明,该模型对微博用户的可信度评测方面有较好的准确性。
2021-02-26 12:04:07 307KB 权威性; 微博; 层次分析法
1
使用微博内容和友谊网络推断用户个人资料
2021-02-25 17:05:26 1.5MB 研究论文
1
该软件APP集成了百度实时热搜Top3、搜狗实时热搜Top3、360实时热搜Top3、微博实时热搜Top3、知乎实时热搜Top3、腾讯实时热搜Top3等六种国内主要平台的Top3热搜,以方便使用者在一个简单的手机APP界面里,尽情浏览热点资讯。
1
爬取的103个微博用户截止2019年8月发布的所有原创微博,以csv文件存储,每个用户对应一个csv文件。包括48位女性,55位男性,男女性分开存储。包括id、微博正文、微博原始图片URL、原始视频URL、发布日期、发布工具、点赞数、评论数、转发数、话题和@用户。总共包括十多万条微博,可以用做性别分类等自然语言处理任务的数据集。
2021-02-25 13:21:06 5.61MB weibo
1
2011最新 微博系统 毕业论文,源码已经上传,可以下载,这个是优秀毕业设计,源码+毕业设计+ppt 2011最新 微博系统 毕业论文,源码已经上传,可以下载,这个是优秀毕业设计,源码+毕业设计+ppt
2021-02-24 13:04:31 3.65MB 2011最新 微博系统 毕业论文
1
提供代码框架,读者们稍作修改就可以用了,本文爬取的是某舆情热门事件的发文ID、点赞数、转发数、评论量
2021-02-23 22:09:46 2KB Python 微博 爬取 爬虫
1
新浪微博在2014年3月公布的月活跃用户(MAU)已经达到1.43亿,2014年新年第一分钟发送的微博达808298条,如此巨大的用户规模和业务量,需要高可用(HA)、高并发访问、低延时的强大后台系统支撑。微博平台第一代架构为LAMP架构,数据库使用的是MyIsam,后台用的是php,缓存为Memcache。随着应用规模的增长,衍生出的第二代架构对业务功能进行了模块化、服务化和组件化,后台系统从php替换为Java,逐渐形成SOA架构,在很长一段时间支撑了微博平台的业务发展。在此基础上又经过长时间的重构、线上运行、思索与沉淀,平台形成了第三代架构体系。我们先看一张微博的核心业务图(如下),是不
2021-02-21 09:08:14 284KB 亿级用户下的新浪微博平台架构
1
内蒙古财经大学《微积分》历年多套期末考试试卷(含答案
2021-02-20 20:03:24 1.72MB 微博 微服务