搜狐新闻语料,5000条,包括新闻标题、新闻链接、新闻内容、新闻类别。 搜狐新闻语料,5000条,包括新闻标题、新闻链接、新闻内容、新闻类别。
2022-11-20 19:33:24 9.49MB 机器学习
1
基于jieba、gensim.word2vec、LogisticRegression的搜狐新闻文本分类-附件资源
2022-09-23 14:39:28 106B
1
消息推送系统实践 搜狐新闻客户端PUSH系统实践分享 共19页.pdf
2022-06-10 09:10:38 668KB 消息推送 PUSH
交互设计-设计之下 搜狐新闻客户端的用户体验设计.pdf
2022-03-17 14:19:34 58.39MB 设计之下
1
《设计之下》是设计师案前的一本极好的参考书,搜狐的这种分享精神、及时总结的做法值得所有从业者学习。对于初入设计行业的新人本书更是有极大的参考价值,通过本书你可以用最快的速度掌握整体流程及详细设计方法。
2021-12-29 11:34:48 58.39MB 设计之下 用户体验设计
1
基于tensorflow+CNN的搜狐新闻文本分类-附件资源
2021-12-25 18:06:27 106B
1
网络爬虫 源码 爬搜狐新闻
2021-11-25 19:39:09 1.96MB 网络爬虫 源码 爬搜狐新闻
1
intro 新浪新闻,腾讯新闻,搜狐新闻,澎湃新闻。 短期目前旨在爬取所有新闻门户网站的新闻,每个门户网站爬虫开箱即用,并自动保存到同目录下的 csv/excel 文件中,禁止将所得数据商用。 长期目标是打造一个信息流聚合平台,或者进行更高层面的比如社会舆情、新闻地理可视化等的处理。 集成该爬虫的网站已上线,体验地址: 项目长期维护,欢迎 star,项目更多信息欢迎关注个人微信公众号 【月小水长】 how to use 每个文件夹下的代码就是对应平台的新闻爬虫 py 文件直接运行 pyd 文件需要,假设为 pengpai_news_spider.pyd 将 pyd 文件下载到本地,新建项目,把 pyd 文件放进去 项目根目录下新建 runner.py,写入以下代码即可运行并抓取 import pengpai_news_spider pengpai_news_spider.main() to
2021-11-22 10:06:28 21.06MB times newsapi tencent sina
1
对搜狗实验室的2012搜狐新闻语料进行切分、格式转换(已转为UTF8),从中抽取了11个新闻类别并分文件夹存储,每个txt文件包含600篇新闻。数据大概共54M,可以用于中文分类。
2021-10-27 19:57:18 53.84MB 文本分类 新闻语料 搜狐新闻
1
爬取的搜狐新闻数据,一共有12个类别,分好类了
2021-10-26 10:02:38 13.09MB 搜狐新闻 爬取
1