中文word2vector词向量实现 说明:背后的原理暂时不做深究, 主要目的就是尽可能快的训练一个中文词向量模型。 环境 笔记本 i5-4210M CPU @ 2.60GHz × 4 , 8G RAM ubuntu16.04lts 独立系统, python 3.6.1 依赖:numpy, scipy, gensim, opencc, jieba 1.获取语料库 1.1维基百科 原始语料文件:zhwiki-latest-pages-articles.xml.bz2 1.6G 1.2 SogouCA 全网新闻数据(SogouCA) 原始语料文件:'news_tensite_xml.full.tar.gz' 746.3 M 2.语料库预处理 2.1 搜狗新闻语料处理 来自若干新闻站点2012年6月—7月期间国内,国际,体育,社会,娱乐等18个频道的新闻数据,提供URL和正文信息 格式说明:
2022-11-30 15:36:28 345KB 附件源码 文章源码
1
黑绿色大图背景服装企业网站博客模板_绿色 黑色 服装 时装 时尚 企业 博客 幻灯 html 新闻 杂志 html5.rar
2022-11-30 09:22:37 2.45MB html5
新闻是社会上的一个严重问题。 人们对新闻的过分依赖是在互联网和社交媒体上传播假新闻的巨大动机,这需要将其与真实情况区分开。 为了填补这一安全空白,目前正在研究各种机器学习,人工智能,自然语言处理以及其他相关的信息和技术工具,以将彼此隔离。 在本文中,我们将假新闻视为一个问题,通过过度研究“基于样式”的方法来研究将假新闻分类为不同类型,将新闻分为假新闻或真实新闻的方法。 我们还将研究分类中使用的机器学习和自然语言功能以及度量,并了解如何应用机器学习来检查此问题。 最后,我们将在印度新闻中应用其中一些方法,并了解它们的效果。
2022-11-29 22:13:07 262KB Fake News Machine Learning
1
体育新闻(微信小程序源码)
2022-11-29 11:23:02 9.99MB 小程序
1
新闻阅读器(微信小程序源码)
2022-11-28 10:20:05 1.02MB 小程序
1
普通用户管理模块: (1)用户注册登录:用户注册为用户并登录新闻管理系统;用户对个人信息的增删改查,比如个人资料,密码修改。 (2)查看新闻管理系统的首页信息:新闻管理系统的首页信息包含了首页、公告消息、交流论坛、新闻资讯、意见反馈、视频分享等。 (3)公告:用户在公告这一菜单下对用户提交的查看、同时也可以发布、评论。 (4)新闻资讯:用户进行新闻资讯的阅览,查看管理者发布的新闻资讯信息。 (5)我的收藏:在“我的”下可以查看管理“我的收藏”信息,可以查看收藏,也可以对不喜欢的信息进行删除收藏; (6)我的账户:当用户点击右上角“我的”这个按钮,会出现子菜单,点击“我的账户”可以对个人的资料以及登录系统的密码进行设置; (7)个人中心:当用户点击右上角“我的”这个按钮,就会进入到对应的后台进行信息的管理了; 管理员管理模块: (1)用户管理:管理员可以对前台上注册过的用户信息进行管控,也可以对管理员信息进行管控。 (2)新闻列表管理:管理员在后台可以对新闻管理系统中显示的新闻进行增删改查。 (3)内容管理:管理员可以对新闻管理系统前台展示的交流论坛、交流分类、新闻列表及新闻分类的分类
2022-11-27 23:03:09 14.94MB java vue idea redis
1
体育新闻赛事数据(微信小程序源码)
2022-11-26 20:21:58 12.6MB 小程序
1
该数据是一个假新闻标记数据,包括从244个网站上利用Chrome的BS Detector扩展工具识别出的假新闻数据。
2022-11-24 20:26:20 20.42MB 假新闻识别 Kaggle
1
FakeNewsCorpus:从精选的数据源列表中抓取的数百万条新闻报道的数据集
1
采用面向对象的思想,通过Redis实现对新闻数据的添加(普通添加和事务添加),通过id删除,通过id修改,分页,获取全部新闻数据
2022-11-24 09:21:34 6KB 面向对象 Redis python
1