新闻分类 根据新闻标题将新闻分类。 尝试了各种分类器-决策树,支持向量分类器,多项朴素贝叶斯分类器,多层感知器,随机森林。 多项式朴素贝叶斯分类器效果最好。 即使我们人类根据关键字进行分类,多项式朴素贝叶斯算法也能发挥最佳效果,这是合乎逻辑的。 我们很可能会预测“政治”,因为我们会看到诸如奥巴马,大选,共和国之类的关键词;如果我们看到诸如毒品,监狱之类的关键词,我们可能会预测“犯罪”。 朴素贝叶斯扫描整个数据集,并找到标题中每个单词与某个类别相关联的概率,然后找到整个标题的概率,因此效果很好。 安装 pip install numpy pip install scikit-learn pip
1
使用jsoup异步抓取新闻数据装载listview(仿开源中国资讯列表)
2022-03-31 16:57:47 3.21MB jsoup
1
后台登录路径:/admin 用户名:liuyanban 密码:11100200 本网站主要是采用会员制度, 文章所有文章都必须是会员才能浏览的,文章的浏览按照点数来控制的,游客在本网站只能看到文章的前200个字,无法浏览详细内容,详细内容必须登陆后才能观看,每看一篇文章扣除点数10分,假如点数不够是能观看的,会员增加点数的办法是发表文章和直接通过管理员来管理,每发表一篇文章,如果能通过管理员审核的话,那么将点数增加100点,在前台会员注册后,通过管理员审核后才能成为正式管理员,也可以通过发表一篇文章来成为正式会员,正式会员发表30篇文章后成为高级会员,也可以通过向管理员申请成为高级会员,高级会员可以无障碍的浏览文章而不用扣除点数。 2)后台管理员部门:后台管理员可以添加分站管理员,将文章大栏目分包出去,分站管理员只能添加,修改,删除所管辖的栏目文章, 后台管理员可以管理前台所有的杂项,如投稿中心,使用方法等,使用办法是在下拉框中选中要修改的项目,然后添加就行了,修改的时候就是在下拉框里选中选项就直接进行该项的修改页面,该功能不带删除是因为在添加的时候,如果数据库没有该项,将直接添加,如果已经有该项,会给出提示,可以直接去修改就行。 会员管理主要是会员管理,对未审核的会员进行审核,也可以对提出申请的会员直接升级成正式会员和高级会员。 3)文章管理主要是添加,修改,删除文章,也可以对会员发表的文章进行审核,在该文章通过审核后,发表该文章的会员将得到100个点,发表的文章数加1,如果是正式会员,文章数超过30篇,那么将成为高级会员。 会员注册的时候用户名必须是6-20位之间,在前台添加时,程序会自动给出提示。程序会检测会员名是否重复。 在前台关键词点击,就会连接到有该关键词的文章列表页面。点击大类就会进入该大类的文章列表页面,电击小类,就会进入该小类的文章列表页面。点击标题就可以进入文章的详细页面,不过该页面只能看到前200个字符,登陆后,可以看到阅读全文的字样,点击就进入文章详细页面,站内调查的设置在后台管理员登陆大后台后可以设置,删除,修改。 站内搜索搜,选中标题时,不填写内容,将搜出所有文章,采用的是模糊搜索,在文本框内写字时,就会搜索到与该关键字相关的内容,网站的公告可以在后台设置和修改。 在使用前请到后台把杂项各选项都设置好
2022-03-31 11:12:45 6.02MB ASP源码 新闻文章
1
零基础入门推荐系统 - 新闻推荐 Top2 比赛地址: 解决方案 采用3种召回方式:itemcf 召回,binetwork 召回和基于 word2vec 的 i2i 召回。合并去重并删除没有召回到真实商品的用户数据后,利用特征工程+ LGB 二分类模型进行排序。 复现步骤 操作系统:ubuntu 16.04 pip install requirements.txt cd code bash test.sh
2022-03-30 18:02:09 19KB news-recommendation Python
1
虚假新闻检测
2022-03-30 15:06:49 49KB JupyterNotebook
1
网络新闻里的热点聚类
2022-03-30 13:39:42 328KB 聚类
1
fake_news_TFIDF_analysis 使用TFIDF分析进行假新闻预测 资料来源:Kaggle资料集 网址: : 目的: 阿拉伯联合酋长国TF-IDF数据处理和相关单词的特征提取 使用新闻数据集来训练MLlib中的不同分类回归模型。 使用训练有素的模型来确定哪些绩效更好。 要求: 安装了Spark 客观的 : 使用TF-IDF数据处理和特征提取来识别文本中更相关的单词 执行步骤以提取特征并标记并提交给分类回归模型。 演示使用MLlib库的不同方法。
2022-03-29 22:58:06 29.01MB
1
毕业设计 基于PHP的新闻发布系统分析与设计
2022-03-27 14:22:03 702KB PHP 新闻发布 分析 设计
1
基于Bootstrap的前端界面含主页,注册,新闻详情页,全是静态页面,需要自各拿走。模仿大公新闻网做的前端界面。
2022-03-27 02:45:01 129.14MB web bootstrap html 前端
1
面向财经新闻的文本挖掘系统设计与实现 面向财经新闻的文本挖掘系统设计与实现面向财经新闻的文本挖掘系统设计与实现面向财经新闻的文本挖掘系统设计与实现
2022-03-26 15:14:15 3.58MB 人工智能
1