上传者: 42134537
|
上传时间: 2022-05-23 22:05:29
|
文件大小: 158.92MB
|
文件类型: ZIP
新闻大师
根据内容相关性在5个类别(热门故事,娱乐,技术,商业,健康)中获取最新新闻
项目发展
该项目是在Python-Django框架中开发的,您可以在documentation文件夹中阅读该项目的完整实现。
基本思想
从获取各种来源的新闻
使用朴素贝叶斯分类器对新闻进行分类(技术,娱乐,商业,健康)
根据新闻标题的内容对新闻进行分类并显示在Web浏览器上
内容选择因素:
文章年龄(出版日期)
源质量
文字品质
情感分数
机器学习算法
使用朴素贝叶斯实现训练模型,支持向量机和使用keras进行深度学习模型作为数据集,获得朴素贝叶斯分类器的最高准确性(0.89)
数据集