上传者: 42162171
|
上传时间: 2021-12-08 17:05:21
|
文件大小: 139.45MB
|
文件类型: -
MAIS202 2020年秋季最终项目:假新闻检测器
抽象的
这是麦吉尔MAIS202的最终项目。 该项目的目标是对任何新闻产生“真实”或“伪造”分类。 提出并实现的算法是经典的朴素贝叶斯算法。 另外,我已经实现了广泛的自然语言预处理,使用了诸如“停用词去除”和“词义化”之类的方法来提高分类的准确性。 通过对多项式算法进行网格搜索并实现最佳参数,测试精度达到了97%。
储存库结构
该存储库包含2个文件夹和2个文件:。
派力宝
可交付成果1 数据选择提案.pdf
交付品2
Deliverable2.ipynb
Delivearble2.pdf
可交付成果3
Deliverable3.ipynb
交付品3.pdf
可交付成果4 Deliverable4.ipynb
资料集
Fake.csv
True.csv
最终项目
pycache的
环保
范本
fake.html
r