上传者: 42139357
|
上传时间: 2021-12-16 23:09:58
|
文件大小: 3.04MB
|
文件类型: -
机器学习的作者身份归属
具有随机森林和TFIDF分数的作者身份归因
该存储库包含博客文章《 代码。 它使用随机森林模型以及TFIDF分数作为特征,在n个作者之间执行作者身份分类。
文件说明
路径
描述
作者属性
主文件夹。
└sample_data
包含作者数据的文件夹。
├authors_folders
每个作者一个文件夹。
├authors_article_0.txt
作者的第一篇文章。
├authors_article_1.txt
第二篇。
├... authors_article_n.txt
...上一篇文章。
├attribution_model.py
作者