pan18ap:在PAN 2018 Author Profiling共享任务中,文本分类中表现最好的团队-Twitter中的性别识别

上传者: 42146086 | 上传时间: 2025-06-17 03:55:33 | 文件大小: 50KB | 文件类型: ZIP
PAN 2018,作者分析任务(pan18ap) 渥太华大学自然语言处理实验室的参与在的 我们的模型是文本分类中表现最好的模型,在英语,西班牙语和阿拉伯语数据集上的准确度分别为0.8221、0.82和0.809。 考虑到文本和图像分类以及所有三个数据集的组合,我们的模型在23个团队中排名第二。 我们在Twitter中进行性别识别的方法仅利用文本信息,包括推文预处理,功能构建,使用潜在语义分析(LSA)进行的降维以及分类模型构建。 我们提出了一种线性支持向量机(SVM)分类器,具有不同类型的单词和字符n-gram作为特征。 内容 入门:PAN共享任务的初学者指南 安装 引文 如果我们的代码对您有用,请不要忘记引用我们的论文: Daneshvar,S.,&Inkpen,D.(2018年)。 。 CLEF 2018上用于PAN的笔记本。CEUR研讨会论文集,2125,1-10。 动机 您之所以在这里,可能是由于以下原因之一: 您是的参与者,正在寻找在过去几年中对该任务的其他参与者有效的方法。 您是机器学习和自然语言处理的狂热者,正在寻找一些入门代码来尝试一些NLP和ML实

文件下载

资源详情

[{"title":"( 11 个子文件 50KB ) pan18ap:在PAN 2018 Author Profiling共享任务中,文本分类中表现最好的团队-Twitter中的性别识别","children":[{"title":"pan18ap-master","children":[{"title":".gitignore <span style='color:#111;'> 1.34KB </span>","children":null,"spread":false},{"title":"Daneshvar2018.bib <span style='color:#111;'> 1.34KB </span>","children":null,"spread":false},{"title":"requirements.txt <span style='color:#111;'> 51B </span>","children":null,"spread":false},{"title":"data","children":[{"title":"Flame_Dictionary.txt <span style='color:#111;'> 32.12KB </span>","children":null,"spread":false}],"spread":true},{"title":"pan18ap","children":[{"title":"train_model.py <span style='color:#111;'> 44.70KB </span>","children":null,"spread":false},{"title":"__init__.py <span style='color:#111;'> 0B </span>","children":null,"spread":false},{"title":"process_data_files.py <span style='color:#111;'> 22.95KB </span>","children":null,"spread":false},{"title":"utils.py <span style='color:#111;'> 4.87KB </span>","children":null,"spread":false}],"spread":true},{"title":"LICENSE <span style='color:#111;'> 34.33KB </span>","children":null,"spread":false},{"title":"_config.yml <span style='color:#111;'> 25B </span>","children":null,"spread":false},{"title":"README.md <span style='color:#111;'> 8.98KB </span>","children":null,"spread":false}],"spread":true}],"spread":true}]

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明