本文档详细分析了预训练语言模型领域的最新进展,可为自然语言处理的研究和学习人员提供参考。用于重现分析结果的代码可在github上获取。
2023-02-10 12:19:55 304KB 自然语言处理 NLP 语言模型 Bert
1
高音数据集对性别分类的自然语言处理NLP 借助自然语言处理NLP,我可以从Tweeter数据集中识别性别分类 该文件包含: 加载数据集: 该数据集用于训练CrowdFlower AI性别预测器。 您可以在此处阅读有关该项目的所有信息。 要求参与者仅查看Twitter的个人资料并判断用户是男性,女性还是品牌(非个人)。 数据集包含20,000行,每个行都有一个用户名,一条随机鸣叫,帐户个人资料和图像,位置,甚至是链接和侧边栏颜色。 数据集来自这里: : 灵感 您可以尝试使用此数据集回答以下几个问题: 推文和个人资料中的单词如何预测用户的性别? 用什么词可以强烈预测男性或女性性别? 风格因素(例如链接颜色和侧边栏颜色)如何很好地预测用户的性别? 数据 数据集包含以下字段: unitid:用户的唯一ID _golden:模型的黄金标准中是否包含用户; 对或错 unitsta
2022-11-11 19:02:20 3.03MB JupyterNotebook
1
本文件包含清华大学ACL2020的论文和数据集 以及代码。适用于NLP的方向的研究。论文是全英文的 里面有详细的论述和数据集 以及代码
1
iwslt14数据集:用于英语和法语之间的机器翻译。
2022-09-22 16:46:39 10.2MB 机器翻译 人工智能 自然语言处理 nlp
1
谷歌黑板报-数学之美 数学在信息检索和自然语言处理中的主导作用和奇妙应用 共45页.pdf
2022-06-19 19:06:46 841KB 信息检索 自然语言处理 nlp
中文分词工具包 smallseg
2022-06-06 14:02:32 1.1MB 中文分词 源码软件 自然语言处理 nlp
中文分词库 IKAnalyzer
2022-06-02 22:01:28 1.12MB 中文分词 自然语言处理 nlp
中文分词:采用二元词图以及viterbi算法.docx
2022-05-25 19:06:26 746KB 算法 中文分词 自然语言处理 nlp
共用12个文件,分为英文和中文。其中中文情感词典包括:评价、情感、主张、程度(正面、负面)的情感文本。可用于中文文本分析中情感分析,计算情感词语等。
2022-05-22 15:53:54 88KB 文档资料 自然语言处理 nlp
1