NLP学习指南 本教程致力于帮助同学们快速入门NLP,并掌握各个任务的SOTA模型。 各任务模型列表汇总:,,,(todo), 各任务概述和技巧:,文本匹配,序列标注,文本生成,语言模型 之后就可以开始逐个击破,但也不用死磕,控制好目标难度,先用三个月时间进行第一轮学习: 读懂机器学习,深度学习原理,不要求手推公式 了解经典任务的基准,动手实践,看懂代码 深入一个应用场景,尝试自己修改模型,提升效果 迈过了上面这道坎后,就可以重新回归理论,提高对自己的要求,某种手推公式,盲写模型,拿到比赛Top等。 第一步:基础原理 机器学习最初入门时对数学的要求不是很高,掌握基础的线性代数,概率论就可以了,正常读下来的理工科大学生以上应该都没问题,可以直接开始学,碰到不清楚的概念再去复习。 统计机器学习部分,建议初学者先看懂线性分类,SVM,树模型和图模型,这里推荐李航的“统计学习方法”,薄的摸起来没有
2021-10-20 20:00:38 17KB
1
Deep text matching 1、前言 Github 上面有很多文本匹配项目,本项目工作主要借鉴了 和 ,模型的代码风格来自前者。另外模型是使用 keras 深度学习框架进行复现的,主要也是使用的前者的复现代码,只是增加了个别模型的复现,也去除了一些我觉得不太重要的模型;另外,由于本项目只是实验层面探索,所以将 matchzoo 源码中一些和模型无关的很多代码进行了删减,同时对部分模型的结构进行了细微的调整,没有完全遵从论文里的设置。 我使用这些模型在2018年蚂蚁金服的文本匹配竞赛数据集(数据集来自text matching 上传,因此数据的预处理代码也使用的该项目的代码)上进行了一些实验,另外我借鉴了 项目的代码测试了几个 bert 系列模型(bert 及其变体)。由于训练集、验证集、测试集中的正负样本比例都是1:1,因此我使用了准确率这一评价指标来衡量了这些模型的性能,结果
2021-10-19 14:55:46 18.35MB Python
1
英文文本相似度/文本推理/文本匹配数据集——STS
2021-10-10 12:10:22 385KB 文本匹配
1
文本匹配的相关模型DSSM,ESIM,ABCNN,BIMPM等,数据集为LCQMC官方数据
2021-09-19 20:55:35 10.25MB Python开发-自然语言处理
1
中文文本相似度/文本推理/文本匹配数据集——Chinese SNLI MultiNli
2021-09-07 10:45:17 19.19MB 文本匹配
1
中文文本相似度/文本推理/文本匹配数据集——OCNLI
2021-09-07 10:41:38 1.57MB 文本匹配
1
Kaggle自然语言处理文本匹配竞赛华人第1名团队PPT-深度学习与特征工程,代码仓库地址在ppt 内
2021-09-02 20:17:22 3.19MB 深度学习 机器学习 NLP 文本匹配
1
NLP基本任务 NLP基础演示:文本分类聚类,情感分析,文本匹配,问答系统 任务1:文本分类新闻标题分类
2021-07-17 00:05:13 32.71MB 系统开源
1
https://github.com/HouJP/kaggle-quora-question-pairs 这里对应的视频
2021-07-15 16:28:41 60.45MB kaggle
1
https://github.com/HouJP/kaggle-quora-question-pairs 这里对应的PPT
2021-07-15 16:26:43 3.43MB kaggle
1