YSDA自然语言处理课程
这是2020年版本。 有关上一年的课程资料,请转到
每周的讲座和研讨会资料位于./week*文件夹中,有关资料和说明,请参阅README.md
YSDA作业的最后期限将在Anytask中列出()。
任何技术问题,想法,课程材料中的错误,贡献想法-添加
安装库和故障排除:。
教学大纲
词嵌入
讲座:单词嵌入。 分布语义。 基于计数的(神经前)方法。 Word2Vec:学习向量。 GloVe:先数一数然后学习。 评价:内在性与外在性。 分析和可解释性。
研讨会:玩单词和句子的嵌入
作业:基于嵌入的机器翻译系统
文字分类
讲座:文本分类:简介和数据集。 通用框架:特征提取器+分类器。 经典方法:朴素贝叶斯,MaxEnt(逻辑回归),SVM。 神经网络:通用视图,卷积模型,递归模型。 实用技巧:数据增强。 分析和可解释性。
研讨会:使用卷积神经网络进行文本分类。
1