自然语言处理—基本任务.pptx

上传者: u011062044 | 上传时间: 2022-05-16 21:05:32 | 文件大小: 4.96MB | 文件类型: PPTX
自然语言理解 自然语言处理—基本任务 《人工智能应用基础》 CONTENTS 内 容 02 自然语言处理基本任务 《人工智能应用基础》 中文文本分词、文本表示和命名实体识别 中文文本中词与词之间没有明确的分割标记,而是以连续字符串形式呈现。所以,任何中文自然语言处理任务都必须解决中文序列切分的问题——中文分词。 《人工智能应用基础》 中文分词研究成果被应用到自然语言处理的不同任务中,包括信息检索、机器翻译、语音识别、文本错误识别、中文繁简体自动转换、自动问答等。 中文分词模型算法主要经历了三个阶段,分别是基于匹配的词典分词、基于标注的机器学习算法和基于理解的深度学习算法。 最初的中文分词研究人员认为需要先建立词典,再通过匹配的方法进行分词,这种方法称为机械分词。 《人工智能应用基础》 主要研究问题包括:如何构建一个完备的词典;随着词典规模的不断增加,如何优化词典的存储,更易于查找以提升检索效率;匹配算法如何设计;匹配中出现的歧义切分如何消解。 常见的匹配算法包括:正向最大匹配法或正向最长词优先匹配法(Forward Maximum Matching,FMM)、逆向最大匹配法(Rever

文件下载

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明