本文基于Perceptron算法的过渡方法,对现代哈萨克语阿拉伯文字的句法分析进行了研究。 传统的哈萨克语语法分析技术通常对单个任务(例如词性(POS),块和句法分析)进行分层和顺序分析,并通过其本地状态最佳模型独立地分析每个任务。 本文介绍了一种使用感知器模型进行训练的哈萨克解析系统,并使用Beam-Search算法进行解析的平移归约法进行解码。 我们使用平均感知器代替传统感知器模型来解决过度拟合的问题。 由于联合模型的搜索空间是每个任务的搜索空间的乘积,即固定列值B与动态列值的乘积,因此改进了Beam-Search解码算法,提高了搜索空间的准确性。 另外,设计奖励函数以减少波束搜索解码算法在搜索时修剪掉最佳结果的风险,从而提高结果的准确性。 由于语法分析是哈萨克语言处理的重要组成部分,因此它们是语义分析,机器翻译以及哈萨克语言中许多其他应用程序的基础任务。
2021-03-10 18:55:48 128KB Transition-Based parsing; Perceptron Algorithm
1