机器学习
MATE-ML是A M ethod对于A utomaticŤERMËxtraction基于M achine大号收入。
该方法将术语提取视为分类任务,因为提取的目的可以看作是将候选分类为术语或非术语。 下图显示了 MATE-ML 的四个步骤,它们是完全自动化的,并允许根据将使用提取的术语的应用程序调整它们。
输入:语料库、通用语言语料库(可选)、外部知识(对应标注词)。
Text preprocessing:清理和标准化输入数据,识别 POS(词性),去除停用词等。
Feature extraction:计算描述输入语料库单词的语言、统计和混合特征。
Filter application:应用特征和属性(词)选择。
Classification of the candidate terms:应用归纳或转导分类算法来识别词。
输出:提取的术语列表。
注意:当前版本实现
2021-10-20 00:53:40
5.85MB
Java
1