回答下列问题:  (1)如何能构建一个系统,以至从非结构化文本中提取结构化数据?  (2)有哪些稳健的方法识别一个文本描述的实体和关系?  (3)哪些语料库适合这项工作,如何使用它们来训练和评估模型?信息有很多种”形状“和”大小“,一个重要的形式是结构化数据:实体和关系的规范和可预测的组织。例如:我们可能对公司和地点之间的关系,可用关系数据库存储。但如果我们尝试从文本中获得相似的信息,事情就比较麻烦了。如何从一段文字中发现一个实体和关系的表呢?然后,利用强大的查询工具,如SQL,这种从文本获取意义的方法被称为“信息提取”信息提取有许多应用,包括商业智能、简历收获、媒体分析、情感检测、专利检索及
1
回答下列问题:   (1)如何能构建一个系统,以至从非结构化文本中提取结构化数据?   (2)有哪些稳健的方法识别一个文本描述的实体和关系?   (3)哪些语料库适合这项工作,如何使用它们来训练和评估模型? 信息有很多种”形状“和”大小“,一个重要的形式是结构化数据:实体和关系的规范和可预测的组织。例如:我们可能对公司和地点之间的关系,可用关系数据库存储。
1