用于对文本进行实体识别、语义标注的软件和源码的文档。
2023-03-15 22:29:18 283KB 信息抽取 非结构化 中文 分析
1
该指导手册包含对信息抽取对介绍,ANNIE的使用,以及GATE的多种组件。
2023-03-15 22:17:29 1.34MB 信息抽取
1
Chatbot_CN 基于深度学习、强化学习、对话引擎的多场景对话机器人 • • • • • • • • Made by Xu • :globe_with_meridians: 项目说明     Chatbot_CN 是一个基于第三代对话系统的多轮对话机器人项目,旨在于开发一个结合规则系统、深度学习、强化学习、知识图谱、多轮对话策略管理的 聊天机器人,目前随着时间的慢慢发展,从最初的一个 Chatbot_CN 项目,发展成了一个 Chatbot_* 的多个项目。目前已经包含了在多轮任务型对话的场景中,基于话术(Story)、知识图谱(K-G)、端到端对话(E2E)。目的是为了实现一个可以快速切换场景、对话灵活的任务型机器人。 同时,Chatbot_CN 不仅仅是一个对话系统,而是一套针对客服场景下的完整人工智能解决方案。对话是解决方案的核心和最重要一环,但不仅限于对话,还包括智能决策
1
cocoNLP - 中文信息抽取工具包
2023-01-09 12:22:05 560KB 自然语言处理
1
顾客评论信息抽取算法的研究.pdf
2022-07-12 14:08:34 576KB 文档资料
人工智能-机器学习-表格信息抽取引擎的设计与实现.pdf
2022-05-03 17:06:19 1.8MB 人工智能 机器学习 文档资料
ACE_2005完整数据集,包括english,chinese,arabic数据,可用于信息抽取,事件抽取等。-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
2022-04-29 21:06:23 100.56MB ACE 信息抽取 事件抽取 数据集
这是VLDB 2018的best paper,强烈推荐,在快速训练集方面非常有用!
1
LETOR 是一个网页搜索排序数据集,包括搜索关键词和搜索结果数据,可用以评价文档排序算法的效果。
2022-02-06 23:20:10 1.66GB 搜索排序 信息抽取 信息检索
1
CCKS2019-任务5 引言 目前,PDF已成为电子文档发行和数字化信息传播的一个标准,其广泛的学术界的交流以及各类公告的发行。如何从非结构化的PDF文档中抽取结构化数据是知识图谱领域所面临的的一大挑战。此处利用Adobe公司开发的Acrobat DC SDK对PDF进行格式转换,从半结构化的中间文件进行信息转移。引用现有的开源PDF解析方法,Acrobat导出的中间文件保存了更完整在CCKS 2019年公众公司公告评论中,我们的方法获得总成绩第三名。在本次评估中,我们将公告文件(PDF)格式)转换成XML。对于任务一,我们通过查找表标签,获取PDF中所有的表格;然后根据表格的一部分,确定其
2021-12-28 14:36:08 54.12MB flask web-api event-extraction ner
1