桥接文本和表格数据以进行跨域文本到SQL的语义解析
这是以下论文的官方代码版本:
Xi Victoria Lin,Richard Socher和Caiming Xiong。 。 EMNLP 2020的发现。
概述
跨域表格语义解析(X-TSP)是在给某个数据库发出自然语言问题的情况下预测可执行结构化查询语言的任务。 在训练期间,该模型可能会或可能不会看到目标数据库。
该库实现
一个强大的基于序列到序列的跨域文本到SQL语义解析器,在两个广泛使用的基准数据集: 和上实现了最先进的性能。
从改编而来的一组用于解析,标记化和验证SQL查询的。
通过修改正式的语言预处理和后处理模块,可以使解析器适合于学习从文本到其他结构化查询语言(例如的映射。
模型
我们的模型将自然语言话语和数据库(模式+字段选择列表)作为输入,并生成SQL查询作为标记序列。 我们应用模式指导的解码和后处理,以确保最终
1