Learning Question Answering over QA Corpora and Knowledge Base
2021-08-20 09:19:55 1.23MB 知识图谱
1. Abstract 问题的提出在于计数类问题在很多模型上表现性能不佳,作者分析出现这类问题是源于软注意力机制 (Soft-Attention),进而提出了一个计数模块 2. Problems with Soft Attention 在 VQA 领域中,造成计数类问题表现不佳的原因主要有:(1) Soft-Attention 的广泛运用,(2) 区别于标准的计数问题,对于 VQA 来说,没有明确的标签标定需要计数对象的位置,(3) VQA 系统的复杂性,表现在不仅要处理计数类问题,同时还要兼顾其他复杂的问题,(4) 真实场景中,对某个对象区域可能存在多次重叠采样。 截至目前,即使是 Hard
2021-08-06 20:51:51 887KB al ar c
1
A2 Key 2020 sample tests Reading and Writing - question paper+answer key.pdf
2021-07-14 15:02:12 1.37MB A2Key2020samp
A2 Key for Schools 2020 sample tests Listening - question paper
2021-07-09 18:02:55 712KB A2KeyforSchoo
A2 Key 2020 sample tests Reading and Writing - question paper
2021-07-09 18:02:49 1.19MB A2Key2020samp
This sample test is for CSSBB exam taker.
2021-07-08 20:58:02 266KB CSSBB SIX SIGMA
1
开源QG系统(Question Generation,问题生成) 当前实验结果不理想,但确实是按照标准变压器实现的,有兴趣的大佬拿来做baseline的话提升空间应该会很大(手动滑稽)作者目前在做别的QG研究,暂时无暇继续完善该项目,有兴趣的大佬可以直接叉,也欢迎在issue区留言或者直接找到作者的联系方式 系统基本介绍 使用Python版本:Python3.6(其中模型评估部分脚本基于Python2.7)使用深度学习框架:Pytorch0.4.1使用模型结构:变压器使用数据集:SQuAD(可扩展到其他QG数据集) 代码运行方式: ./pipeline.sh [指定运行模式] [指定GPU] 指定运行模式包括: 0:安装依赖包1:加载数据集2:数据预处理3:模型训练4:模型测试5:模型评估6:测试演示 可以同时指定多个运行模式,例如希望顺序执行“ 3:模型训练”和“ 4:模型测试”阶
2021-07-08 19:48:23 6.18MB 系统开源
1
美国知识问答网站 Quora 上的问题答案数据集,可用以进行重复问题检测。
2021-07-05 13:06:12 20.36MB 自然语言理解 NLP 问题答案匹配
1
释义张量流 Tensorflow(1.1.0)中实现了多种用于复述的模型和代码。 我非常小心地记录了代码,并解释了整个模型中各个步骤的操作。 希望对于那些想开始使用Tensorflow的人来说,这将是一个教学示例代码! 到目前为止,此仓库已实现: 基本的暹罗LSTM基准,大致基于的模型 如所述,带有附加“匹配层”的Siamese LSTM模型 。 的或多或少的最新的双边多视角匹配模型 。 欢迎添加更多模型/优化或修补现有模型的公关! 模型代码的大部分位于 很多数据处理代码都来自受其启发,如果您喜欢此项目的结构,请检查一下它们! 安装 该项目是在Python 3.5中开发
2021-06-30 21:38:50 91KB nlp machine-learning deep-learning tensorflow
1
“万创杯”中医药天池大数据竞赛——中医文献问题生成挑战 决赛 第一名方案 wodejiafeiyu|nano- nano- 康一帅 简介 环境 Tensorflow == 1.14.0 Keras == 2.3.1 bert4keras == 0.8.8 文件说明 EDA:用于探索性数据分析。 code/train.py:用于模型的训练。 code/infer.py:用于模型的推断(预测)。 code/utils.py:工具函数。 data:数据目录。 赛题背景分析及理解 赛题是中医药领域的问题生成挑战,而问题生成属于NLG中重要的一种应用。 问题生成任务需要我们根据篇章及对应的答案自动生成相应的问题,即“篇章+答案→问题”这样的流程。 训练集由三个字段(篇章、问题、答案)构成,测试集由两个字段(篇章、答案)构成,其中的问题字段需要我们生成。 根据以上分析,我们可以采用Seq2Seq
2021-06-24 20:03:44 10.89MB JupyterNotebook
1