新冠疫情相似句对判定大赛线上第一名方案 pku吴彦祖队朱政烨 赛题分析 赛题背景 如何通过自然语言技术将问答进行相似分类仍然是一个替代的问题。如识别患者相似性问题,有利于理解患者真正诉求,帮助快速匹配正确答案,提升患者获得感;归纳医生相似答案,有助于分析答案规范性,保证疫情期间问诊规范性,避免误诊。 任务目标 比赛整理近万条真实语境下疫情相关的患者提问句对,要求选手通过自然语言处理技术识别相似的患者问题。 数据示例 查询1 查询2 标签 每晚运动后咯血,是怎么了? 每晚运动后咯血是什么原因? 1个 每晚运动后咯血,是怎么了? 每晚运动后为什么会咯血? 1个 每晚运动后咯血,是怎么了?
2022-04-19 18:06:57 1.7MB nlp NaturallanguageprocessingPython
1
句子的分类非常具有挑战性,因为句子包含的上下文信息有限。 在本文中,我们提出了一种用于句子分类的注意力门控卷积神经网络(AGCNN),该方法通过使用专用的卷积编码器从不同大小的特征上下文窗口中生成注意权重。 它充分利用有限的上下文信息来提取和增强重要特征在预测句子类别中的影响。 实验结果表明,我们的模型可比标准CNN模型提高3.1%的精度,并且在六项任务中的四项上均能获得超过基准的竞争性结果。 此外,我们设计了一个激活函数,即自然对数重定比例的整流线性单位(NLReLU)。 实验表明,NLReLU的性能优于ReLU,可与AGCNN上的其他知名激活功能相媲美。
2022-02-25 18:44:22 128KB Sentence classification convolutional neural
1
sentence-tagger:构造概率图(例如单词标签对出现的概率,标签和先前的标签对出现的概率等)。根据这些标签出现的可能性来标记句子。执行Witten Bell平滑以计算句子的概率和困惑度
2021-12-21 18:18:27 5KB Python
1
实现中英文句子切分算法。实现中英文句子切分算法。实现中英文句子切分算法。实现中英文句子切分算法。实现中英文句子切分算法。
2021-12-06 20:46:19 700KB sentence segment token 分句
1
使用LSTM aka语言建模进行句子预测 LSTM文字按字生成。 用于根据输入的单词或句子生成多个句子建议。 有关项目详细信息的更多信息,请参见与此项目相关联的。 响应:仅生成1个私钥,即生成描述的单词数 Input: hydrant requires repair Output: hydrant requires repair is not working Input: describe the problem Output: describe the problem please attend to Input: door and window Output: door and window in the kitchen is not working in the Input: machine is leaking Output: machine is leaking and need
2021-12-06 14:57:31 41.05MB Python
1
《Convolutional neural networks for sentence classification》原文及翻译
2021-11-24 22:07:56 982KB NLP 期刊阅读
1
中文问句分类数据集,可用于训练中文问句分类和句向量抽取等任务。
1
A Structured Self-attentive Sentence Embedding
2021-09-02 09:13:32 3.53MB gc nlp
1
Universal Sentence Encoder句子模型离线
2021-08-18 13:24:15 904.54MB python
1
Test of Essential Academic Skills - Sentence Correction认证考试题库(TEAS-SC)