文本相似度计算一直是自然语言处理领域研究中的一个基础问题。而文本语义相似度计算则是在文本相似度计算基础上增加了语义分析,在语义层面对文本相似度作进一步的分析研究,具有广阔的应用背景。本文针对句子级别的文本语义相似度计算问题,提出了应用结构化特征和神经网络的方法,并将该方法应用到一个实际的问答系统中,取得了良好的效果。本文深入研究文本语义相似度计算方法,主要研究内容如下:(1)基于结构化表示的文本语义相似度计算方法针对句子级文本相似度计算方法中平面特征表征性弱的问题,本文提出了应用结构化特征来表示句子级文本的句法、语义等信息。在浅层句法树和依存关系树的基础上,获得了基于短语的浅层句法树PST(Phrase-based Shallow Tree)和基于短语的依存树PDT(Phrase-based Dependency Tree)的结构化特征,并与平面特征向量相结合,使用支持向量回归模型进行文本语义相似度计算。实验结果表明,加入PST或PDT特征可以分别使皮尔逊相关系数比基准系统提高0.054和0.041。(2)基于Tree-LSTM的文本语义相似度计算方法为了进一步提高长文本语义相似度计算性能,本文提出应用深度学习方法对长文本进行语义相似度计算研究。首先,设计了适合神经网络模型的新的基于短语的浅层句法树NPST(New PST)和新的基于短语的依存树NPDT(New PDT)结构化。
1
问答系统
2021-03-29 16:05:48 40.17MB nlp 问答系统
1
这个项目的代码基于这个红楼梦项目的 。现在只实现了all_relation.html 所有人物关系页面的部分,代码也比较乱,之后我会慢慢整理这个项目的,试图创建一个知识图谱来教程方便大家学习。 <!--|-index.html 欢迎界面 --> <!--|-search.html 搜索人物关系页面--> <!--|-all_relation.html 所有人物关系页面--> <!--|-KGQA.html 人物关系问答页面--> <!--|-config.py 配置参数--> <!--|-create_graph.py 创建知识图谱,图数据库的建立--> <!--|-query_graph.py 知识图谱的查询--> <!--|-ltp.py 分词、词性标注、命名实体识别--> <!--|- get_*.py
2021-03-24 15:28:28 8.43MB 系统开源
1
质量保证体系 第七届中软杯(智能问答系统) 非常感谢杨大帅比和张小可爱为项目所付出的所有心血,最后一次虽有遗憾却不后悔的中软杯 bilibili视频地址: 实际上整个项目完成度还很欠缺,多个地方因时间原因未完成,或者只是仓促完成,导致某些逻辑很简单,所以效果也不是很好,各位也就当看一个思路就好。 需求介绍 要求: 简略概述要求: 构建一个完整的QA系统 整个系统由三部分构成:前台,后台,合并 前台:请设计一个程序,实现QA对话界面,该界面可以基于用户提问,自动连接后台,并从汇总查找答案,并呈现给用户 后台:请设计一个程序从文档中提取适当的多且质量高的答案对(QA对) 知识库:QA对存储管理的嵌入数据库的东西 项目架构 功能架构划分: 分为用户端和管理员端 用户端:用户端为用户使用的页面。用户端提供了用户提问回答,热点问题,智能推荐,闲聊对话等功能。同时页面简洁美观,响应良好,为用户提供了良
2021-03-21 15:14:36 92.21MB 系统开源
1
包括将json或excel数据存储后存入neo4j,提取用户问题关键字以及识别问题类型,将用户问题转化为neo4j的查询语句,执行neo4j查询语句并拼接成自然语言
2021-03-19 14:04:47 45KB 医药问答系统
1
c#简易问答系统
2021-03-16 13:06:29 16.21MB c# 问答 系统
基于知识的问答 基于知识库的中文问答系统。整体流程如下: 根据背景和问题寻找到最相关的K个知识, K Knowledge+Background+Question构成一个大问题。 正确选项分别与该问题中所有错误选项组合,构成3个答案组合,分别与大问题组合构成3个样例,采用余弦距离计算大问题与正确选项和错误选项的相似度。 正确选项相似度为t_sim,错误选项相似度为f_sim,损失函数为 loss = max(0, margin - t_sim + f_sim) 模型 寻找相关知识:LSI 训练:biLSTM 要求 python3,张量流 stop_words,中文 (a2u6) 资料格式 知识 地球是宇宙中的一颗行星,有自己的运动规律。 地球上的许多自然现象都与地球的运动密切相关。 地球具有适合生命演化和人类发展的条件,因此,它成为人类在宇宙中的唯一家园。 ... 培训与测
2021-03-11 19:07:36 1.82MB 系统开源
1
肝病质量保证体系 基于neo4j知识图谱和规则匹配的肝病问答系统项目介绍详见:基于医疗知识图谱的问答系统源码详解和基于医疗知识图谱的问答实践中遇到的问题
2021-03-11 19:07:34 15.77MB 系统开源
1
有美 智能问答系统演示,word2vec语义匹配 数据 链接: ://pan.baidu.com/s/1KYpyC42pi8xDT19sH02EZw密码:g22n 结果 you:我账号被人盗了 [('账号被盗了',0.859556081969784),('我的号被盗了',0.8302024684697034),('帐号被盗了',0.829032549231153),('账号被盗被怎么办?',0.7960073683134146) ,('账号被盗怎么办?',0.7198214053422787),('号刚才被盗了',0.7108523513577553),('找回被盗账号',0.7011944711921758),('账号给盗了怎么找回',0.6763156222131452 ),('账号忘了',0.6746552683415384),('如何找回被盗账号',0.6667820752109
2021-03-11 19:07:32 26KB 系统开源
1
毕业设计,问答系统,百度知道,有代码,有数据库,有演示。 前台:https://hiszm.blog.csdn.net/article/details/114646436 后台:https://hiszm.blog.csdn.net/article/details/114653216 github https://github.com/hiszm/zhidao 可以直接用于毕业设计
2021-03-11 17:08:16 16.36MB 毕业设计 问答系统 百度知道 有代码
1