目前,问句相似度的计算主要借鉴普通陈述句的相似度计算方法。由于普通陈述句的相似性更多反映的是语句间语义上的匹配符合程度,而衡量问句间的相似性则须同时考虑问句及其答案句之间的相似程度,为此,设计了一种新的问句相似度计算方法。该方法不仅利用问句之间的语义和语法特征考察问句之间的匹配程度,还利用问句的问题类型等信息来间接刻画答案句之间的特征形象,从而以获取问句的深层语义信息,以提高问句相似度计算的准确性。实验验证了该方法的有效性。
1
数据集包含了,问题和相应的答案,可用于组件FAQ语料库,语料的数量在几十万条,比较干净,没有进行分词。
2021-04-18 22:06:15 61.85MB 问答语料 FAQ系统
1
一个支持多语言的,用php技术开发的开源FAQ(问答)系统,类似百度知道,支持多种数据库,phpMyFAQ具有内容管理功能,图片管理,支持多用户、用户组、新闻系统、用户跟踪、语言模块,支持Microsoft Active Directry活动目录。
2021-01-28 01:57:08 7.25MB files_phpmyfaq开源
1
关于FAQ问答系统的设计与实现,包括索引结构、候选问题集的建立。以及相似度算法的实现等
2019-12-21 19:54:08 2.53MB FAQ问答系统
1