PTT 中文语料 嗨,这里是PTT中文语料集,我透过将每篇文章化简为问答配对,其中问题来自文章的标题,而回覆是该篇文章的推文。可惜的是目前这份资料集的噪声还有点大,若您有更好的方法能提取出文章的问答配对,或发现这份资料集有什么能改进的部份,还请与我联系,也祝各位开发顺利:> 资料说明 资料集一共有两份,您可于或是从本专案的data资料夹里取得。 Gossiping-QA-Dataset.txt 搜集了PTT八卦版于2015年至2017年6月的文章,每一行都是一个问答配对,问与答之间以一个tab ( \t )区隔开,比如说 matlab有什麼炫砲一點的圖? 一樣的圖改一改顏色,有點半透明感覺更唬爛炫 有沒有情人節吃什麼cp值最高的八卦 吃屎啊廢話 免費的一餐 姆咪一個人守得住街亭嗎? 引來一堆肥宅穢土轉生 有機會喔 有沒有被落石砸到該反省的八卦 蔡英文執政就故意誇大報導 東森不意外 情人節
2022-04-02 15:40:15 133.63MB chatbot dialog corpus dataset
1
image_QA_system 2018年级研究生毕业设计,图像问答系统的设计与实现,源代码和学位论文论文2018年4月15日11:31:34
2022-04-01 09:13:46 26KB 系统开源
1
复旦大学博士论文,系统而全面地介绍了基于知识图谱的智能问答相关关键技术 复旦大学博士论文,系统而全面地介绍了基于知识图谱的智能问答相关关键技术
2022-03-29 00:07:25 3.34MB 知识图谱问答
1
swiper.js手机端性格测试问答页面模板 swiper.js手机端性格测试问答页面模板
2022-03-24 17:29:35 230KB swiper 问答页面
1
XGQA:新冠问答系统
2022-03-18 15:00:53 1.32MB 系统开源
1
中文预训练词向量北京师范大学中文信息处理研究所与中国人民大学 DBIIR 实验室的研究者开源的"chinese-word-vectors"。github地址为:https://github.com/Embedding/Chinese-Word-Vectors 此中文预训练词向量为知乎Word + Ngram的词向量
2022-03-18 09:38:10 225.28MB 数据集
1
用于问答类的小游戏的题目与答题,全部为选择题,中间有题目分类。
2022-03-17 20:19:16 5.43MB 题库、题目、
1
问答系统的实现机制多种多样,基于信息检索 (IR: Information Retrieval) 的、基于问答知识库 (KB: Knowledge Base) 的、基于知识图谱 (KG: Knowledge Graph) 的等等,一个相对完善的问答系统往往是多种机制的组合。
2022-03-15 22:38:01 2MB 人工智能 机器学习
1
Spring-Boot-Neo4j-Movies Spring-Boot集成Neo4j结合Spark的朴素贝叶斯分类器实现基于电影知识图谱的智能问答系统 博客地址: 项目博客地址: 升级Spark依赖,由原来的2.3升级到2.4,GitHub官方提醒> = 1.0.0,<= 2.3.2之间的版本容易受到攻击 spark2.4 == >scala2.11 and scala2.12 <!-- https://mvnrepository.com/artifact/org.apache.spark/spark-core --> org.apache.spark spark-core_2.12 2.4.0 <
2022-03-10 19:18:34 1.36MB 附件源码 文章源码
1
本代码实现是基于python实现的基于复旦大学崔万云博士的learing question answering over corpora and konwlege bases ,代码实现与论文有所出入,原因是本实现用的语料是中文做训练数据集,其中命名实体认为论文有太多欠缺,而实体识别是智能问答思想关键。希望更多读者能够有更好的方法。
2022-03-10 18:41:28 56.58MB 知识库 智能问答 python 图谱
1