中文预训练词向量北京师范大学中文信息处理研究所与中国人民大学 DBIIR 实验室的研究者开源的"chinese-word-vectors"。github地址为:https://github.com/Embedding/Chinese-Word-Vectors 此中文预训练词向量为知乎Word + Ngram的词向量
2022-03-18 09:38:10 225.28MB 数据集
1
用于问答类的小游戏的题目与答题,全部为选择题,中间有题目分类。
2022-03-17 20:19:16 5.43MB 题库、题目、
1
问答系统的实现机制多种多样,基于信息检索 (IR: Information Retrieval) 的、基于问答知识库 (KB: Knowledge Base) 的、基于知识图谱 (KG: Knowledge Graph) 的等等,一个相对完善的问答系统往往是多种机制的组合。
2022-03-15 22:38:01 2MB 人工智能 机器学习
1
Spring-Boot-Neo4j-Movies Spring-Boot集成Neo4j结合Spark的朴素贝叶斯分类器实现基于电影知识图谱的智能问答系统 博客地址: 项目博客地址: 升级Spark依赖,由原来的2.3升级到2.4,GitHub官方提醒> = 1.0.0,<= 2.3.2之间的版本容易受到攻击 spark2.4 == >scala2.11 and scala2.12 <!-- https://mvnrepository.com/artifact/org.apache.spark/spark-core --> org.apache.spark spark-core_2.12 2.4.0 <
2022-03-10 19:18:34 1.36MB 附件源码 文章源码
1
本代码实现是基于python实现的基于复旦大学崔万云博士的learing question answering over corpora and konwlege bases ,代码实现与论文有所出入,原因是本实现用的语料是中文做训练数据集,其中命名实体认为论文有太多欠缺,而实体识别是智能问答思想关键。希望更多读者能够有更好的方法。
2022-03-10 18:41:28 56.58MB 知识库 智能问答 python 图谱
1
一个简单的KBQA 一个简单的基于知识图谱的问答系统 数据集:数据集为2019年语言智能大赛的关系撤除数据集 实体识别模型:利用Transformer模型进行实体识别(以后会变更为bert) 事实识别:自己构造了几十条数据,利用逻辑回归进行预测 关系类型:包含'主演','作者','歌手','出生日期','导演','出生地','出版社','成立日期','连载网站','国籍','毕业院校”,“民族”,“所属专辑”,“目”,“作曲”等15中关系类型 实体类型:包含'影视作品','书籍','歌曲','人物','企业','网络小说','生物'7种实体类型
2022-03-10 14:51:16 130KB 系统开源
1
周杰伦 总共有的内部内容本身并不全面,但是麻雀虽小,五脏俱全,该项目对多种类型的问题形式都能得到正确的相应结果。以“晴天”为例,本系统适当能够回答晴天的歌词是什么,晴天是哪首专辑的歌曲,该专辑是哪一年发行的,该专辑对应的歌手是谁,该歌手的的基本信息是什么。关于项目的更多细节在知乎中有更详细的介绍,知乎网址: : 首先,本系统运行在python3环境下,并需要安装jieba,rerfo等python库,安装方式比较简单,我这里使用pip作为python的包管理工具,直接在cmd中运行pip3 install jieba即可完成安装。本系统在apache-jena-fuseki服务器上,在cmd窗口中输入apache-jena-fuseki文件输入命令。/fuseki-server.bat或在文件夹下双击fuseki-server.bat文件,cmd窗口出现“服务器信息开始于端口3030的
2022-03-10 14:46:44 324KB 系统开源
1
Dense Passage Retriever - 是一套用于开放领域问答任务的工具和模型Q&A Dense Passage Retriever Dense Passage Retriever - 是一组用于开放域问答任务的工具和模型。 它基于这项研究工作,并为多个问答数据集提供了最先进的结果。 特征密集检索器模型基于双编码器架构。 受本文启发的抽取式问答读者和排名者联合模型。 相关数据预处理和后处理工具。 推理时间逻辑的密集检索器组件基于 FAISS 索引。 安装 从源头安装。 推荐使用 Python 的虚拟或 Conda 环境。 git clone git@github.com:fairinternal/DPR.git cd DPR pip install 。 DPR 在 Python 3.6+ 和 PyTorch 1.2.0+ 上进行了测试。 DPR 依赖第三方库来实现编码器代码。 目前支持 Huggingface BERT、Pytext BERT 和 Fairseq RoBERTa 编码器模型。 由于标记化过程的普遍性,DPR 目前使用 Hugging
2022-03-10 10:49:05 95KB 自然语言处理
1
《Windows程序调试》完整书签版+在线笔记心得问答交流.rar
2022-03-09 22:32:00 11.68MB Windows程序调试
1
聊天机器人 一个可以使用自己的语言料进行训练的中文聊天机器人,目前包含seq2seq tf1.x和tf.2x版本,seqGan版本为tf1.x版本,pytorch版本,欢迎大家实践交流。 关于语料的说明 大家可以使用小黄鸡的预料,地址 seq2seq版本代码执行顺序 1,在下载好代码和语料之后,将语料文件放入数据目录下。 2,准备数据预处理器(data_utls.py)-> execute.py(执行器)-> app.py(可视化对话模块)的顺序执行就可以了。 3,超参配置在seq2seq.ini和seq2seq_sever.ini文件中配置。 seqGAN版本代码执行顺序 1,在下载好代
2022-03-08 08:30:31 28.28MB python ai chatbot pytorch
1