1.项目利用TF-IDF(Term Frequency-Inverse Document Frequency 词频-逆文档频率)检索模型和CNN(卷积神经网络)精排模型构建了一个聊天机器人,旨在实现一个能够进行日常对话和情感陪伴的聊天机器人。
2.项目运行环境:Python环境、TensorFlow 环境和Python包jieba、tqdm、nltk、pyqt5等。
3.项目包括4个模块:数据预处理、模型创建与编译、模型训练及保存、模型生成。数据来源于GitHub开源语料集,下 载地址为: https://github.com/codemayq。在TF-IDF模型中定义的架构为:计算TF-IDF向量,通过倒排表的方式找到与当前输入类似的问题描述,针对候选问题进行余弦相似度计算。模型生成一是通过中控模块调用召回和精排模型;二是通过训练好的召回和精排模型进行语义分类,并且获取输出。
4.准确率评估:测试准确率在90%左右。
5.项目博客:https://blog.csdn.net/qq_31136513/article/details/131540115
1