孪生LSTM网络(Siamese-LSTM) 本项目是基于孪生LSTM网络+注意力机制+曼哈顿距离(Manhattan distance)实现的句对相似度计算。 中文训练数据为蚂蚁金服句对数据,约4万组,正负样本比例1:3.6;英文训练数据来自Kaggle上的Quora句对数据,约40万组,正负样本比例1:1.7。新增一组翻译数据:使用Google Translator将Quora数据翻译成中文。 资料 参考文献 中国大陆可能无法访问《How to predict...Manhattan LSTM》一文,请直接查看本项目中附件之参考博客 其它数据 英文词向量: 英文词向量: 中文词向量: 工程参考 Original author's GitHub 一些网络设计思路 使用 训练 $ python3 train.py $ type cn for Chinese Data or en for
2023-03-17 22:42:46 40.91MB keras attention manhattan-distance siamese-lstm
1
功能描述 基于siamese-lstm的中文句子相似度计算 环境搭建 Ubuntu:16.04(64bit) Anaconda:2-4.4.0(python 2.7) 历史版本下载: TensorFlow:1.5.1 numpy:1.14.3 gensim:3.4.0 (nltk:3.2.3) jieba:0.39 word2wec中文训练模型 参考链接: 代码使用 模型训练 # python train.py 模型评估 # python eval.py 论文参考 代码参考 版本:a61f07f6bef76665f8ba2df12f34b25380016613 AETC2018赛题描述 相关链接:
2022-03-31 17:55:17 33.67MB Python
1
释义张量流 Tensorflow(1.1.0)中实现了多种用于复述的模型和代码。 我非常小心地记录了代码,并解释了整个模型中各个步骤的操作。 希望对于那些想开始使用Tensorflow的人来说,这将是一个教学示例代码! 到目前为止,此仓库已实现: 基本的暹罗LSTM基准,大致基于的模型 如所述,带有附加“匹配层”的Siamese LSTM模型 。 的或多或少的最新的双边多视角匹配模型 。 欢迎添加更多模型/优化或修补现有模型的公关! 模型代码的大部分位于 很多数据处理代码都来自受其启发,如果您喜欢此项目的结构,请检查一下它们! 安装 该项目是在Python 3.5中开发
2021-06-30 21:38:50 91KB nlp machine-learning deep-learning tensorflow
1
分享一份孪生网络数据集,供初学者使用 内含已经切分好的训练集、验证集和测试集 格式为: q1,q2,tag
2021-03-03 21:04:09 1.65MB 孪生网络 数据集 Siamese-LSTM
1