matlab代码左移神经机器翻译(seq2seq)教程 作者:Thang Luong,Eugene Brevdo,赵瑞 此版本的教程要求 介绍 序列到序列(seq2seq)模型(,)在各种任务(例如机器翻译,语音识别和文本摘要)中都取得了巨大的成功。 本教程为读者提供了对seq2seq模型的全面理解,并展示了如何从头开始构建具有竞争力的seq2seq模型。 我们专注于神经机器翻译(NMT)的任务,这是带有wild的seq2seq模型的第一个测试平台。 所包含的代码轻巧,高质量,可立即投入生产,并结合了最新的研究思路。 我们通过以下方式实现这一目标: 使用最新的解码器/注意包装器,TensorFlow 1.2数据迭代器 结合我们在构建递归模型和seq2seq模型方面的专业知识 提供有关构建最佳NMT模型和复制的提示和技巧。 我们认为,提供人们可以轻松复制的基准非常重要。 因此,我们提供了完整的实验结果,并在以下公开可用的数据集上对模型进行了预训练: 小型:由ET提供的TED演讲的英语-越南语平行语料库(133K句子对)。 大型:由所提供的德英平行语料库(450万个句子对)。 我们首先建立
2021-10-12 14:43:50 651KB 系统开源
1
PyTorch实现基于Transformer的神经机器翻译
2021-10-11 12:03:41 468KB Python PyTorch Transformer 神经机器翻译
PyTorch实现基于Transformer的神经机器翻译
2021-10-10 18:38:13 468KB Python开发-机器学习
1
国内外机器翻译比较研究-基于百度和谷歌在线翻译调查.zip
2021-10-06 13:03:22 2KB
机器翻译词对齐的 Python 实现。 以 'python .py > ' 运行选项:-n num_lines 从输入文件中获取更少的行 -d 获取非默认文件,例如:sample ibm1.py:实施 IBM 模型 1 ibm2.py:实施 IBM 模型 2 hmm.py:实施 HMM 模型进行字对齐 fastAlign.py:实施快速对齐方法,但使用固定的 lambda 参数 alignIntersect.py:使用基于交集的对齐方式Dice 的系数 modelAgreement.py:为 IBM Model2 实现基于交集的对齐 带有 .a 扩展名的相应名称的文件是从这些模型中获得的前 1000 个句子的对齐,这些模型在英语和法语的完整 hansards 数据上进行训练。 它们可以与分数对齐一起运行以进行 AER 评估。 t_
2021-09-30 15:13:54 6.68MB Fortran
1
OpenNMT: 开源神经机器翻译系统OpenNMT的Pytorch一个移植
2021-09-25 22:26:27 33.9MB Python开发-机器学习
1
神经机器翻译模型,用于将阿塞拜疆语翻译成英语。 在这个项目中,我发现了如何开发一种神经机器翻译系统来将阿塞拜疆语翻译成英语。 我使用阿塞拜疆语到英语术语的数据集作为语言学习卡片的基础。 该数据集可从ManyThings.org网站获得,其示例摘自Tatoeba项目。 清除文本数据后,就可以进行建模和定义了。 我已经在这个问题上使用了编解码器LSTM模型。 在这种架构中,输入序列由称为编码器的前端模型编码,然后由称为解码器的后端模型逐字解码。 使用有效的Adam方法对模型进行训练,以实现随机梯度下降,并最大程度地减少了分类损失函数,因为我们将预测问题构造为多类分类。 还创建了模型图,为模型配置提供了另一个视角。 接下来,对模型进行训练。 在现代CPU硬件上,每个时期大约需要30秒。 无需GPU。 然后,我们可以对数据集中的每个源短语重复此操作,并将预测结果与英语中的预期目标短语进行比
2021-09-25 21:42:45 1.55MB tensorflow neural-machine-translation Python
1
PyOpenNMT:开源神经机器翻译 这是端口, 是一种开源(MIT)神经机器翻译系统。 完整文档可。 该代码仍在大量开发中(0.1版之前的版本)。 如果您需要稳定的版本,我们建议分叉。 特征 实现了以下OpenNMT功能: 注意和辍学的多层双向RNN 数据预处理 从检查点保存和加载 批处理和波束搜索进行推理(翻译) 多GPU Beta功能: 上下文门 多种源和目标RNN(lstm / gru)类型和注意力(dotprod / mlp)类型 图像到文本处理 源词功能 “注意是您所需要的” TensorBoard /蜡笔记录 复制,覆盖和结构化关注 快速开始 步骤1:预处理数据 python preprocess.py -train_src data/src-train.txt -train_tgt data/tgt-train.txt -valid_src data/src-
2021-09-25 21:09:48 7.28MB Python
1
机器学习、机器翻译训练语料 、未处理、获取前两列对话即可
2021-09-24 15:06:06 3.59MB 机器翻译训练语料 机器学习
1