一个较小的机器翻译数据集,在不含GPU的情况下也可进行训练,适合NLP的初学者
2021-03-09 10:09:36 1023KB 人工智能 NLP 数据集 cmn-eng
1
EasyNMT-易于使用的最新神经机器翻译 该软件包提供了易于使用的最新机器翻译,可用于100多种语言。 该软件包的重点是: 易于安装和使用:3行代码使用最新的机器翻译 自动下载经过预训练的机器翻译模型 超过150种语言的翻译 自动检测170多种语言 句子和文件翻译 多GPU和多进程转换 目前,我们提供以下模型: 来自-NLP的 ,支持1200多种翻译方向,支持150多种语言。 来自 ,支持50多种语言的任意方向之间的翻译。 来自 ,支持100多种语言在任何方向之间的翻译。 例子: 安装 您可以通过以下方式安装软件包: pip install -U easynmt 这些模型基于PyTorch 。 如果您有可用的GPU,请参阅如何安装 。 如果您使用Windows并在安装过程中,请参阅如何解决。 用法 用法很简单: from easynmt import EasyNMT mod
2021-03-06 11:04:28 85KB Python
1
中文英文的平行语料,来源于niutrans语料,总共20万句(中文10万英文10万),该语料可用于机器翻译等的训练。
2021-02-17 15:29:33 7.84MB 机器翻译
1
北京大学常宝宝老师-计算机语言学 讲义 词语切分 数据平滑 语言模型 词类自动标注 句法分析
2021-02-10 16:53:46 4.36MB NLP;机器翻译
1
Bob 截图翻译.app.zip
2021-02-06 18:01:07 7.07MB 机器翻译
1
一步步教你如何搭建机器翻译系统,包括: 1. 机器翻译现状 4 1.1 什么是机器翻译? 4 1.2 相关论文 7 1.3 相关会议 8 1.4 相关工具 8 2. NMT系统搭建指导 9 2.1 获取数据 9 2.2 数据预处理 10 2.3 模型训练 12 2.4 模型的解码及bleu计算 13 3. 系统的优化 15 3.1 模型的ensemble 15 3.2 定制化领域微调 15 3.3 迁移学习 15 4. 翻译引擎的部署 16 4.1 翻译系统概述 16 4.2 基于Tensor2tensor的引擎部署 16 4.3 简单系统搭建 17 4.4 多个模型共同部署的方案 18 5. 机器翻译进阶 19 5.1 爬虫技术 19 5.2 数据清洗 19 5.3 数据增强 20 5.4 翻译质量评估 21 6. 常用框架概述 22 6.1 Tensor2tensor 22 6.2 Nematus 29 6.3 Marian 29 6.4 其他框架 30 7. 其他 30 7.1 Bleu原理 30 7.2 BPE原理 30
2020-01-03 11:18:22 2.05MB 机器翻译 人工智能 t2t
1
Yang Liu Associate Professor Department of Computer Science and Technology Tsinghua University Bio Yang Liu is a tenured associate professor at the Department of Computer Science and Technology, Tsinghua University. He received his PhD degree from the Chinese Academy of Sciences Institute of Computing Technology in 2007. His research focuses on natural language processing and machine translation. He has published over 60 papers in leading NLP/AI journals and conferences such as Computational Linguistics, ACL, AAAI, EMNLP, and COLING. He was the recipient of ACL 2017 Outstanding Paper, COLING/ACL 2006 Meritorious Asian NLP Paper Award and the National Science and Technology Progress Award second prize. He served as Executive Committee Member of Asia-Pacific Chapter of ACL, Editorial Board Member of Computational Linguistics, Associate Editor of ACM TALLIP, ACL 2014 tutorial co-chair, ACL 2015 local arrangement co-chair, IJCAI 2016 senior PC, ACL 2017/2018 area co-chairs, EMNLP 2016/2018 area co-chairs, and SIGHAN information officer.
2019-12-21 22:17:17 7.85MB 机器翻译
1
讨论了基础知识、核心方法和前沿研等三个方面的内容,包括参数训练方法、语言模型和参数平滑方法、解码算法和译文自动评测方法及系统整合方法等。
2019-12-21 22:10:49 5.39MB 自然语言处理
1
手工调整过的华尔街日报的双语对齐资源,约8500句,已手工对齐。适合机器翻译做数据集
1
采用深度神经网络来实现机器翻译功能 用python代码实现
2019-12-21 21:48:23 654KB 机器翻译 深度学习 python
1