共8400多对中英语句,已预处理,中文用jieba分了词,标点符号没问题,保存于en-zh.csv,分隔符是制表符\t(不是默认逗号)。 句粒度,但有不少长句,裁剪后5w对也够用。 原始数据集也在包中,其中en-zh_News.tmx有一部分句子有问题,(en-zh.csv丢弃了有问题的句子),如果必要建议不要直接使用该文件。 另外附赠我对语料的预处理文件(propressor.py),以及数据集(pytorch的Dataset)等相关的实现(LangData.py)。 如果又可以改善的地方,欢迎留言
2019-12-21 21:44:28 35.14MB 中英平行语料库 语料
1
PCL5为打印机语言,文档详细介绍了各种指令,可实现无驱打印(小部分指令惠普打印机不识别)
2019-12-21 21:44:21 8.88MB PCL5 中英文档 联想
1
NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
2019-12-21 21:42:47 45.53MB 平行语料库
1
高清(非扫描版),完整的GPON标准,包含中、英两套文档。 GPON技术规范984.1中文版.pdf GPON技术规范984.2中文版.pdf GPON技术规范984.3中文版.pdf GPON技术规范984.4中文版.pdf T-REC-G.984.1-200803-I!!PDF-E.pdf T-REC-G.984.2-200303-I!!PDF-C.pdf T-REC-G.984.3-201401-I!!PDF-E.pdf T-REC-G.984.4-200802-I!!PDF-E.pdf T-REC-G.988-201010-I!!PDF-E.pdf
2019-12-21 21:40:00 10.09MB GPON G.984 G.988
1
给我上这个课的老师是我最喜欢的老师了 自己看计算机组成的书(白中英)上面有很多地方容易造成误解 有的地方讲的还不清楚 这个课件绝对是好东西 即使是考研的 看看也颇有益处
2019-12-21 21:35:37 19.1MB 课件 计算机组成 ppt
1
大师Donald E. Knuth(汉名高德纳)的著作,计算机程序设计与艺术第四卷2册:生成所有元组和排列Generating All Tuples and Permutations(中英)
1
计算机组成原理(白中英第五版)完整版课件,从第一章到第八章,进行了细化分解 计算机组成原理(白中英第五版)完整版课件,从第一章到第八章,进行了细化分解
2019-12-21 21:16:59 16.41MB 课件
1
Modern Operating Systems 4th Edition by Andrew S. Tanenbaum (Author), Herbert Bos 包含高清中文扫描版pdf(带完整目录),英文高清原版pdf,课后习题解答(英文)
2019-12-21 21:01:47 173.71MB 操作系统
1
NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
2019-12-21 21:01:34 45.53MB 平行语料库
1
斯坦福大学公开课 《机器学习课程》带中英字幕下载链接
2019-12-21 20:58:36 2KB 机器学习
1