NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
2019-12-21 21:42:47 45.53MB 平行语料库
1
包括电脑端手机端user_agent,手机都是一年内最新的设备信息,因为是用户访问网站的记录,所以里面有重复的 wap:Mozilla/5.0 (Linux; U; Android 5.1.1; zh-CN; FDR-A01w Build/HuaweiMediaPad) AppleWebKit/534.30 (KHTML, like Gecko) Version/4.0 Mobile Safari/534.30 wap:Mozilla/5.0 (iPhone; CPU iPhone OS 11_4_1 like Mac OS X; zh-CN) AppleWebKit/537.51.1 (KHTML, like Gecko) Mobile/15G77 UCBrowser/12.1.7.1109 Mobile AliApp(TUnionSDK/0.1.20.3) wap:Mozilla/5.0 (Linux; U; Android 7.0; zh-cn; HUAWEI CAZ-TL10 Build/HUAWEICAZ-TL10) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/57.0.2987.132 MQQBrowser/8.9 Mobile Safari/537.36 wap:Mozilla/5.0 (Linux; U; Android 5.1.1; zh-CN; FDR-A01w Build/HuaweiMediaPad) AppleWebKit/534.30 (KHTML, like Gecko) Version/4.0 Mobile Safari/534.30 wap:Mozilla/5.0 (Linux; U; Android 5.1.1; zh-CN; FDR-A01w Build/HuaweiMediaPad) AppleWebKit/534.30 (KHTML, like Gecko) Version/4.0 Mobile Safari/534.30 pc:Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.90 Safari/537.36 2345Explorer/9.5.2.18321
2019-12-21 21:31:01 8.17MB user_a 爬虫 python 浏览器头
1
英语音标十万词,csv格式,英式音标数据库,无中文,仅单词和音标,逗号分隔,需要的下吧。为啥描述一定要100个字节-_-!
2019-12-21 21:17:23 2.37MB 英语音标词库
1
NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
2019-12-21 21:01:34 45.53MB 平行语料库
1
这是10万条美团评论,可以用来做一些小型语料库,解析好的,附带评论星级等
2019-12-21 20:49:10 5.3MB 在线评论 美团外卖 10万条
1
提供的原始文件有大约4M左右 涉及1千多天猫用户 几千个天猫品牌 总共10万多条的行为记录 用户4种行为类型 Type 对应代码分别为: 点击:0;购买:1;收藏:2;购物车:3
2019-12-21 20:24:55 4.26MB 天猫 网上商城 交易数据
1
十万词英汉词典词库sqlite数据库,包含单词、读音、释义三列,可以作为小型简易英汉词典的词库资源
2019-12-21 20:17:23 3.69MB 词典 英语 单词 sqlite
1
十万英语词汇读音音标词库JSON格式,格式规范,无特殊符号,标准英式音标,适合制作大型英汉词典读音显示
2019-12-21 20:17:23 2.65MB 英语 词汇 读音 音标
1
中文词库素材词汇量超过10万+语料库,语料库包含200个已分类的语料。是以前做分本分类搜集来的,供从事这方面的朋友学习借鉴
2019-12-21 19:38:19 2.39MB 语料库;词库素材
1
豆瓣爬虫加10万条电影数据集,用户数据集,影评数据集
2019-12-21 19:35:48 40.02MB database set 数据集 电影数据
1