搜索【语料训练】的结果

复旦中文语料（自然语言处理语料）（训练集）

来源：复旦大学计算机信息与技术系国际数据库中心自然语言处理小组；由复旦大学李荣陆提供；test_corpus.rar为测试语料，train_corpus.rar为训练语料，传的时候没注意（传错了也不知道咋删），完整版我重新另外上传了

2025-05-27 11:11:39 94.28MB 中文语料 复旦语料 train_corpus test_corpus

1

利用wikipedia语料训练word2vec代码

利用wikipedia语料训练word2vec代码，中英文都可，语料自行下载

2022-11-16 00:13:59 5KB word2vec

1

中英文语料训练CBOW模型获得词向量（pytorch实现）

自然语言处理第二次作业： data文件夹中存储语料（中文语料以及英文语料由老师提供，另一份为中文停用词语料） output文件夹中存储输出的词向量文件 script文件夹中为CBOW的脚本，同时处理中文语料与英文语料运行步骤：在脚本中确定训练中文或者是英语后，直接运行即可

2022-05-11 10:42:22 13.58MB nlp pytorch cbow 词向量

1

chatbot：一个可以自己进行训练的中文聊天机器人，根据自己的语料训练出自己想要的聊天机器人，可以用于智能客服，在线问答，智能聊天等场景。目前包含seq2seq，seqGAN版本，tf2.0版本，火炬版本-源码

聊天机器人一个可以使用自己的语言料进行训练的中文聊天机器人，目前包含seq2seq tf1.x和tf.2x版本，seqGan版本为tf1.x版本，pytorch版本，欢迎大家实践交流。关于语料的说明大家可以使用小黄鸡的预料，地址 seq2seq版本代码执行顺序 1，在下载好代码和语料之后，将语料文件放入数据目录下。 2，准备数据预处理器（data_utls.py）-> execute.py（执行器）-> app.py（可视化对话模块）的顺序执行就可以了。 3，超参配置在seq2seq.ini和seq2seq_sever.ini文件中配置。 seqGAN版本代码执行顺序 1，在下载好代

2022-03-08 08:30:31 28.28MB python ai chatbot pytorch

1

WikiExtractor.py

WikiExtractor.py 中文维基语料训练获取工具之一

2022-01-11 09:07:34 120KB python 中文维基语料训练获取工具 WikiExtractor.py WikiExtractor

1

NLP文本分类语料库（复旦）语料训练集

2021-12-06 10:12:26 52.56MB NLP 文本 分类语料库 训练集

1

50W聊天语料训练数据.zip

50万条中文闲聊对话高质量语料，最新整理，包括很多热门语句和流行词汇。适用于NLP（自然语言处理）进行对话学习训练，可用于聊天机器人研究和开发。

2021-09-27 10:19:15 29.18MB NLP 语料聊天 机器学习

1

snet1.txt 对话机器人训练语料、机器学习、自然语言处理用

对话机器人训练语料、机器学习、自然语言处理用

2021-09-24 15:06:06 314KB 对话机器人语料 nlp 机器学习 语料训练

1

Kaldi中aishell语料训练结果（kaldi_aishell_exp.txt）

包含mono、tri1、tri2、tri3a、tri4a、tri5a已训练好的mdl、fst等文件，不包含dnn训练结果

2021-07-22 22:06:56 76B kaldi aishell 语音识别 语音模型

1

wiki.zh.bin

Wiki中文语料2020年版，经过opencc繁简转换，jieba分词，训练出的词向量模型，维度为20。。。。。。。。。。。。。。

2021-07-13 19:58:29 259.9MB wiki中文语料 训练出的bin模型

1

个人信息

热门下载

最新下载

其他资源