WikiText 长期依赖语言建模数据集包含 1 亿个英文词汇,其来自于 Wikipedia 优质文章和标杆文章。 该数据集分为 WikiText-2 和 WikiText-103 两个版本,其相较于 PTB 词库规模更为庞大,并且每个词汇还保留相关的原始文章,这适用于需要长时依赖自然语言建模的场景。 该数据集由 Salesforce Research 于 2016 年发布,主要发布人为 Stephen Merity、Caiming Xiong、James Bradbury 和 Richard Socher,相关论文有《Pointer Sentinel Mixture Models》。
2022-07-13 16:05:06 373.28MB 数据集
saber学习,关于MAST建模的PPT,希望有帮助
2022-03-09 21:56:04 280KB MAST
1
本书是针对R语言的一本教材,主要针对本科生和研究生,重点放在R语言的原理解释和模型建立上。
2022-01-11 14:20:08 27.81MB R语言
1
使用LSTM aka语言建模进行句子预测 LSTM文字按字生成。 用于根据输入的单词或句子生成多个句子建议。 有关项目详细信息的更多信息,请参见与此项目相关联的。 响应:仅生成1个私钥,即生成描述的单词数 Input: hydrant requires repair Output: hydrant requires repair is not working Input: describe the problem Output: describe the problem please attend to Input: door and window Output: door and window in the kitchen is not working in the Input: machine is leaking Output: machine is leaking and need
2021-12-06 14:57:31 41.05MB Python
1
如题,接着传第三部分,王斌会_多元统计分析及R语言建模.part3
2021-10-26 18:22:35 15.88MB 王斌会 R语言建模 part3
1
接着上传,王斌会_多元统计分析及R语言建模.part2
2021-10-26 17:38:10 39.06MB 王斌会 R语言建模
1
很高兴之前上传的本书数据大家这么喜欢,看到大家都对R这么感兴趣,文件太大,分三次上传,王斌会_多元统计分析及R语言建模.part1,另两份文件是,王斌会_多元统计分析及R语言建模.part2,王斌会_多元统计分析及R语言建模.part3,只收一分作为辛苦分,希望本书对大家有帮助
2021-10-26 17:35:37 39.06MB 王斌会 R语言建模 第一版 part1
1
music_rnn, 基于递归神经网络的音乐语言建模 概述一个在MIDI文件数据集上训练LSTM递归神经网络的项目。 可以在 writeup上找到关于这个项目或者最终报告的更多信息。 警告:这个代码库的某些部分未完成。 依赖项python 2.7AnacondaNumpy ( ht
2021-10-11 15:29:29 38.34MB 开源
1
简单的变形金刚 该库基于HuggingFace的库。 使用简单的Transformers,您可以快速训练和评估Transformer模型。 初始化模型,训练模型和评估模型仅需要三行代码。 技术支持 序列分类 代币分类(NER) 问题回答 语言模型微调 语言模型训练 语言生成 T5型号 Seq2Seq任务 多模态分类 对话式AI。 文本表示生成。 目录 设置 与conda 从安装Anaconda或Miniconda Package Manager 创建一个新的虚拟环境并安装软件包。 conda create -n st python pandas tqdm conda activate st如果使用cuda: conda install pytorch>=1.6 cudatoolkit=11.0 -c pytorch否则: conda install pytorch cpuonly
1
基于UML语言建模的网络安全体系的建模分析研究.pdf