CNN LSTM语言模型 从头实现用于语言模型的CNN-LSTM网络。有用的特征从下面的CNN层中提取出来, 然后提供给LSTM层,LSTM层为预测形成一个顺序上下文。
2022-12-02 09:29:39 32.59MB CNN LSTM 语言模型 LSTM网络
COCO LM预训练(WIP) 在Pytorch中实现 ,纠正和对比文本序列以进行语言模型预训练。 他们能够以自我监督的方式进行对比学习,以进行语言模型预训练。 似乎是Electra的坚实后继者。 安装 $ pip install coco-lm-pytorch 用法 使用x-transformers库的示例 $ pip install x-transformers 然后 import torch from torch import nn from x_transformers import TransformerWrapper , Encoder from coco_lm_pytorch import COCO # (1) instantiate the generator and discriminator, making sure that the generator is ro
1
自定义中文语料,约2千万条数据,用于训练kenlm模型,使用地址:https://github.com/yeyupiaoling/PPASR/blob/develop/docs/beam_search.md#%E8%AE%AD%E7%BB%83%E8%87%AA%E5%B7%B1%E7%9A%84%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B
2022-11-17 19:27:15 287.19MB 中文语料 kenlm 语言模型
本程序可以完成对以arpa语言模型文件格式保存的语言模型的建立,性能评估,包括如何计算交叉熵,如何计算困惑度perplexity.
2022-11-04 10:52:40 6KB Speech recog python LM
1
准PR控制离散化m准谐振控制器tustin离散化m语言模型可直接生成C代码进行嵌入式控制 %误差带宽设置 %************************************************************ %** 控制系数初始化 %准谐振控制 %tustin离散化 %系数:
2022-10-17 12:01:50 17KB MATLAB 可移植代码 PR
1
预训练语言模型,可用于文本分类等NLP任务,序列标注任务,情感分析任务,采用业界通用的技术实现,接下游文本分类,序列标注,情感分析等任务,性能良好
2022-10-12 14:57:35 547KB 语言模型
1
用实体信息丰富预训练的语言模型进行关系分类1
2022-08-03 22:00:37 237KB 自然语言处理 语言模型
1
OCR-Corrector 专为OCR设计的纠错器。 未来考虑增加OCR需要的各种NLP工具,包括: 粘连文本分词 命名实体识别 键值对匹配 功能 输入OCR识别结果(文本+单字符置信度),输出修正后的文本。 (单字符置信度:识别网络最后 softmax 输出的概率值,用来进行方便地发现错字。)
2022-07-03 21:08:25 1.64MB 人工智能 OCR 语言模型 深度学习
预训练语言模型已经成为大多数自然语言处理任务的事实范式。这也有利于生物医学领域:来自信息学、医学和计算机科学界的研究人员提出了各种在生物医学数据集上训练的预训练模型,如生物医学文本、电子健康记录、蛋白质和DNA序列,用于各种生物医学任务。
2022-06-01 23:52:26 1.99MB 预训练语言模型 生物医学
1
路径选择行为大数据采集系统建模,朱小栋,,伴随着汽车与日俱增,图形式可变情报板GRIP极大地促进了交通诱导和降低交通堵塞风险。然而,面对GRIP板做出路径选择时,不同的驾驶�
1