只为小站
首页
域名查询
文件下载
登录
pypi_
kenlm
-0.1.20210121-cp39-cp39-win_amd64.whl
无需复杂的配置过程,一键安装pypi_
kenlm
,适用于Python3.9
2025-07-10 18:19:03
205KB
pypi_kenlm_py39
1
pypi_
kenlm
-0.1.20210121-cp38-cp38-win_amd64.whl
无需复杂的配置过程,一键安装pypi_
kenlm
,适用于Python3.8
2025-04-15 22:30:36
204KB
pypi_kenlm_py38
1
pypi_
kenlm
-0.1.20210121-cp37-cp37m-win_amd64.whl
无需复杂的配置过程,一键安装pypi_
kenlm
,适用于Python3.7
2024-06-02 10:40:35
203KB
pypi_kenlm_py37
1
Kenlm
、ConvSeq2Seq等多种模型的文本纠错,并在SigHAN数据集评估各模型的效果,开箱即用
实现了
Kenlm
、ConvSeq2Seq、BERT、MacBERT、ELECTRA、ERNIE、Transformer等多种模型的文本纠错,并在SigHAN数据集评估各模型的效果,开箱即用
2023-10-13 18:19:05
13.26MB
数据集
自定义中文语料约2千万条数据
自定义中文语料,约2千万条数据,用于训练
kenlm
模型,使用地址:https://github.com/yeyupiaoling/PPASR/blob/develop/docs/beam_search.md#%E8%AE%AD%E7%BB%83%E8%87%AA%E5%B7%B1%E7%9A%84%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B
2022-11-17 19:27:15
287.19MB
中文语料
kenlm
语言模型
安装
kenlm
kenlm
的安装
2021-12-21 09:13:54
354KB
简单
1
kenlm
_20200110.rar
统计语言模型工具有比较多的选择,目前使用比较好的有srilm及
kenlm
,其中
kenlm
训练速度也更快,号称单机版训练超级快,支持大规模的语料训练,文件的输入格式一行行以空格隔开的文本。
kenlm
训练语言模型用的是传统的“统计+平滑”的方法。
2021-11-21 21:05:38
5.91MB
ngram
kenlm
xun
1
编译好的
kenlm
.zip
编译好的
kenlm
2021-10-15 11:09:04
10.21MB
kenlm
语言模型
语音识别
1
pycorrector:pycorrector is a toolkit for text error correction. 文本纠错,
Kenlm
,Seq2Seq_Attention,BERT,MacBERT,ELECTRA,ERNIE,Transformer等模型实现,开箱即用
| 简体中文 pycorrector 中文文本纠错工具。音似、形似错字(或变体字)纠正,可用于中文拼音、笔画输入法的错误纠正。python3.6开发。 pycorrector依据语言模型检测错别字位置,通过拼音音似特征、笔画五笔编辑距离特征及语言模型困惑度特征纠正错别字。 Guide Question 中文文本纠错任务,常见错误类型包括: 谐音字词,如 配副眼睛-配副眼镜 混淆音字词,如 流浪织女-牛郎织女 字词顺序颠倒,如 伍迪艾伦-艾伦伍迪 字词补全,如 爱有天意-假如爱有天意 形似字错误,如 高梁-高粱 中文拼音全拼,如 xingfu-幸福 中文拼音缩写,如 sz-深圳 语法错误,如 想象难以-难以想象 当然,针对不同业务场景,这些问题并不一定全部存在,比如输入法中需要处理前四种,搜索引擎需要处理所有类型,语音识别后文本纠错只需要处理前两种, 其中'形似字错误'主要针对五笔或者笔画手
2021-07-15 12:34:01
13.6MB
bert
spelling-errors
electra
error-detection
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
ios无人直播 虚拟视频实用版 可以导入视频
Monet智能交通场景应用
BP神经网络+PID控制simulink仿真
代码随想录知识星球精华-大厂面试八股文第二版v1.2.pdf
Keil5安装包
基于STM32的电子时钟设计
MATLAB之LSTM预测
画程(版本6.0.0.127)setup个人版
2019综合测评仿真.zip
MVDR,Capon波束形成DO估计.zip
基于VMD算法的信号降噪.rar
elsevier 爱思唯尔 系列期刊的word模板,template,单栏,双栏
opcua服务器模拟器+opcua客户端工具.rar
基于hadoop商品推荐系统课程设计
中国地面气象站观测数据2000-2021
最新下载
树莓派ARM架构 linux java串口开发 librxtxSerial.so
骑行电动车佩戴头盔数据集
upgen打包工具命令行版
SAP SHOW PP部分(全)
nanoboot 5.0.3.1 x86 32位 N270可用的最终版本黑群晖
diskgenius4.7.2专业版
32位黑群晖一套亲测好用.rar
OPatch 版本 OPatch-11.2.0.3.27:p6880880_112000_Linux-x86-64.zip
Win10带数字签名Multikey64bit.zip
MIL-STD-1553B手册说明
其他资源
LeapSDK.zip
AllProPro-模拟主站104调试必备
mcs 51单片机 proteus 仿真实用实例大全 例子集合,含汇编代码keil工程和proteus工程
移动端js复制功能,点击复制按钮,就可以复制指定的内容
SATI文献题录分析工具
CCKS2017病例标注
武汉大学《数字图像处理》期末考试试卷及答案.pdf
deep learning 完整中文版(无水印)
matlab光伏发电
enterprise architect 15
160个DIV+CSS网页模板
基于三角网的等值线追踪及填充算法
UloadPicDemo
简介BIOS.pdf
数据库讲义学习完整版.rar
基于剪切干涉原理的散斑噪声降噪算法
Java仿微信飞机大战--Swing界面
生产者和消费者的javaGUI
HI-TECH PICC9.83(破解版)
snakegame.rar
扫描银行卡识别卡号的demo
中科大Fluent讲稿
protobuf-net的代码生成工具ProtoGen
SecondCopy8.1.2.0汉化注册版(内附注册码)
LabVIEW单通道数据采集保存数据库