经典拼写校正器在半页 Python 中的数据集 aspell.txt birkbeck.txt big.txt spell-testset1.txt spell-testset2.txt wikipedia.txt
2023-04-17 23:03:19 2.42MB 数据集
1
深刺 使用深度学习纠正拼写错误 动机 该项目的灵感来自在上发表的文章。 可以在Github上找到他的代码。 2017年1月,我开始了并且从第一堂课开始就迷上了。 以前,我曾多次听到过“神经网络”一词,并且对它们可以完成的事情有一个大致的了解,但从未对它们的“工作原理”有所了解。 自完成课程以来,我没有太多机会来尝试这项技术,但是我一直在考虑它的用途,尤其是在信息检索领域,这是我过去十年来一直致力于的领域。 除非您是Google,否则纠正拼写错误的典型技术是,或者它的近亲是。 魏斯先生很好地解释了为什么这些方法效果不佳。 目标 使用Tensorflow重新实现Weiss先生的递归神经网络(RNN),并达到相同的准确性水平。 他建议尝试实施某些探索领域以及其他领域,以查看是否可以获得进一步的改进。 编码 该代码的第一部分主要涉及下载Google发布的并对其进行设置,以进行培训,而这主要是
2022-10-04 17:29:45 93.39MB deep-learning neural-network rnn spelling
1
| 简体中文 pycorrector 中文文本纠错工具。音似、形似错字(或变体字)纠正,可用于中文拼音、笔画输入法的错误纠正。python3.6开发。 pycorrector依据语言模型检测错别字位置,通过拼音音似特征、笔画五笔编辑距离特征及语言模型困惑度特征纠正错别字。 Guide Question 中文文本纠错任务,常见错误类型包括: 谐音字词,如 配副眼睛-配副眼镜 混淆音字词,如 流浪织女-牛郎织女 字词顺序颠倒,如 伍迪艾伦-艾伦伍迪 字词补全,如 爱有天意-假如爱有天意 形似字错误,如 高梁-高粱 中文拼音全拼,如 xingfu-幸福 中文拼音缩写,如 sz-深圳 语法错误,如 想象难以-难以想象 当然,针对不同业务场景,这些问题并不一定全部存在,比如输入法中需要处理前四种,搜索引擎需要处理所有类型,语音识别后文本纠错只需要处理前两种, 其中'形似字错误'主要针对五笔或者笔画手
2021-07-15 12:34:01 13.6MB bert spelling-errors electra error-detection
1
简介:纠正诸如“ campagn”(活动)之类的拼写错误相对容易。 但是,如果您打算键入“三”,则常见的错误是键入“有”而不是“三”。 “有”和“三个”的拼写正确。 但是,如果我们比较短语“三天”和“有天”,则显然“三天”是正确的短语。 如何使您的拼写校正算法识别上述差异? 在此程序中,我尝试使用上下文中的信息来解决此问题。 所需的Python软件包:re,collections,nltk,numpy,operator,csv,sys兼容性:该程序经过测试,可以使用Anaconda发行版在Python 3.6.5上运行 该程序需要几分钟才能运行给定的示例。 因此,请耐心等待。 如何运行:python3 main.py inputFileLocation For example, python3 main.py /Users/tg/Desktop/517/assignment2/i
2021-05-08 15:44:52 4.34MB Python
1
正字法学脚 通过纠正错误来尝试表现出卓越的存储库。 我有时对文化不敏感且无礼。 抱歉。 该项目的核心是GitHub上的同名用户 。 该用户扫描流行的存储库以查找常见的错别字,并尝试使用适当的提取请求来更正它们。 这个项目尚处于起步阶段。 您可以通过发送它严厉抨击作为指导发展的。 如果有必要,则每一个评论的拉动请求都会收到(来自人类)精心制作的手工响应。 这将@ orthoographic-pedant牢固地置于半自动化类别中。 更新:。 提交的日志 (必须登录) 用户评论和提及: @ orthoographic-pedant,您可以将光线带到黑暗的地方。 :light_bulb: 这让我兴奋不已。 尽管我很欣赏语言折衷者的观点,但我还是不得不偶尔去学步道。 先生,您是绅士和学者。 @ orthographic- thx小机器人:) 您。 没事的随时回来。 喜欢这个机器人,@ orthographic-pedant! 太好了 您的机器人是一个手提袋。 蜜罐及相关工作 要在Github上捕获其他任何拼写检查机器人,以下存储库是一个蜜罐: 有一个类似
2021-02-02 03:34:43 119KB bot spelling-checker pedant BotPython
1