简介:纠正诸如“ campagn”(活动)之类的拼写错误相对容易。
但是,如果您打算键入“三”,则常见的错误是键入“有”而不是“三”。 “有”和“三个”的拼写正确。 但是,如果我们比较短语“三天”和“有天”,则显然“三天”是正确的短语。
如何使您的拼写校正算法识别上述差异? 在此程序中,我尝试使用上下文中的信息来解决此问题。
所需的Python软件包:re,collections,nltk,numpy,operator,csv,sys兼容性:该程序经过测试,可以使用Anaconda发行版在Python 3.6.5上运行
该程序需要几分钟才能运行给定的示例。 因此,请耐心等待。
如何运行:python3 main.py inputFileLocation
For example, python3 main.py /Users/tg/Desktop/517/assignment2/i
2021-05-08 15:44:52
4.34MB
Python
1