上传者: 42134554
|
上传时间: 2021-10-07 10:39:18
|
文件大小: 9KB
|
文件类型: -
pysrilm
SRILM 的 Python 接口
版权所有(c)Will Roberts 2015年6月9日
许可证:此包中包含的源代码在 MIT 许可证下获得许可(请参阅LICENSE.txt )。 要安装,您还需要的副本,为此您需要 SRI 的许可证。
入门
您可以像这样加载一个n元语法模型(请注意,由于SRILM理解zlib,因此您可以将gzip压缩的文件传递给read方法):
import srilm
ngrams = srilm.Ngrams(3)
ngrams.read('ngram-counts-eu.tsv.gz')
在模型中查找某个 n-gram 的频率:
ngram = ['red', 'flower']
freq = ngrams.find_count(ngram)
迭代特定模型中特定顺序的所有 n-gram:
for (bigram, count) in