上传者: 42168745
|
上传时间: 2021-06-07 16:03:58
|
文件大小: 9.37MB
|
文件类型: ZIP
多语言
程序语言专家。 它用于检测程序语言,就像,但基于朴素贝叶斯分类器。
入门
使用pip安装
pip install git+https://github.com/polyrabbit/polyglot
首先,我们需要在多语言训练语料库上训练多语言,语料库中的每个文件夹都应该包含名称由文件夹标识的相同语言的文件。 例如
polyglot train --corpus=./corpus --ngram=3 --verbose --output=./model.json
使用上述命令生成预先包含的 。 运行polyglot train --help以了解使用细节。
训练后,我们可以使用朴素贝叶斯分类器对给定文件进行分类。 例如
echo import os | polyglot classify --ngram=3 --top=3 --verbose --model=./mode