上传者: 42131414
|
上传时间: 2021-10-15 19:16:40
|
文件大小: 2.94MB
|
文件类型: -
这是一个简单的文本分类示例,其中使用了用Python编写的潜在语义分析(LSA)并使用了scikit-learn库。
该代码与我在撰写的LSA教程博客文章一起提供。
脚步:
[可选]:运行getReutersTextArticles.py下载Reuters数据集并提取原始文本。 已经为您执行了此步骤,并且数据集存储在“数据”文件夹中。
运行runClassification_LSA.py将LSA应用于数据集,然后测试分类准确性。
运行inspect_LSA.py可以深入了解LSA在做什么。