https://blog.csdn.net/liu506039293/article/details/103972942
2021-05-02 10:39:43 5.72MB python
1
考研核心单词&高频词.pdf
2021-03-10 19:07:00 600KB 考研 英语 单词 高频词
1
针对短文本特征稀疏、噪声大等特点,提出一种基于 LDA 高频词扩展的方法,通过抽取每个类别的高频词作为向量空间模型的特征空间,用 TF-IDF 方法将短文本表示成向量,再利用 LDA 得到每个文本的隐主题特征,将 概率大于某一阈值的隐主题对应的高频词扩展到文本中,以降低短文本的噪声和稀疏性影响。实验证明,这种方法的分类性能高于常规分类方法
2019-12-21 21:41:21 624KB LDA 短文本分类
1
资源包括了四十W条商品品牌和分类的词库,做电商搜索可以直接用
2019-12-21 21:04:04 12.44MB xie
1