杂货店
基于LibLinear的简单高效的短文本分类工具
嵌入作为默认标记器,以支持中文标记化
其他语言:
表现
火车组合:48个带有32个标签的新闻标题
测试集:带有32个标签的16k新闻标题
与svm和朴素贝叶斯进行比较
分类器
准确性
时间成本
scikit学习(nb)
76.8%
134
scikit学习(svm)
76.9%
121
杂货店
79.6%
49
样例代码
>> > from tgrocery import Grocery
# Create a grocery(don't forget to set a name)
>> > grocery = Grocery ( 'sample' )
# Train from list
>> > train_src = [
( 'education' , 'Student debt to cost Brit
2022-06-22 23:35:22
71KB
C++
1