数据集来自国际文本信息检索会议(Text Retrieval Conference,TREC)中TREC2006的中文邮件和英文邮件数据集,供垃圾邮件分类学习使用
2021-04-24 19:36:02 176.55MB 垃圾邮件 文本分类 数据集
1
There are two corpora - mostly English (trec06p) and Chinese (trec06c). trec06p/full/ -- Ideal feedback English corpus trec06p/full-delay/ -- Delayed feedback English corpus trec06c/full/ -- Ideal feedback Chinese corpus trec06c/delay/ -- Delayed feedback Chinese corpus
2019-12-21 20:43:28 127.2MB data mail trec06
1