Unsupervised TXT classifier:分类任意两个TXT文档,无需培训-JAVA-开源

上传者: 42102933 | 上传时间: 2021-04-29 17:05:19 | 文件大小: 244KB | 文件类型: ZIP
使用已知的分类算法制作该程序是为了解决两个最常见的问题。 首先是过度训练,其次是缺乏用于类别训练的数据。 而是,每个TXT文件都是自己的类别,而不是分配的类别。 从某种意义上说,这类似于聚类,但实际上不是聚类算法,因为其中涉及一些训练。 来自Classifier4J的汇总器已经过调整,可以接受两个输入(我们称它们为A和B)。 然后,对摘要器进行A训练以对文档B进行摘要,反之亦然。 这为两个文档提取了一个相关结构(从而避免了过度训练),然后使用向量空间分析对其进行比较,以给出一个文档属于另一个文档的范围(从而避免信息不足)。 此方法可用于通过合并某些类别的文本来创建用户定义的类,然后计算文档之间的相关距离,但这不是必需的。

文件下载

资源详情

[{"title":"( 137 个子文件 244KB ) Unsupervised TXT classifier:分类任意两个TXT文档,无需培训-JAVA-开源","children":[{"title":"aliceP1.txt <span style='color:#111;'> 80.65KB </span>","children":null,"spread":false},{"title":".project <span style='color:#111;'> 385B </span>","children":null,"spread":false},{"title":"holmes.txt <span style='color:#111;'> 37.56KB </span>","children":null,"spread":false},{"title":"usage.java <span style='color:#111;'> 1.11KB </span>","children":null,"spread":false},{"title":"DefaultTokenizer.java <span style='color:#111;'> 6.32KB </span>","children":null,"spread":false},{"title":"......","children":null,"spread":false},{"title":"<span style='color:steelblue;'>文件过多,未全部展示</span>","children":null,"spread":false}],"spread":true}]

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明