采用卷积神经网络(cnn)进行文本分类,依赖dl4j
简介
基于dl4j-example中的示例,训练数据较少,从某东上拉取了几百条产品及类型划分,可以用于文本分类,搜索意图识别
train.txt示例,第一列表示产品分类,后边则是分词后的产品名称
eg.衣服 海澜之家 旗下 品牌 海澜 优选 生活馆 多色 条纹 短袖 t 恤 男 浅灰 条纹 07170 / 95
运行
1.运行Word2VecUtil.main生成word2vec.bin模型文件,data目录已存在,训练数据采用train.txt中的产品名称
2.运行CnnSentenceClassificationExample.main训练模型并输出测试结果
测试结果
Type:衣服, ProductName : 【 一件 48 两件 78 三件 98 】 t 恤 男 2018 男装 韩 版 夏季 短袖 t 恤 男 短袖 体恤 衣服
2021-11-30 11:25:25
3.61MB
Java
1