只为小站
首页
域名查询
文件下载
登录
text-cnn:嵌入Word2vec词向量的CNN
中文文本分类
-源码
使用CNN和Word2vec进行文本分类 本文是参考gaussic大牛的“ text-classification-cnn-rnn”后,基于同样的数据集,嵌入词级别操作的CNN文本分类实验结果,gaussic大牛是基于字符级的;进行了第二版的更新:1。加入不同的卷积核; 2。加入正则化; 3。词唯一的中文或英文,删除掉文本中数字,符号等类型的词; 4。删除长度为1的词训练结果较第一版有所提升,验证集准确率从96.5%达到97.1%,测试准确率从96.7%达到97.2%。 本实验的主要目是为了探索基于Word2vec训练的词向量嵌入CNN后,对模型的影响,实验结果得到的模型在验证集达到97.1%
2021-03-11 19:01:08
15.65MB
text-classification
tensorflow
word2vec
cnn
1
中文文本分类
实验
中文文本分类
完整流程的简单实现,分词、去停用词、提取特征、计算文档的特征向量、支持向量机训练、测试文档分类,简单实现,其中词频统计、去停用词使用布隆过滤器加速,效果不错
2021-03-09 19:55:13
383KB
文本分类
布隆过滤器
特征向量
1
复旦
中文文本分类
语料库训练集
训练集
2021-03-02 19:04:30
144.1MB
文本分类
1
一种基于逆向匹配算法的
中文文本分类
技术
针对中文文本的自动分类问题,提出了一种逆向匹配算法。该算法的基本思路是构造一个带权值的分类主题词表,然后用词表中的关键词在待分类的文档中进行逆向匹配,并统计匹配成功的权值和,以权值和最大者作为分类结果。本算法可以避开中文分词的难点和它对分类结果的影响。理论分析和实验结果表明,该技术分类结果的准确度和时间效率都比较高,其综合性能达到了目前主流技术的水平。
2021-02-22 18:07:26
255KB
文本分类;
逆向匹配算法;
增益权值;
主题词表
1
基于svm的
中文文本分类
系统
基于内容的文本分类系统,使用libsvm 进行分类。
2020-12-30 15:13:41
40.58MB
svm
文本分类
中文分词
libsvm
1
复旦
中文文本分类
-训练集
本语料库由复旦大学李荣陆提供。训练和测试两个语料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
2020-01-03 11:24:19
109.68MB
文本分类
1
复旦大学
中文文本分类
数据集-训练+测试
由复旦大学李荣陆提供。answer.rar为测试语料,共9833篇文档;train.rar为训练语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少人力和物力,所以请大家在使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
2019-12-25 11:15:53
103.28MB
数据集
中文语料库
1
中文文本分类
语料(复旦)(完整版)
中文文本分类
语料(复旦)-训练集和测试集 这个链接是训练集,本语料库由复旦大学李荣陆提供。test_corpus为测试语料,共9833篇文档;train_corpus为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大,下载时请耐心等待。
2019-12-21 22:04:21
101.81MB
文本分类
数据集
复旦
中文
1
搜狗文本分类语料库-
中文文本分类
实现文本分类的主要包括几个步骤文本分词处理,特征选择,特征权重计算,文本特征向量表示,基于训练文本的特征向量数据训练SVM模型,对于测试集进行特征向量表示代入训练得到的svm模型中进行预测分类,达到93%的准确率
2019-12-21 21:59:17
26.06MB
文本分类
1
中文文本分类
语料库(复旦大学)训练与测试集
中文文本分类
语料(复旦大学)-训练集和测试集。测试语料共9833篇文档;训练语料共9804篇文档。使用时请注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。
2019-12-21 21:50:45
106.15MB
中文文本分类
语料库
测试集
训练集
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
cublas64_11.dll cublasLt64_11.dll cusolver64_11.dll
Spring相关的外文文献和翻译(含出处).zip
PSO-LSSVM的MATLAB代码.rar
quartus II13.0器件库.zip
RentingSystem.rar
Plex v7.12电视端app
拾荒者.exe同时ID扫描器IP扫描器
mingw-w64-install.exe
matlab时频分析工具箱+安装方法+函数说明+最新版tftb.
基于VMD算法的信号降噪.rar
python实现的学生信息管理系统—GUI界面版
DBSCAN算法Matlab实现
华为OD机试真题.pdf
C4.5决策树算法的Python代码和数据样本
《应用非线性控制》(美)斯洛坦著;程代展译(清晰)
最新下载
GNSS惯性导航组合(第3版)配套MATLAB源代码 ISBN 9787121278754
Siemens S7 F Systems V6.2
C#读取Ollama api DeepSeek和其他模型接口桌面小程序
华为hcip数通试题考考试模拟软件
简约自适应APP下载页源码
使用ollama容器部署Deepseek本地大模型后使用,C#winform离线版
联想智能云教室-V1.3.20.0810-C200805试用版
STM32F103RB最小系统板,带完整的PCB工程-电路方案
3d模型格式转换器v5.3最新破解版.rar
ASPEN超详细教程.pdf
其他资源
[MATLAB数学建模与仿真][PPT]+[例题源文件]+[习题答案]
数字信号处理导论课后习题答案
经典定位算法仿真代码
百战程序员1573题目答案最全--自己整理的
java,socket聊天,单聊,群聊,传文件,加密聊天和传文件
secoclient-win-32-1.60.3.17.rar
jacob-1.20.zip
粒子群优化SVM.rar
数据库课程设计报告 酒店管理信息系统
克里金插值算法
小鱼儿yr系统封装优化设置辅助工具V2.02.1(GUI版).zip
江苏省河流、湖泊、县域、高速、等shp数据
致谢:freecodecamp-100DaysOfCode-源码
用组合逻辑实现时钟的逻辑图
PADS常用库
FPGA红外线感应
模拟退火算法的matlab工具箱satools
自写环信demo
2019JAVA BAT 面试宝典 springboot springmvc spring cloud 知识点
Plupload 上传.net MVC 上传示例
C#做的拼图小游戏源代码