可直接运行, 1、内容概要:本资源主要基于XGBoost与LightGBM实现文本分类,适用于初学者学习文本分类使用。 2、数据集为电商真实商品评论数据,主要包括训练集data_train,测试集data_test ,经过预处理的训练集clean_data_train,训练好的word2vec词向量模型w2v_model.pkl和中文停用词表stopwords.txt,可用于模型训练和测试,详细数据集介绍见商品评论情感数据说明文档。 3、源代码:word2vec_analysis.py 是基于Word2Vec进行词向量的生成,采用向量平均求得句向量,然后分别构建RandomForest和GBDT分类模型进行文本分类。 4、源代码:xgboost_model.py是基于xgboost模型对文本进行分类。 5、源代码:lightGBM_model.py是基于lightGBM模型对文本进行分类。
2024-04-10 20:39:49 37.99MB 数据集
1
麻雀搜索算法(Sparrow Search Algorithm, SSA)是一种新型的群智能优化算法,在2020年提出,主要是受麻雀的觅食行为和反捕食行为的启发。在麻雀觅食的过程中,分为发现者(探索者)和加入者(追随者),发现者在种群中负责寻找食物并为整个麻雀种群提供觅食区域和方向,而加入者则是利用发现者来获取食物。为了获得食物,麻雀通常可以采用发现者和加入者这两种行为策略进行觅食。种群中的个体会监视群体中其它个体的行为,并且该种群中的攻击者会与高摄取量的同伴争夺食物资源,以提高自己的捕食率。此外,当麻雀种群意识到危险时会做出反捕食行为。
2024-04-10 16:51:04 2KB matlab
1
大三的注意了,词法分析的原程序代码……………………!!!!!
2024-04-09 18:48:31 1.69MB 词法分析
1
实现ftp下载,通过vb编程实现。实现下载、上传、资源浏览等。
2024-04-09 00:24:57 903KB ftp
1
sm2国密算法加解密,签名、验签QT工具的源代码(包含sm2,sm3和sm4源码)。 环境我使用的QT5.14的IDE编译,其他版本qt未测试。不过仅使用了几个简单控件应该关系不大。 详细介绍参见个人博客:SM2 (含SM3、SM4)国密算法工具QT版,彻底搞懂国密算法的使用 https://blog.csdn.net/yyz_1987/article/details/120501076
2024-04-08 20:43:26 2.09MB 源码
17、TLM1.0 源代码分析 如果发现错误,或有建议,请联系 zhangqiang1227@gmail.com 413 17. TLM1.0 源代码分析 相对于前面的 factory 机制,phase 机制或者 sequence 机制来说,TLM 的源代码 都是相对简单许多,但是从另外一方面来说,它是比较繁琐的。 17.1. TLM 端口简介 17.1.1. UVM 中两类 TLM 端口 从本质上来说,UVM 中有两类 TLM 端口,一类是用于 driver 和 sequencer 之间 连接的端口,一类是用于其它 component 之间连接的端口,如 monitor 和 scoreboard。 对于第一类来说,有下述三种端口,它们的原型分别是: 文件:src/tlm1/sqr_connections.svh 54 class uvm_seq_item_pull_port #(type REQ=int, type RSP=REQ) 55 extends uvm_port_base #(uvm_sqr_if_base #(REQ, RSP)); 73 class uvm_seq_item_pull_export #(type REQ=int, type RSP=REQ) 74 extends uvm_port_base #(uvm_sqr_if_base #(REQ, RSP));
2024-04-07 21:47:59 4.72MB
1
摘要:C#源码,文件操作,Word  C#操作WORD文件,生成Word文档,将输入的文字保存为Word的doc格式,用Word2000及以上版本都可以打开,相当实用的一个C#小技巧,源码开源下载。
2024-04-07 16:54:40 418KB C#源代码 文件操作
1
JAVA制作一个网络安全传输工具-源代码
2024-04-07 10:28:50 448KB 网络安全 java
1
Octeon-Linux-kernel-4.14:这是Marvell Octeon Linux内核4.14源代码。 提供“原样”且无支持。 不支持对此代码进行任何更改。 不支持从此来源进行构建
2024-04-06 20:02:37 193.2MB 系统开源
1