机器学习与算法源代码2: 数据分析的基本武器.zip
2022-05-18 19:08:16 577KB 机器学习 算法 数据分析 人工智能
机器学习与算法源代码12: 数据降维之PCA主成分分析.zip
2022-05-18 19:08:10 3.31MB 机器学习 算法 文档资料 人工智能
机器学习与算法源代码13: 数据聚类与分群.zip
2022-05-18 19:08:10 1.29MB 机器学习 算法 聚类 源码软件
粒子群算法PSO、毕设论文、Matlab源代码、实验数据
1
1、内容概要:本资源主要基于TextCNN(keras)实现文本分类,适用于初学者学习文本分类使用。 2、数据集为电商真实商品评论数据,主要包括训练集data_train,测试集data_test ,经过预处理的训练集clean_data_train和中文停用词表stopwords.txt,可用于模型训练和测试,详细数据集介绍见商品评论情感数据说明文档。 3、源代码:word2vec_analysis.py 是基于Word2Vec进行词向量的生成,采用向量平均求得句向量,然后分别构建RandomForest和GBDT分类模型进行文本分类。 4、源代码:textcnn_model.py是基于Keras构建CNN、TextCNN卷积神经网络模型对文本进行分类。
2022-05-07 08:29:02 11.13MB 文本分类 深度学习 TextCNN 自然语言处理
该单词库功功能实现:1.四级、六级、托福、雅思、普通成人高考词汇查看与搜索 2.选择不同速度播放。 3.计时。可记录自己学习了多长时间 包括自己写的源程序。还有这个程序的原始图片、数据库等资料。
2022-05-01 16:35:19 15.5MB 安卓源代码 项目数据资料
1
1、内容概要:本资源主要基于bert(keras)实现文本分类,适用于初学者学习文本分类使用。 2、数据集为电商真实商品评论数据,主要包括训练集data_train,测试集data_test ,经过预处理的训练集clean_data_train和中文停用词表stopwords.txt,可用于模型训练和测试,详细数据集介绍见商品评论情感数据说明文档。 3、源代码:word2vec_analysis.py 是基于Word2Vec进行词向量的生成,采用向量平均求得句向量,然后分别构建RandomForest和GBDT分类模型进行文本分类。 4、源代码:bert_model.py是基于keras-bert构建Bert模型对文本进行分类。
2022-04-21 00:11:16 11.13MB bert keras 自然语言处理 人工智能
1、内容概要:本资源主要使用深度学习相关方法构造漏洞分类模型进行实验调研。适用于初学者学习软件漏洞分类使用。本次实验使用的是从2002年到2019年5月份的NVD漏洞数据。详见资源nvdcve文件夹。 2、源代码文件说明 (1)xml_to_excel.py:漏洞数据预处理脚本,将xml格式NVD原始数据转换为excel格式的标准漏洞文件。 (2)vul_plot.py:统计和可视化漏洞数据脚本。nvd_dataset.py:获取前n个漏洞类型的数据脚本。features_keywords.py:特征提取脚本,训练集和测试集文本向量化。 (3)lstm_model.py:构建双向GRU分类模型Bi-GRU;C-LSTM串联模型;构建word2vec模型;数据预处理 ;指标评价可视化。 (4)cgru_model.py:TextCGRU串联,构建word2vec模型;数据预处理;指标评价可视化等。 3、figures文件夹包含模型图绘制,评价指标可视化。 4、nvdcve文件夹包含原始数据,预处理数据,词向量模型w2v_model.pkl和分类模型较大自己训练即可)。
2022-04-18 22:00:05 185.09MB NLP 神经网络 软件漏洞 深度学习
1、内容概要:本资源主要基于Python实现kdd99入侵检测数据集预处理,搭建DNN和CNN神经网络实现kdd99入侵检测分类,适用于初学者学习入侵检测分类使用。 2、入侵检测数据集: 该数据集是从一个模拟的美国空军局域网上采集来的9个星期的网络连接数据,分成具有标识的训练数据和未加标识的测试数据。KDD99数据集总共由500万条记录构成,它还提供一个10%的训练子集kddcup.data_10_percent_corrected和测试子集corrected。 3、源代码Handle_data.py是kdd99数据集预处理源代码,kddcup.data_10_percent_corrected.xls是预处理后的数据集。 4、源代码:Kdd_dnn.py是基于DNN神经网络对入侵检测数据集进行分类;kdd_cnn.py是基于CNN神经网络对入侵检测数据集进行分类。
2022-04-16 18:09:43 5.22MB 入侵检测KDD99 机器学习 DNN CNN
1、内容概要:本资源主要基于XGBoost与LightGBM实现文本分类,适用于初学者学习文本分类使用。 2、数据集为电商真实商品评论数据,主要包括训练集data_train,测试集data_test ,经过预处理的训练集clean_data_train,训练好的word2vec词向量模型w2v_model.pkl和中文停用词表stopwords.txt,可用于模型训练和测试,详细数据集介绍见商品评论情感数据说明文档。 3、源代码:word2vec_analysis.py 是基于Word2Vec进行词向量的生成,采用向量平均求得句向量,然后分别构建RandomForest和GBDT分类模型进行文本分类。 4、源代码:xgboost_model.py是基于xgboost模型对文本进行分类。 5、源代码:lightGBM_model.py是基于lightGBM模型对文本进行分类。
2022-04-16 14:07:38 37.99MB 机器学习 xgboost lightGBM word2vec