文本分类 使用Python进行文本分类的简单实践 文件 内容 罗基奥.py 使用 Rocchio 算法的文本分类。 每个文档都在一个向量空间中表示。 在训练阶段,找到每类文档的质心。 在测试阶段,计算测试文档到每个质心的距离,并将文档分配到最近的质心类。 天真的eBayes.py 使用朴素贝叶斯算法的文本分类。 每个文档在一个向量空间中表示。 在训练阶段,学习字典每个术语的类先验和类条件概率。 在测试阶段,文档被分配给给定测试文档具有最大后验概率的类。 这是一个 IPython 笔记本,展示了使用 scikits-learn 机器学习库的完整但简单的文本分类管道。 管道从文本清理和标记化开始,然后将每个文档投影到一个向量空间中。 Tfidf 加权用于对向量进行归一化。 然后测试一些分类器; 使用它们的默认参数。 最后,在蛮力参数网格搜索上使用 10 倍交叉验证,找到了一些分类器的最
2023-03-12 19:06:52 1.16MB Python
1
样例如下: TD 矿业工程 TD-0 矿业工程理论与方法论 TD-05 矿业工程与其他学科的关系 TD-9 矿山经济 TD91 选矿理论 TD912 矿石性质及类型 TD913 矿石可选性的研究 共计42354条分类,excel表两列,一列的编号,另一列是名称。 按大类字母顺序排列。
1
信用评估是商业银行等机构防范风险的重要途径,为了提高信用评估的准确率,使用随机森林(RF)来建立风险评估模型。针对随机森林模型的性能与参数的选择和数据集不平衡比例密切相关,提出了一种基于随机森林的组合分类算法(KM-GA-RF)。以UCI数据库中的German数据集进行研究,通过K-means算法对标签进行类分解。而对于哪个类分成的簇数(ki)以及随机森林算法自身的参数:树数(n_estimators)、特征数(max_features),使用改进的遗传算法对其进行优化选取。实验结果表明,基于随机森林的组合优化模型与传统RF以及其他算法进行比较,RF的预测精度高于支持向量机等算法,达到0.765,而提出的组合优化模型的预测精度为0.815,提高了5%。
1
GWO优化LSTM分类,这个代码分了两类。
2023-03-12 01:10:56 19.24MB 机器学习 算法 GWO LSTM
1
利用pytorch实现图像分类的一个完整的代码,训练,预测,TTA,模型融合,模型部署,cnn提取特征,svm或者随机森林等进行分类,模型蒸馏,一个完整的代码。 实现功能: 基础功能利用pytorch实现图像分类 包含带有warmup的cosine学习率调整 warmup的step学习率优调整 多模型融合预测,加权与投票融合 利用flask + redis实现模型云端api部署(tag v1) c++ libtorch的模型部署 使用tta测试时增强进行预测(tag v1) 添加label smooth的pytorch实现(标签平滑)(tag v1) 添加使用cnn提取特征,并使用SVM,RF,MLP,KNN等分类器进行分类(tag v1)。 可视化特征层。 转载:https://github.com/lxztju/pytorch_classification
2023-03-11 16:54:10 3.03MB 预测模型 图像分类 pytorch
1
先安装环境 ----> 使用data_classify.py文件进行训练集与测试集分割 ----> 在进行训练即可 数据准备:当前数据存放 data_name 文件夹内 文件夹名就是类别名,n个类别就是n个文件夹 目录主要结构组成: model_AlexNet.py ----> 自己建的AlexNet模型(可选其他模型) model_Vgg16.py ----> pytorch自带更改的模型(可选其他模型) train.py ----> 用于训练模型 test.py ----> 用于测试模型 辅助文件: data_classify.py ----> 将 data_name内的类别分为训练集与测试集。 ​ 注意查看代码内容,包含argparse模块 清除单通道图像 -----> 数据清洗,处理异常图像 旧版数据加载 -----> 用于学习图像 数据加载
1
此演示展示了信号数据示例的完整深度学习工作流程。 我们展示了如何准备、建模和部署基于深度学习 LSTM 的分类算法来识别机械空气压缩机的状况或输出。 我们展示了如何执行深度学习工作流程的以下部分的示例: 第 1 部分 - 数据准备第 2 部分 - 建模第 3 部分 - 部署 该演示是作为 MATLAB 项目实现的,需要您打开该项目才能运行它。 该项目将管理您需要的所有路径和快捷方式。 第一次运行项目时还需要一个重要的数据副本。 第 1 部分 - 数据准备本示例说明如何提取将用作LSTM深度学习网络输入的声学特征集。 跑步: 打开 MATLAB 项目 Aircompressorclassification.prj 打开并运行 Part01_DataPreparation.mlx 第 2 部分 - 建模此示例展示了如何训练 LSTM 网络对包括健康和不健康信号的多种操作模式进行分类
2023-03-11 14:40:05 18.09MB matlab
1
随机森林分类器
2023-03-10 15:52:12 51KB JupyterNotebook
1
[PHP招聘程序源代码版|BBWPS]功能介绍 1、完善的招聘参数设置; 2、灵活的信息参数设置,方便控制显示效果; 3、针对求职、招聘信息强大的组合查询功能; 4、简单易用的个人简历、工作经历、企业招聘信息发布/编辑; 5、提供收藏夹功能,个人/企业会员可随时收藏感兴趣的招聘/求职信息; 6、支持个人会员在线投放求职信给招聘单位、企业会员在线发布面试通知给求职人员; 7、个人会员可通过会员后台维护个人简历、工作资历,管理收藏信息、面试通知,利用超级查询系统在线检索招聘信息; 8、企业会员可通过会员后台维护企业资料、招聘信息,管理收藏信息,利用超级查询系统在线检索求职信息; 9、系统管理员可通过系统后台管理/维护本频道下属所有会员相关信息,包括:个人简历/工作资历、企业资料/招聘信息,所有会员收藏信息,所有面试通知信息,所有简历投放信息; 10、管理员可推荐招聘企业特别显示; 11、内置数据智能缓冲技术,大幅度降低系统动态查询压力; 12、灵活、简单的模版设计,默认模版未夹带任何隐藏广告代码; 13、结合平台广告系统,可方便的进行广告投放/管理;更新广告无需重新修改/发布每条信息; 14、支持模块复制建立多个频道使用,支持为模块设置子域名访问; 15、支持与BBWPS系统大首页及其他应用模块进行数据通讯,可供应本模块数据给平台及其他模块,或从其他模块提取数据到本模块显示。 ------------------------ 安装及使用:本应用模块必须在已完成BBPWS平台安装基础上装载,不能独立安装。平台CNZZ已在压缩包中提供,无须另外下载。
2023-03-10 15:02:12 3.01MB Php源码-生活分类
1
主要是读取文本,然后进行分词、词干提取、去停用词、计算词频,有界面,很实用
2023-03-10 13:37:17 70KB 词频计算
1