:incoming_envelope: 垃圾邮件发送者 :postbox: 垃圾邮件检测器 概要 文本挖掘是一个广阔的领域,随着生成的大量文本数据而越来越受欢迎。 使用机器学习模型已经完成了一些应用程序的自动化,例如情感分析,文档分类,主题分类,文本摘要和机器翻译。 垃圾邮件过滤是文档分类任务的一个示例,该任务涉及将电子邮件分类为垃圾邮件或非垃圾邮件(又名火腿)。 在这个项目中,我将以使用Python和可公开获得的邮件语料库的教程的形式,介绍如何实现这种系统的不同步骤。 输出将是一个API和一个Web应用程序,允许用户输入消息并获得响应(如果是垃圾邮件或火腿)。 数据源 安然电子邮件数据集 链接: : Python库 对于Fla
2022-05-10 22:47:54 42.02MB python flask data-science scikit-learn
1
检测帕金森病 帕金森氏病与运动障碍症状有关,例如震颤,僵硬,运动迟缓和姿势不稳。 运动迟缓和僵硬的表现通常在疾病的早期。 这些对患者的笔迹和素描能力有显着影响,显微照相术已被用于帕金森氏病的早期诊断。 虽然人的笔迹受许多因素(例如语言熟练程度和教育程度)的影响,但发现绘制形状(例如螺旋形)是一种非侵入性且独立的措施。 怎么跑 python detect_parkinsons.py --dataset dataset/spiral python detect_parkinsons.py --dataset dataset/wave
2022-05-07 16:10:17 20.73MB python random-forest scikit-learn sklearn
1
使用scikit-learn在python中进行SVM MNIST数字分类 该项目提出了的众所周知的问题。 出于本教程的目的,我将使用具有原始像素特征的算法。 该解决方案使用易于使用的机器学习库以python编写。 该项目的目标不是达到最先进的性能,而是教您如何使用sklearn的SVM在图像数据上训练SVM分类器。 尽管该解决方案并未针对高精度进行优化,但结果还是不错的(请参见下表)。 如果您想获得最佳性能,这两个资源将向您展示当前的最新解决方案: 下表显示了与其他模型相比的一些结果: 方法 准确性 评论 随机森林 0.937 简单的一层神经网络 0.926 简单的2层卷积网络 0.981 支持向量机 0.9852 C = 5,伽玛= 0.05 线性SVM + Nystroem内核逼近 线性SVM +傅立叶核逼近 项目设置 本教程是在Ubuntu 18.10上编写和测试的。 项目包含具有所有必要库的Pipfile Python-版本> = 3.6 pipenv-软件包和虚拟环境管理 麻木 matplotlib scikit学习 安装Python。 git克隆仓
1
Scikit-learn使用手册中文版、机器学习原理和实战、深度学习实战caffe
2022-05-03 12:06:56 120.78MB 机器学习 深度学习 scikit-learn caffe
黑色素检测 什么是黑色素瘤? “黑色素瘤” ,也称为“恶性黑色素瘤” ,是一种由称为黑色素细胞的含色素细胞发展而来的癌症。 黑色素瘤通常发生在皮肤上,但很少发生在口腔,肠或眼睛中。 黑色素瘤的主要原因是皮肤色素含量低的人暴露于紫外线(UV)中。 紫外线可以来自太阳,也可以来自其他来源,例如晒黑设备。 大约25%的痣来自于痣。 在以下了解更多信息:-> 。 关于存储库- 此存储库包含用于黑色素瘤检测应用程序的源代码。 以下是“项目结构” : . | Main.py | dataset.npz | testcase.npz | README.md |---featext |
2022-04-29 15:51:58 8.64MB opencv machine-learning numpy scikit-learn
1
阿达·本 与论文工作相关的代码: “ AdaBnn:经过自适应结构学习训练的二值化神经网络” 该存储库当前包含两个协作笔记本: 带有实验性质的基于Keras实施AdaNet算法提出的由该文件实验“ ”在,对于学习神经网络结构为子网的集合。 此外,AdaBnn表示为对AdaNet的修改,它对运行时间施加了二进制约束,以尝试在时间方面提高性能,并且是一种基于“的正则化方式”。 “。 另外,包含的单独代码包含Adanet和AdaBnn实现及其文档。 一些发现 根据笔记本中提供的实验: 在自适应结构学习的情况下,对网络权重进行二值化具有类似的效果,即遗传算法中的突变率很高,在迭代之间很难遵循学习模式,在T迭代中不保持增量性能。 Adam优化在大多数情况下更适合于此类AdaBnn结构,并且迭代次数更少(本文中的T参数)。 目前,对AdaNet进行二值化处理并没有太大的改进,但它可能是为权重/激活添加约束作为自适应结构学习的正则化方法的起点。 进一步的工作 进一步的工作可能包括将二值化过程作为卷积子网的一部分,这是(M Courbariaux,2016)的最初建议。 例 导入依赖关
2022-04-29 11:23:47 4.24MB deep-learning tensorflow scikit-learn keras
1
scikit-survival:基于scikit-learn的生存分析
1
如何处理数据缺失值?INRIA研究员Gael 《机器学习缺失值处理》54页ppt教程,为你讲解一个关于机器学习的教程,以建立缺失值的预测模型。这教程涵盖了理论结果(统计学习)和实践建议,重点介绍了使用scikit-learn在Python中的实现
2022-04-22 18:05:10 7.12MB python scikit-learn 机器学习 学习
调谐斯克莱恩 Tune-sklearn是Scikit-Learn的模型选择模块(GridSearchCV,RandomizedSearchCV)的替代品,它具有尖端的超参数调整技术。 产品特点 以下是tune-sklearn提供的功能: 与Scikit-Learn API的一致性:在标准Scikit-Learn脚本中更改少于5行即可使用API​​ []。 现代调整技术:tune-sklearn使您可以通过简单地切换几个参数来轻松利用贝叶斯优化,HyperBand,BOHB和其他优化技术。 框架支持:tune-sklearn主要用于调整Scikit-Learn模型,但它也支持并提供了许多其他带有Scikit-Learn包装器的框架的示例,例如Skorch(Pytorch)[ ],KerasClassifier(Keras)[ ],和XGBoostClassifier(XGBoost)[]。 向上扩展:Tune-sklearn利用 (一个用于分布式超参数调整的库)在不更改代码的情况下并行化多个核甚至多个机器上的交叉验证。 查看我们的和(针对master分支)。 安装 依存关
1
数据科学 机器学习系列5 利用Scikit-learn构建回归模型:准备和可视化数据.ipynb
2022-04-19 19:07:47 26KB scikit-learn 机器学习 回归 python
1