数据载体 DataVec是Apache 2.0许可的库,用于机器学习ETL(提取,转换,加载)操作。 DataVec的目的是将原始数据转换为可用的矢量格式,然后将其提供给机器学习算法。 通过向该存储库贡献代码,您同意根据Apache 2.0许可提供您的贡献。 为什么要使用DataVec? 数据处理有时会很混乱,我们认为它应该与高性能代数库(例如nd4j或Deeplearning4j)区分开。 DataVec使从业人员可以获取原始数据并快速生成符合开放标准的矢量化数据(svmLight等)。 开箱即用支持的当前输入数据类型: CSV数据 原始文本数据(推文,文本文档等) 图片资料 支持库 SVMLight MatLab(MAT)格式 JSON,XML,YAML,XML Datavec从许多Hadoop生态系统工具中汲取了灵感,尤其是通过Hadoop API访问磁盘上的数据(就像S
2022-12-17 18:04:45 24.28MB machine-learning formatter schema spark
1
机器学习思维导图1
2022-12-17 15:19:36 1.51MB 机器学习
1
机器学习课程设计 人脸识别完整Matlab源码+项目说明.zip 【功能实现】 1.信息隐藏 2.信息解码 3.人脸识别 【注意】 不要改变文件结构!!,.exe文件在exe里,生成的图片及.mat在generated_photo里,一张典例图片在example_photo里,image里是一些README文档需要的照片,resource里的是一些依赖文件,不要动!
内容概要:主要分为基本概念、常用算法和其他三部分。 正是对机器学习的过程中的痛苦有切身体会,作者希望能做一份教程,以浅显易懂的方式去讲解它,降低大家的学习门槛。作者为此花费了数月时间,经常做到深夜,把自己的学习笔记整理成了这份教程。
2022-12-16 17:25:14 431.27MB 机器学习
1
机器学习课程作业_基于卷积神经网络的手写数字识别matlab源码+项目说明.zip 函数说明: read_label和read_image分别为读取标签和图像数据点的函数 convolve是实现卷积的函数,pool是实现池化的函数 SGD_MSGD是主函数,可以直接运行得到答案(把minibatch设为1就是SGD,大于1就是MSGD) OPTIMAL是优化版的主函数,可以直接运行得到答案 OPTIMAL_FINALE是最终优化版的主函数,可以直接运行得到答案 toolbox是用工具箱函数写的CNN,可以直接运行得到答案
机器学习备忘单 该备忘单包含许多关于机器学习的经典方程式和图表,它们将帮助您快速回顾关于机器学习的知识和思想。 该备忘单还将吸引准备进行与机器学习相关的工作面试的人员。 下载PDF 如何编译 docker pull soulmachine/texlive docker run -it --rm -v $(pwd):/data -w /data soulmachine/texlive xelatex -synctex=1 --enable-write18 -interaction=nonstopmode machine-learning-cheat-sheet.tex LaTeX模板 本书采用。 如何在Windows上编译 安装 ,然后将其bin路径(例如D:\texlive\2012\bin\win32到PATH环境变量中。 安装 。 配置TeXstudio。 运行TeXstud
2022-12-16 07:37:11 4.24MB TeX
1
...
2022-12-16 00:22:06 341KB CS
1
预防心脏病变得非常必要。良好的数据驱动的心脏病预测系统可以改善整个研究和预防过程,确保更多的人可以过上健康的生活。这就是机器学习发挥作用的地方。机器学习有助于预测心脏疾病,而且做出的预测相当准确。 该项目涉及对心脏病患者数据集进行分析,并进行适当的数据处理。然后,训练不同的模型,并使用不同的算法KNN、决策树、随机森林进行预测
2022-12-15 23:57:03 82KB 机器学习 KNN 决策树 随机梯度下降
1
校园生活的智能化需要基于各种数据源的自动化处理与分析,这些数据源可能来自传统的传感终端(即典型的传感器)或智能设备,这意味着校园内某些可能的应用实现依赖于机器学习的相关知识。因此,请以“校园里的机器学习”为主题完成你的综述论文。 请利用课程中学到的知识,面向医疗保健领域设计一个数据驱动的机器学习系统。
2022-12-15 20:28:56 30KB 机器学习
1
基于机器学习,利用常用异常检测算法(Isolation Forest、CBLOF、KNN)对数据集中的异常数据进行识别及检测。 孤立森林(Isolation Forest)于2008年由西瓜书作者周志华团队提出,凭借其线性的时间复杂度与优秀的准确率被广泛应用于工业界中结构化数据的异常检测。
2022-12-15 10:27:21 216KB 机器学习 异常检测
1