完善的机器学习:笔记,练习和Jupyter笔记本 在下面,您将找到补充第二版《机器学习精炼》(剑桥大学出版社出版)的一系列资源。 目录 小部件样本和我们的教学法 我们相信,只有对以下三个问题中的每一个回答都是肯定的,才能精通某种机器学习概念/主题。 Intuition你能用一个简单的图景描述这个想法吗? Mathematical derivation您可以用数学符号表达直觉并推导基础模型/成本函数吗? Implementation您可以在不使用高级库的情况下使用Python这样的编程语言对派生代码进行编码吗? Intuition comes first. 直观的飞跃先于知识的飞跃,因此,我们在书中包括了300多种彩色插图,这些彩色插图经过精心设计,可以直观地掌握技术概念。 这些插图中的许多是动画的快照,这些动画显示了某些算法的收敛性,某些模型从不完全拟合到过度拟合的演变等。可以使用动画(与静态图形相对)来最好地说明和理解此类概念。 您可以在此存储库中找到大量这样的动画-您也可以通过这些注释的原始Jupyter笔记本版本来修改自己。 这里只是几个例子: 交叉验证(回归)
1
更新(2021年2月1日) 注意力! 该存储库将不再维护,请检查我们新的Deep Forest存储库,以提高效率。 详细信息在: 仓库: : 文档: : PyPI上的软件包: ://pypi.org/project/deep-forest/ 您可以通过pip安装较新版本的gcForest pip install deep-forest 此存储库中的旧版本(gcForest v1.1.1)仅用作该算法的说明。 gcForest v1.1.1来了! 这是gcForest实施的官方克隆。(大学的Web服务器有时不稳定,因此我们将官方克隆放在github上) 软件包官方网站: : 该软件包按“原样”提供,免费供学术使用。 您可以自行承担运行风险。 出于其他目的,请联系教授( )。 说明:[1]中提出的gcForest的python 2.7实现。 gcFores
1
机器学习是量化金融中一个越来越重要和有争议的话题。 关于机器学习技术是否可以成为实用的投资工具,一直存在激烈的争论。 尽管机器学习算法可以发现微妙的、上下文的和非线性的关系,但在尝试从嘈杂的历史数据中提取信号时,过度拟合会带来重大挑战。 在本文中,我们描述了一些围绕机器学习的基本概念,并提供了一个简单的例子,说明投资者如何使用机器学习技术来预测股票收益的横截面,同时限制过度拟合的风险。
2022-11-20 06:59:23 1.41MB Machine Learning Return
1
jsMind jsMind是一个显示/编辑思维导图的纯的javascript类库,其基于HTML5的帆布进行设计.jsMind以BSD协议开源,在此基础上你可以在你的项目上任意使用。可以你在此浏览 。 jsMind是用于思维导图的纯JavaScript库,它基于html5 canvas。 jsMind是根据BSD许可发布的,如果您遵守许可,则可以将其嵌入到任何项目中。 您可以此处。 jsmind投放发布到npm 链接: 应用程式: : 主页: : 演示: 文件: 维基: 捐赠: 开始使用: < html > < head > < link type =" text/css " rel =" stylesheet " href =" style/jsmind.css " /> < script type =" text/jav
1
Feature Engineering for Machine Learning_Principles and Techniques for Data Scientists(2018.03).A4
2022-11-18 14:57:30 6.16MB 机器学习 特种工程
1
Feature Engineering for Machine Learning and Data Analytics (Chapman & Hall/CRC Data Mining and Knowledge Discovery Series) ISBN-10 书号: 1138744387 ISBN-13 书号: 9781138744387 Edition 版本: 1 出版日期: 2018-04-04 pages 页数: 418 Chapter 1 Preliminaries and Overview Guozhu Dong and Huan Liu Part I Feature Engineering for Various Data Types Chapter 2 Feature Engineering for Text Data Chase Geigle, Qiaozhu Mei, and ChengXiang Zhai Chapter 3 Feature Extraction and Learning for Visual Data Parag S. Chandakkar, Ragav Venkatesan, and Baoxin Li Chapter 4 Feature-Based Time-Series Analysis Ben D. Fulcher Chapter 5 Feature Engineering for Data Streams Yao Ma, Jiliang Tang, and Charu Aggarwal Chapter 6 Feature Generation and Feature Engineering for Sequences Guozhu Dong, Lei Duan, Jyrki Nummenmaa, and Peng Zhang Chapter 7 Feature Generation for Graphs and NetworksYuan Yao, Hanghang Tong, Feng Xu, and Jian Lu Part lI General Feature Engineering Techniques Chapter 8 Feature Selection and Evaluation Yun Li and Tao Li Chapter 9 Automating Feature Engineering in Supervised Learning Udayan Khurana Chapter 10 Pattern-Based Feature Generation Yunzhe Jia, James Bailey, Ramamohanarao Kotagiri, and Christopher Leckie Chapter 11 Deep Learning for Feature Representation Suhang Wang and Huan Liu Part ll Feature Engineering in Special Applications Chapter 12 Feature Engineering for Social Bot Detection Onur Varol, Clayton A. Davis, Filippo Menczer, and Alessandro Flammini Chapter 13 Feature Generation and Engineering for Software Analytics Xin Xia and David Lo Chapter 14 Feature Engineering for Twitter-Based Applications Sanjaya Wijeratne, Amit Sheth, Shreyansh Bhatt, Lakshika Balasuriya, Hussein S. Al-Olimat, Manas Gaur, Amir Hossein Yazdavar, Krishnaprasad Thirunarayan Index
2022-11-18 14:53:08 22.18MB Machine lear
1
受成分限制的基于注意力的网络(CrabNet) 该软件包实现了成分受限的基于注意力的网络( CrabNet ),该网络仅采用成分信息来预测材料特性。 目录 如何引用 安装 复制出版物结果 使用CrabNet或DenseNet训练或预测材料属性 如何引用 如果要使用CrabNet请引用以下工作: (insert BibTeX citation) 安装 此代码使用PyTorch创建神经网络模型。 为了进行快速的模型训练和推理,建议您使用带有最新驱动程序的NVIDIA GPU。 Windows用户应该可以按照以下步骤通过Anaconda安装所有必需的Python软件包。 Linux用户还需要
2022-11-17 21:06:16 188.35MB machine-learning scikit-learn pytorch transformer
1
Python数据科学:Python数据科学拥有位于http://youtube.comtheengineeringworld上的YouTube课程的所有数据集和jupyter笔记本文件,名称为“ Python数据科学课程”。
2022-11-17 10:37:57 1.83MB python data-science data machine-learning
1
人脸识别 本项目代表对面部投影技术(PCA,ICA和LDA)的比较分析,旨在比较使用公平意识训练对这些模型的性能影响的程度。 该技术在FERET图像数据集的两个450图像子集上进行了测试,一个旨在保留美国人口的种族构成(70%的白种人,20%的非洲人,10%的东南亚人),而其他人的种族背景分布均匀(33%的白人,33%的非洲人,33%的东南亚人)。 这两个数据集每个类(人)都包含两个图像,旨在模拟法律规范应用,其中每个人的可用图像数量预计会很少。 培训方法基于[1]中使用的方法。 首先通过均值减法和标准化对训练图像进行预处理。 然后执行PCA,得到一个180维子空间(450的40%),该子空间在受人口影响的数据中分别保留99.66%的信息,在公平意识的数据中分别保留99.68%的信息。 然后将这些预测用作ICA和LDA的输入数据。 生成的空间用于投影以前看不见的图像,并通过将它们与同一个
1
Machine learning for predicting properties of porous media from
2022-11-14 13:32:27 3.13MB 深度学习 卷积神经网络 岩石图像
1