房屋价格预测器 目的和技术:以下程序使用Python , Matplotlib , Numpy , Sympy , Pandas和sci-kit预测波士顿市的房价。 程序: 提出问题 收集数据 清理数据 探索可能性和相关性 图形化地建模数据 评估功能内的价格 算法:我实现了一个多元线性回归模型来预测房价。这种方法也称为多元回归,是一种统计技术,它使用几个参数变量来预测响应变量的结果。在这种情况下,我从数据集中提取了几个变量,包括房价,犯罪率,年龄,距水的近距离,税收等,以使我的模型更准确。我挑选出与初始价格数据相对应的p值较低的变量,以及对于此特定问题具有逻辑意义的其他条件。然后,我将自己的知识运用到分配方法,标准差,MSE,RMSE等方面……对房价进行最终计算。 另外,我考虑了线性回归中的多重共线性等问题,以确保我的程序尽可能精确。 数据可视化工作: 下面是一个模型,用于说明数据集中变量
2021-12-05 18:05:17 3.27MB JupyterNotebook
1
PySlide 正在开发中 很棒的组织病理学整个幻灯片图像处理库! ·· 目录 关于该项目 该库提供了预处理组织病理学完整幻灯片图像的功能。 数字全片是物理组织标本的超高分辨率图像,在手术过程中已将其取出以供病理学家评估。 这些标本存储在载玻片上,并使用生物扫描仪进行扫描,以产生约100,000x100,000像素(1gb-4gb)大小的图像。 由于它们占用的内存很大,因此以计算方式分析图像可能是一项复杂的任务,尤其是在机器学习方面。 Openslide之类的库提供了一个不错的框架,可以像python这样的语言来打开和使用这些图像,但是缺少用于更高级的预处理和分析的丰富功能集。 该库是工作和操作WSI的综合框架的开始,尤其是侧重于机器学习。 例如,已经探索了许多方法来减轻训练ml全片图像数据集的内存负担,包括将图像平铺为更小,更易于管理的补丁。 该库提供了一种希望的简单方式来执行此类
2021-12-05 16:57:27 3.59MB JupyterNotebook
1
rl迷宫 OpenAI体育馆中用于强化学习解决方案的迷宫环境
2021-12-05 15:26:59 18KB JupyterNotebook
1
蒙特卡洛经济 使用蒙特卡洛模拟封闭经济的财富分配
2021-12-05 14:52:05 373KB JupyterNotebook
1
差异性隐私和联合学习。 精选笔记本,介绍如何使用差异隐私和联合学习来训练神经网络。 入门笔记本 在开始学习差异隐私和联合学习之前,了解张量很重要; 神经网络的基本数据结构。 了解张量: 创建简单的神经网络 使用MNIST数据创建密集网络 转移学习 大多数情况下,您不想自己训练整个卷积网络。 对大型图像集(例如ImageNet)进行现代ConvNets培训需要在多个GPU上花费数周的时间。 可以帮助您解决此问题。 什么是差异隐私? 差异隐私是用于防止模型在学习过程中意外记住训练数据集中存在的秘密的一组技术。 为了使其正常工作,我们需要坚持以下几点: 向数据主体保证:不管有哪些研究,数据集或信息来源,都可以通过将您的数据用于任何分析中而不会受到不利影响或其他影响。 确保从敏感数据中学习的模型仅在学习他们应该学习的知识时,不会无意中学习从他们的数据中学到的知识 以下是一些笔记本,以进一
2021-12-04 21:20:28 81.86MB JupyterNotebook
1
取消旧版 快速入门:使用DeOldify(免费!)的最简单方法是在此处: DeOldify图像着色的最高级版本仅在此处可用。 免费尝试一些图片! 图片(艺术) | 视频 NEW使用默认的图像着色器(又称“艺术”)有麻烦吗? 请尝试以下“稳定”的方法。 它通常不会产生像“艺术”一样有趣的颜色,但是毛刺明显减少了。 图像(稳定) 老爱尔兰在Colour的John Breslin的视频教程表格中提供了有关如何使用上述Colabs的说明。 这很棒! 点击下面的视频图像观看。 在获取更多更新 。 目录 关于DeOldify 简而言之,该项目的任务是对旧图像和胶片进行着色和还原。 我们将详细介绍一些细节,但首先让我们看一些漂亮的图片和视频! DeOldify中令人兴奋的新东西 毛刺和伪像几乎被完全消除 更好的皮肤(更少的僵​​尸) 更详细,更真实的渲染 更少的“蓝色偏见” 视频-实际
2021-12-04 21:17:12 104KB JupyterNotebook
1
FER 基于FER2013 Kaggle数据集的面部表情识别模型。 当前模型可实现约67%的精度。 在添加更多训练数据集以提高概括能力的过程中。 对模型体系结构进行一些调整可能会提高准确性。
2021-12-04 20:06:43 802KB JupyterNotebook
1
贝叶斯套索的Jupyter笔记本 我使用python sklearn模块实现了套索算法。然后,我使用PyMC3和emcee执行了贝叶斯套索的两种实现。一个笔记本示例在bayes_lasso.ipynb中。这两个贝叶斯套索实现在bayesian_lasso_emcee.py中。lasso_PyMC3.py
2021-12-04 18:12:10 69KB JupyterNotebook
1
TCSP-时间约束满意度问题 TSCP是一个约束满足问题,其中变量代表时间点,时间信息由一元和二进制约束集表示。 我们将TCSP与图相关联,包括: 一组具有连续域的变量X_1 to X_n 一组约束,每个约束由一组间隔表示 一元约束T_i将变量X_i的域限制为给定的间隔集。 二进制约束T_{ij}将X_j - X_i的距离值约束到一组间隔。 我们用有向约束图表示,其中节点代表变量,边i -> j指定约束T_{ij} 。 为简单起见,我们还引入了X_0 = 0 ,因此一元约束由T_{0i} 。 STP-简单的时间问题 STP是TCSP,其中所有约束都指定一个间隔。 我们将这个问题与distance graph (V, E_d) ,其中V由与约束网络相同的节点组成,并且每个边缘都由权重a_{ij}标记,表示X_j - X_i <= a_{ij} 。 输入 求解器程序的输入由std
2021-12-04 17:24:26 356KB JupyterNotebook
1
dengai2 第二次尝试来自DrivenData.org的DengAI挑战。 此处提供了挑战的链接: : 。 这项挑战的目的是预测城市中的登革热病例。 该疾病是通过蚊子传播的,因此预测登革热的数量与预测蚊子的数量高度相关。 回购概述 原始数据直接从DrivenData下载,位于data / raw文件夹下。 经过处理的文件夹将数据转换成可行的格式以用于某些模型测试后,其中包含数据。 所有代码都位于py文件夹中。 笔记本-探索 该文件的目的是获得数据的第一印象并进行所有认为的绘图。 发现: 应用KPSS和ADF测试,我们看到大多数时间序列都很好,尽管有些时间必须根据KPSS和ADF的特定测试结果进行差分或逆趋势处理。 对于某些变量,我们发现大量遗漏的观测值。 为了解决这个问题,我们应用KNNImputation并测试了不同数量的邻居。 为了评估插补的性能,我们在每次插补之后预测目
2021-12-04 16:29:44 10.35MB JupyterNotebook
1