视觉问答 该实现遵循“图像字幕和视觉问题解答的自下而上和自上而下注意”( )和“视觉问题解答的提示和技巧:从中学到的知识”中描述的VQA系统2017年挑战”( )。 结果 模型 验证准确性 训练时间 实施模型(CNN扩展+ BCP) 64.2 40至50分钟(Titan Xp) 使用计算准确性。 实施细节 我们的实现遵循论文的总体结构,但有以下简化: 我们不使用额外数据。 每个图像我们仅使用固定数量的对象(K = 36)。 我们使用一个简单的单流分类器而不进行预训练。 我们使用简单的ReLU激活而不是封闭的tanh。 前两点大大减少了培训时间。 在单个Titan Xp上,我们的实现每个周期大约需要200秒,而本文中描述的实现每个周期需要1个小时。 第三点是因为我们认为原始文档中的两个流分类器和预训练过于复杂,因此没有必要。 对于非线性激活单元,我们尝试了门tanh,
2021-12-06 15:43:30 29KB JupyterNotebook
1
DBN 深度信念网络在Tensorflow中的实现
2021-12-06 14:06:16 38KB JupyterNotebook
1
Kaggle M5预测精度2020 背景 资料库包含我的团队对2020年3月2日至6月30日在Kaggle举行的(即M5)的解决方案。请查看我的! 入门 克隆仓库: git clone https://github.com/mingjiewong/Kaggle-M5-Forecasting-Accuracy-2020.git cd Kaggle-M5-Forecasting-Accuracy-2020 从Kaggle的https://www.kaggle.com/c/m5-forecasting-accuracy/data下载原始数据,然后将其提取: mkdir {path-to-dir}/Kaggle-M5-Forecasting-Accuracy-2020/datasets cd {path-to-dir}/Kaggle-M5-Forecasting-Accuracy-2020
2021-12-06 11:42:37 169KB JupyterNotebook
1
你好! 我是旧金山大学数据科学的硕士学位。 在业余时间,我喜欢旅行和玩数据! 在Covid时代,世界经济遭受重创。 很大一部分是旅游业,其中包括酒店,因为他们面临着大量的取消。 但是,取消预订是酒店由来已久的问题。 当一个人在最后一刻取消时,这可能会成为酒店的沉没成本: 当我看到预订,我的第一个想法是:是否有一种方法可以抢先确定用户是否要取消预订? 这可以帮助酒店/ BnB业主节省很多钱和水电费! 任何数据科学项目都包含四个步骤: 我使用了“。 让我们开始吧! 这是。 我使用了随机森林,正则逻辑回归和XgBoost来确定预订被取消的倾向。 经过超参数调整和交叉验证,我能够以88.7%的准确度预测取消情况。 我希望您能像我一样发现这个项目很有趣!
2021-12-06 06:10:40 1.24MB JupyterNotebook
1
Google BERT入门 这是Packt发布的《 的代码库。 使用BERT构建和训练最先进的自然语言处理模型 这本书是关于什么的? BERT(来自变压器的双向编码器表示形式)以令人鼓舞的结果彻底改变了自然语言处理(NLP)的世界。 本书是入门指南,可帮助您掌握Google的BERT架构。 通过对变压器架构的详细说明,这本书将帮助您了解变压器的编码器和解码器如何工作。 您将通过学习如何对BERT模型进行预训练以及如何对下游任务使用经过预训练的BERT进行学习,来探索BERT体系结构,方法是通过使用Hugging Face转换器库对NLP任务(例如,情感分析和文本摘要)进行微调来对BERT模型进行调整。 随着您的前进,您将了解BERT的不同变体,例如ALBERT,RoBERTa和ELECTRA,并查看SpanBERT,它用于NLP任务(如问题解答)。 您还将介绍基于知识提炼的更简单,
2021-12-05 21:58:01 186KB JupyterNotebook
1
分类_贷款状态 建立了一个分类器,以预测是否将还清贷款案。 数据集 使用以前贷款申请中的历史数据集,清理数据并在数据上应用不同的分类算法使用以下算法构建模型-k最近邻居决策树支持向量机Logistic回归 分析步骤 数据探索数据清理预处理-特征选择/提取归一化数据分类算法模型评估 结果 当适用这些结果时,将使用以下度量标准将结果报告为每个分类器的准确性:Jaccard索引F1分数LogLoass
2021-12-05 21:36:33 5KB JupyterNotebook
1
kinect注入 Kinect和IMU传感器数据的记录器和分类
2021-12-05 20:17:04 2.94MB JupyterNotebook
1
需求预测 用于预测需求的线性回归模型,使用python编写的笔记本运行线性回归以预测需求负荷。 数据恰好来自2013年至2015年间阿根廷Corrientes省的 。单击 查看笔记本。
2021-12-05 18:50:37 726KB JupyterNotebook
1
房屋价格预测器 目的和技术:以下程序使用Python , Matplotlib , Numpy , Sympy , Pandas和sci-kit预测波士顿市的房价。 程序: 提出问题 收集数据 清理数据 探索可能性和相关性 图形化地建模数据 评估功能内的价格 算法:我实现了一个多元线性回归模型来预测房价。这种方法也称为多元回归,是一种统计技术,它使用几个参数变量来预测响应变量的结果。在这种情况下,我从数据集中提取了几个变量,包括房价,犯罪率,年龄,距水的近距离,税收等,以使我的模型更准确。我挑选出与初始价格数据相对应的p值较低的变量,以及对于此特定问题具有逻辑意义的其他条件。然后,我将自己的知识运用到分配方法,标准差,MSE,RMSE等方面……对房价进行最终计算。 另外,我考虑了线性回归中的多重共线性等问题,以确保我的程序尽可能精确。 数据可视化工作: 下面是一个模型,用于说明数据集中变量
2021-12-05 18:05:17 3.27MB JupyterNotebook
1
PySlide 正在开发中 很棒的组织病理学整个幻灯片图像处理库! ·· 目录 关于该项目 该库提供了预处理组织病理学完整幻灯片图像的功能。 数字全片是物理组织标本的超高分辨率图像,在手术过程中已将其取出以供病理学家评估。 这些标本存储在载玻片上,并使用生物扫描仪进行扫描,以产生约100,000x100,000像素(1gb-4gb)大小的图像。 由于它们占用的内存很大,因此以计算方式分析图像可能是一项复杂的任务,尤其是在机器学习方面。 Openslide之类的库提供了一个不错的框架,可以像python这样的语言来打开和使用这些图像,但是缺少用于更高级的预处理和分析的丰富功能集。 该库是工作和操作WSI的综合框架的开始,尤其是侧重于机器学习。 例如,已经探索了许多方法来减轻训练ml全片图像数据集的内存负担,包括将图像平铺为更小,更易于管理的补丁。 该库提供了一种希望的简单方式来执行此类
2021-12-05 16:57:27 3.59MB JupyterNotebook
1