天文物体检测 使用SDSS对天文物体进行分类-DR16数据 数据: SDSS-DR16:Sloan Digital Sky Survey或SDSS是一项主要的多光谱成像和光谱红移测量,使用的是位于美国新墨西哥州Apache Point天文台的专用2.5 m广角光学望远镜。 变量说明: objid =对象标识符 ra = J2000右提升(r波段) dec = J2000偏角(r波段) u = u波段 g = g波段 r = r波段 我=我的乐队 z = z波段 运行=运行编号 重新运行=重新运行编号 camcol =相机列 字段=字段编号 specobjid =对象标识符 类=对象类(星系,恒星或类星体对象) redshift =最终Redshift 板=板号 mjd =观察的MJD 光纤=光纤ID
2021-12-06 21:14:29 7.47MB JupyterNotebook
1
ISIC_挑战_2017 目前,全球每年有超过132,000种黑色素瘤皮肤癌发生。患者和皮肤科医生通过目视检查进行的诊断仅在60%的时间内是准确的。 此外,人均皮肤科医生的短缺促使人们需要计算机辅助方法来检测皮肤癌。 数据集是大量公开的皮肤镜检查图像的集合,并标有地面真实数据。 ISIC 2017挑战赛分为3个任务: 任务01:病变分割 任务02:病变属性检测 任务03:疾病分类 我从事Task1和Task3的工作,即将图像分割和分类为3种可能的类别之一 任务01:病变分割 为了进行培训,我使用了2000张皮肤镜图像,并从ISIC数据集中获得了相应的Ground-Truth遮罩。 对于使用相应的地面真实性测试600张图像,我将图像的大小调整为(128,128),以便进行更快的处理。
2021-12-06 20:02:31 5.18MB JupyterNotebook
1
m5-forecasting-lightgbm-kaggle
2021-12-06 17:42:56 5KB JupyterNotebook
1
堆叠分类器 堆叠分类器以预测客户是否将退出银行
2021-12-06 16:59:11 260KB JupyterNotebook
1
视觉问答 该实现遵循“图像字幕和视觉问题解答的自下而上和自上而下注意”( )和“视觉问题解答的提示和技巧:从中学到的知识”中描述的VQA系统2017年挑战”( )。 结果 模型 验证准确性 训练时间 实施模型(CNN扩展+ BCP) 64.2 40至50分钟(Titan Xp) 使用计算准确性。 实施细节 我们的实现遵循论文的总体结构,但有以下简化: 我们不使用额外数据。 每个图像我们仅使用固定数量的对象(K = 36)。 我们使用一个简单的单流分类器而不进行预训练。 我们使用简单的ReLU激活而不是封闭的tanh。 前两点大大减少了培训时间。 在单个Titan Xp上,我们的实现每个周期大约需要200秒,而本文中描述的实现每个周期需要1个小时。 第三点是因为我们认为原始文档中的两个流分类器和预训练过于复杂,因此没有必要。 对于非线性激活单元,我们尝试了门tanh,
2021-12-06 15:43:30 29KB JupyterNotebook
1
DBN 深度信念网络在Tensorflow中的实现
2021-12-06 14:06:16 38KB JupyterNotebook
1
Kaggle M5预测精度2020 背景 资料库包含我的团队对2020年3月2日至6月30日在Kaggle举行的(即M5)的解决方案。请查看我的! 入门 克隆仓库: git clone https://github.com/mingjiewong/Kaggle-M5-Forecasting-Accuracy-2020.git cd Kaggle-M5-Forecasting-Accuracy-2020 从Kaggle的https://www.kaggle.com/c/m5-forecasting-accuracy/data下载原始数据,然后将其提取: mkdir {path-to-dir}/Kaggle-M5-Forecasting-Accuracy-2020/datasets cd {path-to-dir}/Kaggle-M5-Forecasting-Accuracy-2020
2021-12-06 11:42:37 169KB JupyterNotebook
1
你好! 我是旧金山大学数据科学的硕士学位。 在业余时间,我喜欢旅行和玩数据! 在Covid时代,世界经济遭受重创。 很大一部分是旅游业,其中包括酒店,因为他们面临着大量的取消。 但是,取消预订是酒店由来已久的问题。 当一个人在最后一刻取消时,这可能会成为酒店的沉没成本: 当我看到预订,我的第一个想法是:是否有一种方法可以抢先确定用户是否要取消预订? 这可以帮助酒店/ BnB业主节省很多钱和水电费! 任何数据科学项目都包含四个步骤: 我使用了“。 让我们开始吧! 这是。 我使用了随机森林,正则逻辑回归和XgBoost来确定预订被取消的倾向。 经过超参数调整和交叉验证,我能够以88.7%的准确度预测取消情况。 我希望您能像我一样发现这个项目很有趣!
2021-12-06 06:10:40 1.24MB JupyterNotebook
1
Google BERT入门 这是Packt发布的《 的代码库。 使用BERT构建和训练最先进的自然语言处理模型 这本书是关于什么的? BERT(来自变压器的双向编码器表示形式)以令人鼓舞的结果彻底改变了自然语言处理(NLP)的世界。 本书是入门指南,可帮助您掌握Google的BERT架构。 通过对变压器架构的详细说明,这本书将帮助您了解变压器的编码器和解码器如何工作。 您将通过学习如何对BERT模型进行预训练以及如何对下游任务使用经过预训练的BERT进行学习,来探索BERT体系结构,方法是通过使用Hugging Face转换器库对NLP任务(例如,情感分析和文本摘要)进行微调来对BERT模型进行调整。 随着您的前进,您将了解BERT的不同变体,例如ALBERT,RoBERTa和ELECTRA,并查看SpanBERT,它用于NLP任务(如问题解答)。 您还将介绍基于知识提炼的更简单,
2021-12-05 21:58:01 186KB JupyterNotebook
1
分类_贷款状态 建立了一个分类器,以预测是否将还清贷款案。 数据集 使用以前贷款申请中的历史数据集,清理数据并在数据上应用不同的分类算法使用以下算法构建模型-k最近邻居决策树支持向量机Logistic回归 分析步骤 数据探索数据清理预处理-特征选择/提取归一化数据分类算法模型评估 结果 当适用这些结果时,将使用以下度量标准将结果报告为每个分类器的准确性:Jaccard索引F1分数LogLoass
2021-12-05 21:36:33 5KB JupyterNotebook
1