使用PySpark的贷款默认预测 使用Lending Club中包含100万以上行的数据集将贷款预测为违约/非违约 整个项目是在单个群集的Databricks云环境中完成的
2023-05-12 17:03:23 1.44MB HTML
1
蛋白质金属结合位点预测 投稿人:田秋,郑子涵,金文浩 生物学意义: 蛋白质及其结构是生命中生物学功能的关键。 通过翻译,核糖体将延长氨基酸序列链,这些氨基酸的物理化学特性及其相互依赖性使一级结构折叠成其复杂的三级结构。 一旦建立了结构,蛋白质结构可能会允许某些离子结合,这可能导致该结构通过构象变化更稳定,或有助于催化。 例如,锌指稳定结构,或血红素基团中离子的必要性,以使血红蛋白转运氧气。 另外,结合位点的序列和结构往往在整个世代中都被保守,并且来自蛋白质数据库(PDB)的大约1/3的蛋白质结构包含金属离子这一事实可能表明它显着干预了蛋白质的行为。 目标 : 我们的兴趣是利用一个突出的神经网络来识别哪些金属与哪个序列结合,以及该金属与哪些氨基酸特异性结合。 我们的目标是将金属分类为准确度为95%的序列。 我们的目标是对哪些氨基酸与F1分数达75%的金属结合进行分类。 概述: [
2023-04-09 12:39:17 316.17MB JupyterNotebook
1
沃伦-股票价格预测器 股市预测是试图确定公司股票或在交易所交易的其他金融工具的未来价值的行为。 成功预测股票的未来价格可能会产生可观的利润。 有效市场假说表明,股票价格反映了所有当前可用的信息,因此,任何不基于新发现信息的价格变化本质上都是不可预测的。 其他人则不同意,并且拥有这种观点的人拥有无数的方法和技术,据称它们可以获取未来的价格信息。 在这里,我们利用Facebook的时间序列预测算法Prophet,使用多变量,单步预测策略,实时预测美国公司的股票市场价格。 入门 从github下载或克隆项目 $ git clone https://github.com/nityansuman/wa
2023-04-07 10:52:14 1.28MB python flask neural-networks stock-price-prediction
1
肺炎的预测 使用迁移学习预测肺炎(计算机视觉) Inception v3是一种广泛使用的图像识别模型,已显示在ImageNet数据集上达到了78.1%以上的精度。 该模型是多年来由多个研究人员提出的许多想法的集合。 它基于原始论文:Szegedy等人的“重新思考计算机视觉的初始架构”。 al。 该模型本身由对称和不对称的构建块组成,包括卷积,平均池,最大池,连接,丢失和完全连接的层。 Batchnorm在整个模型中得到广泛使用,并应用于激活输入。 损耗是通过Softmax计算的。 我们已经对模型进行了微调,以使其可以用于2个新的不同类的分类。 记住要安装requirements.txt
2023-04-01 13:53:06 52KB JupyterNotebook
1
基于不平衡数据的Python_Health-Insurance-交叉销售预测 在该项目中,我们将现代机器学习技术应用于保险单持有人的数据,以分析和预测其行为。 使用Python语言,我们对数据的处理方法产生了令人兴奋的见解,可以帮助保险公司进行业务建模。
2023-03-17 18:20:03 6.05MB JupyterNotebook
1
该存储库包含Tübingen-Oslo团队在 使用的源代码。 该方法在英语和西班牙语数据集上均赢得了最佳位置。 该论文描述了该研究: ÇağrıÇöltekin和Taraka Rama(2018) 。 在:第十二届国际语义评估研讨会(SemEval-2018)的会议记录,第34-38页( ) 要求 该存储库仅包含模型的代码。 您需要按照网页上的说明获取数据。 为了进行测试,存储库中包含一个小样本。 除了标准的Python库, , (和 )需要运行在这个仓库的脚本。 脚本的简要说明 所有脚本都在Python 3上运行(可能需要进行一些更改才能在Python 2上运行)。 大多数脚本通过命令行选项和提供摘要的-h选项进行控制。 k-fold-linear.py使用n-grams袋模型对指定输入进行给定超参数的k倍交叉验证,并报告。 k-fold-linear.py -h给出了简要
2023-03-06 09:45:16 649KB Python
1
乳腺癌预测应用程序使用 Flask-Python 在乳腺癌威斯康星州数据集上建立机器学习模型来预测癌症是良性还是恶性。 定义问题陈述 我们的主要目标是使用 Flask API 构建一个应用程序并部署在 Heroku 上以对乳腺癌是良性还是恶性进行分类。 使用此链接访问完整项目的文件夹 此文件夹包含连接到这 5 部分文章的 Python 代码: | | | | 通过这段代码,我们将学习: 如何在 Heroku 上使用 Flask API 部署模型? 数据来自威斯康星癌症数据集。 该数据由威斯康星大学麦迪逊分校的医院和William H. Wolberg博士收集。 阅读更多 与我联系
2023-03-05 10:43:23 66KB HTML
1
您可以使用本数据集从严格的制图变量(与遥感数据相反)中预测森林覆盖类型(主要的树种)。给定的30 x 30米单元的实际森林覆盖类型是根据美国森林服务(USFS)区域2资源信息系统数据确定的。然后,从美国地质调查局和USFS获得的数据中得出自变量。数据为原始格式(未缩放),包含用于定性自变量(例如荒野和土壤类型)的二进制数据列。 sampleSubmission.csv test3.csv train.csv
2023-03-02 21:46:14 1.52MB 数据集
1
BigMart销售预测 BigMart销售数据集包含2013年销售数据,这些数据来自不同城市的10个不同网点的1559种产品。 以下项目的目标是建立一个回归模型,以预测下一年在10个不同的BigMart网点中每种1559产品的销售情况。 BigMart销售数据集还包含每个产品和商店的某些属性。 此模型可帮助BigMart了解在增加整体销售额中起重要作用的产品和商店的属性。 该项目由Harsh Nagoriya自豪地创建。
2023-02-27 02:56:28 1.26MB JupyterNotebook
1