文本的二进制分类 这是将短信分类为垃圾邮件或非垃圾邮件的示例预热。 这是一个通用实现,可以用作基准和进一步的开发。 该实现包括对文本和Naive Bayes分类器的一些粗略清理。 还可以使用Flask应用程序进行部署。 如何开始 创建环境 我使用conda在Unix环境中创建环境。 $ conda init $ conda create -n ENV_NAME python=3.8.5 $ conda activate ENV_NAME 安装要求 需求已经放在单独的requirements.txt文件中。 要安装它们,请运行以下命令: $ pip install -r requirements.txt 要下载英语的spacy实用程序,请执行以下操作: $ python -m spacy download en_core_web_sm 跑步 要分别训练和创建模型,您应该转到src :
2022-04-16 20:02:53 1.31MB JupyterNotebook
1
适用于金融的Python食谱-代码存储库 适用于金融的Python食谱发布时间:2020年1月31日 平装:432页发行人:Packt Publishing 英语语言 链接 目录 财务数据和预处理 Python技术分析 时间序列建模 多因素模型 使用GARCH类模型对波动率进行建模 财务方面的蒙特卡洛模拟 Python中的资产分配 通过机器学习识别信用违约 金融学中的高级机器学习模型 金融深度学习 埃里克·莱文森(Eryk Lewinson)。 Python财务手册。 Packt Publishing,2020年。 @book{Lewinson2019, address = {Birmingham, UK}, author = {Lewinson, Eryk}, edition = {1}, isbn = {9781789618518}, publisher =
2022-04-16 19:38:41 153.27MB JupyterNotebook
1
家谱 生成家谱图和祖先图的Python代码。应该被其他人用来生成自己的家谱。可自定义的视觉效果(字体,画布大小,背景,框架,图像大小等)。使用枕形图和祖先图/图表生成的族谱图,该图/图表由Matplotlib,枕形图和Cartopy组合生成
2022-04-16 15:15:36 164.41MB JupyterNotebook
1
分层相关传播,用于解释基于MRI的阿尔茨海默氏病分类中的深层神经网络决策 莫里茨·博莱(MoritzBöhle),法比安·埃特尔(Fabian Eitel),马丁·韦甘特(Martin Weygandt)和克斯坦·里特 预印本: : 摘要:深层神经网络已导致许多医学成像任务的最新成果,包括基于结构磁共振成像(MRI)数据的阿尔茨海默氏病(AD)检测。 但是,网络决策通常被认为是高度不透明的,因此很难将这些算法应用于临床程序。 在这项研究中,我们建议使用分层相关传播(LRP)来可视化基于MRI数据的AD的卷积神经网络决策。 与其他可视化方法类似,LRP在输入空间中生成一个热图,以指示每个体素对最终分类结果做出贡献的重要性/相关性。 与引导反向传播产生的磁化率图相反(“体素的哪个变化最能改变结局?”),LRP方法能够直接突出显示输入空间中对网络分类的积极贡献。 特别是,我们表明(1)LRP
2022-04-14 16:20:12 3.32MB JupyterNotebook
1
信用卡_欺诈检测 快速分析信用卡数据集 链接到数据: : 该项目是对从kaggle下载的信用卡数据的分析。 该项目的主要目标是创建一个有效的分类器,以区分欺诈性操作和常规操作。 实际数据库高度不平衡,包括30个功能变量和1个目标变量。 其中28个要素变量是匿名的。 该项目包含3本书: data_explo用于探索和一些可视化 用于模型创建的MLdetection:已选择3个模型-Logistic回归,Random Forest和SVM(在第一个版本中) 检查分类器决策中影响最大的变量的可解释性
2022-04-14 15:36:21 3.6MB JupyterNotebook
1
深度学习用于后处理集成天气预报 我们使可用的数据,以及为需要运行在我们的模型中的代码通过这个资料库。 我们希望我们的发现和数据可以用于进一步推进天气预报研究。 研究内容 我们的研究重点是应用从深度学习到集成天气预报的最新架构。 为了实现这一目标,我们使用来自ECMWF的全局重新预测数据(我们称为ENS10 )以及重新分析数据ERA5 。 更具体地说,ENS10旨在为研究人员提供基本的预报值数据集,这些数据将用于现代数值天气预报管道中。 使用ERA5数据作为基本事实,然后使用整体预测的子集进行后处理和改进。 我们的目标是帮助天气预报中心更便宜,更准确地预测极端天气事件。 在热带气旋的情况下,我们使用五个轨迹的子集,在全部10个成员合奏中的连续排名概率得分(CRPS)中进行了测量,相对于预测技能,其相对提高了26%以上。 此外,这些模型可以更准确地预测旋风的未来路径。 依存关系 为了通过虚拟
2022-04-13 22:52:11 157.74MB JupyterNotebook
1
快速AI Colab笔记本测试Fastbook的代码
2022-04-13 09:43:24 3.52MB JupyterNotebook
1
机器_学习_代码_实现 基于NumPy的机器学习算法的Python代码实现。
1
UCI_CpuPerformance_Regression- 使用UCI CpuSet进行回归 数据集:您可以通过获取数据 df = pd.read_csv('./machine.data', sep=',', header=None) 数据集属性信息: 供应商名称:30(顾问,amdahl,apollo,basf,bti,burroughs,crd,cambex,cdc,dec,dg,地层,四相,古尔德,霍尼韦尔,hp,ibm,ipl,magnuson,微数据,nas,ncr ,nixdorf,perkin-elmer,prime,siemens,sperry,sratus,wang) 型号名称:许多独特的符号 MYCT:机器循环时间(以纳秒为单位)(整数) MMIN:最小主内存(以千字节为单位)(整数) MMAX:最大主内存(以千字节为单位)(整数) CACH:高速缓存内
2022-04-12 23:10:49 86KB JupyterNotebook
1
NBA比赛预测 预测任何给定的NBA比赛的结果 概述 随着篮球运动的日益普及,数据已经成为分析球员和球队表现的最前沿。 NBA老板会尽一切努力来获得优于对手的优势,球员们会寻求经理和教练的帮助,以帮助他们通过对相关数据的洞察力来提高自己的实力。 投注者还希望通过统计信息更好地告知自己游戏的潜在结果。 根据过去18年来自basektball-reference.com的NBA统计数据,我们创建了一个模型来预测主队是否会根据之前的统计数据赢得特定比赛。 我们在每个模型中都严格使用团队数据。 业务问题 达拉斯小牛队的老板马克·库班(Mark Cuban)一直在考虑招聘和外部分析顾问,因为他的团队长期处于亏损状态。 Cuban不知道出了什么问题,他希望具有强大分析背景的人可以帮助他了解团队问题。 有几位外部顾问向他推销,我们就是其中之一! 我们决定创建一个模型,以帮助预测为什么任何给定的NBA球
2022-04-12 21:22:35 670KB JupyterNotebook
1