这是一组脚本,有助于处理NMR pH滴定数据。 这些脚本允许拟合(使用R)和绘制多个残基的数据。 该程序需要变得更加用户友好。
2022-12-31 15:19:06 18KB 开源软件
1
这里是 ShowMeAI 持续分享的【开源eBook】系列!内容覆盖机器学习、深度学习、数据科学、数据分析、大数据、Keras、TensorFlow、PyTorch、强化学习、数学基础等各个方向。整理自各平台的原作者公开分享(审核大大请放手) ◉ 简介:作者 Sanjiv Ranjan Das 是 Santa Clara 大学商学院金融与数据科学教授。这本书是作者为其课程《Machine Learning with R》开发整理的课堂笔记。 ◉ 目录: 数据科学的艺术 起步:数学基础 开源:R语言建模 更多:数据处理与其他 方差均值:马科维茨优化 从经验中学习:贝叶斯定理 自然语言:从新闻中提取信息 巴斯模型 提取维度:判别和因子分析 竞标:拍卖 截断和估计:有限的因变量 乘风破浪:傅里叶分析 建立联系:网络理论 统计大脑:神经网络 聚类分析和预测树
2022-12-31 12:25:25 4.29MB 人工智能 数据科学 算法 R语言
1
这是 ShowMeAI 持续分享的速查表系列!本速查表是《数据科学家知识要点图》。数据科学、机器学习、大数据分析……如果我们想成为一名数据科学家,应该如何开始呢?需要了解哪些工具和技术? 这份速查表用“地铁图”的可视化方式,描绘了成为数据科学家的学习路径。每个领域表示为一条“地铁线”,内容主题按照序号标示为一个个车站。你可以选择一条线路,搭乘地铁并穿过所有车站(主题),最终到达目的地或者中途切换到下一条线路。
1
Organization of data structure part of the code
2022-12-29 22:34:56 858KB data structure
1
DNS(域名系统)在引导Internet流量方面提供了关键功能。 保护DNS服务器免受带宽攻击是DNS服务提供商的一项重要任务。 传统的基于规则的异常或入侵检测方法无法动态更新规则。 基于数据挖掘的方法能够在海量动态查询流量数据中找到各种模式。 这些模式可以帮助DNS服务提供商实时检测异常。 本文提出了一种新颖的频繁情节挖掘算法,以及一种可以实时检测异常的体积趋势预测方法。 基于查询量时间序列的特征,采用基于密度的聚类方法将多个域名划分为不同的组。 提出了一种一致的情节挖掘方法,以发现查询流量如何在不同域名之间的不同时间“传播”。 实验是对实字DNS日志数据集进行的。 提出了有趣的模式,表明基于数据挖掘的方法在DNS服务领域中是合适且有希望的。
2022-12-29 15:31:56 640KB Data mining; Clustering; Frequent
1
基因组VCF到制表符分隔的值 用于将VCF数据转换为制表符分隔值(TSV)的Python脚本 一个小的脚本,它将以VCF格式编码的基因组变异数据转换为制表符分隔的值文件。 该脚本利用解析VCF文件。 默认情况下,程序会打印固定的VCF列,所有INFO标签值(在VCF标头中定义,给定记录中不存在的INFO标签都附加“。”),以及杂合子的所有基因型数据(FORMAT列)和纯合子。 如果存在基因型数据,则每个样本打印一行,而表示为VCF_SAMPLE_ID的列表示给定样本的数据。 脚本具有以下可选参数 跳过样本基因型数据(即FORMAT列) 保留拒绝的基因型(即FILTER\uff01='PASS'/ GT =='./。') 跳过INFO数据。 压缩输出TSV 将VCF列的数据类型打印为标题行 重要信息:如果使用大型多样本VCF文件运行vcf2tsv,则输出TSV的大小将Swift增大,因为默认情
2022-12-29 09:27:44 5KB tsv conversion vcf vcf-data
1
data(近期用到的“图卷积学习”方面的数据集),保存记录。
1
bgp在数据中心的运用。适用于数据中心网络工程师。
2022-12-28 18:18:24 3.03MB bgp 数据中心
1
将您的文档变成数据! | | | Parsr是一个最小的文档(图像,pdf,docx,eml )清洗,解析和提取工具链,可生成JSON,Markdown(MD),CSV / Pandas DF或TXT格式的随时可用,有组织且可用的数据。 它为分析,数据科学家和开发人员提供了干净的结构化和标签丰富的信息集,这些信息集适用于即用型应用程序,包括数据输入和文档分析器自动化,归档等。 当前,Parsr可以执行:文档清理,层次结构再生(单词,行,段落),标题,表,列表,目录,页码,页眉/页脚,链接等的检测。 查看。 目录 入门 安装 -提供高级安装指南- 安装和运行Parsr API的最快方法是通过docker: docker pull axarev/parsr 如果您还希望安装用于发送文档和可视化结果的GUI: docker pull axarev/parsr-ui-localhost 注意:Parsr也可以裸机安装(不通过Docker容器安装),其过程在中进行了。 用法 -提供高级用法指南- 要运行 ,请发出: docker run -p 3001:3001 axar
2022-12-28 16:44:46 16.95MB python nlp pdf data
1
Approximation Algorithms for K-Modes Clustering,何增友,,In this paper, we study clustering with respect to the k-modes objective function, a natural formulation of clustering for categorical data. One of the main contributions of this p
2022-12-28 15:33:15 223KB Clustering Categorical Data K-Means
1