大规模数据聚类的基于随机梯度下降的K-Means算法
2021-12-16 16:15:52 3.5MB 研究论文
1
Kyuubi是基于构建的高性能通用JDBC和SQL执行引擎。 Kyuubi的目标是促进用户处理大数据(如普通数据)。 它提供了标准化的JDBC接口,在大数据场景中具有易于使用的数据访问。 最终用户可以专注于开发自己的业务系统并挖掘数据价值,而不必了解底层的大数据平台(计算引擎,存储服务,元数据管理等)。 Kyuubi依靠Apache Spark提供高性能的数据查询功能,并且引擎功能的每一项改进都可以帮助Kyuubi的性能取得质的飞跃。 此外,Kyuubi通过引擎缓存提高了临时响应速度,并通过水平缩放和负载平衡增强了并发性。 它提供了完整的身份验证和身份验证服务,以确保数据和元数据的安全性。 它提供强大的高可用性和负载平衡,以帮助您保证SLA承诺。 它提供了两级弹性资源管理体系结构,可以有效地提高资源利用率,同时满足包括交互,批处理和点查询或全表扫描在内的所有方案的性能和响应要求。 它包
2021-11-23 16:02:17 17.45MB multi-tenant sql spark yarn
1
DeeperForensics-1.0:用于真实世界人脸伪造检测的大规模数据集 该存储库提供以下论文的数据集和代码: DeeperForensics-1.0:用于真实世界人脸伪造检测的大规模数据集,,,在CVPR 2020中。 | | 摘要:我们介绍了我们正在努力建立用于人脸伪造检测的大型基准。 该基准测试的第一个版本DeeperForensics-1.0代表了迄今为止最大的人脸伪造检测数据集,共有60,000个视频,共1760万帧,是现有同类数据集的10倍。 应用了广泛的现实世界扰动以获得更大规模和更高多样性的更具挑战性的基准。 我们会仔细收集DeeperForensics-1.0中的所有源视频,并通过新提议的端到端人脸交换框架来生成假视频。 经用户研究验证,生成的视频质量优于现有数据集中的视频。 该基准测试具有一个隐藏的测试集,其中包含在人类评估中获得较高欺骗性分数的操纵视频。
2021-11-09 15:15:06 40.27MB benchmark dataset videos method
1
不踩坑的Python爬虫:如何在一个月内学会爬取大规模数据.pdf
2021-10-17 19:07:33 24KB Python
快速核磁共振 | | 通过获取更少的测量值来加快磁共振成像(MRI)的潜力,可以降低医疗成本,将对患者的压力降到最低,并使MR成像在目前速度缓慢或昂贵的应用中成为可能。 是Facebook AI Research(FAIR)和NYU Langone Health的一项合作研究项目,旨在研究使用AI来加快MRI扫描的速度。 纽约大学朗格健康中心已经发布了完全匿名的膝盖和大脑MRI数据集,可以从下载。 可以找到与fastMRI项目相关的出版物。 该存储库包含方便的PyTorch数据加载器,子采样功能,评估指标以及简单基准方法的参考实现。 它还包含fastMRI项目的某些出版物中方法的实现
1
行业分类-外包设计-大规模数据储存和递送系统.zip
MATLAB大规模数据处理技巧.pdf
2021-08-24 18:17:27 4.26MB MATLAB 大数据
1
如何将大规模数据导入Neo4j及导入具体步骤及Demo-附件资源
2021-07-24 15:17:35 23B
1
云计算环境下大规模数据存储技术研究.pdf
2021-07-19 09:04:29 829KB 云计算 云服务 数据服务 参考文献