【项目资源】: 包含前端、后端、移动开发、操作系统、人工智能、物联网、信息化管理、数据库、硬件开发、大数据、课程资源、音视频、网站开发等各种技术项目的源码。 包括STM32、ESP8266、PHP、QT、Linux、iOS、C++、Java、python、web、C#、EDA、proteus、RTOS等项目的源码。 【项目质量】: 所有源码都经过严格测试,可以直接运行。 功能在确认正常工作后才上传。 【适用人群】: 适用于希望学习不同技术领域的小白或进阶学习者。 可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。 【附加价值】: 项目具有较高的学习借鉴价值,也可直接拿来修改复刻。 对于有一定基础或热衷于研究的人来说,可以在这些基础代码上进行修改和扩展,实现其他功能。 【沟通交流】: 有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 鼓励下载和使用,并欢迎大家互相学习,共同进步。
2024-04-01 14:48:38 3.49MB 毕业设计 课程设计 项目开发 资源资料
1
聚类马氏距离代码MATLAB SDCOR 用于大规模数据集中局部离群值检测的可扩展的基于密度的聚类 作者: Sayyed-Ahmad Naghavi-Nozad,Maryam Amir Haeri和Gianluigi Folino 目录 抽象的: 本文提出了一种基于批量密度的聚类方法,用于大规模数据集中的局部离群值检测。 与众所周知的假定所有数据都驻留在内存中的传统算法不同,我们提出的方法具有可伸缩性,并且可以在有限的内存缓冲区范围内逐块处理输入数据。 在第一阶段建立一个临时的聚类模型; 然后,通过分析点的连续内存负载来逐步更新它。 随后,在可伸缩聚类结束时,获得原始聚类的近似结构。 最后,通过对整个数据集的另一次扫描并使用适当的标准,将偏远评分分配给称为SDCOR(基于可伸缩密度的​​聚类离群值比率)的每个对象。 对现实生活和综合数据集的评估表明,与需要将所有数据加载到内存中的最著名的传统基于密度的方法相比,该方法具有较低的线性时间复杂度,并且更加有效。 还有一些基于快速距离的方法,这些方法可以对磁盘中驻留的数据执行操作。 框架: 更详细地,所提出的方法包括三个主要阶段。 在第一阶段
2022-12-28 11:42:38 203.7MB 系统开源
1
针对目前缺少大型数据分析框架间的横向比较问题,使用有代表性的大数据工作负载,对Hadoop、Spark和Flink进行性能和可扩展性等因素的比较评价。此外,通过调整工作负载的一些主要参数,例如HDFS块大小、输入数据大小、互连网络或线程配置等,描述了这些框架的行为模式特征。实验结果分析表明,对于非排序的基准测试程序,使用Spark或Flink替代Hadoop,分别带来平均77%和70%执行时间的降低。整体上,Spark的性能结果最好;而Flink通过使用的显式迭代程序,极大提高了迭代算法的性能。
2022-06-22 10:27:49 2.05MB hadoop
1
主要介绍了keras使用Sequence类调用大规模数据集进行训练的实现,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
2022-06-14 14:01:42 55KB keras Sequence类 数据集 训练
1
针对传统Takagi-Sugeno-Kan(TSK)模糊系统处理大规模数据时间代价较高的问题,提出一种基于概率模型框架的L2型TSK模糊系统建模策略,建立具有处理大规模数据能力的贝叶斯L2型TSK模糊系统(B-TSK-FS).具体地,基于L2型TSK模糊系统的输出误差概率化表示,对系统前后件参数联合学习,提高系统的泛化能力.另外,引入狄利克雷先验分布函数,对模糊隶属度稀疏化表示,实现样本的压缩,降低运算时间.在模拟和真实数据集上的实验结果验证了所提出模糊系统的优势.
1
ECE219_Winter2021:大规模数据挖掘
2022-05-29 12:25:10 17.78MB JupyterNotebook
1
大规模数据挖掘-第三章 学习笔记一.doc
2022-05-06 09:08:21 50KB 数据挖掘 学习 文档资料 人工智能
老师上课讲的ppt内容,关于大数据可视化的,和大家分享
2022-01-19 16:28:16 6.93MB 数据可视化
1
Spark是一种通用内存计算框架,使用Scala语言进行实现,它是一种面向对象、函数式编程语言,能够像操作本地集合对象一样轻松地操作分布式数据集
1
IT行业技术实践案例参考
2021-12-23 13:02:10 1.81MB 技术实践 大数据