scrapy提供了多种类型爬虫的基类,如BaseSpider、sitemap爬虫等,是一个为爬取网站数据、提取结构性数据而设计的应用程序框架,它可以应用在广泛领域
2022-06-17 14:14:24 487KB scrapy Python 爬虫 分布式
1
用-Hadoop-进行分布式数据处理
2022-06-17 14:09:12 903KB hadoop 大数据 分布式 数据处理
大数据基础第四章分布式数据库Hbase,本PPT含HBase概述、访问接口、数据模型、实现原理、运行机制、HBase的安装与运行截图。
2022-06-17 09:10:56 32.39MB 大数据 分布式数据库 HBase
分布式系统概念与设计 原书第5版.pdf,分布式系统知识必不可少的一本书,分布式的通信,安全,文件系统,事物等知识
2022-06-17 00:48:53 57.48MB 分布式系统 概念与设计 第5版 中文版
1
用-Hadoop-进行分布式数据处理
2022-06-16 18:07:45 903KB hadoop 分布式 数据处理 数据分析
1
干货分享(一) " ChainSQL与分布式数据库以及数据库集群的区别 干货分享(一) " ChainSQL与分布式数据库以及数据库集群的区别 什么是ChainSQL? ChainSQL是江苏众享金联科技有限公司联合北京众享比特科技有限公司发布的基于区块链技术的数据库中间件,综合了区块链技术和传统数据库的特性,对数据表的所有操作以日志的形式记录在区块链上,提供不可篡改且能在任何时间点恢复的数据库服务,用户可像使用数据库一样便捷地使用区块链技术。 什么是分布式数据库? 分布式数据库是指利用高速计算机网络将物理上分散的多个数据存储单元连接起来组成一个逻辑上统一的数据库。分布式数据库的基本思想是将原来集中式数据库中的数据分散存储到多个通过网络连接的数据存储节点上,以获取更大的存储容量和更高的并发访问量。分布式数据库在使用上可视为一个完整的数据库。 ChainSQL与分布式数据库以及数据库集群的区别全文共6页,当前为第1页。分布式数据库主要是通过对库和表拆分的方式来实现。主要拆分方式有两种:水平拆分和垂直拆分。垂直拆分是把不同的表拆到不同的数据库中,而水平拆分是把同一个表拆到不同的数据库中。当
2022-06-16 18:03:43 688KB 数据库 分布式 文档资料
SeaweedFS支持SeaweedFS SeaweedFS是一个独立的Apache许可的开源项目,由于这些出色的支持者的支持,其正在进行的开发成为可能。 如果您想要SeaweedFS支持SeaweedFS SeaweedFS是一个独立的Apache许可的开源项目,由于这些出色的支持者的支持,其正在进行的开发是完全可能的。 如果您想使SeaweedFS更加强大,请考虑加入Patreon上的赞助商。 我和其他支持者将非常感谢您的支持! 通过Patreon赞助SeaweedFS。下载不同平台上的Binary在Slack上使用SeaweedFS在Twitter上使用SeaweedFS SeaweedFS Mailin
2022-06-15 22:56:13 25.37MB Golang Miscellaneous
1
分布式文件系统HDFS、分布式资源管理系统YARN、分布式计算框架Spark、分布式ETL工具Sqoop、分布式数据采集工具Flume、分布式消息队列Kafka、分布式消息队列Kafka、分布式数据仓库Inceptor、分布式NewSQL数据库Hyperbase
2022-06-15 21:03:04 35.78MB 分布式存储
集合Maven,hdfs,mapreduce等相关所有jar包及依赖包
2022-06-15 19:20:53 29.37MB hadoop jar
1
费了老大劲找到的经典书籍,分享给大家
2022-06-15 19:20:21 43.6MB 分布式数据库
1