使用情况
数据量统计:
总数据量: ~1.7PB
系统总容量: ~2.4PB
每日新增数据量: ~15TB
6TB 未压缩原始日志
4TB 未压缩的多维数据(每天重新加载)
压缩率: ~5x (gzip, more with bzip)
使用情况统计:
3200 jobs/day with 800K tasks(map-reduce tasks)/day
55TB of compressed data scanned daily
15TB of compressed output data written to hdfs
80 MM compute minutes/day
2022-05-22 20:02:42
1.84MB
hiv
数据仓库
1