超千亿规模的数据,数据库根本就运行不了,怎么办?
数据从产生到能够查询,要延迟一天才能看到,如何能做到分钟级延迟?
50台规模的hadoop集群,几亿条数据,一个MR任务要运行几小时,每天也就能进行几百次查询。
如何能让任务的执行时间缩短到秒级响应,每天能执行千万次查询。
Hbase只接受KV形式的存储,数万个维度的大宽表,如何进行多维索引?
Storm流计算能预计算固定的维度、粒度,但业务千变万化,突发事件很多,如何对任意维度的组合进行筛选、钻取、统计?
硬盘坏了,机器宕机,怎样做到数据可靠不丢失?
小型机太贵,我们买不起,怎么办?
YDB特性
1. 千亿规模
在真实业务环境上验证,每天可达千亿增量,总数据量可达几万亿 。
2. 低延迟
数据从产生到能查询,根据配置的不同一般在十几秒到几分钟。
3. 查询快-高性能
常规查询毫秒级响应 常规统计秒级响应。
4. 实时搜索
长文本字段可以根据关键词进行全文检索模糊匹配,并且有较高的性能。
5. 多维钻取
支持上万个维度,任意组合查询,任意维度组合过滤、分组,统计、排序。
6. 容灾可靠
索引存储在分布式文件系统中,不因硬件的损坏或异常宕机而丢失数据。
7. Sql Api:
更易于上手与使用。
1