大数据科普:大数据系统后台层次角色 及数据流向 最近有不少质疑大数据的声音,这些质疑有一定的道理,但结论有些以偏概全,应该 具体问题具体分析。对大数据的疑问和抗拒往往是因为对其不了解,需要真正了解之后 才能得出比较客观的结论。 大数据是一个比较宽泛的概念,它包含大数据存储和大数据计算,其中大数据计算 可大致分为计算逻辑相对简单的大数据统计,以及计算逻辑相对复杂的大数据预测。下 面分别就以上三个领域简要分析一下: 第一,大数据存储解决了大数据技术中的首要问题,即海量数据首先要能保存下来 ,才能有后续的处理。因此大数据存储的重要性是毫无疑问的。 第二,大数据统计是对海量数据的分析统计和轻度挖掘,例如统计海量用户产品的 日/月活跃度、用户基于地区的分布、用户历史操作、运营侧数据指标等,这些需要大数 据计算平台的支持才能实现,对于拥有海量用户的互联网公司来说是不可或缺的技术。 第三,大数据预测领域才是争议最多的领域。事实上,预测必有误差、必有小概率 事件,大数据预测的背后是各种机器学习/模式识别等深度挖掘算法,这些算法只是工具 而已,用得好不好、恰不恰当还是要看应用的领域和使用
2022-06-22 09:03:33
36KB
文档资料