博客
关于我
大数据的下一站是什么?服务/分析一体化(HSAP)
阅读量:99 次
发布时间:2019-02-26

本文共 1240 字,大约阅读时间需要 4 分钟。

大数据的下一站:服务与分析一体化(HSAP)架构

作者:蒋晓伟(量仔)阿里巴巴研究员

传统的数据库系统分为交易型 OLTP 和分析型 OLAP。随着互联网的快速发展,数据量呈现出指数级增长。单机数据库已无法满足业务需求,尤其是在分析场景中,一个查询可能需要处理大量甚至全量数据。这种压力促成了 Hadoop 技术的兴起,解决了海量数据分析的需求。同时,分布式数据库也应运而生,为 OLTP 场景中的数据量增长提供了支持。

传统的 OLTP 和 OLAP 分离架构存在明显缺陷:定期数据同步导致分析结果延迟,无法满足实时决策需求。近年来,HTAP(Hybrid Transactional Analytical Processing)架构应运而生,允许 OLTP 数据库直接进行分析,提升了时效性。然而,HTAP 是否能取代传统大数据系统,成为大数据的下一站,这一问题引发了广泛讨论。

以推荐系统为例分析大数据系统的典型场景。推荐系统通过实时用户行为数据和交易记录生成个性化推荐,后端技术架构复杂且多元化。推荐系统核心目标是根据用户实时行为做出个性化推荐,每一次用户与系统交互都需要优化后续体验。这样的系统后端需要高效处理海量实时数据,支持复杂查询和模型更新。

推荐系统的数据特征包括:1)用户行为事件(如浏览、点击)和交易记录等;2)基于滑动窗口计算不同维度和时间粒度特征(如商品点击率、浏览量等)。这些特征用于生成实时和离线机器学习样本,训练模型并持续更新。

现有解决方案通过多个产品组合(如 Flink、Druid、HBase)实现服务与分析的融合,但存在数据孤岛、复杂数据同步和高开销等问题。这种复杂度制约了业务迭代速度,增加了开发和运维成本。

我们提出 HSAP(Hybrid Serving/Analytical Processing)架构,通过统一系统解决服务与分析的融合问题。HSAP 展现出以下优势:

  • 高并发混合查询:支持远超 OLAP 的高并发查询,延迟要求更高,且需要处理复杂分析查询。

  • 高吞吐实时数据导入:支持海量实时数据写入,要求写入数据的可见性在秒级甚至亚秒级。

  • 弹性可扩展性:数据写入和查询负载可能突发式增长,系统需要快速调整。

  • HSAP 的核心架构包括:

    • 存储计算分离:分布式文件系统管理数据分片,资源管理器调度计算资源,支持快速扩展。
    • 统一实时存储:支持行存和列存结合,满足点查询和大范围扫描需求。
    • 混合工作负载隔离:通过调度机制确保服务型和分析型查询公平共享资源。
    • 系统开放性:支持与现有存储平台和引擎联邦查询,提供灵活接口。

    阿里巴巴搜索推荐精细化运营业务案例展示了 HSAP 的实际应用:通过统一系统实现实时大屏、实时报表、效果跟踪等多种查询和分析服务,解决运营、产品、算法等不同视角的数据需求。

    HSAP 架构降低了业务复杂度,提升了开发和运维效率,支持快速应对新需求。其秒级甚至亚秒级实时性使数据创造更大商业价值,为大数据发展指明了方向。

    转载地址:http://exwy.baihongyu.com/

    你可能感兴趣的文章
    php更新数据库失败,php – 无法更新MySQL数据库
    查看>>
    php机器人聊天对话框,基于AIML的PHP聊天机器人
    查看>>
    PHP查找数组中最大值与最小值
    查看>>
    php查最大值,在PHP数组中查找最大值
    查看>>
    php标签筛选,关于PHP CodeIgniter框架中通过<a>标签和url做多条件分类筛选
    查看>>
    php根据年月日计算年龄
    查看>>
    RabbitMQ - 单机部署(超详细)
    查看>>
    php检查注册,PHP检查注册的电子邮件地址是一个’school.edu’地址
    查看>>
    php模拟发送GET和POST请求
    查看>>
    RabbitMQ - 以 MQ 为例,手写一个 RPC 框架 demo
    查看>>
    php模板引擎smarty
    查看>>
    php正则表达式模式
    查看>>
    php正则表达式的特殊字符含义
    查看>>
    PHP正则表达式获取武汉市的实时pm2.5数据并邮件发送phpmailer
    查看>>
    RabbitMQ + JMeter组合,优化你的中间件处理方式!
    查看>>
    PHP水仙花问题解法之一
    查看>>
    php没有解析是怎么回事,linux下php文件没有被剖析怎么办?_后端开发
    查看>>
    php注册页面实现注册后跳转页面
    查看>>
    PHP消息队列的实现方式与详解,值得一看
    查看>>
    PHP混合Go协程并发
    查看>>