AnalyticDB 搭载 AMD 性价比提升30%

图灵汇官网

概述

阿里云原生数仓 AnalyticDB for PostgreSQL 与 AMD 新一代硬件紧密集成,通过自主研发的计算引擎及行列混合存储架构,实现了性能的显著提升,整体性能提升了30%。此数仓解决方案旨在为企业构建一体化的离线在线分析平台,支持流批一体的综合数据分析,统一引擎满足离线批处理、流式加工与交互式分析的需求,从而在开发运维、时效性和成本效益方面提供卓越价值。

硬件优化路径

硬件架构优化

系统设计与处理器性能

AMD与阿里云合作打造的新型硬件基于创新CIPU架构,搭载AMD EPYC Genoa处理器,提供稳定算力、高效I/O引擎与芯片级安全加固。第四代EPYC相较于前代,在高算力、高内存带宽、低延迟等方面进行了优化,特别适合数据仓库和在线分析场景。

计算能效提升

新一代服务器在相同核心数下展现出显著性能提升:整数性能提高约24%,浮点性能提高约52%,这意味着更少的服务器资源就能完成更多工作,或是在相同的资源下实现更高工作效率。

安全性和隔离性强化

第四代AMD EPYC支持安全内存加密(SME)和安全加密虚拟化(SEV),确保内存与线程安全,有效抵御旁路攻击。此外,增加的加密上下文数量,以及SEV-ES和SEV-SNP功能,进一步增强了虚拟机状态的安全性和数据防护能力。

内核优化

计算引擎自研

AnalyticDB for PostgreSQL的自研计算引擎通过以下技术加速数据处理与交互式分析:

  • 向量化技术:利用SIMD指令集最大化芯片并行计算能力。
  • LLVM JIT:动态编译优化,提高计算效率。
  • 动态内存模型:根据计算模式自动选择行存/列存,优化内存使用。
  • 特定场景加速方案:如Runtime Filter加速Join分析,字典优化加速低基数字段计算。

行列混合存储优化

一份存储空间同时支持实时高吞吐写入/更新和实时高聚合分析,实现高效数据管理和查询性能。

  • 写入优化:通过Write Optimized Part高效处理批量/流式数据,Optimize过程将数据转换为Read Optimized Part,提升查询性能。Metadata支持高并发Update/Delete操作。
  • 去重机制:基于Btree索引的强主键模型,实现快速精准数据去重,单CPU Core写入性能可达10万行/秒。
  • Upsert功能:提供灵活的主键冲突处理策略,包括忽略更新、覆盖更新或条件更新。

安全能力增强

  • 网络连接安全:SSL/TLS加密算法满足最新网络安全标准。
  • 存储安全:云盘加密实现数据加密存储。
  • 加密算法:支持非对称加密和对称加密(如SM4)。
  • 权限控制:实现细粒度权限管理和最小敏感数据访问。
  • 动态数据脱敏:引擎级支持敏感字段脱敏规则,保护敏感信息。
  • SQL审计:记录SQL操作细节,支持异常行为追踪。

测试结果

性能测试采用TPC-H基准测试集,实验组使用AMD EPYC Genoa服务器,与同等规格的主流硬件相比,AnalyticDB for PostgreSQL性能平均提升32.7%。

应用优势与场景

离在线一体分析

提供稳定高效的离线批处理与高性能在线报表分析能力,减少数据一致性问题,实现高效交互式分析,支持实时物化视图,满足高并发报表查询需求。

海外数仓平滑迁移

SQL语法全面覆盖,兼容Greenplum/Redshift/Synapse/Snowflake等,加强安全、资源隔离、容灾能力,提供优于海外数仓的实时分析与交互式分析功能,性价比更高。

流批一体实时数仓

自研流批一体引擎,支持实时数据源消费与实时物化视图同步,实现高吞吐流式数据处理、实时多表关联与Ad-hoc查询,满足实时报表分析需求。

启动指南

新购实例优先开启AMD形态。在选择地域时,推荐勾选“北京、上海、杭州、深圳”地区,以享受优化服务与更快响应时间。

本文来源: 图灵汇 文章作者: 汪红羽