在九月的北京,为期三天的顶级技术盛宴——QCon全球软件开发大会圆满拉开帷幕,以“启航 AIGC 软件工程变革”为主题,汇集了20多个涵盖微服务架构治理、异构计算、AIGC产品设计等领域的精彩演讲专题。
货拉拉货运研发部技术总监亓隆基受邀参加,在“稳定性和可观测性”技术专场,以《货拉拉交易核心链路连续无故障500+天的建设实践》为题,分享了货拉拉在交易核心链路稳定性建设方面的独到见解与实践经验。
亓隆基深入探讨了稳定性与可用性建设的底层逻辑,强调了系统可用、功能可靠、无损失的目标。他指出,通过确保服务自身及依赖的fail-safe机制,构建稳定性体系。在实践中,亓隆基坚持了“木桶原理”、“逆向思维”和“墨菲定律”,并将其应用在事前、事中、事后三个关键阶段,旨在全面防范风险、快速应对突发事件和深入分析事故原因。
亓隆基进一步介绍了货拉拉在功能可用性、业务可观测性和技术架构可观测性方面的具体实践与探索。通过扩展Doom核心思想,货拉拉实现了一种高效的方法来验证服务的输入输出一致性,有效应对了复杂业务场景的挑战,实现了分钟级的价格业务监控,成功拦截了大量线上问题。
货拉拉通过建立全局视野,主动感知链路变化,自动检测链路稳定性设计,以及自动监测畸形调用,显著提升了技术架构的可观测性,使得链路治理的效率从月级提升至日级,为持续的技术架构优化提供了有力支持。
亓隆基总结道,随着业务的不断迭代与创新,稳定性建设是一项永无止境的挑战。从过去的问题频发到现在的连续500天无故障,货拉拉的技术稳定性体系已从无到有,逐步形成了具有独特特色的建设模式。未来,货拉拉将沿着“减负”与“智能化”的双轨路径发展,通过增强自动化工具能力来提高工作效率,引入AI技术优化稳定性工作质量,以期进一步提升用户体验。
这场技术盛宴不仅展示了前沿的软件开发理念与实践,更为行业同仁提供了宝贵的学习与交流机会,共同探索着AIGC时代软件工程的变革之路。