长期押注机器学习,云计算巨头AWS为何这么做?

图灵汇官网

亚马逊云服务(AWS)如何成为全球云计算领域的领导者?它在云计算领域是否有自己独特的方法论?

作为亚马逊公司的云计算服务平台,AWS已经运营了14年。要简述其在云计算领域持续增长和创新的原因并不容易。近年来,机器学习成为AWS的重要业务之一,这为我们揭示了AWS在云计算领域的一些关键策略。

根据AWS公布的数据,从2016年推出三项机器学习服务至今的五年间,AWS已累计推出超过776项机器学习服务和功能。2019年,新推出的248项机器学习服务和功能占当年总推出服务和功能数(2345项)的比例超过10%。

机器学习服务日益丰富

当中国云服务商纷纷转向产业市场,并逐渐确立差异化发展方向时,位于美国的全球云计算巨头AWS却在大力推广其机器学习服务。

在最近的“亚马逊re:Invent 2020大会”上,AWS CEO Andy Jassy在主题演讲中提到:“2019年我花了75分钟讲解机器学习,但2020年我想换一种方式。”随后,无论是在他的发言还是客户证言中,“机器学习”一词被反复提及超过75次。

云计算的发展为机器学习提供了肥沃的土壤。亚马逊副总裁兼CTO Werner Vogels博士在“2021年将改变世界的八大技术趋势”预测中指出,机器学习在2020年已成为主流,未来三年内产生的数据量将超过过去三十年,而结合机器学习模型和数据采集与聚合工具,将成为各行业处理信息的唯一可行方法。

认识到机器学习的重要性后,AWS对未来的发展方向进行了预判,其机器学习服务逐渐变得更加全面和深入。

从2016年至2020年的五年间,AWS在机器学习领域推出的服务数量增长最快的阶段是2017年至2018年。在这段时间里,机器学习服务从2017年的60项增加到215项,此后每年新增服务数量均超过200项。

截至目前,AWS的机器学习服务已经形成了“上-中-下”三层服务体系:

三层服务体系

AWS的机器学习服务框架图 - 第一层:AI服务,包括视觉识别、语音文字转换、聊天机器人等即用型服务; - 第二层:Amazon SageMaker服务,提供数据自动标注和集成开发环境,是一个全托管的机器学习平台; - 第三层:机器学习框架和基础设施,涵盖多种机器学习框架及计算资源。

“我们的机器学习解决方案能快速模拟数据,挖掘数据价值,改变数据管理体系,将计算和分析融入所有业务流程。”Andy Jassy在演讲中提到。

这正是AWS的聪明之处,它将机器学习抽象为一项通用服务,成为数据湖、数据仓库、数据智能等热门服务不可或缺的工具。它不强调行业属性和应用场景,而是突出机器学习作为服务对IT和业务效率的提升。至于应用在哪个行业或场景,完全由客户决定。

此外,机器学习也变得越来越普及和易用。在Andy Jassy看来,机器学习不应仅限于机器学习专家,而应扩展到更多开发者手中。这些开发者可能包括不懂机器学习的数据分析师和IT业务人员。

事实上,AWS推出的SageMaker已经成为其历史上增长最快的服务之一。目前,全球已有超过10万名客户在使用AWS的机器学习和人工智能服务。

客户需求驱动创新

AWS很少透露具体的产品创新计划,但在多次采访中,其回答始终是“以客户为中心”。实际上,不同客户对机器学习的不同需求确实推动了AWS在该领域的不断创新。

AWS大中华区云服务产品管理总经理顾凡举了一个SageMaker的例子:“客户反馈,去年发布的产品都很不错,但在机器学习领域还有一块硬骨头没有解决,那就是如何快速将原始数据转化为所需的特征数据。”

在这样的需求背景下,AWS推出了机器学习服务AWS Data Wrangler,这是一种特征工厂工具。特征是机器学习中的术语,指代输入函数的数据。在传统的机器学习工具中,客户需要自行连接不同的数据源,抓取数据并格式化,才能继续后续流程。

而使用AWS Data Wrangler后,无论是单一特征还是复合特征,都能迅速转换。此外,在SageMaker Studio中,用户可以直观地看到转换过程,便于进行流程干预。

另一方面,在机器学习框架方面,尽管大多数平台倾向于只支持TensorFlow,但AWS通过调研发现,一些专业机器学习人员更希望自主选择框架。

“AWS支持所有主流机器学习框架……我们有多个团队,分别优化TensorFlow、PyTorch和MXNet,这就是为什么客户能够获得这些框架的最佳性能。”Andy Jassy在演讲中提到。

客户需求使AWS的服务更具灵活性和兼容性,不仅在机器学习领域,其他产品线也是如此。

Amazon Aurora是AWS的一款云原生关系数据库,兼容MySQL和PostgreSQL,主要用于专有云环境,成本仅为其他商用数据库的十分之一。随着无服务器计算需求的增长,有客户提出能否让Aurora支持无服务器模式,于是AWS推出了Aurora无服务器V2版本,以满足这一需求。

AWS大中华区首席云计算企业战略顾问张侠坦言:“这样做可能会导致部分现有Aurora用户转向Aurora无服务器,短期内可能影响收入,但从长远来看,这符合客户需求,有助于帮助客户节约云上成本,为更多创新项目腾出资金。”

提供SaaS服务,也提供边缘硬件

中国云计算服务商在发展过程中通常有较强的“边界”意识,在初创期曾声称“不做SaaS”。然而,随着产业互联网的推进,SaaS已成为各服务商提供的标准服务之一。

对于AWS而言,如果客户需求明确且AWS有能力提供相应服务,它不会自我设限。如果这项服务与合作伙伴提供的服务产生冲突,则通过平等竞争,由客户自行选择。

我们之前提到,AWS的机器学习服务形成了“上-中-下”三层结构,其中底层AI服务中包括了一些旨在降低机器学习使用门槛的SaaS服务。AWS表示,随着机器学习技术在各行各业的广泛应用,相关服务的需求也在不断增加。

最近,AWS与黑莓合作推出了智能汽车数据平台IVY,该平台能够自动收集和分析汽车数据,从而提供个性化的驾驶体验。

在工业领域,AWS也针对性地推出了五项机器学习服务,包括Amazon Monitron和Amazon Lookout for Equipment,这些服务可用于预测性维护;Amazon Panorama Appliance和SDK则利用计算机视觉改善工业运营和工作场所安全;Amazon Lookout for Vision则可以低成本、高效地进行图像和视频异常检测。

值得注意的是,AWS Panorama一体机实际上是AWS自主研发的边缘计算硬件设备。AWS全球副总裁Swami Sivasubramanian告诉钛媒体APP,在客户已有本地摄像头的情况下,只需将其连接到工业网络中,即可实现摄像头数据流的自动识别与交互。

因此,AWS既提供SaaS服务,又在必要时提供硬件设备。在服务部署形式上,AWS采取更加开放的态度,不限制创新。

“我们有两个原则:一是授人以鱼不如授人以渔,我们更希望帮助客户掌握技能,给予工具并教会他们使用工具;二是当客户在工程技术上有需求时,我们会迅速帮助他们用产品原型解决问题。”AWS大中华区云服务产品管理总经理顾凡总结道。

数据显示,2011年AWS发布了80多项重要服务和功能;2012年发布了近160项;2016年发布了1017项;2019年发布了2345项。

面对如此众多的服务,AWS如何确保创新真正落地?

“我们的产品至少90%以上都是根据客户需求开发的。如果你看到我们推出的新产品,首先要相信全球范围内有很多客户有这种需求。”AWS大中华区首席云计算企业战略顾问张侠说。

同时,一项产品上线,并不要求所有客户都立即使用。“每次re:Invent大会发布新产品时,客户都非常兴奋,因为他们带着需求而来。无论是新用户还是老用户,都不会存在创新无法落地的问题。”

本文来源: 图灵汇 文章作者: 当科技