向着AI进发:亚马逊云科技全栈联动式大规模创新

在2024 re:Invent全球大会上,亚马逊云科技推出了令人眼花缭乱且数量惊人的新技术发布,而且这一系列的创新,目标都与AI相关,可以说是全栈联动式的大规模更新。

在生成式AI方面,亚马逊云科技全面强化了基础设施、模型和应用三层技术栈。最引人注意的是一系列Amazon Nova基础模型的发布,包括Nova Micro、Lite、Pro以及专注于生成高质量图像的Nova Canvas、擅长创作高清视频的Nova Reel等模型。

值得一提的是,在各自对应的智能应用细分领域,Nova Micro、Lite和Pro相较于Amazon Bedrock平台中表现最为优异的模型,在运算速度卓越的同时,还将应用成本削减至少75%。

Amazon Bedrock平台也迎来了全方位的重大升级。一方面,其模型库得到了极大丰富,引入Luma AI和poolside等前沿模型,并及时更新Stability AI的最新研究成果,同时借助全新上线的Amazon Bedrock Marketplace,为用户呈上多达 100 余种涵盖热门、新兴以及专业领域的多样化模型。

另一方面,在推理性能优化方面,实现了推理准确性的显著提升、成本的有效控制以及响应速度的大幅加快;并整合了GraphRAG 等先进的知识库功能,通过自动推理检查功能以及多智能体协作技术的增强了AI系统的安全性。

Amazon Q Developer推出了三款智能体,能够自动化执行单元测试、文档编制以及代码审查等一系列复杂流程,并且通过与GitLab展开深度集成,进一步拓展了自身的应用场景。Amazon Q还针对Windows.NET、VMware和大型机等传统工作负载,打造了一系列转型功能以有效缩短转型周期、降低转型成本,Amazon Q Business和Amazon Q in QuickSight的洞察能力也得到了显著强化。

会上发布的新一代Amazon SageMaker,将快速SQL分析、PB级大数据处理、数据探索和集成、模型开发和训练以及生成式人工智能(AI)等功能统一到一个集成平台上。Amazon SageMaker Unified Studio作为平台的核心枢纽,提供了一个便捷、统一的数据和 AI 开发环境。

用户能够借助Amazon Q Developer的智能辅助,精准选择最适配的工具进行数据处理。Amazon SageMaker Catalog确保数据、模型以及开发组件在整个流程中始终保持合规访问状态。

全新推出的 Amazon SageMaker HyperPod集成了新训练配方功能、灵活训练计划设定以及任务治理等一系列先进特性,可以让模型的训练时间最多可节省数周,同时成本降低幅度高达40%。

Amazon SageMaker Lakehouse实现了数据湖、数据仓库、运营数据库以及企业应用程序中数据的统一管理模式,允许用户运用熟悉的AI和机器学习工具,或者借助Apache Iceberg兼容的查询引擎,对存储其中的数据进行便捷访问和高效处理。

不需要构建复杂的数据管道,用户可直接在Amazon SageMaker Lakehouse和Amazon Redshift中对第三方应用数据进行深入分析,极大地提升了数据处理效率和灵活性。

在基础设施的算力方面,基于自研的Amazon Trainium2打造的EC2 Trn2实例正式投入商用,相较于当前市场主流的GPU实例,性价比提升幅度高达30 - 40%。与此同时,亚马逊云科技还发布了配备64个Trainium2芯片的EC2 Trn2 UltraServers服务器,浮点算力高达83.2Petaflops,相当于单一实例的四倍之多。

Project Rainier则凭借集结数十万个 Trainium2芯片,算力超过以往任何集群五倍以上,可以为科研探索、产业升级等提供大规模算力支持。目前,采用更为先进的3纳米工艺制程的下一代 Trainium3芯片已进入研发阶段,预计将于2025年末正式上线,届时有望使集群性能实现四倍的飞跃式提升。

第二代的UltraCluster网络架构,也就是“10p10u”网络,能够完美支持超过20000个GPU 协同工作,带宽飙升至10Pb/s,而延迟却被控制在10ms以内,使模型训练时间缩短至少15%,适用于对实时性要求极高的AI应用场景。

除了计算和网络,亚马逊云科技在存储以及数据库等核心领域也在持续创新和突破。Amazon S3新增了Metadata元数据功能,能够实现对元数据的自动获取与实时更新,并且查询性能提升三倍,事务处理能力提升十倍。

Amazon Aurora DSQL 采用的active - active架构搭配自动故障恢复功能,使得应用程序能够在任意端点自由进行读写操作。它不仅能够提供高达99.999%的多区域可用性,还具备近乎无限的可扩展性。

Amazon DynamoDB global tables增加了多区域强一致性支持,使分布式数据库服务能力得到了显著增强,能够确保跨国业务数据在不同区域之间实现实时、精准的同步。

如此众多的创新,来源于亚马逊文化中的“逆向工作法”,即从客户的需求出发,进行务实的创新。亚马逊CEO Andy Jassy在演讲中表示:“我们对待包括AI在内的各类技术,并非是因为觉得它酷炫,而是旨在解决客户面临的问题。我们把这称作’实用AI’。”

亚马逊云科技CEO Matt Garman在其主题演讲中也提到:“我们的创新速度比以往任何时候都要快,从而为客户提供构建所需的一切。我从未像今天这样对未来充满期待。我们正处于一个关键的时刻,我们所看到的创新数量令人难以置信。这些创新不仅来自亚马逊云科技的创新,来自客户、合作伙伴、企业以及初创企业的创新让人感到无比兴奋。现在正是创新的最佳时机,丰富而强大的工具集前所未有,将助力用户实现创新目标。”

Matt Garman主题演讲词云解析

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1