美国当地时间4月18日,Meta发布了其最新的开源大模型Llama 3,次日,亚马逊云科技宣布,Llama 3基础模型现已在其平台上正式可用,引发业界广泛关注。
据悉,Meta此次发布的Llama 3基础模型包括两个版本:Llama 3 8B和Llama 3 70B。这两款模型经过预训练和微调,具备强大的文本生成能力,同时支持广泛的用例,包括推理、代码生成和指令跟随等。
更为重要的是,Llama 3使用了仅含解码器的Transformer架构以及高达128k规模的新型分词器,极大地提升了模型的性能。
在Meta公布的AI基准测试中,Llama 3 70B的表现甚至超越了谷歌的Gemini Pro1.5以及Anthropic的Claude 3 Sonnet,这一成绩足以证明其在大型语言模型领域的领先地位。Meta表示,Llama 3模型利用数据并将性能提升到新的高度。
Amazon SageMaker JumpStart是亚马逊云科技专门构建的一个机器学习中心,提供预训练的模型、内置算法和预构建的解决方案,帮助客户快速开始机器学习项目。通过SageMaker JumpStart,客户可以方便地访问到各种领先的机器学习模型。
同时,SageMaker JumpStart还提供了丰富的功能支持,如SageMaker Pipelines、SageMaker Debugger等,帮助客户提升模型性能并实施MLOps控制。
此次引入Llama 3基础模型,无疑是亚马逊云科技在AI领域的一次重要布局。通过Amazon SageMaker JumpStart平台,客户可以轻松发现、部署Llama 3模型,并运行推理。这一举措不仅降低了客户部署大型语言模型的难度和成本,还为他们提供了更多的选择和灵活性。
在安全性方面,通过SageMaker JumpStart部署的模型将始终处在亚马逊云科技的安全环境下,由客户的VPC控制,确保数据的安全和隐私。
客户现在可以在Amazon SageMaker Studio中通过几次点击或通过SageMaker Python SDK编程方式发现并部署Llama 3模型,还可以利用SageMaker Pipelines、SageMaker Debugger或容器日志等功能,提升模型性能并实施MLOps控制。
SageMaker JumpStart页面中的Meta Llama 3模型页面
SageMaker JumpStart 中可用的所有 Llama 3 模型,以及每个模型支持的默认实例类型和最大总token数