share_log

亚马逊云科技陈晓建:2025年很多客户将从生成式AI原型验证转为生产应用

TechWeb ·  Dec 27 14:33

【TechWeb】12月27日消息,亚马逊云科技2024 re:Invent全球大会于12月初在美国举办,期间推出一系列技术发布,聚集生成式AI、数据战略和云服务三大领域,覆盖基础设施、模型和应用的全栈联动创新,可谓为企业应用生成式AI铺平了道路。

近日,在亚马逊云科技2024 re:Invent中国行活动上,亚马逊云科技大中华区产品部总经理陈晓建就表示:“在非常受关注的生成式AI应用领域,2024年许多客户从思考阶段进入实践阶段,进行了大量场景试验。2025年肯定会发生一个变化,很多客户将从原型验证阶段转化为生产阶段。”

帮助客户将生成式AI技术从小范围试验探索到落地至真正投入生产应用,亚马逊云科技到底是如何进行全栈联动来达成这一能力的呢?我们从其最新的技术发布中可以窥见一斑。

整体来看,2024 re:Invent全球大会上,亚马逊云科技在生成式AI领域,推出Amazon Nova系列基础模型并强化Amazon SageMaker、Amazon Bedrock和Amazon Q等核心服务,通过更低的训练和推理成本、更多的模型选择、更深入场景的应用全面加速企业应用生成式AI创新;在数据战略方面,发布新一代Amazon SageMaker为数据、分析和AI提供统一平台;Amazon S3新增Tables存储类型和元数据功能,以及无服务器分布式SQL数据库Amazon Aurora DSQL将进一步提升用户的数据管理能力;在云服务方面,推出搭载Trainium2芯片的新型计算实例和为万亿参数模型提供实时推理性能的超级服务器。

陈晓建强调:“这些新发布展现出亚马逊云科技不仅在云的核心服务层面持续创新,更在从芯片到模型,再到应用的每一个技术堆栈取得突破,让不同层级的创新相互赋能、协同进化。只有这样全栈联动的大规模创新才能真正满足当今客户的发展需求,助力各行各业重塑未来。”

生成式AI从原型验证到生产应用,有效改善大模型幻觉是基础

将生成式AI应用于企业实际的业务时,很多企业的第一个顾虑就是“幻觉”问题——大模型一本正经的胡说八道。想象一下,如果企业想将生成式AI用来做一个非常重要的业务应用场景,比如法律咨询、金融交易或者健康咨询等,这里如果出现幻觉的话,结果是无法接受的。

“亚马逊云科技团队一直在思考如何解决幻觉的问题,也探索了多种不同的技术方案。最后我们发现自动推理技术(Automatic Reasoning)能够很有效的解决幻觉问题。”陈晓建称。

陈晓建介绍,自动推理技术(Automatic Reasoning)是一项特殊的 AI 技术,它能够从数学层面证明这个推理的结果是不是正确的。它通常用于验证这个系统是不是按照设计的规范来正常的运行。自动推理在很多领域下都已经有了实践的应用,比如金融交易、健康咨询、法律咨询等领域。亚马逊云科技拥有自动推理方面的多位世界级专家。例如,可以通过自动推理来证明在Amazon IAM(Identity and Access Management)之中设计的权限和策略是不是按照企业所预想的方式来进行,这种方式的证明叫做“可证明的安全性”。这些技术同样能够帮助提升模型的准确性、降低模型的幻觉。

本次2024 re:Invent上,亚马逊云科技推出了Amazon Bedrock 自动化推理检查的功能,它能够有效的预防由于模型幻觉带来的事实性错误。

生成式AI三层架构同频更新:更强训练推理、更多模型、更优应用

在解决大模型幻觉问题后,陈晓建表示,2025年,很多客户将从生成式AI原型验证阶段转化为生产阶段,届时客户需求将更加复杂,不仅是选择模型,还需要各种技术支持。因此,在生成式AI领域,亚马逊云科技全面强化基础设施、模型和应用三层技术栈能力。

更强训练推理方面,此次2024 re:Invent上,亚马逊云科技推出新⼀代Amazon SageMaker,为客户提供一个单一的数据和AI开发环境,用户可以在其中查找和访问其组织中的所有数据,为各种常见的数据用例选择最佳工具,并将数据和AI项目扩展至团队内不同分工角色以实现协作。此外,Amazon SageMaker AI的四项创新包括Amazon SageMaker HyperPod的新训练配方功能、灵活训练计划和任务治理功能,以及在Amazon SageMaker中使用亚马逊云科技合作伙伴的热门AI应用。这些功能将帮助客户更快开始训练流行模型,通过灵活训练计划节省数周时间,并将成本降低高达40%。

陈晓建表示,新的Amazon SageMaker涵盖了分析、数据处理、搜索、数据准备、AI模型开发和训练、⽣成式AI等所有必需功能。

更多模型方面,亚马逊云科技一方面新推出了自研的Amazon Nova六款基础模型,包括Nova Micro、Nova Lite、Nova Pro和Nova Premier基础模型,以及用于生成高质量图像的Nova Canvas和生成高质量视频的Nova Reel,这些模型成本更低速度更快。另一方面,Amazon Bedrock通过推出的Amazon Bedrock Marketplace新功能新接入Luma AI和poolside等100多款热门、新兴及专业模型。这些给企业客户提供了丰富的模型选择。

同时,Amazon Bedrock推出了低延迟优化推理、模型蒸馏、提示词缓存等功能,大幅提升推理效率;支持GraphRAG等知识库功能增强数据利用能力;通过自动推理检查功能和多智能体协作等创新,进一步增强AI安全性并推动智能体发展。

陈晓建总结道:“更新能力后的Amazon Bedrock 提供的功能不只是提供多种多样的功能和模型,还能帮客户在不同的场景下选择最适合的场景功能,它同时提供了大模型真正用于生产的时候所需要的各种各样的工具。”

更优应用方面,Amazon Q更加深入软件开发和商业应用场景。Amazon Q Developer增加三款新的智能体,能自动执行单元测试、文档编制和代码审查流程,并通过与GitLab深度集成,扩展应用场景;推出转型功能以加速Windows.NET、VMware和大型机工作负载的迁移和现代化,缩短转型时间并降低成本。强化了Amazon Q Business和Amazon Q in QuickSight洞察能力,并简化了复杂工作流程的自动化实现方式。

至此,对生成式AI应用于生产时所需的各类模型、技术、工具等都已具备。

夯实底层,升级计算、网络、存储和数据库等云服务

事实上,生成式AI应用是天然的“云原生”应用。如何让企业客户在使用生成式AI应用时更快、更省、更稳,还有很多云基础服务方面的工作可以优化和提升。

2024 re:Invent上,亚马逊云科技在计算、网络、存储和数据库等云计算服务核心领域也进行了创新,为包括生成式AI应用在内的各类工作负载提供更强大的底层支持。

在自研芯片领域,基于Amazon Trainium2的EC2 Trn2实例正式可用,较当前GPU实例性价比提升30-40%;推出配备64个Trainium2芯片的EC2 Trn2 UltraServers服务器,提供高达83.2 Petaflops浮点算力,计算能力是单一实例的四倍。采用3纳米工艺的下一代Trainium3芯片预计将在2025年末上线,预计将使集群性能提升4倍,并在性能、能效和密度上树立新标杆。

在网络基础设施领域,推出第二代UltraCluster网络架构,支持超过20,000个GPU协同工作,带宽达10Pb/s,延迟低于10ms,这一突破性升级将模型训练时间缩短至少15%。

在存储服务领域,Amazon S3新增Metadata元数据功能实现自动获取和实时更新;推出专为Iceberg表优化的S3 Tables存储类型,将查询性能提升3倍,事务处理能力提升10倍。

在数据库服务领域,推出Amazon Aurora DSQL全新的无服务器分布式SQL数据库,采用active-active架构并具备自动故障恢复功能,支持应用程序在任意端点进行读写,能实现近乎无限的可扩展性。Amazon DynamoDB global tables增加了多区域强一致性支持,进一步增强了其分布式数据库服务能力。

陈晓建表示,亚马逊云科技是全球云计算的开创者和引领者,更是企业构建和应用生成式AI的首选,今年re:Invent全球大会的这一系列重磅发布再次印证了这一点。

沙利文大中华区总监李庆表示:”本届re:Invent大会上的新发布更加侧重于产品的实际应用和工具优化。本次更新有两个方面让人印象深刻:一是随着全球企业对生成式AI的深入应用,数据不仅实现跨区域的传输与协同,更实现跨地域、跨区域的深度连接;二是亚马逊云科技进一步优化生成式AI的应用,从数据存储、治理到管理的全流程提升,旨在简化AI对数据的使用,同时强化模型功能、增加AI agent管理和应对模型幻觉的功能。此外,新发布的Amazon Nova大模型家族备受期待,这一系列的模型和亚马逊云科技的开放选择理念将为用户带来更多创新机会,进一步推动AI的发展。”(果青)

Disclaimer: This content is for informational and educational purposes only and does not constitute a recommendation or endorsement of any specific investment or investment strategy. Read more
    Write a comment