阿里雲全面升級GPU雲服務：AI大模型推理性能可提升100%

快科技 · 07/19 05:09

快科技7月19日消息，阿里云推出全面升级的GPU云服务，通过全新优化GPU套件，多GPU推理服务性能可最大提升100%。

针对调用GPU算力最常用的容器技术，阿里云推出ACK云原生AI套件，帮助开发者及企业更高效地开发和部署AI应用，加速大模型应用落地。

随着AI大模型的体量变大、应用变广，单GPU已难以承载推理应用的全部需求，多GPU推理时代已经到来，如何在GPU资源紧缺的当下，实现GPU高效互联，是提升多GPU推理性能的关键。

阿里云通过进一步优化底层的AI通信加速库DeepNCCL，让GPU云服务在推理场景下有更好的性能表现：在同等硬件环境下，Token输出吞吐至少提升14%，首Token时延降低15%。

通过深度优化，推理加速性能也提升显著，Token处理能力提升100%，相同的资源可以支持2倍的业务需求，用Kubernetes容器集群技术调用GPU算力，已成为运行AI大模型任务的主流选择。

ACK容器服务可提供自动化编排及GPU高效管理和调度的能力，让模型部署、扩展变得更简单。

为进一步提升AI应用运维效率，阿里云推出ACK云原生AI套件，可实现Kubernetes在GPU调度和细粒度共享、AI任务调度、训练数据加载以及大模型推理服务启动等关键领域的能力增强和加速，相较开源均有大幅能力提升。

比如，针对AI任务频繁加载远程存储数据的需求，ACK云原生AI套件可提升训练数据读取性能30%以上，降低大模型推理服务冷启动时延70%以上。

在全球累计超过1000万活跃用户的国产AI绘画工具海艺AI，就是通过ACK调用阿里云GPU云服务的先行者。

此前，用户通过海艺AI生成一张图片平均耗时20秒，遇到队列等待延迟可上升至分钟级；采用阿里云GPU云算力及ACK容器服务后，海艺AI的模型切换完全无感，推理耗时降低至3.95秒，整体性能提升至少50%以上。

在最新的Forrester 全球AI基础设施解决方案研究报告中，阿里云综合产品能力指标位居全球第二，已成为中国AI大模型的公共底座。

零一万物、百川智能、智谱AI、昆仑万维、vivo、复旦大学、巨人网络等大批企业和机构在阿里云上训练大模型，并通过阿里云对外提供服务。

小鹏汽车、联想、德勤、微博、完美世界、喜马拉雅等已接入阿里云通义大模型，在阿里云上为消费者和客户提供丰富的AI应用服务。

快科技7月19日消息，阿里雲推出全面升級的GPU雲服務，通過全新優化GPU套件，多GPU推理服務性能可最大提升100%。

針對調用GPU算力最常用的容器技術，阿里雲推出ACK雲原生AI套件，幫助開發者及企業更高效地開發和部署AI應用，加速大模型應用落地。

隨着AI大模型的體量變大、應用變廣，單GPU已難以承載推理應用的全部需求，多GPU推理時代已經到來，如何在GPU資源緊缺的當下，實現GPU高效互聯，是提升多GPU推理性能的關鍵。

阿里雲通過進一步優化底層的AI通信加速庫DeepNCCL，讓GPU雲服務在推理場景下有更好的性能表現：在同等硬件環境下，Token輸出吞吐至少提升14%，首Token時延降低15%。

通過深度優化，推理加速性能也提升顯著，Token處理能力提升100%，相同的資源可以支持2倍的業務需求，用Kubernetes容器集群技術調用GPU算力，已成爲運行AI大模型任務的主流選擇。

ACK容器服務可提供自動化編排及GPU高效管理和調度的能力，讓模型部署、擴展變得更簡單。

爲進一步提升AI應用運維效率，阿里雲推出ACK雲原生AI套件，可實現Kubernetes在GPU調度和細粒度共享、AI任務調度、訓練數據加載以及大模型推理服務啓動等關鍵領域的能力增強和加速，相較開源均有大幅能力提升。

比如，針對AI任務頻繁加載遠程存儲數據的需求，ACK雲原生AI套件可提升訓練數據讀取性能30%以上，降低大模型推理服務冷啓動時延70%以上。

在全球累計超過1000萬活躍用戶的國產AI繪畫工具海藝AI，就是通過ACK調用阿里雲GPU雲服務的先行者。

此前，用戶通過海藝AI生成一張圖片平均耗時20秒，遇到隊列等待延遲可上升至分鐘級；採用阿里雲GPU雲算力及ACK容器服務後，海藝AI的模型切換完全無感，推理耗時降低至3.95秒，整體性能提升至少50%以上。

在最新的Forrester 全球AI基礎設施解決方案研究報告中，阿里雲綜合產品能力指標位居全球第二，已成爲中國AI大模型的公共底座。

零一萬物、百川智能、智譜AI、崑崙萬維、vivo、復旦大學、巨人網絡等大批企業和機構在阿里雲上訓練大模型，並通過阿里雲對外提供服務。

小鵬汽車、聯想、德勤、微博、完美世界、喜馬拉雅等已接入阿里雲通義大模型，在阿里雲上爲消費者和客戶提供豐富的AI應用服務。

声明：本內容僅用作提供資訊及教育之目的，不構成對任何特定投資或投資策略的推薦或認可。更多信息

阿里云全面升级GPU云服务：AI大模型推理性能可提升100%