share_log

长江证券:苹果(AAPL.US) 发布Apple Intelligence智能助手 异构芯片或成AI算力新方向

長江證券:蘋果(AAPL.US) 發佈Apple Intelligence智能助手 異構芯片或成AI算力新方向

智通財經 ·  23:11

與GPU相比,TPU不需要再頻繁地訪問內存,減少了與存儲器的交互次數,從而大幅度提高了計算效率。

智通財經APP獲悉,長江證券發佈研報稱,在2024年的全球開發者大會上,蘋果(AAPL.US)推出了個人智能助理Apple Intelligence。該助手包含了多個功能強大的生成模型,可以快速、高效地處理用戶日常任務,並能即時適應用戶當前的活動。此外,蘋果發佈了基礎模型AFM,爲底層操作系統賦能。Apple Intelligence正是由AFM基礎模型賦能的。在算力層面,AFM模型由谷歌(GOOG.US)TPU算力芯片提供支持,該TPU性能追及英偉達(NVDA.US)旗艦算力芯片。

蘋果發佈Apple Intelligence智能助手

蘋果發佈了基礎模型AFM,爲底層操作系統賦能。在2024年的全球開發者大會上,蘋果推出了個人智能助理Apple Intelligence。Apple Intelligence包含了多個功能強大的生成模型,可以快速、高效地處理用戶日常任務,並能即時適應用戶當前的活動。Apple Intelligence可以實現撰寫和潤色文本、優先處理和總結通知、爲與家人朋友的對話創建有趣的圖片等功能,以及採取應用內操作以簡化跨應用交互。Apple Intelligence將被搭載於IOS18、IOS18ipad以及MacOS18操作系統上。目前Apple Intelligence搭載於iOS18.1Beta版上,僅限註冊開發者試用,訂閱價格爲99美金一年;普通用戶仍需要排隊等待。

Apple Intelligence由AFM基礎模型賦能

AFM基礎模型主要包含了端側模型和雲端模型兩個部分。其中端側模型專爲端側應用的特定場景所設計,只能處理語言相關的單模態任務,可以本地化搭載於iphone、ipad、Mac等設備上,模型包含30億參數量。雲端模型爲私有云應用場景所設計,具備多模態能力,有更高的泛化能力,可應對更加通用的任務。這兩個基礎模型是蘋果創建的生成式模型家族中的一部分,除了上述兩個模型,Apple Intelligence還包含了一個編碼模型和一個擴散模型。編碼模型基於AFM語言模型,用於爲Xcode注入智能功能;擴散模型幫助用戶以視覺方式表達自己,比如在Messages應用中使用。

AFM雲端模型性能追及GPT-3.5,略遜於GPT-4。

在模型性能評估階段,蘋果設計了1393個任務,將AFM模型與其他主流模型的性能進行了對比。對比結果顯示,AFM雲端模型性能超越Mixtral-8x22混合專家模型、GPT-3.5等模型,略遜於GPT-4和LLaMA-3-70B模型;在端側模型方面,AFM端側模型性能接近市場主流端側模型。人類測評結果顯示,AFM端側模型性能超越Gemma-7B、Phi-3-mini、Mistral-7B、Gemma-2B等主流模型,略遜於LLaMA-3-8B模型;結果證明了AFM端側模型的優異性能,有望在iPhone、iPad等設備上發揮較高實用性。

異構芯片或成AI算力發展新方向

在算力層面,AFM模型由谷歌TPU算力芯片提供支持。谷歌爲本次訓練提供了算力支持,雲端的AFM-server模型由8192個TPU V4算力芯片訓練得到,在訓練階段,蘋果把8192芯片分成8組,每組1024個芯片相互串聯形成一個基本單位,各組之間保持平行關係,訓練數據與迭代僅在組內完成;端側的AFM-on-device模型由2048個TPU V5p算力芯片訓練得到。

谷歌TPU性能追及英偉達旗艦算力芯片。TPU(Tensor Processing Unit),是一種專爲處理張量運算而設計的ASIC芯片。TPU通過脈動陣列機制實現高效運算。與GPU相比,TPU不需要再頻繁地訪問內存,減少了與存儲器的交互次數,從而大幅度提高了計算效率。因此,TPU的有效算力利用率相比於GPU更高;GPU的算力利用率通常爲20%-40%,而TPU的算力利用率往往超過50%。

風險提示

1、AI技術推進不及預期;

2、下游應用需求不及預期。

声明:本內容僅用作提供資訊及教育之目的,不構成對任何特定投資或投資策略的推薦或認可。 更多信息
    搶先評論