エヌビディア(NVDA.US)のGPUは全球のAI推論ソリューションよりも20倍速いです！Cerebrasが最も速いAI推論ソリューションを提供しました。

智通財経 · 08/27 22:31

人工智能初创公司Cerebras今日宣布推出Cerebras Inference，据称是世界上最快的人工智能推理解决方案。

智通财经APP获悉，人工智能初创公司Cerebras今日宣布推出Cerebras Inference，据称是世界上最快的人工智能推理解决方案。该公司表示:“Cerebras　Inference为Llama 3.18B每秒提供1800个token，为Llama 3.170B每秒提供450个token，比基于英伟达(NVDA.US)GPU的超大规模云快20倍。”

Cerebras Inference由第三代晶圆级引擎(WaferScaleEngine)提供动力，同时由于消除了内存带宽障碍，速度更快。Cerebras称其GPU解决方案的推理成本是微软Azure云计算平台的三分之一，而使用的功率是微软Azure云计算平台的六分之一。

该公司表示:“Cerebras通过制造世界上最大的芯片，并将整个模型存储在芯片上，解决了内存带宽瓶颈。”“凭借我们独特的晶圆级设计，我们能够在单个芯片上集成44GB的SRAM，从而消除了对外部存储器和连接外部存储器和计算机的慢速通道的需求。”

提供人工智能模型独立分析的人工智能分析公司(Artificial Analysis)联合创始人兼首席执行官MicahHill-Smith表示:“Cerebras在人工智能推理基准方面处于领先地位。Cerebras为Meta的Llama3.18B和70BAI模型提供的速度比基于GPU的解决方案快一个数量级。我们在Llama3.18B上测量的速度超过每秒1800个输出token，在Llama3.170B上测量的速度超过每秒446个输出token，这是这些基准测试中的新记录。”

他称，“凭借推至性能前沿的速度和具有竞争力的价格，Cerebras Inference对具有实时或大容量需求的人工智能应用程序的开发人员特别有吸引力。”

值得一提的是，这可能会在整个人工智能生态系统中产生连锁反应。随着推理变得更快、更高效，开发人员将能够突破人工智能的极限。曾经因硬件限制而受阻的应用程序现在可能会蓬勃发展，并激发出此前被判定为不可能的创新。不过， J. Gold Associates 分析师杰克·戈尔德 (Jack Gold) 也提出，“但在我们获得更具体的现实基准和大规模运营之前，现在估计它到底有多优越还为时过早。”

本月早些时候，Cerebras提交了首次公开募股(IPO)申请，预计将于今年下半年上市。该公司最近还任命了两名新的董事会成员:曾在IBM(IBM.US)、英特尔(INTC.US)和西班牙电信(TEF.US)担任高管的格伦达•多查克;以及VMware和Proofpoint前首席财务官保罗·奥维尔(Paul Auvil)。

这家初创公司还向上市迈出了重要的一步，本月早些时候聘请鲍勃•科明(Bob Komin)担任首席财务官。Komin曾在Sunrun担任首席财务官，领导了该公司的IPO流程。他还曾在被雅虎收购的Flurry和被微软(MSFT,US)收购的TellmeNetworks担任CFO。

Cerebras首席执行官兼联合创始人AndrewFeldman说，“鲍勃在他的职业生涯中一直是一个关键的运营领导者，在几家公司担任创业高管，这些公司发明了重大的技术和商业模式创新，并迅速成长为行业领导者。他在成长期和上市公司的财务领导方面的丰富经验对Cerebras来说是非常宝贵的。”

人工知能初期のスタートアップ企業Cerebrasは、Cerebras Inferenceを今日発表し、これは世界で最も高速な人工知能推論ソリューションとされています。

智通財経APPが報じたところによると、人工知能初期のスタートアップ企業Cerebrasは、Cerebras Inferenceを今日発表し、これは世界で最も高速な人工知能推論ソリューションとされています。同社は、「Cerebras Inferenceは、Llama 3.18Bにつき1800のトークンを秒間提供し、Llama 3.170Bには450のトークンを秒間提供し、英伟达(NVDA.US) GPUに基づく超大規模クラウドよりも20倍速い」と述べています。

Cerebras Inferenceは、第三世代のウェーハスケールエンジンによって駆動され、メモリ帯域障害を除去したため、より高速です。Cerebrasによると、GPUソリューションに比べ、推論コストはマイクロソフトAzureクラウドコンピューティングプラットフォームの3分の1であり、使用電力は同プラットフォームの6分の1とのことです。

同社は、「Cerebrasは世界最大のチップを製造し、そのチップ全体にモデルを格納することで、メモリ帯域ボトルネックを解消しました。」と述べています。「当社独自のウェーハスケール設計により、単一チップに44GBのSRAMを統合でき、外部ストレージおよび外部ストレージとコンピューターを接続する必要性を排除できます。」

人工知能モデルの独立した分析を提供する人工知能分析企業(Artificial Analysis)の共同創設者兼CEOのMicah Hill-Smith氏は、「Cerebrasは人工知能推論基準でリードしています。 CerebrasがMetaのLlama3.18Bおよび70BAIモデルに提供する速度は、GPUに基づくソリューションよりも桁違いに速いです。 Llama3.18Bでは、毎秒1800個の出力トークンを超え、Llama3.170Bでは、毎秒446個の出力トークンを超える速度を計測しました。これらのベンチマークテストの中で新記録を樹立しています。」

彼は、「極めて高速で競争力のある価格を実現することで、Cerebras Inferenceはリアルタイムまたは大容量の要求を持つ人工知能アプリケーションの開発者に特に魅力的です。」

これは人工知能エコシステム全体に連鎖的な影響をもたらす可能性があります。推論が速く、効率的に行われるようになると、開発者は人工知能の限界を乗り越えることができるようになります。以前はハードウェアの制約によって制約されていたアプリケーションは、今後躍進し、以前は不可能と判断されていた革新を生み出す可能性があります。ただし、J. Gold Associatesのアナリスト、ジャック・ゴールド(Jack Gold)氏も、「しかし、より具体的な実証基準と大規模な運営を得る前に、現時点での優位性を評価するのは時期尚早である」と指摘しています。

本月、Cerebrasは初めての株式公開(IPO)申請を提出し、今年の下半期に上場する予定です。この会社は最近、IBM、インテル、テレフォニカで幹部職を務めたグレンダ・ドザック、およびVMwareおよびProofpointの前最高財務責任者であるポール・オーヴィルを新しい取締役会メンバーに任命しました。

この新興企業は、重要な一歩を踏み出し、先月初めにボブ・コミンを最高財務責任者に任命しました。コミンはSunrunの最高財務責任者を務め、同社のIPOプロセスをリードしました。また、Yahooに買収されたFlurryとマイクロソフトが買収したTellmeNetworksでCFOを務めた経験もあります。

CerebrasのCEOで共同創業者のアンドリュー・フェルドマンは、「ボブは職業人生の中で常に重要な運営リーダーであり、いくつかの企業で起業幹部を務め、これらの企業は重要な技術とビジネスモデル革新を実現し、業界のリーダーとして急成長しました。彼の成長期と上場企業での財務リーダーシップ経験は、Cerebrasにとって非常に貴重です。

これらの内容は、情報提供及び投資家教育のためのものであり、いかなる個別株や投資方法を推奨するものではありません。更に詳しい情報

比英伟达(NVDA.US)GPU快20倍! Cerebras“出炉”全球最快AI推理解决方案

エヌビディア(NVDA.US)のGPUは全球のAI推論ソリューションよりも20倍速いです！Cerebrasが最も速いAI推論ソリューションを提供しました。

リスク免責事項

免責事項