share_log

快手“可灵”意外走红,字节紧急追赶,AI文生视频赛道竞争加剧

快手の「可灵」というアプリが意外にも人気になり、字节が追いかけ、AI文生のビデオ競争が激化しています。

AI Finance Net ·  07/30 07:25

2024年2月、Soraの登場により、多数の大手モデル会社は春節を過ごせなくなった。

「春晩が再放送されている間、私たちは緊急にグループを作って話し合いをしていました」とあるAIトップ企業の社員は「市界」に熱心に語っている。Soraの滑らかな体験に感銘を受け、学習販売博主たちも続々と参加し、オンライン講座を上げて、大儲けをした。

国内版のSoraを最速で「複製」できるのは、多くの人々が阿里、バイドゥ、および「大模型五虎」と呼ばれる企業グループに注目する中、まさかの技術限定の快手になるとは誰も思わなかった。

6月7日、快手は突然、文生のビデオモデルである「Kling」をリリースし、2分間のビデオジェネレーションにも対応している。さらに、期货段階のSoraに比べ、Klingは発表されるや否やテストが開始され、生成結果も優れている。

「Kling」は最近で最も話題にされる対象の1つである、とあるベンチャーキャピタル関係者は「市界」に話している。公式なデータによると、「Kling」は1か月で50万人以上が登録を申請し、30万人以上が使用し、700万本以上のショートビデオが生成された。

「Kling」の予想外の火付け役は、バイトダンスも一抹の困惑を禁じ得ない。5月、バイトダンスも文生のビデオモデルである「即梦」をテスト開始したが、現在熱い文生のビデオのレースでも、明確な優位性を備えていない。

かつて軽視されていたライバルに抜かれたという一石二鳥の状況に、バイトダンスは追いかける必要がある。チタンメディアによると、バイトダンスは最近、AI大型モデルをグループの「P0最高レベル」と位置付けている。抖音、剪映などの多くのチームも、AIビデオモデルアプリを開発するために全力で取り組んでおり、近いうちに発表されると予想される。

1、Klingを作るにあたって、急いで、乱雑に、大胆に

多くの開発者が「市界」に対して、Klingのオンラインリリースと期待を上回るパフォーマンスは、業界内でも意外だったと語っている。

近日、「市界」は「黒猫」というキーワードでKling、即梦、および最近リリースされた「清影」に同じのヒントを入力:「雨の日の都市の通りには、誰もいない。かわいらしい黒い猫が走ります。瞳は緑色で、首に黄色の首輪と鈴がついています。体の毛は黒く輝いています。ビデオはカメラの視点で撮影され、地面の水たまりに映る黒い猫の姿が映し出されます。」

生成された3つのビデオのうち、Kling版は速い走りを実現していなかったが、ビデオ全体はオブジェクティブなルールに合致していた。

対照的に、「即梦」の地面には水たまりがありませんでしたし、黒猫も前に進んでいませんでした。「清影」版でも水たまりがある一方、黒猫の歩き方は不自然で、尾も一部欠落した。

▲(写真はKling、即夢、清影の順です。)

Klingは、快手が3ヶ月かけて作り上げたもので、チームは20人程度で、機能に責任を持つのは現在の快手視覚生成とインタラクションセンターの責任者である万鵬飛と、画像/ビデオ信号処理、計算写真学とコンピュータビジョン、損失関数の軽減、ビジュアル生成などの研究分野を担当している人々である。

Klingの前身は、2023年10月に快手が再起動したあまり耳目を集めていない「プジ、プージーー」というプロジェクトであり、これはAIによる2秒のGifエモーションパッケージ生成ツールでした。今年3月初旬、快手内部で小さな会議が開かれ、万鵬飛の考えは快手のシニアバイスプレジデントゲイ・クン(于越)に好評を得て、プージーは予備調査の製品として決定されました。

「Klingを作るにあたって、実施レベルで共通の認識がありました。急いで、乱雑に、大胆に。」と多くの人々が言います。

Klingプロジェクトは始まってから1ヶ月も経たないうちに、快手の創業者程一笑は支援を表明し、戦略的重要プロジェクトとして位置づけています。ゲイ・クンも「会社のカードはあなたたちが使ってください。会社全体で支援します」とよく語っています。

初期のデジタル人コンテンツの起業家である柯燃は、「Klingの成功は、主に快手が蓄積したビデオデータ素材に帰することが大きい。国内では、これに対抗できるのは抖音だけ」と「市界」に分析しています。

Klingが華々しく登場する中、バイトダンスはやや寂しくなっています。

「即梦」は5月9日にオフィシャルにリリースされました。6月17日には、「即梦」はAI技術の支持を受けた初めての短編ドラマ「三星堆:未来の啓示録」で主要な役割を果たしました。しかし、C端でも、快手が7月13日にリリースしたAI技術支援の短編ドラマ「山海奇鏡」に比べると、即梦の存在感が劣っていました。

市場曰く、バイトはSoraのような文芸ビデオ技術の進展を公表する予定があると伝えられた。これはバイトが可靈に挑戦すると解釈されている。

しかし、バイト側は「市界」に対して、この記事は正確でないとコメントした。7月17日、「市界」はこの件に注目し、技術共有会にも似たイベントだと考えられている。この会議は、豆パックの大型モデルビジュアル基礎研究グループの責任者であるフォン・ジアシが主催し、バイトの研究者、機関投資家などが英語で技術共有を行った。

バイトの '大きな技術' にはまだ時間がかかるかもしれません。

バイトはまだ気づいていません。

それでは、最近の文芸ビデオの競争において、バイトはなぜこの難しい問題に取り組んでおらず、そして最近、彼らは何かに取り組んでいるのでしょうか?

おそらくバイトは'The Power of One'ではなく'可灵'に賭けるほどではない。バイトの大規模モデルプランはより複雑で、今年上半期、バイトには腾讯とアリババの両方が強い競合相手がいた。

大型モデルに対して、Byteのペースは非常に激しい。 確かに、2ヶ月以上前、計算原動力闘技場で初めて大型モデルの価格戦争を開始したのはByteでした。

5月15日、Byte Jumpの力の源デモンストレーションで、Byteは独自の豆パック大型モデルに基づくAPIサービスを発表しました。同時に、火山エンジンの統括であるタン・ダイイーは、豆パックの最新の価格を紹介:0.0008元/千Tokensで、これは業界で99.3%にも満たない「床価格」です。

市場には、つい先日Byteが最高戦略レベルとして大型モデルに注目しているという噂が広がっていた。

これらの影響の下、大型モデルを使用するトップCの呼び出しはほぼすべて無料になり、業界は次の生態段階に向かっている。

ある法律AIアプリ企業の創設者によると、「市界」にAPIサービスが公開された直後、火山エンジンの営業担当者は積極的に顧客と連絡を取り、製品を紹介し始めました。これは、バイトが大型モデルを最高戦略レベルに設定していると市場で推測されている証拠です。

そして最近、バイトの最も重要な製品、豆パックは非常に急速に成長しています。

Questmobileのデータによると、2024年6月までの国内AIGCアプリで、豆包、天工、Kimi Intelligence助手、猫箱の成長が目立ち、中でも豆包のトラフィックランキングがトップです。

快手と比較して、バイトが今もっとも注力しているのは、基礎大型モデルからAIアプリの全エコシステム競争です。また、2021年に正式にクラウドを開始した火山エンジンを考慮すると、巨大なクラウドプロバイダの中では'最も若い'クラウドプロバイダであると言えます。3年以上にわたり、火山雲はクラウド市場の挑戦者の役割を担ってきました。Byte Jumpは、基本的な大型モデル、アプリケーション層、クラウド市場をどのように協調させるかが、総合的な課題です。

最近、バイトの「Button」プラットフォームを大量に使用しているユーザーは、作成したインテリジェントボットをWeChat公式アカウントやWeChat Miniプログラムに接続する方法を探しています。

昨年12月、バイトは海外でAIアプリ開発プラットフォーム「coze」を立ち上げ、今年2月には国内版「Button」がリリースされました。多数のTikTok関連ビジネスは、ここから素早く利益を上げたいと考えています。

今年5月、腾讯はAIインテリジェントエージェントの作成と配信プラットフォーム'tencent yuanqi'をリリースしました。この時、'Button'のアクセス数はすでに233万回を超えていました。しかし、小プログラム、公式アカウント、カスタマーサービス予約号のWeChatシリーズエコシステムを結合することは、まだ実現していません。

AI開発はまだ初期段階にあるため、バイトのように腾讯も時間をかけてユーザーを教育する必要があります。AI時代の分配権を奪うことは、腾讯がもっと大きな功績を上げるために必要なことかもしれません。

3、計画を実行したバイトにはまだ時間がかかります。

業界の観点からは、コンテンツトラフィック、eコマーストラフィック、そして資金力に乏しくないバイトは、文芸ビデオを短期的に見ることができなかったとしても、長期的には後発制できる可能性があります。

積極的なマーケティング戦略に従い、落ち込んだ位置を追跡し、驚異的なパフォーマンスを発揮することは、バイトの得意な分野でもあります。

最近、アリババを狙い、バイトも統合大規模モデルの作業を行っています。 6月26日に開催されたタップタップエコロジーカンファレンス2019で、叶軍CEOは、アリババ自身のユニバーサルテキストに加えて、他の6つのサードパーティの大規模モデルもDingTalkに設置することを発表しました。 これにはMiniMax、月之暗面、智谱AI、猟戸星空、01万物、100川インテリジェンスなど、国内でほとんどの有名な大規模モデル企業が含まれており、自明に「中国で最も開放的なAIエコシステムを構築する」必要があります。

他にも、DingTalkの遊び方に似ているバイトの扣子プラットフォームは、自社の「豆包」のサポートを含め、通義千問、月之暗面、MiniMaxなどの各種外部モデルを統合しています。 6月14日には、「モデル広場」機能もリリースされ、ユーザーが匿名の2つのモデルを選択し、生成されたコンテンツのパフォーマンスに基づいてPKを行うことをサポートしています。

さらに、バイトは最近、「AI +ハードウェア」の探索を加速し、人材を獲得することでこれを費やします。

TechPlanetの報道によると、バイトの子会社PICOは、昨年後半から複数のウェアラブルデバイス、ヘッドフォンやスピーカーを開発しており、これらのデバイスもAIに搭載されています。 バイトの「豆袋」チームも、大規模モデルソフトウェアとハードウェアの組み合わせに基づいて探索しており、大規模モデルソフトウェアとハードウェアの組み合わせは、学習機、ロボット犬、ロボットなどのハードウェアデバイスに次第に適用されています。

また、36krホールディングスによると、バイトのAIハードウェア「D Line」マネージャーは李浩坤氏であるとのこと。 彼は、バイトが今年3月に買収したOWS(Open Wearable Stereo、マルチチャンネル立体音響ヘッドフォン)Oladanceの創設者です。 別のAIハードウェアライン「O Line」の責任者も、バイトが買収した会社の創設者であり、跳躍技術の副社長洪定坤氏に報告しています。

また、文学とビデオの分野では、レースがそれほど煮えていないため、バイトを含む追跡者たちはまだ時間があります。

最近、Developerは「市気」に話しました:「今、それを使用して構造を構築し、負荷の軽減を行っています。したがって、完全にそれを使用することに依存しているわけではありません。」

別の開発者であり、ショートビデオAIGCのブロガーである人によると、Kaolinにはまだ多くの最適化空間があるとのことです。「Kaolinが執筆の一貫性を確保することはできません。通常、Kaolinのスケッチビデオ機能を使用します。Kaolinに「下地」を入れて、異なる視点の動画を生成し、キャメラ作品を模倣し、実際のところ、人の操作に比重が大きいです。」

国内のあるAI模擬デート製品の研究開発メンバーは、「現在の大規模モデルアプリケーション市場では、皆さんが石を摸りながら河を渡ることはわかっています。商業化の方法は遠すぎ、あいまいすぎる問題です。ただし、多くの人が使用し、再生するために、製品の最適化と反復が保証されます。」と述べています。

(ケランは変名です)

著者 | 董温淑

編集:李原

運営 | 劉珊

これらの内容は、情報提供及び投資家教育のためのものであり、いかなる個別株や投資方法を推奨するものではありません。 更に詳しい情報
    コメントする