OpenAI announced the rollout of its advanced Voice Mode to a select group of ChatGPT Plus users, promising more natural, real-time conversations and emotional responsiveness.
What Happened: On Thursday, OpenAI revealed that it has begun the rollout of its advanced Voice Mode to a small group of ChatGPT Plus users. The company stated that the new feature offers more natural, real-time conversations, allows users to interrupt at any time, and senses and responds to the user's emotions.
The users in the alpha stage will receive an email with instructions and a message in their mobile app. OpenAI plans to add more people on a rolling basis and aims for all Plus users to have access by fall. The company also mentioned that video and screen-sharing capabilities will be launched soon.
We're starting to roll out advanced Voice Mode to a small group of ChatGPT Plus users. Advanced Voice Mode offers more natural, real-time conversations, allows you to interrupt anytime, and senses and responds to your emotions. pic.twitter.com/64O94EhhXK
— OpenAI (@OpenAI) July 30, 2024
OpenAI has been working to reinforce the safety and quality of voice conversations as they prepare to bring this frontier technology to millions of people. They tested GPT-4o's voice capabilities with over 100 external red teamers across 45 languages and have trained the model to speak only in the four preset voices.
Why It Matters: This announcement comes a month after OpenAI decided to postpone the launch of its voice assistant feature for ChatGPT, citing the need to address safety issues. The company needed an additional month to improve the model's ability to detect and refuse certain content, enhance the user experience, and prepare its infrastructure for scaling to millions of users while maintaining real-time responses.
Earlier, OpenAI faced controversy when actress Scarlett Johansson hired legal counsel against the company for allegedly replicating her voice using AI technology.
Moreover, Microsoft Corp. (NASDAQ:MSFT) recently integrated OpenAI models into its Azure cloud platform, showcasing the increasing adoption and integration of OpenAI's advanced models in various industries.
Image via Shutterstock
This story was generated using Benzinga Neuro and edited by Pooja Rajkumari
OpenAIは、ChatGPt Plusの限られたユーザーに対して、進化したVoice Modeの導入を発表し、より自然な、リアルタイムな会話や感情に反応する機能を提供します。
出来事: OpenAIは、ChatGPt Plusの少数のユーザーに進化したVoice Modeの導入を開始したことを木曜日に発表しました。同社は、新しい機能によりより自然な、リアルタイムな会話が可能で、ユーザーがいつでも中断でき、ユーザーの感情に気づき、それに対応すると述べています。
アルファ版のユーザーには、指示とモバイルアプリケーション内のメッセージが含まれたメールが送信されます。OpenAIは、段階的に人数を増やし、秋までにすべてのPlusユーザーがアクセスできるようにする予定です。同社は、すぐにビデオや画面共有の機能も開始する予定です。
OpenAIは、ChatGPt Plusの限られたユーザーに、進化したVoice Modeの導入を始めています。進化したVoice Modeにより、より自然な、リアルタイムな会話が可能で、いつでも中断でき、感情に反応します。pic.twitter.com/64O94EhhXK
— OpenAI (@OpenAI) July 30, 2024
OpenAIは、数百万人にこの先進的な技術を提供する準備を進めながら、音声会話の安全性と品質を強化するために取り組んでいます。彼らは、100人以上の外部レッドチームから45言語にわたるGPt-4oの音声機能をテストし、モデルを4つのプリセットボイスでしか話さないように訓練しています。
なぜ重要か:この発表は、OpenAIがChatGPtの音声アシスタント機能の発売を延期することを決定し、安全性の問題に対処する必要があると述べた1か月後に発表されました。同社は、モデルが一部のコンテンツを検出して拒否する能力を向上させ、ユーザーエクスペリエンスを向上させ、数百万のユーザーに向けたインフラストラクチャを維持しながらリアルタイムの応答を維持するための準備をするため、さらに1か月必要でした。
また、女優のスカーレット・ヨハンソンが、AI技術を使って彼女の声を複製したとして、同社に対して法的代理人を雇ったことで、OpenAIは論争に直面しました。
さらに、マイクロソフト(NASDAQ:MSFT)は最近、AzureクラウドプラットフォームにOpenAIモデルを統合し、OpenAIの高度なモデルがさまざまな産業で採用され、統合されることが増えていることを示しています。
Shutterstockを通じての画像
この記事は Benzinga Neuro によって生成され、Pooja Rajkumari によって編集されました。