GPT-4o 的升级在哪里?
1) 媒体融合能力:GPT-4o 具有文本、图像、视频和音频功能,这意味着它可以接受任何形式的文本、音频及其组合的输入,并生成相同媒体格式的响应。
2) 更快的速度:GPT-4o 比其前身快五倍,语音延迟显著改善。它平均可以在 232 毫秒内响应音频输入,达到 320 毫秒,接近人类在对话中的响应时间。这意味着用户可以与GPT-4o进行实时对话,甚至可以直接进行视频通话,以获得各种问题的现场答案。
3) 自由和开放:尽管 “价格战” 之风吹向了人工智能行业,但OpenAI并没有受到影响。截至公告发布之日,GPT-4O将向ChatGPT的所有付费和免费用户发布,取消所有其他限制,并将API价格降低50%。