share_log

机会|GPT-4o登场 八方向受关注

腾讯自选股 ·  05/13 21:16

OpenAI推出最新人工智能模型GPT-4o,GPT-4o在GPT-4的基础上改进了文本、视频和音频功能,多模态交互能力亮眼,听说读写丝滑如真人。

据介绍,新模型使ChatGPT能够处理50种不同的语言,同时提高了速度和质量。新闻稿称,GPT-4o是迈向更自然人机交互的一步,它可以接受文本、音频和图像三者组合作为输入,并生成文本、音频和图像的任意组合输出,“与现有模型相比,GPT-4o在图像和音频理解方面尤其出色。”GPT-4o可以在232毫秒内对音频输入做出反应,与人类在对话中的反应时间相近。

在录播视频中,两位高管做出了演示:机器人能够从急促的喘气声中理解“紧张”的含义,并且指导他进行深呼吸,还可以根据用户要求变换语调。图像输入方面,演示视频显示,OpenAI高管启动摄像头要求实时完成一个一元方程题,ChatGPT轻松完成了任务;另外,高管还展示了ChatGPT桌面版对代码和电脑桌面(一张气温图表)进行实时解读的能力。

国盛证券研报表示,在未来几周内OpenAI将在ChatGPT Plus中推出带有GPT-4o的新版本语音模式。开发人员现在可以在API中将GPT-4o作为文本和视觉模型进行访问。与GPT-4Turbo相比,GPT-4o的速度快2倍,价格减半,速率限制高出5倍。该机构认为,GPT-4o是迈向更自然的人机交互的重大进步,新功能带来了崭新的多模态交互能力,通过新的端到端模型实现了体验上的新突破,有望在各类终端实现用户体验的最大化,利好智能终端Agent、机器人等方向。

开源证券发布研报称,国内AI多模态模型不断跃迁,或持续赋能IP开发、影视、音乐、教育、营销等领域降本提效,拉动对音视频语料的需求,并衍生全新变现模式,建议继续布局多模态AI应用。

信达证券5月13日研报指出,受益于全球生成式AI持续发展,文生图/视频/音乐/代码等多方面应用的迭代更新有望长期给诸多行业带来降本增效,重点关注:

1)AI+搜索:昆仑万维、三六零等;

2)AI+影视:华策影视、慈文传媒、万达电影、上海电影、光线传媒、博纳影业;

3)AI+IP(涉及版权、算料等):中广天择、华数传媒、新华传媒、中文在线、上海电影、华策影视、奥飞娱乐、果麦文化、捷成股份、南方传媒、视觉中国;

4)AI+3D:大丰实业、丝路视觉、凡拓数创、恒信东方、风语筑、锋尚文化、岭南股份;

5)AI+营销:分众传媒(高分红)、三人行、因赛集团、易点天下、值得买、蓝色光标、兆讯传媒、浙文互联、每日互动;

6)AI+教育/阅读:南方传媒、盛通股份、世纪天鸿、掌阅科技等;

7)AI+出版(高分红):南方传媒、皖新传媒、时代出版、城市传媒、中南传媒、凤凰传媒、果麦文化等;

8)AI+游戏:巨人网络、恺英网络、完美世界、紫天科技、盛天网络、昆仑万维、神州泰岳、三七互娱、掌趣科技、宝通科技、吉比特、名臣健康、姚记科技、顺网科技、汤姆猫、星辉娱乐;

9)其他:万兴科技、人民网、新华网、福昕软件、金山办公、松炀资源等。

声明:本文章内容为公开市场资料整理,不构成投资建议,股市有风险,投资需谨慎。

声明:本内容仅用作提供资讯及教育之目的,不构成对任何特定投资或投资策略的推荐或认可。 更多信息
    抢沙发