整合风起。
作者 | 黄昱
编辑 | 周智宇
转眼间,由ChatGPT掀起AI大模型浪潮已有两年,但不少人期待的巨大商机却迟迟没有到来。
与去年一片叫好的面貌不同,AI大模型创业正在进入动荡期。今年下半年以来,国内AI圈的大神们、各家大厂大模型团队核心技术骨干离职的消息频繁传出,动荡不安。
先是零一万物技术联创黄文灏离职,再是阿里通义千问技术负责人周畅转投字节,还有腾讯混元技术负责人刘威、昆仑万维AI专家颜水成等人也离开了原公司。
人才流动是AI行业发展的风向标,这些技术骨干离职的背后,是AI大模型面临技术迭代放缓,以及商业化不理想等多重挑战,所有人都在主动调整,寻找自己认为正确的路线或方向。
处在发展迷茫期的AI大模型行业,正在经历技术、资本与人才的重组,一场洗牌悄然发生,未来行业整合趋势会越来越明显。
事实上,这样的故事在每次技术浪潮中都会上演。一个行业共识是,在经历一番激烈的角逐后,未来扮演重要角色的大模型公司将只剩下个位数,而只有那些深度参与了独角兽发展的人,才能成为最后的幸运儿。
这是一场无法预测结果的残酷竞赛。身处其中,只能全力以赴。
动荡
前沿技术的比拼中,人才可以说是最重要的竞争力。在技术飞速迭代的AI大模型领域,人才更是底层技术、产品能否跟上脚步,最终跻身行业第一梯队的关键因素。
多位投资人告诉华尔街见闻,在这轮AI大模型浪潮中,投资人考察投资项目最看重的还是人才团队,这决定了其是否有持续的技术迭代能力。
然而,无论在大厂还是AI创业公司,前期热潮中聚拢来的人才,正因为现实的冲击而主动或被动的做出新的选择。
据华尔街见闻确认,作为腾讯杰出科学家、腾讯混元大模型技术负责人之一兼AI Lab计算机视觉中心负责人,刘威近日已从腾讯离职。有消息称,刘威已经在新加坡创业,瞄准的还是视频生成领域。
前不久,昆仑万维也宣布颜水成不再担任其2050全球研究院院长,改任昆仑万维荣誉顾问。作为计算机视觉和机器学习领域专家,颜水成在去年9月才加入昆仑万维,帮助昆仑万维从0到1搭建了2050全球研究院,围绕下一代模型架构和Agent两个方向展开了深度的研究。
在这波人才动荡中,更多的人选择从AI创业公司流向大厂,或者在从一个大厂转向另一个大厂。
目前来看,下半年传出在积极筹备大模型研究院的字节跳动,是这波人才流动中的最大赢家。
面壁智能秦禹嘉被曝离职后,2024年下半年加入字节跳动大模型研究院;今年8月,零一万物技术联创黄文灏加入字节跳动的模型算法团队Seed,汇报给字节跳动大模型负责人朱文佳;阿里巴巴通义千问大模型技术负责人周畅在10月份也被曝加入字节跳动。
值得一提的是,周畅的离职还引发了诉讼。11月13日,有消息称周畅违反竞业协议,阿里方面已起诉递交劳动争议仲裁申请书。
前不久,月之暗面创始人杨植麟谈及一些人才回流大厂的现象时表示,这是正常的。“行业行业发展进入了一个新的阶段,它从一开始有很多公司在做,变成了现在少一点的公司在做,接下来大家做的东西会逐渐不一样,我觉得这是必然的规律。”
大模型的训练投入大,即便是大厂也必须做出取舍。年初“文生视频”模型Sora的出现一度掀起了全球竞逐AI视频生成的热潮,然而,OpenAI宣布由于算力短缺而推迟Sora的更新,导致至今尚未对外开放。
显然,在明确落地场景和商业化回报之前,“类Sora”的视频生成模型也不会成为腾讯重点发力的方向。在此背景下,要想在视频生成领域有所作为的刘威自然会另谋出路。
有国内大厂投资负责人对华尔街见闻表示,海外今年也频繁出现人才流动的情况,主要还是因为AI大模型团队面临短期技术瓶颈,以及商业化缓慢的挑战。未来,国内一大批AI初创企业一会面临资金链断裂,以及被大厂收编的命运。
此外,香颂资本执行董事沈萌对华尔街见闻指出,人才流动频繁的背后,一方面是国内大模型缺少深度研发创新,因此各团队之间的人员流动障碍更小;另一方面也折射出行业性的躁动,以及在模型数量上存在泡沫。
未来
人工智能作为一门学科诞生以来已有超过60年,期间曾掀起过多次技术浪潮,在一些浪潮初期,也曾像这次AI大模型一样火热。在2016年掀起的那一轮AI浪潮初期,科技公司们也是使尽浑身解数抢夺AI顶尖人才。
但资本的耐心远不足以支撑AI科学家的研究,当AI技术迟迟无法带来商业兑现,不管是互联网大厂还是明星AI公司,都开始回归理性,开始重新评估AI人才的“价值”,人才流动也变得更快。
历史总是相似的,在经过一段时间热潮后,AI大模型行业也会进入挤压出清阶段。
2022年10月,ChatGPT掀起了全球AI大模型浪潮,在国内更是引发百模大战,创业公司如雨后春笋崛起,互联网大厂纷纷下场,喊出要““All in AI”的口号。
然而经过过去一两年的探索,越来越多企业深刻认识到,能够熬到天明的幸运者只是少数。
百度创始人李彦宏此前也直言不讳地指出,就像历史上许多次技术浪潮一样,在度过最初的兴奋阶段之后,生成式AI的技术泡沫不可避免。然后,当这项技术没有达到最初兴奋阶段的高期望时,人们会感到失望。
李彦宏预判,在AI挤泡沫阶段,那些无法满足市场需求的伪创新将会被清洗掉,在这之后,有1%的企业将脱颖而出,继续成长,为社会创造巨大价值。“现在,我们只是在经历这个阶段,这个行业比去年更冷静,也更健康。”
所有AI大模型团队都站到了做取舍的十字路口。
国内大模型行业最热闹的是上半年的降价潮,在智谱CEO张鹏看来,这一现象是大家找不到差异化的价值点,只能比价格了。
张鹏透露,最近看到了很多自研大模型的行业龙头公司开始掉头的情况,因为他们发现发现这件事没那么容易,不是组建一个团队,拿一个开源模型过来就能跑通的,不如去采购。
此外,十月初,市场中传出消息,称智谱AI、零一万物、MiniMax、百川智能、月之暗面、阶跃星辰这六家有“AI六小虎”中,有两家公司已经决定逐步放弃预训练模型,缩减了预训练算法团队人数,业务重心转向AI应用。
杨植麟认为,预训练还有半代到一代的空间,这个空间明年会释放出来,明年领先的模型会把预训练做到比较极致的阶段。接下来最重点的是强化学习,它还是 Scaling,只是通过不同的方式去 Scale。
与此同时,月之暗面也主动选择了在做业务减法,聚焦把一个业务产品做好。杨植麟透露,月之暗面会根据美国市场的情况去判断,哪个业务最后做大的概率更高。聚焦在上限最高的事情,也要跟AGI的使命最相关。
AI研究的终极目标是实现通用人工智能(AGI)。
“罗马一直在,路怎么走是不一样的。”腾讯机器学习平台总监康战辉前不久表示, AGI大家都有思考,未来两年三年之后算是比较好规划,但未来各家可能走的路线不一样。比如,腾讯就选择了走混合专家模型(MoE) 结构这一路线。
然而,无论路线如何选择,所有AI淘金者面临的的一个共同的难题,就是高算力带来了高成本,但是短期内没有出现可以覆盖高昂成本的商业变现路径。
香颂资本执行董事沈萌对华尔街见闻表示,大模型短时间后会进入一次优胜劣汰的阵痛期,部分向核心技术底层推进的技术和产品更有机会获得市场认可。
这是一场百年难得一遇的科技革命,但没有足够成熟的技术和可靠的商业模式支撑,AI大模型也难免像前几年的VR、元宇宙类似,热潮退去,一地鸡毛。
如今淘汰赛已经开启,在“AI的iPhone时刻”来临之前,所有公司都要拿出足够的耐心和极高的敏锐度,去迎接残酷的挑战。