share_log

定调“算力即国力”,DeepSeek-v3火爆全网!算力板块领跑市场

格隆汇 ·  2024/12/30 10:57

推理算力需求增加

周末期间,国内大模型DeepSeek-v3强势“出圈” ,算力即国力定调。

今日,算力板块表现活跃,领跑市场。

截至发稿,安诺其20CM涨停,中辰股份涨超16%,群兴玩具、云赛智联、电光科技涨停,奥飞数据涨超8%,朗科科技、并行科技涨超7%,协创数据、莲花控股涨超6%,铜牛信息涨超5%。

big

算力需求将下降?

周末,量化巨头幻方旗下、“AI界拼多多”深度求索(DeepSeek)自研的大模型DeepSeek-v3刷屏国内外,引发行业大讨论。

一方面,DeepSeek-v3的成本很低,在预训练阶段仅使用2048块GPU训练了2个月,且只花费557.6万美元。

另一方面,性能上,DeepSeek-v3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

不过,需要注意的是,2048块H800并非全部训练算力投入。

其中,不包括DeepSeek R1模型(对标OpenAI o1)生成的高质量数据消耗的算力,以及模型架构的探索调试阶段消耗的算力。

据悉,DeepSeek之所以能用较少的算力就开发出性能强大的大模型,关键是在后训练的时候把一个叫R1的模型,它的推理能力蒸馏到了V3模型上,这样后训练部分就基本没有成本。

DeepSeek-v3的成功引发了关于算力、大模型训练方式的大讨论,部分投资者担忧行业对算力的需求或大幅下降。

但分析来看,即使诸如DeepSeek-v3之类的大模型成功了,但字节、小米、理想等科技巨头在算力上的投资并不会减少,反而因为有了这些成功案例,让大家看到了行业潜力,有望进一步加码。

而且,DeepSeek的成功将给国内其他企业带来启发,如何更高效地利用算力资源,有望促使更多的中小型企业入局。

未来,随着开发成本的降低,AI应用及软件有望迎来大机遇。

官方定调:算力即国力

12月28日,由中央广播电视总台和国务院国资委联合制作的大型系列纪录片《大国基石》第三期推出《算力引擎》,明确提出算力即国力,它是数字经济时代的新质生产力。

截至2023年,中国算力总规模位列全球第二,累计建成国家级超算中心14个,全国在用超大型和大型数据中心达633个、智算中心达60个。

投资上,中信证券认为,DeepSeek新一代模型的发布意味着AI大模型的应用将逐步走向普惠,助力AI应用广泛落地;同时训练效率大幅提升,亦将助力推理算力需求高增。算力需求的指数级提升与模型训练推理成本的下降将构成产业飞轮,带动全产业链扩张,随着AI进一步普及到日常生活与产业当中,推理算力需求将仍然驱动AI算力产业链持续增长。

中信建投指出,当前随着AI算力需求提升,尤其是国内供给和需求两端都出现积极变化,对于数据中心的需求也将随之增加,尤其是高功率的超大型数据中心机房,也对电力、温控等环节提出了更高要求,建议重点关注IDC产业链,包括IDC服务商、电力设备、液冷温控等环节。

声明:本内容仅用作提供资讯及教育之目的,不构成对任何特定投资或投资策略的推荐或认可。 更多信息
    抢沙发