7
$Metaplanet (3350.JP)$
大家好,战斗力3980。
曾以3980作为最强而自豪,但如今已变成普通水平。![]()
直到星期五🦗高峰。
→ 而这个星期一是2/10号!
→ 包括红色时代在内,是Planet有史以来的特大盈余(BTC价格差(预)
咦,咦,很期待![]()
![]()
!
(很期待会有怎样的价格波动)
大家好,战斗力3980。
曾以3980作为最强而自豪,但如今已变成普通水平。
直到星期五🦗高峰。
→ 而这个星期一是2/10号!
→ 包括红色时代在内,是Planet有史以来的特大盈余(BTC价格差(预)
咦,咦,很期待
(很期待会有怎样的价格波动)
已翻译
4
4
❖maumau
留下了心情
上周由DeepSeek导致美国股市下跌和复苏,对整个市场产生了重大影响,但就其整体情况来说,包括开发方法、所需设备和成本、性能以及主观性答复等,信息仍然杂乱混乱。上次写了关于CUDA,基于这一点,已经涉及到了在AI生态系统中的定位和投资行为。这次将重点放在为什么DeepSeek成为话题,写下自己知道的事情、正在思考的事情,以及当前的投资行为。
今次我对DeepSeek广为人知感到关注的是DeepSeek在AI模型开发中使用的'蒸馏'和'PTX'这两个技术。
首先,在AI模型开发中,'蒸馏(Distillation)'指的是将大型模型(教师模型或Teacher Model)的知识转移到较小的模型(学生模型或Student Model)的技术。通常用于降低计算成本的同时保持接近原始模型的性能。
蒸馏的工作原理
1.教师模型的训练
...
今次我对DeepSeek广为人知感到关注的是DeepSeek在AI模型开发中使用的'蒸馏'和'PTX'这两个技术。
首先,在AI模型开发中,'蒸馏(Distillation)'指的是将大型模型(教师模型或Teacher Model)的知识转移到较小的模型(学生模型或Student Model)的技术。通常用于降低计算成本的同时保持接近原始模型的性能。
蒸馏的工作原理
1.教师模型的训练
...
已翻译
45
19
4
❖maumau
评论了
19
4
1
❖maumau
留下了心情
$富途控股 (FUTU.US)$
moomoo 应用程序非常易于使用,我打算购买一股以表示感谢。尽管刚刚成立一年,但与SBI、楽天和松井相比,我觉得它令人印象深刻。
moomoo 应用程序非常易于使用,我打算购买一股以表示感谢。尽管刚刚成立一年,但与SBI、楽天和松井相比,我觉得它令人印象深刻。
已翻译
7