ラッキーミー
讚了
48
4
1
ラッキーミー
讚了
上週DeepSeek對美國股市下跌和反彈產生了很大的影響,但關於整個情況,包括開發方法、所需設備和成本、性能等,以及主觀性回答等信息仍然混亂不清。上一次談到了CUDA,根據其在AI生態系統中的定位進行了投資行動說明,而這一次將以DeepSeek成爲熱點話題爲中心,寫下我知道的事情、思考的事情,以及目前的投資行動。
這次我關注DeepSeek變得廣爲人知的原因是DeepSeek在AI模型開發中使用的「蒸餾」和「PTX」這兩項技術。
首先,在AI模型開發中,'蒸餾(Distillation)'指的是將大型模型(教師模型或Teacher Model)的知識轉移給較小的模型(學生模型或Student Model)的技術。通常用於在控制計算成本的同時保持接近原模型性能。
蒸餾的機制
1. 教師模型的訓練
...
這次我關注DeepSeek變得廣爲人知的原因是DeepSeek在AI模型開發中使用的「蒸餾」和「PTX」這兩項技術。
首先,在AI模型開發中,'蒸餾(Distillation)'指的是將大型模型(教師模型或Teacher Model)的知識轉移給較小的模型(學生模型或Student Model)的技術。通常用於在控制計算成本的同時保持接近原模型性能。
蒸餾的機制
1. 教師模型的訓練
...
已翻譯
45
19
4
ラッキーミー
讚了
已翻譯
10
ラッキーミー
讚了
$Palantir (PLTR.US)$ 21年的c3ai看起來很像。那時候我三次加倉,然後止損,留下了糟糕的回憶。這個K線圖像教科書上的苦味塔架🗼!美國10年期國債利率一路飆升到5%的天花板🌌,如果週三的CPI超過預期,就會一直攀升到$45的許願之塔🎢,希望能牢牢吸引住後再做出滑動接住🫴
已翻譯
7
3
ラッキーミー
參與了投票