讓我們直奔主題:人工智能領域正炙手可熱,有一家聲稱創新突破的中國初創公司 DeepSeek,一家聲稱用兩種模型開創先河的公司: DeepSeek-V3 (於2024年12月26日發佈)和 DeepSeek-R1 (發佈於2025年1月20日)。兩者都吹噓出色的創新——純強化學習,多頭潛在關注,專家組合,資源優化——並且訓練成本非常低。他們設法激發了國內的愛國主義狂熱,並通過堅稱他們已經在自己的遊戲中擊敗了OpenAI而引起了國外的好奇心。
已翻譯
![數據寄生和DeepSeek的「創新」:當借鑑成爲突破](https://sgsnsimg.moomoo.com/sns_client_feed/102493980/20250131/1738337180891-random6920-102493980-android-compress.jpg/thumb?area=101&is_public=true)
![數據寄生和DeepSeek的「創新」:當借鑑成爲突破](https://sgsnsimg.moomoo.com/sns_client_feed/102493980/20250131/1738337181422-random6852-102493980-android-compress.jpg/thumb?area=101&is_public=true)
![數據寄生和DeepSeek的「創新」:當借鑑成爲突破](https://sgsnsimg.moomoo.com/sns_client_feed/102493980/20250131/1738337181644-random4573-102493980-android-compress.jpg/thumb?area=101&is_public=true)
9
10
1
圍繞美國對中國出口先進AI芯片進行的辯論聲浪日漸高漲,官員們將其吹捧爲維護國家安全和「保持美國技術領先地位」的關鍵舉措。 但是,在掐住硬件真的是遏制競爭最有效的方式嗎?尤其是當新的數據寄生方法,如知識蒸餾,對專有AI模型構成更大威脅時? 讓我們深入探討一下...
已翻譯
5
1
在人工智能領域,這是一個激動人心的一年,最新的爆點來自一個名叫DeepSeek的有競爭力的競爭者。在表面上,他們只是又一個吹噓雄心壯志的新秀,「更快的性能」,「開源榮耀」,「革新機器學習」,所有這些都是常見的口號。但是,更深入一探,你會發現真正引發他們崛起的爭議:「數據寄生」。有人說他們是狡猾的天才在利用系統;...
已翻譯
6
3
人工智能領域喜歡引人注目的頭條,而DeepSeek則交出了一手好牌。隨着最近的開源發佈,聲稱只需數百萬美元的成本,DeepSeek引發了行業中的漣漪(或海嘯,這取決於你問誰)。支持者們把它譽爲人工智能模型訓練領域的「低成本革命」。然而,批評者稱其爲明目張膽的「數據寄生」,指責DeepSeek在OpenAI廣泛和昂貴的研究成果上「蹭車」。而隨着美國政府現在考慮更嚴格的科技出口禁令,這場戲劇只會加劇。讓我們一一分析。
已翻譯
8
1
1
在量子計算的世界中,納斯達克:RGTI的Rigetti Computing已經成爲投資者極度着迷的最新對象。這支股票的漲幅令人驚訝,無論是在單個月內漲幅達725%,還是在過去一年中漲幅高達1024.51%,取決於你挑選的時間窗口。如果這不是「波動性」在呼喊,我也不知道什麼才是。但是隨着關於量子位和超冷電路的熱烈討論,“RGTI是否真的有實力持續攀升,抑或這只是一個等待被爆破的泡沫呢?
已翻譯
44
4
早在2019年,谷歌就聲稱 「量子霸權」,震驚了科技界。據報道,它當時的新量子處理器處理專業計算的速度比任何已知的超級計算機都要快。然而,幾年後,量子計算機仍然主要侷限於研究實驗室。現在,有了谷歌最新的Willow芯片,許多人再次問我們是否正處於量子革命的風口浪尖——o...
已翻譯
28
1
4
科技世界充滿了熱議,量子計算成爲焦點。就像以往的加密狂熱一樣,我們現在看到了一波新的炒作浪潮,這一次圍繞IonQ、Rigetti和D-Wave等公司展開。它們的股價飆升了數百個百分點,受到投機熱情和轟動性頭條的推動。
---
量子計算概念現象:我們是如何到達這裏的?
量子計算...
---
量子計算概念現象:我們是如何到達這裏的?
量子計算...
已翻譯
39
11
7
數字貨幣市場一直是戲劇情節滋生的溫牀,而瑞波幣最近的暴漲也不例外。僅僅幾天之內,瑞波幣超越泰達幣(USDT),成爲市值第三大的加密貨幣,僅次於比特幣和以太幣。過去兩天裏我和一位朋友在WhatsApp上的對話幾乎全部圍繞這個話題展開。他不僅對自己小額投資翻倍感到興奮,甚至預測瑞波幣未來可能達到每枚1000美元的價位——這番言論讓我無語以對。
已翻譯
34
10
6
在過去的兩週裏,瑞波的XRP一路飆升,引發投資者的興奮甚至狂喜。我的一個朋友最近投資了500美元到XRP中,每天通過WhatsApp向我分享最新的動向。他每天發送XRP漲幅的截圖,慶祝它的暴漲。雖然我爲他的成功感到高興,但我也忍不住有點擔心他,以及其他可能陷入當前狂熱中的人...
已翻譯
46
1
4
自上一篇比較阿斯麥控股股份有限公司(阿斯麥)和高通股份公司(QCOM)的文章以來,讀者和朋友們不斷提出一個問題:
“如果我只有2000美元,必須在這兩家公司中選擇一家進行投資,應該選擇哪家?
這是個迷人的困境。阿斯麥和高通都是半導體行業中備受推崇的巨頭,各有所長。那爲什麼不將2000美元...
“如果我只有2000美元,必須在這兩家公司中選擇一家進行投資,應該選擇哪家?
這是個迷人的困境。阿斯麥和高通都是半導體行業中備受推崇的巨頭,各有所長。那爲什麼不將2000美元...
已翻譯
35
6
4
Alex Wong Cian Yih 樓主 Deltaman099 : 我理解你的觀點,我認爲這是一個有趣的觀點。但讓我問你:如果你在運營OpenAI,並且花費了數十億美元使用大量計算資源和人類反饋來訓練模型,結果卻看到競爭對手利用你的模型輸出以僅爲你成本的1/20的價格構建自己的產品——你會怎麼想?你認爲這仍然會激勵你投資於 groundbreaking 創新嗎?知道你的努力如此容易被他人利用?我真心想聽聽如果角色調換你會如何應對這樣的情況。
Alex Wong Cian Yih 樓主 lousyimpressario : 我理解你的觀點,但從公共知識中汲取靈感和直接利用競爭對手的專有輸出來訓練競爭模型之間存在根本的區別。
OpenAI的API政策明確規定,其輸出不能用作訓練數據來開發競爭的人工智能模型。這在其《服務條款》中明確說明,DeepSeek明顯無視了這一規定。OpenAI的API生成的回應不僅僅是從互聯網上搜集的原始數據,它們已經經過充分加工、清潔和結構化,通過人類反饋和廣泛的模型訓練精心篩選出高質量的輸出。
這意味着DeepSeek無需像OpenAI那樣經歷收集原始互聯網數據、進行人工註釋、進行帶人類反饋的強化學習(RLHF)和篩選低質量回應等嚴格且昂貴的數據處理步驟。相反,他們只是拿取OpenAI的高質量API輸出,並將其饋送回自己的模型,有效地跳過了人工智能訓練中最昂貴和勞動密集的部分。
這就是爲什麼被問及其來源時,DeepSeek的模型被看到聲稱是由OpenAI訓練的——明顯表明它直接吸收了OpenAI的API回應而沒有進行實質性轉換。
是的,知識蒸餾和模型優化在行業中很常見,許多人工智能公司確實利用競爭洞察來改善他們的模型。然而,其他公司至少在使用之前會處理、優化和調整數據,確保他們的輸出不是直接拷貝。DeepSeek所做的是拿取OpenAI加工後的知識原樣重複利用,而沒有增加真正的價值或獨創性。
這不僅僅是一個道德問題,這是對OpenAI的《服務條款》的直接違反,也是對其專有研究的不公平利用。如果這種做法變得正常化,將破壞任何公司投資於真正人工智能創新的動機,因爲任何競爭對手都可以簡單地拿取最終產品並免費重複利用。OpenAI和其他嚴肅的人工智能開發者會有很少的理由繼續推動該領域的發展,如果他們的輸出可以如此輕易地被競爭對手重新利用。
因此,這不僅僅是關於'靈感'或'競爭' - 這是一起未經授權利用另一家公司知識產權的明顯案例,爲人工智能發展的未來設立了危險的先例。
Alex Wong Cian Yih 樓主 lousyimpressario : 我明白你的意思,但我認爲你的論點忽略了一些關鍵區別。創新確實是建立在先前知識之上,但從公共數據中汲取和直接利用競爭對手的專有輸出之間有着重大區別。
你的廚師類比並不適用,因爲OpenAI的API響應不僅僅是「口味也就是品嚐」,它們更像是耗費數十億美元完善的祕密配方。DeepSeek不僅僅是從OpenAI那裏獲得靈感;他們被指控直接在OpenAI的專有輸出上進行訓練,而這明確違反了OpenAI的條款和條件。
你還假設這不會影響人工智能投資,但這是一種過於樂觀的觀點。如果主要人工智能開發者無法保護他們的研究成果,他們將沒有動力繼續突破界限。當競爭對手可以直接提取最終結果並跳過最困難的步驟時,爲什麼要花費數十億?
公平競爭應該是關於真正的創新,而不是繞過競爭對手最艱難和昂貴的研發工作。這才是真正的問題所在。
Alex Wong Cian Yih 樓主 Deltaman099 : 我覺得有趣的是,當我們討論行業板塊問題時,你立刻就提到「只能訴諸法庭」的問題。我不是OpenAI,也不是OpenAI的投資者—那麼法律訴訟爲何會是我的關注?我們在這裏討論的不是提起訴訟的問題;而是關於道德、公平競爭,以及對整個人工智能創新的影響。
討論道德關切並不只有通過法律訴訟這一途徑。在訴訟發生之前,不公平的做法可能會影響人工智能行業和競爭格局。真正的問題不是DeepSeek是否優化了他們的模型架構,而是在獲取訓練數據時是否遵守了OpenAI的服務條款。
如果一個模型的表現再好,其基礎是建立在違反另一公司政策的基礎上也毫無意義。創新應該是公平的,真正的突破應該來自原創工作—而不是未經許可重新利用競爭對手的專有數據。
如果我們甚至不能理性地討論這些問題,那麼按照你的邏輯,我們不應該質疑任何行業的潛在違規行爲,除非提起法院訴訟。這不是道德討論的方式。
Alex Wong Cian Yih 樓主 Deltaman099 : 鑑於DeepSeek已將其模型在MIT許可下開源,OpenAI從理論上講可以應用知識蒸餾技術來改進自己的模型,利用DeepSeek的輸出。MIT許可允許商業和無限制使用,這意味着OpenAI可以合法地從DeepSeek的模型中提取見解,以增強其中文能力。
考慮到DeepSeek在中文理解、語法和語義方面的顯著進展,利用其輸出可以顯著增強OpenAI在這一領域的模型。這是開源促進交叉學習的一個實際例子——就像DeepSeek可能是建立在現有人工智能進步基礎上一樣,OpenAI現在也有同樣的機會做出回報。
隨着DeepSeek的模型對所有人可用,它成爲更廣泛人工智能生態系統的一部分,允許改進在多個方向流動。當模型公開共享時,這就是技術進步的方式。