让我们言归正传: 人工智能领域正在聚焦于 DeepSeek一个声称以两种模型开创新局面的中国初创企业 DeepSeek-V3 (发布于2024年12月26日)和 DeepSeek-R1 (于2025年1月20日发布)。两者都宣扬了令人惊叹的创新—纯强化学习,多头潜在注意力,专家混合,资源优化—以及显著低的训练成本。他们设法激起了国内的爱国狂热,并通过坚称他们已经在自家的游戏中击败了OpenAI,从而引发了国外的好奇心。
已翻译



9
10
1
围绕美国对中国出口先进AI芯片的出口管制展开的辩论越发激烈,官员们将其吹捧为维护国家安全和“保持美国技术领先地位”的关键举措。但是,当新的数据寄生方法,如知识蒸馏,对专有AI模型造成更大威胁时,扼杀硬件真的是遏制竞争最有效的方式吗?让我们来分析一下...
已翻译
5
1
在人工智能领域,今年发生了一些激动人心的事情,最新的惊人消息来自一家名为DeepSeek的小型竞争者。从表面上看,他们只是另一家夸大雄心的Upstart——“更快的性能”、“开源的荣耀”、“革新机器学习”,这些都是常见的口号。但深入挖掘,你会发现支撑他们崛起的真正争议:关于“数据寄生”的指控。有人说他们是利用系统的狡猾天才;...
已翻译
6
3
人工智能世界喜欢响亮的头条新闻,DeepSeek绝对不负众望。凭借其最近的开源发布,据称成本仅为几百万美元,DeepSeek在行业内引发了涟漪(或海啸,取决于你问谁)。支持者将其誉为人工智能模型训练中的“低成本革命”。然而,批评者则称其为“数据寄生”的明显案例,指责DeepSeek在OpenAI进行的广泛且昂贵的研究成果上进行了附庸。随着美国政府现在考虑更加严格的技术出口禁令,这场戏剧只会变得更加激烈。让我们来分析一下。
已翻译
8
1
1
在狂野的量子计算世界中,Rigetti Computing(纳斯达克:RGTI)已成为极端投资者着迷的最新对象。股价飙升了令人震惊的百分比——无论是在一个月内飙升725%,还是过去一年涨幅1024.51%,这取决于你挑选的时间窗口。如果这不是暴涨暴跌,我就不知道什么是了。但在所有关于量子比特和超冷电路的热议中,RGTI是否真的有能力继续上涨,还是一个即将破灭的泡沫?
已翻译
44
4
早在2019年,谷歌就声称 “量子霸权”,震惊了科技界。据报道,它当时的新量子处理器处理专业计算的速度比任何已知的超级计算机都要快。然而,几年后,量子计算机仍然主要局限于研究实验室。现在,有了谷歌最新的Willow芯片,许多人再次问我们是否正处于量子革命的风口浪尖——o...
已翻译
28
1
4
科技界正处于兴奋状态,量子计算成为讨论的焦点。类似于之前的加密狂热,我们现在看到了一波新的炒作浪潮——这一次围绕IonQ、Rigetti和D-Wave等公司。他们的股价已经猛涨了数百个百分点,受到投机热情和耸人头条的推动。
---
量子计算概念:我们是如何走到这一步的?
量子计算...
---
量子计算概念:我们是如何走到这一步的?
量子计算...
已翻译
39
11
7
数字货币市场一直是戏剧性叙事的温床,而瑞波币最近的飙升也不例外。仅在几天之内,瑞波币超越了泰达币(USDT),成为市值第三大数字货币,仅落后于比特币和以太坊。过去两天,我与朋友在WhatsApp上的对话几乎完全围绕这个话题展开。他不仅对自己的小笔投资翻倍感到兴奋,甚至预测瑞波币未来可能达到每枚1000美元的价格,这番言论让我无言以对。
已翻译
34
10
6
在过去的两周中,瑞波币的价格飙升,引发投资者的兴奋和狂热。我的一个朋友最近投资了500美元到瑞波币,并每天在WhatsApp上分享最新进展。每天,他都会发送瑞波币涨幅的截图,并庆祝它的涨势。虽然我为他的成功感到高兴,但我不禁为他——以及其他可能被卷入当前狂热浪潮中的人感到有些担忧...
已翻译
46
1
4
自上一篇文章比较阿斯麦控股公司(阿斯麦)和高通公司(QCOM)以来,读者和朋友们经常提出一个问题:
“如果我只有2000美元,并且必须选择其中一家公司投资,应该选择哪一家?”
这是一个迷人的困境。阿斯麦和高通都是半导体行业中备受推崇的巨头,各有各的优势。那么为什么不把2000美元分成两份...
“如果我只有2000美元,并且必须选择其中一家公司投资,应该选择哪一家?”
这是一个迷人的困境。阿斯麦和高通都是半导体行业中备受推崇的巨头,各有各的优势。那么为什么不把2000美元分成两份...
已翻译
35
6
4
Alex Wong Cian Yih 楼主 Deltaman099 : 我理解你的观点,我认为这是一个有趣的角度。但让我问你:如果你正在经营OpenAI,并且投入数十亿美元用于训练模型,利用大量计算资源和人类反馈,然后看到竞争对手使用你模型的输出来建立他们自己的产品,成本仅为你的成本的1/20——那你会有什么感受呢?你认为这种情况仍然会激励你投资于开创性创新吗?明知道你的努力会被他人轻易利用,你会怎么应对这种情况呢?如果角色对换,我真的很想知道你会如何处理这个情况。
Alex Wong Cian Yih 楼主 lousyimpressario : 我明白你的观点,但从公共知识中汲取灵感和直接利用竞争对手的专有输出以训练竞争模型之间存在根本区别。
OpenAI的API政策明确指出,其输出不能用作开发竞争人工智能模型的训练数据。这在他们的条款和条件(T&C)中清晰地列出,而DeepSeek显然忽视了这一规则。OpenAI的API生成的响应不仅仅是从互联网上抓取的原始数据——它们已经是经过充分处理、清洗和结构化的高质量输出,经过人类反馈和广泛的模型训练精心策划而成。
这意味着DeepSeek不必经历与OpenAI相同的严格而昂贵的数据处理步骤,如收集原始互联网数据、进行人工标注、进行人类反馈的强化学习(RLHF)和过滤低质量响应。相反,他们只是直接利用OpenAI的高质量API输出,然后将其反馈到自己的模型中,有效地绕过了人工智能训练中成本最高和劳动密集的部分。
这就是为什么在被问及其起源时,DeepSeek的模型被发现声称它是由OpenAI训练的——这清楚地表明它直接吸收了OpenAI的API响应,而没有进行有意义的转化。
是的,知识蒸馏和模型优化在行业中是很常见的,许多人工智能公司确实利用竞争洞察来改进他们的模型。然而,其他公司至少在使用数据之前会进行处理、优化和调整,确保他们的输出不是直接的复制。DeepSeek所做的就是将OpenAI处理过的知识原封不动地重新用于自身,而没有增加实际的价值或原创性。
这不仅仅是一个伦理问题——这是对OpenAI的T&C的直接违反,也是对他们专有研究的不公平利用。如果这种做法被规范化,将会削弱任何公司投资于真实人工智能创新的动力,因为任何竞争对手都可以简单地获取最终产品并免费重复使用。如果OpenAI和任何其他认真对待人工智能开发的公司,他们将几乎没有理由继续推进该领域,因为他们的输出可能会被竞争对手轻易重新利用。
所以,这不仅仅是关于‘灵感’或‘竞争’——这是一个未经授权利用另一家公司知识产权的明确案例,并且为未来的人工智能发展树立了一个危险的先例。
Alex Wong Cian Yih 楼主 lousyimpressario : 我明白你的意思,但我认为你的论点忽视了一些关键区别。创新确实是建立在先前知识的基础上,但从公共数据中获取信息与直接利用竞争对手的专有输出之间存在重大差异。
你的厨师类比不适用,因为OpenAI的API响应不仅仅是"要品尝的口味"—— 它们更像是花费数十亿美元才得以完善的秘密食谱。DeepSeek不仅仅是从OpenAI那里获得灵感;他们被指控直接在其专有输出上进行训练,而这明确违反了OpenAI的条款与条件。
您还假设这不会影响人工智能投资,但这是一种过分乐观的看法。如果主要人工智能开发者无法保护他们的研究成果,他们将没有太大动力继续突破界限。当竞争对手可以轻松提取最终结果并跳过最困难的步骤时,为什么要花费数十亿呢?
公平竞争应该是真正的创新,而不是绕过竞争对手最困难和昂贵的研发工作。这才是这里真正的问题。
Alex Wong Cian Yih 楼主 Deltaman099 : 我觉得有趣的是,当我们只是讨论一个行业板块的问题时,你立刻就默认"只要去法庭解决"。我不是OpenAI,也不是OpenAI的投资者——那么为什么法律行动会是我的关注点呢?我们在这里辩论的并不是关于提起诉讼的问题,而是关于伦理、公平竞争,以及对人工智能创新整体的影响。
法律行动并不是讨论伦理问题的唯一方式。即使在诉讼发生之前,不公平的做法也会影响人工智能行业和竞争环境。真正的问题并不是DeepSeek是否优化了他们的模型架构,而是他们在获取训练数据时是否遵循了OpenAI的服务条款。
如果一个模型的基础是建立在违反另一家公司政策的基础上,那么它的表现如何并不重要。创新应该是公平的,真正的突破应该来源于原创工作,而不是在未获得许可的情况下重新利用竞争对手的专有成果。
如果我们连这些问题都无法理性地讨论,那么根据你的逻辑,我们就不应该质疑任何行业中的潜在违规行为,除非提起了诉讼。这并不是伦理讨论的工作方式。
Alex Wong Cian Yih 楼主 Deltaman099 : 自从DeepSeek根据MIT许可证开源其模型,理论上,OpenAI可以运用知识蒸馏技术来改进自己的模型,并利用DeepSeek的输出。MIT许可证允许商业和无限制使用,这意味着OpenAI可以合法地从DeepSeek的模型中提取见解,以增强其中文能力。
鉴于DeepSeek在中文理解、语法和语义方面的先进性显著,利用其输出可以显著增强OpenAI在这一领域的模型。这是开源促进跨学习的实际例子——就像DeepSeek可能是建立在现有人工智能进展的基础上,现在OpenAI也有同样的机会回报。
由于DeepSeek的模型对所有人开放,它成为更广泛人工智能生态系统的一部分,使改进可以在多个方向上流动。这就是当模型被公开共享时技术进步的方式。