中国的DeepSeek是否代表了人工智能技术的一个新的、更便宜的前沿?
波士顿大学计算机科学教授说,虽然不完全像太空竞赛,但中国的大胆进步可能预示着美国的清算

斗志斗志的中国初创公司DeepSeek最近透露,DeepSeek- r1是一款可与微软和b谷歌等国内公司的最佳技术相媲美的人工智能模型,其建造成本约为600万美元,仅为Meta在其最新人工智能项目上花费的一小部分。图片来源:Jaap Arriens/NurPhoto
中国的DeepSeek是否代表了人工智能技术的一个新的、更便宜的前沿?
波士顿大学计算机科学教授说,虽然不完全像太空竞赛,但中国的大胆进步可能预示着美国的清算
随着美国的科技公司共同投入数十亿美元——很快可能是数万亿美元——用于开发强大的人工智能工具,一家小型的中国科技初创公司向世界展示了,用更少的钱也可以做到这一点。少得多。提出了澳门威尼斯人注册人工智能未来的各种问题。
斗志斗志的中国初创公司DeepSeek最近透露,DeepSeek- r1是一款可与微软和b谷歌等国内公司的最佳技术相媲美的人工智能模型,其建造成本约为600万美元,仅为Meta在其最新人工智能项目上花费的一小部分。
一些工程师和科学家质疑DeepSeek的说法。周三,OpenAI及其合作伙伴微软(Microsoft)的官员宣布,他们正在调查DeepSeek的程序员是否在未经授权的情况下获得了专有技术,以推动DeepSeek- r1的开发。
波士顿大学艺术与科学学院计算机科学教授、计算与数据科学学院学术事务主席马克•克罗维拉(Mark Crovella)表示,无论如何,DeepSeek团队取得的进展令人印象深刻。
DeepSeek的工程师在一篇22页的论文中阐述了他们的过程,描述了对现有方法的创新使用,以替代原始计算能力。
但是为什么要放弃强大的计算能力呢?该公司很可能别无选择。2022年,拜登政府禁止向中国出口尖端计算机芯片,试图保持美国在人工智能竞赛中的优势地位。当美国限制了中国计算机工程师的能力时,他们似乎转而寻求一种变通方法——一种可能撼动整个人工智能领域的方法。
Crovella说:“看起来(DeepSeek的工程师)可能是被迫依赖性能不如DeepSeek的老一代硬件。”“因此,出口管制的一个潜在影响实际上是迫使他们弄清楚如何让这个项目更聪明地运作,而不是更昂贵。”
《波士顿邮报》今天就这项技术及其对人工智能竞赛的意义与Crovella进行了交谈。
问&一个
马克·克罗维拉
今天部: DeepSeek技术与我们之前看到的有何不同?
克罗维拉:值得注意的一点是,这并不是一项全新的技术,但它是我们已经知道的技术的非常智能的组合。他们所做的改进分为两类。要理解第一个,可以把一个大型语言模型(训练人工智能平台的模型)想象成架构。他们有一组内部以某种方式相互作用的部件来移动数据。DeepSeek以一种意义重大但并非全新的方式改进了架构。他们已经找到了在模型中更快地移动数据的方法。如果你在考虑建筑的结构,这就像为电梯发现了一个新的,更强大的马达,所以现在我们可以把大楼建得更高,更快。所以,这是一个明显的改进,但它并没有从根本上改变建筑的概念。他们所做的另一个改进是,他们采用了一种不同的策略来训练这些模型,这种策略来自于一种叫做强化学习的技术。对于计算机工程师来说,这是一个非常容易理解的概念,但(DeepSeek工程师)考虑以一种稍微新的方式使用它,结果证明它非常有效。
今天部: DeepSeek技术有多重要?你能把它放在上下文中吗?
Crovella:在过去的6到10年里,工程师们已经注意到了一个缩放定律。缩放定律表明,每当我们增加这些模型中的数据量和计算量时——每当我们做出重大增加时——我们就会看到性能的重大提高。这已经被实证证明了好几年了。因此,这就是个人和公司花费数千亿美元的动机所在,因为他们认为这会给他们带来相应的性能改进的潜力,这会给他们带来商业优势。因此,DeepSeek的声明并没有完全否定过去所有的经验证据,但我们看到的是,如果你想要获得10倍的性能提升,也许你不需要购买10倍的硬件。也许我们可以通过算法和方法上的改进来实现这一目标。
今天部: 在科技投资方面,天空似乎是极限。我们现在的手机计算能力已经比阿波罗11号(Apollo 11)登月时的计算能力高出许多倍。DeepSeek的发展是否为推动国内科技公司节俭一点提供了理由?
Crovella:你可以想象训练这些模型对环境的影响。在能源和水资源方面,都有巨大的影响。因此,你可以提出一个论点,即应该激励或引导整个行业更聪明地工作。毕竟,企业在未来几年谈论的对人工智能基础设施的投资规模是惊人的。微软明年将在人工智能基础设施上投入800亿美元。与此同时,美国国家科学基金会(NSF)的澳门威尼斯人注册网站研究预算为每年100亿美元。所以他们谈论的是八个专门澳门威尼斯人注册网站研究机器学习的国家科学基金会,就在微软内部,还有四五个其他公司也在进行类似的投资。我们还能用这些钱做什么?这些公司现在也在问自己同样的问题。这些科技公司将很大一部分自由现金流花在硬件和软件上,以构建机器学习的基础设施,这意味着他们不能(用这些钱)做其他事情。在DeepSeek宣布收购后,我从这些公司内部人士那里听说,他们明显感到恐慌,担心他们在基础设施方面是否真的押错了赌注,是否决定在未来几年里把钱花在浪费的地方。一个月前,在人工智能硬件上投入800亿美元似乎是个好主意。现在看来,如果他们像DeepSeek一样聪明,他们只需要预算80亿美元,对吧?
今天部: 科技风险投资家马克•安德森表示,DeepSeek是“人工智能的人造卫星时刻”。你同意吗?
我认为需要认识到的是,思想的流动没有真正的障碍。(美国)试图对硬件的流动设置障碍,阻止中国使用我们最新的(图形处理单元)硬件,但想法完全可以自由地跨越国界,所以你无法真正阻止其他国家的人前进。所以,我不认为它完全像太空竞赛,但我确实认为它清楚地表明,现在中国有大量的机器学习专业知识,至少在某些时候,能够创造出美国任何人都没有想到的进步。
评论与讨论
波士顿大学缓和评论,以促进知情的、实质性的、文明的对话。辱骂、亵渎、自我推销、误导、语无伦次或离题的评论将被拒绝。版主在正常营业时间(EST)有澳门威尼斯人注册,只能接受用英语写的评论。统计数据或事实必须包含引文或引文链接。