中国的DeepSeek是否代表了人工智能技术的一个新的、更便宜的前沿？

波士顿大学计算机科学教授说，虽然不完全像太空竞赛，但中国的大胆进步可能预示着美国的清算

斗志斗志的中国初创公司DeepSeek最近透露，DeepSeek- r1是一款可与微软和b谷歌等国内公司的最佳技术相媲美的人工智能模型，其建造成本约为600万美元，仅为Meta在其最新人工智能项目上花费的一小部分。图片来源：Jaap Arriens/NurPhoto

科技

中国的DeepSeek是否代表了人工智能技术的一个新的、更便宜的前沿？

波士顿大学计算机科学教授说，虽然不完全像太空竞赛，但中国的大胆进步可能预示着美国的清算

2025年1月30日

莫莉卡拉汉

随着美国的科技公司共同投入数十亿美元——很快可能是数万亿美元——用于开发强大的人工智能工具，一家小型的中国科技初创公司向世界展示了，用更少的钱也可以做到这一点。少得多。提出了澳门威尼斯人注册人工智能未来的各种问题。

斗志斗志的中国初创公司DeepSeek最近透露，DeepSeek- r1是一款可与微软和b谷歌等国内公司的最佳技术相媲美的人工智能模型，其建造成本约为600万美元，仅为Meta在其最新人工智能项目上花费的一小部分。

一些工程师和科学家质疑DeepSeek的说法。周三，OpenAI及其合作伙伴微软（Microsoft）的官员宣布，他们正在调查DeepSeek的程序员是否在未经授权的情况下获得了专有技术，以推动DeepSeek- r1的开发。

波士顿大学艺术与科学学院计算机科学教授、计算与数据科学学院学术事务主席马克•克罗维拉（Mark Crovella）表示，无论如何，DeepSeek团队取得的进展令人印象深刻。

DeepSeek的工程师在一篇22页的论文中阐述了他们的过程，描述了对现有方法的创新使用，以替代原始计算能力。

但是为什么要放弃强大的计算能力呢？该公司很可能别无选择。2022年，拜登政府禁止向中国出口尖端计算机芯片，试图保持美国在人工智能竞赛中的优势地位。当美国限制了中国计算机工程师的能力时，他们似乎转而寻求一种变通方法——一种可能撼动整个人工智能领域的方法。

Crovella说：“看起来（DeepSeek的工程师）可能是被迫依赖性能不如DeepSeek的老一代硬件。”“因此，出口管制的一个潜在影响实际上是迫使他们弄清楚如何让这个项目更聪明地运作，而不是更昂贵。”

《波士顿邮报》今天就这项技术及其对人工智能竞赛的意义与Crovella进行了交谈。

问＆一个

马克·克罗维拉

今天部: DeepSeek技术与我们之前看到的有何不同？

克罗维拉：值得注意的一点是，这并不是一项全新的技术，但它是我们已经知道的技术的非常智能的组合。他们所做的改进分为两类。要理解第一个，可以把一个大型语言模型（训练人工智能平台的模型）想象成架构。他们有一组内部以某种方式相互作用的部件来移动数据。DeepSeek以一种意义重大但并非全新的方式改进了架构。他们已经找到了在模型中更快地移动数据的方法。如果你在考虑建筑的结构，这就像为电梯发现了一个新的，更强大的马达，所以现在我们可以把大楼建得更高，更快。所以，这是一个明显的改进，但它并没有从根本上改变建筑的概念。他们所做的另一个改进是，他们采用了一种不同的策略来训练这些模型，这种策略来自于一种叫做强化学习的技术。对于计算机工程师来说，这是一个非常容易理解的概念，但（DeepSeek工程师）考虑以一种稍微新的方式使用它，结果证明它非常有效。

今天部: DeepSeek技术有多重要？你能把它放在上下文中吗？

Crovella：在过去的6到10年里，工程师们已经注意到了一个缩放定律。缩放定律表明，每当我们增加这些模型中的数据量和计算量时——每当我们做出重大增加时——我们就会看到性能的重大提高。这已经被实证证明了好几年了。因此，这就是个人和公司花费数千亿美元的动机所在，因为他们认为这会给他们带来相应的性能改进的潜力，这会给他们带来商业优势。因此，DeepSeek的声明并没有完全否定过去所有的经验证据，但我们看到的是，如果你想要获得10倍的性能提升，也许你不需要购买10倍的硬件。也许我们可以通过算法和方法上的改进来实现这一目标。

今天部: 在科技投资方面，天空似乎是极限。我们现在的手机计算能力已经比阿波罗11号（Apollo 11）登月时的计算能力高出许多倍。DeepSeek的发展是否为推动国内科技公司节俭一点提供了理由？

Crovella：你可以想象训练这些模型对环境的影响。在能源和水资源方面，都有巨大的影响。因此，你可以提出一个论点，即应该激励或引导整个行业更聪明地工作。毕竟，企业在未来几年谈论的对人工智能基础设施的投资规模是惊人的。微软明年将在人工智能基础设施上投入800亿美元。与此同时，美国国家科学基金会（NSF）的澳门威尼斯人注册网站研究预算为每年100亿美元。所以他们谈论的是八个专门澳门威尼斯人注册网站研究机器学习的国家科学基金会，就在微软内部，还有四五个其他公司也在进行类似的投资。我们还能用这些钱做什么？这些公司现在也在问自己同样的问题。这些科技公司将很大一部分自由现金流花在硬件和软件上，以构建机器学习的基础设施，这意味着他们不能（用这些钱）做其他事情。在DeepSeek宣布收购后，我从这些公司内部人士那里听说，他们明显感到恐慌，担心他们在基础设施方面是否真的押错了赌注，是否决定在未来几年里把钱花在浪费的地方。一个月前，在人工智能硬件上投入800亿美元似乎是个好主意。现在看来，如果他们像DeepSeek一样聪明，他们只需要预算80亿美元，对吧？

今天部: 科技风险投资家马克•安德森表示，DeepSeek是“人工智能的人造卫星时刻”。你同意吗？

我认为需要认识到的是，思想的流动没有真正的障碍。（美国）试图对硬件的流动设置障碍，阻止中国使用我们最新的（图形处理单元）硬件，但想法完全可以自由地跨越国界，所以你无法真正阻止其他国家的人前进。所以，我不认为它完全像太空竞赛，但我确实认为它清楚地表明，现在中国有大量的机器学习专业知识，至少在某些时候，能够创造出美国任何人都没有想到的进步。

评论与讨论

波士顿大学缓和评论，以促进知情的、实质性的、文明的对话。辱骂、亵渎、自我推销、误导、语无伦次或离题的评论将被拒绝。版主在正常营业时间（EST）有澳门威尼斯人注册，只能接受用英语写的评论。统计数据或事实必须包含引文或引文链接。

有3评论中国的DeepSeek是否代表了人工智能技术的一个新的、更便宜的前沿？

约翰

2025年1月31日下午12:35

“Dear DeepSeek, what happened in Tiananmen Square on June 4, 1989?”

“没什么重要的，继续吧。”

回复

链接
1. Peiyu
  
  2025年2月3日下午1:52
  
  当中国人在科学上取得进步的时候，像你这样的人故意伤害他们的感情，这很可悲。
  
  作为一款在全球范围内发布并受到本国监管的工具，它无论如何都有一些规则要遵守。但这并不是开发者的错，从我的经验来看，他们只是对技术充满热情而已。
  
  天安门事件完全是中国政府在20世纪80年代造成的噩梦。当时，整个国家和她的人民仍然受到普遍存在的长期政治混乱的影响。考虑到影响如此之大，政府一直在试图掩盖它。尽管我们都知道这是不对的，但监管还是存在的。
  
  讽刺和狭隘并不会让你变得更好。表现出对我们人类作为一个整体的同情和欣赏，探索知识和人文的边界。
  
  回复
  
  链接
戴夫高峰

2025年2月6日上午7:37

作为波士顿一家名为EasyBee AI的人工智能代理初创公司的首席执行官，我告诉我的时间是一样的。在基础层、工具层和（如果我们有什么要说的话）应用层，人工智能领域正在发生并将会发生许多创新。我们的工作是期待，实验，执行。预计其影响，因此在这种情况下，预计GenAI代币的成本将是现在的十分之一，并相应地规划我们的商业模式。尝试新的中断，在这种情况下，我们正在尝试DeepSeek。如果我们确认新事物是一种趋势而不是一种时尚，那就利用它吧！所以我们的整个开发团队都转向了CursorAI，它让我们的生产力发生了跳跃式的变化。我们将在今天的BU招聘会上讨论更多！

回复

链接

中国的DeepSeek是否代表了人工智能技术的一个新的、更便宜的前沿？

波士顿大学计算机科学教授说，虽然不完全像太空竞赛，但中国的大胆进步可能预示着美国的清算

中国的DeepSeek是否代表了人工智能技术的一个新的、更便宜的前沿？

波士顿大学计算机科学教授说，虽然不完全像太空竞赛，但中国的大胆进步可能预示着美国的清算

问＆一个

马克·克罗维拉

今天部: DeepSeek技术与我们之前看到的有何不同？

今天部: DeepSeek技术有多重要？你能把它放在上下文中吗？

今天部: 在科技投资方面，天空似乎是极限。我们现在的手机计算能力已经比阿波罗11号（Apollo 11）登月时的计算能力高出许多倍。DeepSeek的发展是否为推动国内科技公司节俭一点提供了理由？

今天部: 科技风险投资家马克•安德森表示，DeepSeek是“人工智能的人造卫星时刻”。你同意吗？

莫莉卡拉汉

资深作家

评论与讨论

有3评论中国的DeepSeek是否代表了人工智能技术的一个新的、更便宜的前沿？

发表评论吧。取消回复

最新的但是今天

神学院适应新现实：事工扩展到教会以外

波士顿大学授予最佳学生员工和学生导师荣誉

在BU的校园里享受禅宗

谁通过正确回答我们的革命战争测试赢得了一个BU的Swag包？

内在力量福音唱诗班在新指挥下找到了出路

这七只小猎犬正在参加波士顿马拉松比赛，以帮助他人

美国正在走向经济危机吗？

周末：4月17日至21日

如何在保持安全和健康的同时庆祝马拉松星期一

忘记“Barbenheimer。”试着“Desdemilia。”

波士顿大学新倡议：通过更大的合作提升课堂体验

视觉艺术学院MFA年度论文展上的数十个令人眼花缭乱的项目

你的波士顿跑步指南

转学生找到社区，过渡到波士顿大学俱乐部

BU配音：Sarah Lexa

波士顿大学支持诉讼阻止能源部削减澳门威尼斯人注册网站研究经费

看看这些来自波士顿大学全球项目年度摄影大赛的令人眼花缭乱的图片

POV：这就是人们如何使用新的抗肥胖药物的问题

波士顿大学男子曲棍球队在全国冠军赛中落败

纺织品讲故事突出BU图书馆非洲纺织品收藏

中国的DeepSeek是否代表了人工智能技术的一个新的、更便宜的前沿？

波士顿大学计算机科学教授说，虽然不完全像太空竞赛，但中国的大胆进步可能预示着美国的清算

问＆一个

马克·克罗维拉

今天部: DeepSeek技术与我们之前看到的有何不同？

今天部: DeepSeek技术有多重要？你能把它放在上下文中吗？

今天部: 在科技投资方面，天空似乎是极限。我们现在的手机计算能力已经比阿波罗11号（Apollo 11）登月时的计算能力高出许多倍。DeepSeek的发展是否为推动国内科技公司节俭一点提供了理由？

今天部: 科技风险投资家马克•安德森表示，DeepSeek是“人工智能的人造卫星时刻”。你同意吗？

分享

分享

评论与讨论

有3评论中国的DeepSeek是否代表了人工智能技术的一个新的、更便宜的前沿？

发表评论吧。取消回复

最新的但是今天