开云全站·kaiyun体育(中国)官方网站 登录入口

新闻中心
你的位置:开云全站·kaiyun体育(中国)官方网站 登录入口 > 新闻中心 > 开云体育算力预估是 910C 的五倍-开云全站·kaiyun体育(中国)官方网站 登录入口

开云体育算力预估是 910C 的五倍-开云全站·kaiyun体育(中国)官方网站 登录入口

2025-03-08 09:38    点击次数:89

开云体育算力预估是 910C 的五倍-开云全站·kaiyun体育(中国)官方网站 登录入口

‍‍‍开云体育

DeepSeek 开源动作仍在合手续,激励了 AI 圈又一轮震憾。

2 月 21 日 12 点,DeepSeek 团队在 X 平台发布了一段英文施行。浅显讲授一下,其实说的等于:"从下周运行,我们将开源 5 个代码仓库,以完全透明的步地共享我们轻捷但诚挚的进展。"

紧接着在 2 月 24 日,DeepSeek 就开源了首个代码库 FlashMLA。

用我们得到 App AI 学习圈主持东谈主快刀青衣憨厚的话说,能作念出这样的行为,口舌常有气派的。他打了一个譬如:之前开源的是使命后果,就像一个憨厚傅,把他所有这个词的造就忘我传授给你。而面前,你不但能拿到憨厚傅的阴事,还能看到憨厚傅在历程中是怎样干活儿的。这对好多东谈主来说,会比末端更有价值。

固然,列国网友对 DeepSeek 这一动作齐不乏叹息之辞,反响十分热烈。

今天我们先不细究代码库 FlashMLA 的使命旨趣,而是想来聊一下,从 DeepSeek R1 发布以来许多东谈主在想考的一个问题:真确具有"开源精神"的DeepSeek 加上华为,能不可超越英伟达和 Open AI?

刚巧前不久,我们得到的万维钢憨厚,在他的专栏里花大篇幅回应了这个问题。本文选自《万维钢 · 精英日课 6》,文中万憨厚用更全面、更长期的视角,探讨了为什么 AI 需要越来越强的算力,以及中国为什么要打破芯陡然间落拓、坚合手永久参加通用东谈主工智能研发等问题。

底下,请万维钢憨厚为你共享:

作者:万维钢

泉源:《万维钢 · 精英日课6》

01

对算力的需求永无异常

DeepSeek 采选了一些精巧的优化程序,粗糙用比拟少的算力达成 o1 级别的功能,这相当了不得,这对中国——也对好意思国——的大模子研发者齐是天大的好音信。

但这毫不是说以后英伟达那种高档芯片就没用了,咱国产芯片就够用了。面前 AI 缩放定律远远莫得看到尽头,更高的智能条目更高的算力这个根蒂原则并莫得变。

要知谈就算莫得 DeepSeek,别家公司和科研团队,包括 OpenAI 我方,也在优化模子性能,再筹商到英伟达芯片升级,用山姆 · 奥特曼的话说等于"模子输出资本每年齐会裁汰十倍"(即降至正本的十分之一)。

假定 DeepSeek 打破之前那一刻,OpenAI 用 100 的算力得到 100 的智能,DeepSeek 打破了,人人用 10 的算力就能得到 100 的智能——但你的方针不是 100 的智能,而是一万、致使一百万的智能,是以你仍然需要比面前进步百倍千倍的算力。

是以对算力的需求面前来说照旧无异常的。

但英伟达并非安枕而卧,好意思国有好几家公司在作念我方的 AI 芯片,中国也有包括华为、寒武纪、百度、壁仞科技等等正在追逐。那么国产 AI 芯片的水平相关于英伟达来说到底如何呢?国产最强的是华为昇腾。

我让 ChatGPT Deep Research 调研而且制作了底下这张表格,把华为昇腾和英伟达近几年的主流 GPU 作念了个对比——

这个末端不错说是既不让东谈主悲不雅,又不让东谈主乐不雅。现时能用的最强国产 GPU 是 2022 年发布的华为昇腾 910B,它的性能在某种真谛上也曾稍稍杰出面前仍然被好多 AI 公司庸碌使用的、英伟达 2020 年发布的 A100。这很热切,这诠释就算好意思国对中国搞全面断供,中国也能陆续考试 AI。

但 910B 比英伟达面前确方丈芯片,2023 年发布的 H200 和 24 年发布的 B100,就差距比拟大了,算力大约独特于英伟达的二分之一到四分之一。华为 2025 年行将量产昇腾 910C,基础算力与 910B 差未几,推感性能传奇达到英伟达之前 H100 的 60%。但英伟达 2025 年会推出 GX200,算力预估是 910C 的五倍。

02

高档智能一定是通用智能

为什么英伟达在陆续突飞大进,而华为有点接近极限的真谛?

这里最热切的原因等于光刻制程。

英伟达 A100 和华为昇腾系列齐是 7 纳米制程,在这个表率上中芯外洋能作念。只是在 910C 这个级别条目 N+2 制程,中芯外洋的良率传奇很低,这意味着坐褥资本高。而英伟达 H 系列、B 系列、GX 系列区别是 5 纳米、4 纳米、3 纳米制程,中芯外洋作念不了。

因为中国大陆莫得极紫外光刻机。《精英日课》讲《芯片干戈》一书的时候说过,极紫外光刻机极其不可能靠一个国度完全自强门庭造出来,面前看至少明天十年之内可能性不大。

是以现时最可行的见识,照旧从英伟达买。

那你说面前 DeepSeek 也曾很好用,我们就在这个基础上提高性能行不行,何苦非得追求最高的性能呢?我以为那是万万不行的。

要知谈 DeepSeek 是个相对比拟小的模子,它是不错跟 o1 对标,但 o1 也不是超大模子。

就在 2025 年下半年,也许更早,OpenAI 会推出 GPT-5,那将是一个超大的模子。它会像面前 GPT-4o 一样领有端对端考试出来的多模态,它将不但能阅读图像,而且能阅读视频和音频,它将能处理海量的数据——是以它需要好多张 GPU。DeepSeek 不会烧毁这种模子。

再者,更热切的是,AGI、以及紧接着更热切的 ASI,等于需要超大的算力—— 因为高档智能一定是通用智能。

DeepSeek R1 的遵守高,有好多开创性的时代,然则我们也不可否定,其中有一定以捐躯宽度交流遵守的要素。

R1 和之前的 V3 齐是「搀和人人(mixed experts)」模式,是可能最早法国的 Mistral 模子先采选的,是把智能散播开成几许个人人模块,每次遭受新任务就只调用相关的模块,而无须「全脑」沿途想考,这就大大检朴了算力。

这个作念法独特于你问我数学题我就用数学模块,问我古诗词我就用古诗词模块。但我们想象,关于更复杂的问题,也许等于需要同期调用几个领域的常识和想维模式才能科罚。

独特是创造力老是来自不同想法的连气儿,那么这个模块分割法就会落拓发达。再者,DeepSeek 专注于数学、编程和讲话处理这几个领域,亦然为了检朴算力不得不为之。

就在最近,斯坦福大学李飞飞的团队发明了一个更激进的作念法,堪称只用不到 50 好意思元(有个说法是 6 好意思元)的考试用度就弄出一个数学解题水平跟 R1、o1 差未几的推理模子,叫 S1。他们是怎样作念的呢?

第一,从开源的通义千问(qwen)的一个小版块讲话模子运行,省去前期大界限的考试;

第二,用一千谈精选数学题特地考试数学解题才智,且只考试数学才智;

第三,用 Google Gemini 的一个推理版块的推理历程的蒸馏数据来考试我方的推理才智。

这个作念法,就如同找个脑子快的孩子,给他一套精选习题集,让他背诵别东谈主的解题套路。这样考试作念题家固然快,然则这除了快莫得别的孝顺。这个作念法不会像 R1 那样涌现出任何新才智,不会给你任何惊喜。

这不是通往 AGI 之路。

03

更多的参数 + 更长的想考期间 = 更好的谜底

梁文锋襟怀大志,齐备不单是想提供一个低廉的作念题家,而是想作念 AGI。接下来的情形,我估量,差未几是底下这样的——

关于一般的日常任务,比如一般编程、搞个会议纪要、写个请问使命的发言稿、弄个报表之类,唯有用平素模子就不错,中国不但没问题而且可能有价钱和服务上的上风,也许中国的模子是最佳的。

但关于科研任务,独特是探索最前沿打破,你需要能想得很广而且很深,你需要尽可能地堆积算力。我有个说法是如若一个科研团队称心花 5000 好意思元问 ChatGPT 一个问题,而另一个通常水平的科研团队称心花一万好意思元,那么后者将得到更好的谜底——只是是因为模子称心为他们想考更永久间。

唯有缩放定律仍然灵验,那么,更多的参数 + 更长的想考期间 = 更好的谜底

亦然更值钱的谜底。接下来 AI 在科研领域会大显本事,科研发现的速率会加速,是以争夺会相当强烈。一种新药只可被发现一次,谁先作念出来等于谁的。

还有一个在我看来最热切的筹商,是谁先达到 ASI。

我们这里不妨界说ASI 是「我方不错考试我方」的超等东谈主工智能。那么谁先达到 ASI,谁就等于是取得了一个齐备的最初上风。这就独特于计策游戏里谁先造出「奇不雅」来,能大大加强我方的计策上风。

试想如若好意思国率先达到 ASI,那就意味着以后的路全买通了,剩下的事只是给 AI 喂芯片喂电力良友,不需要东谈主类科学家再有奇想妙想,可谓是安枕而卧——那到时候中国怎样办呢?还靠一帮东谈主费力追逐吗?

运气的是中国有个 DeepSeek。就在 DeepSeek 的论文中,也曾袒表露少量迹象,模子我方给我方提倡了一个算力优化策略。你不错说梁文锋也曾看到了 ASI 的光辉。我们想象 OpenAI 细则也有访佛的东西,但他们从未公开过。

DeepSeek 震撼好意思国这段期间,Anthropic CEO 达里奥 · 阿莫迪(Dario Amodei)有一些公开言论,很耐东谈主寻味。他说如若不落拓中国发展 AI,那会对全东谈主类齐有刚正,我们会迎来突飞大进的十年——然则中国会把 AI 用于军事,而这对好意思国很不利,是以他号召好意思国政府加强对中国 AI 的落拓。他还说,真但愿 DeepSeek 团队到好意思国来为他们公司使命。

这些言论在 X 上遭到了好意思国网友的围攻。起先你动作一个科技公司 CEO 去强调地缘政事,这自己等于错的:科技应该为全东谈主类服务。再者你咋这样会想呢?东谈主家 DeepSeek 凭啥到好意思国来帮你干?

这些言论进一步诠释了 DeepSeek 的计策真谛。接下来好意思国政府有可能加强对中国 AI 的落拓,致使完全脱钩,但也有可能松动英伟达的出口料理,毕竟跟特朗普什么齐不错谈。不论如何,我们必须认准 ASI 这个大标的,而齐备不可骄横于解解数学题、日常编程那些任务。

总想四两拨千斤、少费钱多管事儿、以 20% 的参加科罚 80% 的问题,那是走不远的。

中国必须有东谈主宁可采选勤奋又费钱的路。

万憨厚是前物理学家,现科学作者,得到 App《万维钢 · 精英日课》主持东谈主。万憨厚从 2016 年起,在得到 App 开设《精英日课》年度专栏,于今已更新到第 6 季,累计杰出 70 万东谈主次订阅奴才。宽容你加入正在更新的《万维钢 · 精英日课 6》。