中国公司在硅谷掀起风波 显卡地位堪忧

科技资讯 2025-01-03 13:00:22 浏览
显卡地位堪忧

在西方还在沉浸在圣诞假期,疯狂过年的时候,我们的中国企业给了他们一个新年二踢脚,给他们脑瓜子崩得嗡嗡得响。

前有宇树科技的机器狗视频让大家惊呼,还要啥波士顿动力。紧随其后又来了一个国产大模型DeepSeek,甚至有股做空英伟达的味道。

DeepSeek-V3:性能国际一流,技术力牛逼,价格击穿地心

训练

DeepSeek刚刚公布最新版本V3,这个V3与大洋彼岸那个自称Open,却越来越Close的公司产品不同,DeepSeek-V3是开源的。

而DeepSeek-V3不只是开源,它还兼具了性能国际一流,技术力牛逼,价格击穿地心三个特点。这一套不解释连招打得业内大模型厂商们都有点晕头转向了。

V3一发布,OpenAI创始成员Karpathy直接看嗨了,甚至发出了灵魂提问,难道说大模型们压根不需要大规模显卡集群?我估计老黄看到这头皮都得发麻了吧。

同时,Meta的AI技术官也是直呼DeepSeek的成果伟大。知名AI评测博主TimDettmers,直接吹起来了,表示DeepSeek的处理优雅elegant。

而在这些技术出身的人,看着V3的成绩送去赞扬的时候,也有些人急了。比如奥特曼就搁那说,复制比较简单啦,很难不让人觉得他在内涵DeepSeek。

更有意思的是,做到这些的公司既不是什么大厂,也不是纯血AI厂商。DeepSeek公司中文名叫深度求索,他们本来和AI没任何关系。就在大模型爆火之前,他们其实是私募机构幻方量化的一个团队。

深度求索:从量化投资到AI大模型的弯道超车

中国公司

深度求索能够实现弯道超车,既有点必然,也好像有点运气的意思。

早在2019年,幻方就投资2亿元搭建了自研深度学习训练平台萤火虫一号,到了2021年已经买了足足1万丈英伟达A100显卡的算力储备了。要知道,这个时候大模型没火,万卡集群的概念更是还没出现。

而正是凭借这部分硬件储备,幻方才拿到了AI大模型的入场券,最终卷出了现在的V3。

你说好好的一个量化投资领域的大厂,干嘛要跑来搞AI呢?深度求索的CEO梁文锋在接受采访的时候给大家聊过,并不是什么看中AI前景。而是在他们看来,通用人工智能可能是下一个最难的事之一,对他们来说,这是一个怎么做的问题,而不是为什么做的问题。

就是抱着这么股莽劲,深度求索才搞出了这次的大新闻,下面给大家具体讲讲V3有啥特别的地方。

性能强悍:开源模型几乎没一个能打的

目前来看,在V3面前,开源模型几乎没一个能打的。

还记得去年年中,小扎的Meta推出模型Llama3.1,当时就因为性能优秀而且开源,一时间被捧上神坛,结果在V3手里,基本是全面落败。

而在各种大厂手里的闭源模型,那些大家耳熟能详的什么GPT-4o、Claude3.5Sonnet啥的,V3也能打得有来有回。

你看到这,可能觉得不过如此,也就是追上了国际领先水平嘛,值得这么吹吗?残暴的还在后面。

GPU时超低:只有Llama3.1405B的1/10

大家大概都知道了,现在的大模型就是一个通过大量算力,让模型吃各种数据的炼丹过程。在这个炼丹期,需要的是大量算力和时间往里砸。

所以在圈子里有了一个新的计量单位GPU时,也就是用了多少块GPU花了多少个小时的训练时间。GPU时越高,意味着花费的时间、金钱成本就越高,反之就物美价廉了。

前面说的此前开源模型王者,Llama3.1405B,训练周期花费了3080万GPU时。可性能更强的V3,只花了不到280万GPU时。以钱来换算,DeepSeek搞出V3版本,大概只花了4000多万人民币。

而Llama3.1405B的训练期间,Meta光是在老黄那买了16000多个GPU,保守估计至少都花了十几亿人民币。至于另外的那几家闭源模型,动辄都是几十亿上百亿大撒币的。

你别以为DeepSeek靠的是什么歪门邪道,人家是正儿八经的有技术傍身的。为了搞清楚DeepSeek的技术咋样,咱们特地联系了语核科技创始人兼CTO池光耀,他们主力发展企业向的agent数字人,早就是DeepSeek的铁粉了。

技术创新:让大模型更优雅

池光耀给我们讲了一个很有意思的例子,他说之前用GPT-3和V3给一个电影写两篇影评,结果GPT-3写得像是记者写得报道,而V3写得就像一个资深影评人写得。

也就是说,V3在语言生成方面,更加优雅、流畅,有逻辑性,更贴近人类的表达习惯。这是因为DeepSeek在V3中,引入了新的技术,叫作“动态局部注意力机制”,这个机制可以有效地捕捉文本中的局部语义,从而让模型的输出更加准确、流畅。

这就是DeepSeek-V3的特别之处,它不仅性能强悍,GPU时超低,而且在技术创新上也走在前列。它让我们看到了中国AI企业在国际舞台上的崛起,也让我们对人工智能的未来充满了期待。

本文版权声明本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请联系本站客服,一经查实,本站将立刻删除。

发表评论

热门推荐