就在西方还沉浸在圣诞假期,疯狂过年的时候,咱们中国企业给人家放了个新年二踢脚,给人家脑瓜子崩得嗡嗡得。前有宇树
同时,Meta的AI技术官也是直呼DeepSeek的成果伟大。知名AI评测博主TimDettmers,直接吹起来了,表示DeepSeek的处理优雅elegant。
在这些技术出身的人们送去赞扬的同时,也有些人急了。比如奥特曼就搁那说,复制比较简单啦,很难不让人觉得他在内涵DeepSeek。
DeepSeek的逆袭之路
更有意思的是,做到这些的公司既不是什么大厂,也不是纯血AI厂商。DeepSeek公司中文名叫深度求索,他们本来和AI没任何关系。就在大模型爆火之前,他们其实是私募机构幻方量化的一个团队。
深度求索能够实现弯道超车,既有点必然,也好像有点运气的意思。早在2019年,幻方就投资2亿元搭建了自研深度学习训练平台萤火虫一号,到了2021年已经买了足足1万丈英伟达A100显卡的算力储备了。要知道,这个时候大模型没火,万卡集群的概念更是还没出现。
而正是凭借这部分硬件储备,幻方才拿到了AI大模型的入场券,最终卷出了现在的V3。你说好好的一个量化投资领域的大厂,干嘛要跑来搞AI呢?深度求索的CEO梁文锋在接受采访的时候给大家聊过,并不是什么看中AI前景。而是在他们看来,通用人工智能可能是下一个最难的事之一,对他们来说,这是一个怎么做的问题,而不是为什么做的问题。
就是抱着这么股莽劲,深度求索才搞出了这次的大新闻,下面给大家具体讲讲V3有啥特别的地方。
性能强悍,吊打开源模型
目前来看,在V3面前,开源模型几乎没一个能打的。还记得去年年中,小扎的Meta推出模型Llama3.1,当时就因为性能优秀而且开源,一时间被捧上神坛,结果在V3手里,基本是全面落败。
技术优势,吊打闭源豪强
而在各种大厂手里的闭源模型,那些大家耳熟、计算机视觉和机器人控制。相信随着DeepSeek技术和应用的不断成熟,它将在未来人工智能领域发挥越来越重要的作用。
结语
DeepSeek的横空出世,再次证明了中国AI企业的实力。在国际AI巨头林立的背景下,DeepSeek能够脱颖而出,靠的不仅仅是技术优势,还有敢打敢拼的勇气和锲而不舍的创新精神。相信在未来,DeepSeek将继续引领中国AI产业的发展,为世界人工智能事业做出更大的贡献。
发表评论