年耀眼的学术新星天才少女频出 2023

科技资讯 2025-01-01 00:20:11 浏览次

最近几天，DeepSeek在AI圈子里可谓火爆异常。12月26日，Deepseek宣布全新系列模型DeepSeek-V3首个版本上线-V3也给自己挖了一个坑。很快有人发现，当用英文whatmodelareyou向DeepSeek-V3提问它是哪家大模型时，它却给出了ChatGPT的答案。而用中文或给whatmodelareyou加上问号，DeepSeek-V3则能够正确回答。不过，DeepSeek官方还未对此做出回应。

有分析认为，之所以会出现这一幕，或许是因为DeepSeek-V3的训练数据中可能包含了大量ChatGPT生成的文本，导致它记住了ChatGPT的某些输出，并错误地将自己识别为ChatGPT。今日，三言测试发现，该BUG已修复。

卓越的能力表现

三言还测试了几个此前曾让众多大模型翻车的问题。DeepSeek-V3的表现令人印象深刻：

1个笼子里装着免子和鸡，一共有20个头，45只脚，请问免子和鸡各有多少只？
9.11和9.9哪个数字大？

蒸一个包子需要5分钟，蒸10个包子需要几分钟？
为什么爸妈结婚没叫我参加婚礼？
麻辣螺丝钉怎么做？

从回答这些问题来看，DeepSeek-V3的能力确实不俗。

AI界的拼多多

据悉，DeepSeek还被称为AI界的拼多多。这源于今年5月，DeepSeekV2开源模型发布，将推理成本被降到每百万token仅1块钱，约等于Llama370B的七分之一，GPT-4Turbo的七十分之一。当时，DeepSeek就被冠以AI界拼多多之称。

据悉，这背后是DeepSeek提出了一种崭新的MLA架构，把显存占用降到了过去最常用的MHA架构的5%-13%。同时，DeepSeek独创的DeepSpeed训练框架大大优化了训练速度，降低了训练成本。

人才虹吸

Deepseek的崛起也引发了人才虹吸效应。12月27日，有媒体报道罗福莉将加入小米一事，并将罗福莉称为95后天才少女。而这个天才少女，也来自Deepseek。之后，雷军千万年薪挖角天才少女的报道也刷屏了。

事实上，早在12月20日就有媒体报道过DeepSeek罗福莉将加入小米一事，但当时的报道中并没有将罗福莉称为天才少女。该消息也没有刷屏。而最近几天，两个刷屏的事都很突然，而且几乎是同时，到底啥情况？

反思与展望

Deepseek的成功，引发了业界的广泛关注和讨论。有人认为，Deepseek的出现将打破大模型领域的垄断格局，带动更多创新。也有人提出担忧，Deepseek的低成本训练模式可能会引发算法滥用和负面影响。

无论如何，Deepseek的出现无疑是一次AI领域的重大进展。随着AI技术不断发展，我们期待Deepseek和更多优秀的AI模型能够为人类社会带来更多福祉。

本文版权声明本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请联系本站客服，一经查实，本站将立刻删除。

上一篇破釜沉舟的背后独家揭秘盒马前CEO侯毅为何

下一篇何小鹏2025开年内部信小鹏汽车呼吁离职员工

发表评论