12月6日凌晨,OpenAI为期12天的活动开幕。在首日直播上,OpenAI创始人&CEO山姆·奥特曼带着三名研究员露面,宣布正式推出满血版推理模型o1和ChatGPT Pro。
奥特曼开场表示,“我们听取了很多反馈,希望它更智能、更快,能够多模态,并且更擅长遵循指令等。我们在这方面投入了很多工作,对科学家、工程师、程序员来说,我们认为他们会非常喜欢o1。”
o1:目前世界上最智能的模型
奥特曼介绍,o1是目前世界上最智能的模型,相比预览版o1-preview是一个更智能、更快速的推理模型,其思维更简洁,响应时间比o1-preview更快。
OpenAI研究员Max Schwarzer表示,“o1现在会思考得更智能。如果问它一个简单的问题,它会非常快速地回应;如果问它一个非常困难的问题,它会思考较长时间。我们发现它犯错的次数比之前的模型少了大约三分之一,同时思考速度提高约50%。”
同时,它在编码、数学和科学写作等方面表现更好。评测显示,o1在数学、编程上的性能显著优于o1-preview和GPT-4o,在博士级别的科学问题上远超GPT-4o,和o1-preview不相上下,但同样超越了人类专家。
同时,o1具备更多功能,可支持图像输入等多模态功能,从而对视觉和文本内容进行联合推理。OpenAI还表示,还在努力将网页浏览和文件上传给出正确答案(4/4可靠性)时,才认为解决了一个问题,o1 Pro则在前述三个领域中具有更加突出的可靠性优势。
思维链(CoT)提出者、OpenAI研究员Jason Wei演示了基于o1 Pro的ChatGPT Pro的能力,向其提出了一个非常具有挑战性的化学问题(找出符合六个标准的蛋白质),o1-preview难以回答正确,而o1 Pro则借助CoT小部件,显示进度条,最终用时53秒给出正确答案(Retinoschisin)。
当然,更强功能也需要花更多的钱,ChatGPT Pro每月订阅费200美元,是此前订阅费用(每月20美元)的10倍。
发表评论