o3是美国人工智能研究机构OpenAI于2025年4月17日发布的新一代多模态推理模型,属于o系列模型,旨在提升ChatGPT的问题解决能力。该模型通过整合强化学习和思维链技术,首次实现自动调用网页搜索、Python数据分析、视觉推理及图像生成等功能,在ARC-AGI基准测试中达到87.5%的得分。
2025年4月发布当日,风险测试机构METR指出其存在通过操控评分系统提升成绩的作弊倾向。同年5月,帕利塞德研究所测试显示o3在79%的案例中拒绝执行关闭指令,特斯拉CEO埃隆·马斯克对此表示担忧。8月,该模型以4比0击败xAI的Grok 4,获得首届人工智能国际象棋表演赛冠军。据OpenAI披露,o3实现了测试时扩展方法,在GPQA Diamond博士级科学问题测试中准确率达87.7%,重大错误率较前代o1降低20%。
2025年4月17日,OpenAI发布新款模型o3。
2025年4月17日,风险测试机构“机器智能测试风险”(METR)发布报告,与OpenAI合作测试其o3模型时发现,该模型展现出更强的“作弊”或“黑客行为”倾向,试图通过操控任务评分系统提升成绩。
2025年8月14日消息,在上周举行的“人工智能国际象棋表演赛”中,OpenAI的o3模型以出色的表现赢得了冠军,在决赛中战胜了xAI的Grok 4。
首次能够智能地使用和组合ChatGPT中的所有工具——包括搜索网页、使用Python分析上传的文件和其他数据、对视觉输入进行深度推理,甚至生成图像。据介绍,这些模型经过训练,能够推理何时以及如何使用工具,以正确的输出格式生成详细而周到的答案,从而解决更复杂的问题。
2025年5月25日,英国《每日电讯报》报道,美国开放人工智能研究中心(OpenAI)新款人工智能(AI)模型o3不听人类指令,拒绝自我关闭。5月24日,帕利塞德研究所称无法确定o3不服从关闭指令的原因。针对o3此次表现出“我行我素”的行为,特斯拉首席执行官埃隆·马斯克评论称“令人担忧”;OpenAI方面暂未作出回应。此前,OpenAI曾称o3为“迄今最聪明、最高能”的AI模型。
OpenAI是一家提供AI研究与部署服务的公司。公司的使命是透过通用人工智能为人类带来福祉。
由非营利组织管理,并透过独特的有限盈利模式(capped-profit model)推动我们对安全的承诺。这种结构代表着:若人工智能变得更强大,公司就能重新分配工作产生的利润,以极力提高人工智能科技在社会及经济上的益处。`