OpenAI最近推出了其最新的预览模型,名为OpenAI o1。这个新模型在复杂推理任务上展示了人工智能崭新的能力,它能像人类一样思考并解决问题。
根据测试,该模型在国际数学奥林匹克的资格考试中获得了83%的分数,而GPT-4只能解决13%的问题。而在编程比赛中,o1模型获得了89%的百分位成绩,而GPT-4只获得11%。
OpenAI表示,在下一个更新版本中,他们希望AI能够达到与博士生水平相当的物理、化学和生物学挑战性基准测试表现。相比于现有的大模型如GPT-4o等,o1能够解决更困难的推理问题,并改善此前模型中存在的机制缺陷。
比如,在解答编程问题时会更有条理,在动手写代码之前会先思考整个回答流程再开始输出代码。此外,o1也会花更多时间进行试错和答案修正来显著提高生成结果准确性和质量。
目前,OpenAI宣布自9月12日起,订阅了ChatGPT服务的用户将可以访问这两个新模型——o1-preview每周消息数量限制为30条,而o1-mini则为50条。
本文属于原创文章,如若转载,请注明来源:OpenAI o1预览模型发布:推理能力更强 可达理科博士生水准https://news.zol.com.cn/899/8993983.html