o3 mini

Gábor Bíró • 2025年2月9日

3 阅读时间

OpenAI 近期推出了 o3-mini 模型，这标志着在优化推理能力的人工智能系统发展道路上又向前迈进了一步。对于那些寻求基于 AI 的支持来解决技术或科学问题的人来说，这款新模型尤其有用。

来源: 作者原创

o3-mini 在多个方面与 OpenAI 之前的模型有所不同，尤其是在以下几个领域：

推理级别：o3-mini 提供三个不同的推理级别（低、中、高），允许用户根据给定任务的复杂性来调整模型的性能。这对于快速回答简单问题或详细分析复杂问题尤其有用。
更快的响应时间：o3-mini 拥有平均 7.7 秒的响应时间，与上一代模型相比有了显著提升。这对于执行时间敏感型任务的用户尤其有利。
成本效益（API 连接）：新模型的运营成本更低。输入 tokens 的价格为每百万 1.10 美元，而输出 tokens 的价格为每百万 4.40 美元。这使得该模型对于个人和企业用户都更经济实惠。
技术领域的准确性：o3-mini 在科学（例如，一般科学问题）、数学（例如，竞赛数学）和编程（例如，代码审查）任务方面表现出色。这使其成为学生、研究人员和开发人员的理想选择。
结构化输出支持：借助基于 JSON Schema 的输出，o3-mini 可以轻松集成到自动化系统或其他软件环境中。
STEM 优化：o3-mini 在科学（例如，GPQA）、数学（例如，AIME）和编程（例如，CodeForces）任务方面尤其强大。在中等推理级别，它可以在这些领域达到与 o1 相当的性能。
广泛的可用性：o3-mini 是首个向免费 ChatGPT 用户提供的推理模型。此外，它还为 Plus、Team 和 Pro 订阅者提供更高的消息限制（每天 150 条消息）。

用例

对于那些经常处理技术性或复杂问题的人来说，o3-mini 最为有益：

o3-mini 的主要优势在于其速度和成本效益。三个推理级别提供了灵活性，使模型能够轻松适应不同的需求。此外，更低的成本使 AI 更广泛地普及，即使对于那些以前负担不起更昂贵模型的人也是如此。

o3-mini 的发布是对 DeepSeek-R1 的及时回应，后者是另一款具有成本效益的 AI 模型，在行业中构成了重大竞争。借助这款模型，OpenAI 不仅有可能重新获得市场份额，还可能在小规模推理模型中树立新的标准。

OpenAI 为 o3-mini 引入了一项新的安全技术：审慎对齐方法。这使得模型能够在生成响应之前分析用户提示的安全方面，从而降低有害或不良输出的可能性。

OpenAI 的 o3-mini 代表了推理能力模型系列中的一项实用创新。虽然它没有带来根本性的改变，但它融入了多项增强功能，为日常用户提供了实实在在的好处。其速度、灵活性和成本效益使其成为那些希望更高效地解决技术或科学任务的人的宝贵工具。