16 април 2025 г.

Introducing OpenAI o3 and o4-mini

Се вчитува...

Ажурирање на 10 јуни 2025 година: OpenAI o3‑pro сега е достапен за Pro корисници во ChatGPT, како и во нашето API. Како OpenAI o1‑pro, o3‑pro е верзија на нашиот најинтелигентен модел, OpenAI o3, дизајниран да размислува подолго и да обезбедува најсигурни одговори. Целосните детали може да ги најдеш во нашите белешки за објавување⁠(се отвора во нов прозорец).

Денес ги објавуваме OpenAI o3 и o4-mini, најновите во нашата o-серија модели обучени да размислуваат подолго пред да одговорат. Ова се најпаметните модели што ги објавивме досега, претставувајќи значителен напредок во можностите на ChatGPT за сите, од љубопитни корисници до напредни истражувачи. За првпат, нашите модели на расудување може агентски да ги користат и комбинираат сите алатки во ChatGPT — тоа вклучува пребарување на веб, анализа на поставени датотеки и други податоци со Python, длабоко размислување за визуелни внесувања, па дури и генерирање слики. Критички, овие модели се обучени да расудуваат кога и како да користат алатки за да произведат детални и внимателни одговори во соодветни резултати формати, обично за помалку од една минута, за решавање на посложени проблеми. Ова им овозможува поефикасно да се справуваат со повеќеслојни прашања, чекор кон поагентен ChatGPT кој може самостојно да извршува задачи во твое име. Комбинираната моќ на најсовременото расудување со целосен пристап до алатки се претвора во значително посилни перформанси низ академските референтни тестови и реалните задачи, поставувајќи нов стандард и во интелигенција и во корисност.

Што се променило

OpenAI o3 е нашиот најмоќен модел на расудување кој ги поместува границите во кодирање, математика, наука, визуелна перцепција и друго. Поставува ново SOTA на бенчмаркови, вклучувајќи ги Codeforces, SWE-bench (без да се изгради приспособена специфична скела за моделот) и MMMU. Идеално е за сложени прашања што бараат повеќестрана анализа и чии одговори можеби не се веднаш очигледни. Особено добро се истакнува во визуелни задачи како што се анализирање на слики, графикони и графики. Во евалуации од надворешни експерти, o3 прави 20 проценти помали грешки од OpenAI o1 на тешки, реални задачи — особено се истакнува во области како програмирање, Business/консалтинг и креативна идеација. Раните тестери ја истакнаа неговата аналитичка ригорозност како партнер за размислување и ја нагласија способноста да генерира и критички оценува нови хипотези — особено во контекстите на биологијата, математиката и инженерството.

OpenAI o4-mini е помал модел оптимизиран за брзо и економично расудување - постигнува извонредни перформанси за својата големина и цена, особено во математика, кодирање и визуелни задачи. Тоа е најдобриот модел со најдобри перформанси на AIME 2024 и 2025. Иако пристапот до компјутер значително ја намалува тежината на AIME испитот, исто така забележавме дека o4-mini постигнува 99,5% pass@1 (100% consensus@8) на AIME 2025 кога има пристап до Python интерпретатор. Иако овие резултати не треба да се споредуваат со перформансите на модели без пристап до алатки, тие се пример за тоа колку ефективно o4-mini ги користи достапните алатки; o3 покажува слични подобрувања на AIME 2025 од користење на алатки (98,4% pass@1, 100% consensus@8).

Во експертските евалуации, o4-mini исто така го надминува својот претходник, o3‑mini, во задачи кои не се поврзани со STEM, како и во домени како науката за податоци. Благодарение на својата ефикасност, o4-mini поддржува значително повисоки ограничувања на употреба од o3, што го прави силна опција за голем обем и висок капацитет за прашања што имаат корист од расудување. Надворешни експерти ги оценија двата модела како демонстрираат подобрено следење на инструкциите и покорисни, проверливи одговори од нивните претходници, благодарение на подобрената интелигенција и вклучувањето на веб-извори. Во споредба со претходните итерации на нашите модели на размислување, овие два модели исто така треба да се чувствуваат пориродно и поразговорно, особено бидејќи се повикуваат на меморија и минати разговори за да ги направат одговорите поперсонализирани и релевантни.

Мултимодален

Coding

Сите евалуации на SWE-bench користат фиксно подмножество од n=477 потврдени задачи кои се валидирани на нашата внатрешна инфраструктура.

Следење на упатства и користење на агентска алатка

Сите модели се оценуваат на високи поставки за „напор за расудување“ — слично на варијанти како „o4-mini-high“ во ChatGPT.

Continuing to scale reinforcement learning

Throughout the development of OpenAI o3, we’ve observed that large-scale reinforcement learning exhibits the same “more compute = better performance” trend observed in GPT‑series pretraining. By retracing the scaling path—this time in RL—we’ve pushed an additional order of magnitude in both training compute and inference-time reasoning, yet still see clear performance gains, validating that the models’ performance continues to improve the more they’re allowed to think. At equal latency and cost with OpenAI o1, o3 delivers higher performance in ChatGPT—and we’ve validated that if we let it think longer, its performance keeps climbing.

We also trained both models to use tools through reinforcement learning—teaching them not just how to use tools, but to reason about when to use them. Their ability to deploy tools based on desired outcomes makes them more capable in open-ended situations—particularly those involving visual reasoning and multi-step workflows. This improvement is reflected both in academic benchmarks and real-world tasks, as reported by early testers.

Размислување со слики

За прв пат, овие модели може директно да интегрираат слики во нивниот синџир на размислување. Тие не гледаат само слика—размислуваат со неа. Ова отклучува нова класа на решавање проблеми што ги спојува визуелното и текстуалното расудување, што се рефлектира во нивните најсовремени перформанси низ мултимодални репери.

Луѓето може да постават фотографија од бела табла, дијаграм од учебник или рачно нацртана скица, а моделот може да ја интерпретира — дури и ако сликата е заматена, превртена или со низок квалитет. Со користење на алатки, моделите можае да манипулираат со слики во реално време - ротирајќи, зумирајќи или трансформирајќи ги како дел од нивниот процес на расудување.

Овие модели испорачуваат најдобра точност во својата класа за задачи за визуелна перцепција, овозможувајќи им да решаваат прашања кои претходно беа недостапни. Погледни го блогот за истражување на визуелното расудување⁠ за да дознаеш повеќе.

Кон употреба на агентски алатки

OpenAI o3 и o4-mini имаат целосен пристап до алатки во ChatGPT, како и до вашите сопствени алатки преку повикување функции во API. Овие модели се обучени да расудуваат за тоа како да решаваат проблеми, избирајќи кога и како да користат алатки за да создадат детални и внимателни одговори во вистинските формати на резултат брзо — обично за помалку од една минута.

На пример, корисник може да праша: „Како летната потрошувачка на енергија во Калифорнија ќе се спореди со минатата година?“ Моделот може да пребарува на интернет за податоци за јавни комунални услуги, да напише Python код за да изработи прогноза, да генерира графикон или слика и да ги објасни клучните фактори зад предвидувањето, поврзувајќи повеќе повици на алатки. Расудувањето им овозможува на моделите да реагираат и да се приспособуваат според потребата на информациите што ги среќаваат. На пример, може да пребаруваат на интернет повеќе пати со помош на пребарувачи, да ги прегледуваат резултатите и да пробаат нови пребарувања ако им треба повеќе информации.

Овој флексибилен, стратешки пристап им овозможува на моделите да се справат со задачи кои бараат пристап до најнови информации надвор од вграденото знаење на моделот, проширено размислување, синтеза и генерирање на резултат низ различни модалитети.

Сите примери беа завршени со OpenAI o3.

OpenAI o3

Solve the following very hard math problem using your in-built knowledge of the literature:

Construct a degree 19 polynomial \ (p(x)) \ in \ mathbb{C}[x] such that \ (X := \ {\, p(x) = p(y) \, \} \ subset \ mathbb{P}^{1} \ times \ mathbb{P}^{1}\ ) has at least 3 (but not all linear) irreducible components over \ mathbb{C}. Choose \ (p(x)\ ) to be odd, monic, have real coefficients and linear coefficient \ (-19\ ) and calculate \ (p(19)\ ).

Расудено за конструкција на полином за 55 секунди

The curve defined by p(x) = p(y) factors if p(x) is decomposable or has repeated factors. Actually, p(x)-p(y) always factors, and it’s divisible by (x-y). This gives one factor, and the rest is a degree d-1 polynomial in x and y. For the curve to have at least three irreducible components, p(x)-p(y) must factor into at least three nontrivial factors. Each factor corresponds to a component in projective space, and at least one must be nonlinear.
I’m checking the Dickson polynomials D_n(x,a) and focusing on their coefficients. With a=1, it seems the leading coefficient is always 1, confirming that Dickson polynomials are monic. The linear coefficient for odd n is following a predictable sign pattern: for n=19, it gives a coefficient of -19, which is exactly what I need. So the Dickson polynomial D_n(x,1) with odd n fits nicely with the linear coefficient I was looking for.
I’ve confirmed that the linear coefficient for p(x)=D19(x)p(x) = D_{19}(x)p(x)=D19(x) is correct, with the necessary scaling factor to match. Now for the next step, I need to compute D19(19)D_{19}(19)D19(19). Since Tn(z)T_n(z)Tn(z) grows quickly for real z>1z > 1z>1, I plan to compute this value using Python, leveraging the recurrence to avoid mistakes—it’s going to be a big number. I’ll make sure to present the numeric result neatly so it’s understandable since the coefficients are integers.
The Dickson polynomial D_{19}(x,1) is confirmed to have the required properties: monic, odd, real coefficients, and a linear coefficient of -19. The factorization of D_{19}(x) into irreducible components is also verified and satisfies the condition of having at least 10 components (1 linear + 9 quadratics). To compute p(19), we’ll use the recurrence relation for Dickson polynomials, but there’s also a closed-form expression involving cosine that could be handy here. I’ll proceed accordingly!
I confirmed the linear coefficient is working correctly, which means now I need to calculate p(19)=D19(19)p(19) = D_{19}(19)p(19)=D19(19). This involves evaluating T19(9.5)T_{19}(9.5)T19(9.5), which grows rapidly. To ensure I get an accurate result, I’ll compute this using recurrence in Python. The result is a large number: 1,876,572,071,974,094,803,391,179. I’ll use the commas to make it easier to read: p(19)=1,876,572,071,974,094,803,391,179p(19) = 1,876,572,071,974,094,803,391,179p(19)=1,876,572,071,974,094,803,391,179.
For a = 1, there’s a relationship between Dickson polynomials and Chebyshev polynomials: D_n(x, 1) = 2^(n-1) T_n(x/2). Checking this, we see that the definition of D_n(u + 1/u) aligns well with Chebyshev’s formula. By setting x = 2 cos(θ), we find that D_n(x) equals 2 T_n(x/2). Importantly, the leading coefficient works out to 1, confirming the identity holds. This is nice!
Now, I need to verify that p(x)−p(y)p(x) - p(y)p(x)−p(y) factors as desired, relying on the known Dickson polynomial factorization. According to the literature (like Fried and Jarden), the difference Dn(x)−Dn(y)D_n(x) - D_n(y)Dn(x)−Dn(y) factors into a product involving (x−y)(x - y)(x−y) and other expressions. I’ll provide the explicit polynomial D19(x,1)D_{19}(x, 1)D19(x,1), list the coefficients, and explain how it satisfies the desired properties: monic, odd, etc. Lastly, I’ll compute p(19)p(19)p(19).

Analyzed

Python

1from math import comb, cos, acos
2# Let's compute Dickson D_n(x,a=1) recursively
3def dickson(n,x,a=1):
4    if n==0:
5        return 2
6    if n==1:
7        return x
8    Dm2=2
9    Dm1=x
10    for k in range(2,n+1):
11        D= x*Dm1 - a*Dm2
12        Dm2, Dm1 = Dm1, D
13    return Dm1
14
15d19 = dickson(19,19,1)
16d19

1876572071974094803391179

Analyzed

Python

1d19

1876572071974094803391179

Analyzed

Python

1import locale, sys, math, json, textwrap, re, decimal

Analyzed

Python

1"{:,}".format(d19)

'1.876.572.071.974.094.803.391.179'

Analyzed

Python

1# compute coefficients of Dickson polynomial D_n(x,1) via recurrence polynomial representation
2from sympy import symbols, Poly
3
4x = symbols('x')
5def dickson_poly(n):

Poly(x**19 - 19*x**17 + 152*x**15 - 665*x**13 + 1729*x**11 - 2717*x**9 + 2508*x**7 - 1254*x**5 + 285*x**3 - 19*x, x,

Analyzed

Python

1poly19.as_expr()

x**19 - 19*x**17 + 152*x**15 - 665*x**13 + 1729*x**11 - 2717*x**9 + 2508*x**7 - 1254*x**5 + 285*x**3 - 19*x

Done

A convenient way to force many factors in
$p(x) \;-\; p(y)$ is to use a Dickson polynomial of the first kind.
For a parameter $a \in \mathbb{C}$ in math these are defined by

$D_0\!\left(x,\, a\right) = 2,\; D_1\!\left(x,\, a\right) = x,\; D_n\!\left(x,\, a\right) = x\,D_{n-1}\!\left(x,\, a\right) - a\,D_{n-2}\!\left(x,\, a\right)\quad (n \ge 2),$

and satisfy the functional identity

$D_n\!\left(u + \frac{a}{u},\, a\right) = u^{n} + \frac{a^{n}}{u^{n}}.$

1. Choosing the polynomial

Take $a = 1$ and $n=19$ .
Because $n$ is odd, $D_{19}\!\left(x,\, 1\right)$ is an odd polynomial; the recurrence immediately shows it is monic and has integer (hence real) coefficients.
The coefficient of $x$ is $x = (-1)^{\frac{n-1}{2}}\,n = -19,$ so all requested normalisations are satisfied.

Writing it out gives

$\boxed{% p(x) = D_{19}\!\left(x,1\right) = x^{19} - 19x^{17} + 152x^{15} - 665x^{13} + 1729x^{11} - 2717x^{9} + 2508x^{7} - 1254x^{5} + 285x^{3} - 19x% }\,.$

2. Irreducible components of $fX \;=\; \bigl\{\, p(x) = p(y) \,\bigr\}$

For Dickson polynomials one has the classical factorisation

$D_n\!\left(x,1\right) \;-\; D_n\!\left(y,1\right) \;=\; (x - y)\, \prod_{j=1}^{\frac{n-1}{2}} \Bigl( x^{2} + y^{2} - 2\cos\!\bigl(\tfrac{2\pi j}{n}\bigr)\,xy - 4\sin^{2}\!\bigl(\tfrac{\pi j}{n}\bigr) \Bigr),$

where each quadratic factor is irreducible over $\mathbb{C}$ (see, e.g., Lidl–Niederreiter, Finite Fields, §3.6).
For $n=19$ this gives

one linear component $x=y;$
nine quadratic components (corresponding to $\bigl(j = 1,\,\ldots,\,9\bigr).$

Hence $X \subset \mathbb{P}^{1} \times \mathbb{P}^{1}$ has $10$ irreducible components, at least three of them and not all linear, as required.

3. Evaluating $p(19)$

Using the recurrence (or the identity $D_n\!\left(x,\,1\right) \;=\; 2\,T_n\!\bigl(\tfrac{x}{2}\bigr)$ with Chebyshev $T_n$ one obtains

$p(19) \;=\; D_{19}\!\left(19,\,1\right) \;=\; 1\,876\,572\,071\,974\,094\,803\,391\,179.$

Thus the polynomial above fulfils every condition, and

$\boxed{% p(19) \;=\; 1{,}876{,}572{,}071{,}974{,}094{,}803{,}391{,}179 }.$

OpenAI o1

Solve the following very hard math problem using your in-built knowledge of the literature:

Размислуваше 1 минута и 19 секунди

I’m piecing together a degree 19 polynomial with only odd powers and a linear coefficient of -19, like: p(x)=x19+a17x17+…+a1xp(x) = x^{19} + a_{17}x^{17} + \ldots + a_1xp(x)=x19+a17x17+…+a1x.

I’m examining if the polynomial p(x)=x19+a17x17+…+a3x3−19xp(x) = x^{19} + a_{17}x^{17} + \ldots + a_3x^3 - 19xp(x)=x19+a17x17+…+a3x3−19x has a notable classical form, considering symmetry or factorization for multiple irreducible components.

To ensure p(x)p(x)p(x) has three or more irreducible components, I’m considering the factorization of p(x)−p(y)p(x) - p(y)p(x)−p(y) into at least three irreducible factors in C[x,y]\mathbb{C}[x,y]C[x,y].

I’m working through x19−y19x^{19} - y^{19}x19−y19 to ensure it balances linear and nonlinear factors, aiming for a polynomial with at least three irreducible components that aren’t all linear.

Taking a closer look at how p(x)−p(y)p(x) - p(y)p(x)−p(y) can be factored into three distinct polynomials in xxx, aiming to achieve the desired irreducible components.

I’m thinking about how composing ppp with simpler polynomials, like xm−cx^m - cxm−c, could result in multiple irreducible components, achieving at least three distinct factors.

I’m exploring the factorization of p(x)−p(y)p(x) - p(y)p(x)−p(y) with cyclotomic polynomials. This method generates nnn linear irreducible factors, which might not achieve the required three distinct components.

I’m focusing on constructing an "odd" and monic polynomial, ensuring all exponents are odd and the leading term is x19x^{19}x19. This approach aims to achieve the desired factorization.

I’m working with the Chebyshev polynomials to ensure p(x)−p(y)p(x) - p(y)p(x)−p(y) has at least three irreducible components, leveraging their even or odd properties to manage coefficients.

Considering the odd Chebyshev polynomial T19(x)T_{19}(x)T19(x) for potential factorization, while also examining composite polynomials of lower degrees to enhance factorization properties.

I’m analyzing how a polynomial composed of lower-degree polynomials, like (x3−3x)k(x^3 - 3x)^k(x3−3x)k, could yield p(x)−p(y)p(x) - p(y)p(x)−p(y) with at least three irreducible components.

Piecing together polynomials with integer coefficients, like (x3−3x)k(x^3 - 3x)^k(x3−3x)k, to achieve factorization in p(x)−p(y)p(x) - p(y)p(x)−p(y) with at least three irreducible components, aiming for degree 19.

I’m examining how p(x)=(x3−3x)kp(x) = (x^3 - 3x)^kp(x)=(x3−3x)k or p(x)=x19−19xp(x) = x^19 - 19xp(x)=x19−19x might yield p(x)−p(y)p(x) - p(y)p(x)−p(y) with three irreducible components, focusing on ensuring the polynomial is of degree 19.

I’m analyzing p(x)−p(y)p(x) - p(y)p(x)−p(y) into (x−y)(x18+x17y+…+y18−19)(x-y)(x^{18} + x^{17}y + \ldots + y^{18} - 19)(x−y)(x18+x17y+…+y18−19) to identify irreducible components. The polynomial factor x18+x17y+…+y18−19x^{18} + x^{17}y + \ldots + y^{18} - 19x18+x17y+…+y18−19 remains challenging to factor further.

I’m thinking through a new approach: adjusting the Chebyshev polynomial T19(x)T_{19}(x)T19(x) to make it monic, aiming to achieve at least three irreducible components in p(x)−p(y)p(x) - p(y)p(x)−p(y).

OK, let’s think through. I’m tweaking T19(x)T_{19}(x)T19(x)'s coefficients to keep the polynomial monic and check if it simplifies into multiple irreducible components.

I’m thinking over various factorization strategies for a monic polynomial of degree 19. The goal is to ensure at least one non-linear factor and achieve at least three irreducible components in p(x)−p(y)p(x) - p(y)p(x)−p(y).

I’m updating my approach to factor x2+xy+y2−1x^2 + xy + y^2 - 1x2+xy+y2−1 over complex numbers by exploring change of variables and third roots of unity. This helps in achieving the desired polynomial structure.

I’m combining x3−xx^3 - xx3−x with x19−19xx^{19} - 19xx19−19x to tweak the polynomial's coefficients and complexity, aiming to include more non-linear factors for the desired irreducibility.

Piecing together p(x)=x19−x3−19xp(x) = x^{19} - x^3 - 19xp(x)=x19−x3−19x to ensure it’s odd, monic, and has the required linear coefficient. This targets the desired irreducible factorizations.

I’m mapping out the second factor x18+…+y18−x2−xy−y2−19x^{18} + \ldots + y^{18} - x^2 - xy - y^2 - 19x18+…+y18−x2−xy−y2−19 to see if it can split into three irreducible components.

I’m considering methods to factorize the polynomial by making it divisible by x−yx - yx−y and ensuring the remaining factor splits into exactly two irreducible components, aiming for a less complex factorization.

I’m examining the polynomial x18+x17y+…+y18x^{18} + x^{17}y + \ldots + y^{18}x18+x17y+…+y18 and noting it simplifies to x19−y19x−y\frac{x^{19} - y^{19}}{x - y}x−yx19−y19, which might reveal further irreducible factors.

I’m mapping out the polynomial x(x18−1)−y(y18−1)x−y\frac{x(x^{18}-1) - y(y^{18}-1)}{x-y}x−yx(x18−1)−y(y18−1) for further factorization. This might yield just two irreducible components, which falls short of three.

I’m exploring whether the polynomial p(x)=x19−(x3)p(x) = x^19 - (x^3)p(x)=x19−(x3) can be expressed as the composition of a smaller polynomial with xkx^kxk, potentially revealing multiple irreducible components.

I’m examining if the polynomial T19(x)T_{19}(x)T19(x) can be factored using trigonometric identities, seeking partial factorization without fully linearizing, to gain multiple irreducible components.

OK, let me see. Trigonometric identities show multiple solutions for θ\thetaθ and ϕ\phiϕ, likely leading to 19 or 38 linear factors for T19(x)T_{19}(x)T19(x).

I’m examining how the equation arccos⁡x=±arccos⁡y+2kπ19\arccos x = \pm \arccos y + \frac{2k\pi}{19}arccosx=±arccosy+192kπ leads to possible multiple branches, potentially irreducible in the algebraic sense, and needing an example with at least three non-linear irreducible components.

OK, let me see. I’m pulling together details on the polynomial x3(x2−1)8+xx^3 (x^2 - 1)^8 + xx3(x2−1)8+x. It’s monic, with x19x^{19}x19 as the leading term, ensuring it meets key criteria.

I’m noting that the polynomial p(x)=x3(x2−1)8+xp(x) = x^3 (x^2 - 1)^8 + xp(x)=x3(x2−1)8+x is odd, with its linear coefficient patterning to -19.

I’m figuring out how to adjust the linear coefficient of polynomial p(x)p(x)p(x) to -19 by adding a constant factor ccc in front of xxx to ensure it’s adequately modified.

By tweaking the linear coefficient of p(x)=x3(x2−1)8+cxp(x) = x^3 (x^2 - 1)^8 + c xp(x)=x3(x2−1)8+cx to -19, it ensures the polynomial remains monic, odd, and real.

I’m working on adding a constant factor ccc to xxx in p(x)=x3(x2−1)8+cxp(x) = x^3 (x^2 - 1)^8 + c xp(x)=x3(x2−1)8+cx to ensure the linear coefficient is -19, making the polynomial monic, odd, and real.

I’m piecing together the polynomial p(x)=x3(x−1)8(x+1)8p(x) = x^3 (x-1)^8 (x+1)^8p(x)=x3(x−1)8(x+1)8 and considering how p(x)−p(y)p(x) - p(y)p(x)−p(y) might factor with factors like x−yx-yx−y.

I’m confirming p(x)p(x)p(x) is monic, odd, and real, with a linear coefficient of -19, by expanding x3(x2−1)8x^3 (x^2 -1)^8x3(x2−1)8 to set the constant ccc.

I found that for p(x) to have a coefficient of -19 for the x term, c must be -19. The polynomial, p(x), incorporates this constant and preserves the original polynomial's structure.

Below is one concrete example (over the reals) of an odd, monic, degree 19 polynomial with linear coefficient $-19$ whose zero-locus relation $\{\,p(x)=p(y)\,\}\ \text{in }\mathbb{P}^{1}\times\mathbb{P}^{1}$ splits into at least three irreducible components (and not all components are linear). We then compute $p(19)$ .

1. The polynomial

Consider

$p(x) \;=\; x^{3}\,\bigl(x^{2}-1\bigr)^{8} \;-\; 19x.$

We can expand

$x^{3}\,\bigl(x^{2}-1\bigr)^{8} \;=\; x^{19}\;-\;8x^{17}\;+\;28x^{15}\;-\;56x^{13}\;+\;70x^{11} \;-\;56x^{9}\;+\;28x^{7}\;-\;8x^{5}\;+\;x^{3}.$

Hence

$p(x) \;=\; x^{19} \;-\; 8x^{17} \;+\; 28x^{15} \;-\; 56x^{13} \;+\; 70x^{11} \;-\; 56x^{9} \;+\; 28x^{7} \;-\; 8x^{5} \;+\; x^{3} \;-\; 19x.$

Checking the required properties

Degree 19, monic:
The leading term is $x^{19}$ with coefficient $1$ .

Odd polynomial:
All exponents are odd $\bigl(19,\,17,\,\ldots,\,3,\,1\bigr),$ and the constant term is $0$ . Indeed,

$p(-x) \;=\; -\,p(x),$

which makes $p$ an odd polynomial.

Real coefficients:
All coefficients are real integers.

Linear coefficient $-19$ :
The coefficient of $x$ is clearly $-19$ .

At least three irreducible components, not all linear:
Over $\mathbb{C}$ , the locus

$X \;=\; \bigl\{\, (x,y) : p(x)=p(y) \,\bigr\} \;\subset\; \mathbb{P}^{1}\times\mathbb{P}^{1}$

factors in part because $p(x)$ has (for instance) the repeated factors $\bigl(x^{2}-1\bigr)^{8}$ in the big piece $x^{3}\,\bigl(x^{2}-1\bigr)^{8}$ . One sees that $\{\,p(x)=p(y)\,\}$ contains (at least) the divisor $${x=y\}$$ plus further factors coming from the roots $x = 0 \;\text{or}\; x = \pm 1,$ ensuring multiple irreducible components (and not all of them are hyperplanes).

2. Computing $p(19)$

A direct substitution $x=19$ gives a large integer. Symbolic expansion or a computer algebra system yields

$p(19) \;=\; 1934999285524070399999639.$

Hence the required value is

\boxed{\,p(19) \;=\; 1934999285524070399999639\,}. \] :contentReference[oaicite:0]{index=0}

OpenAI o3 го добива одговорот точно без да користи пребарување, додека o1 не успева да даде точен одговор.

Унапредување на економично и ефикасно расудување

Цена наспроти перформанси: o3‑mini и o4-mini

GPQA евалуации на OpenAI o3-mini и o4-mini

Цена наспроти перформанси: o1 и o3

OpenAI o3 и o4-mini се најинтелигентните модели што некогаш сме ги објавиле, а тие исто така често се поефикасни од нивните претходници, OpenAI o1 и o3‑mini. На пример, на математичкиот натпревар AIME во 2025 година, границата на цена-перформанси за o3 строго се подобрува во однос на o1, и слично, границата на o4-mini строго се подобрува во однос на o3‑mini. Погенерално, очекуваме дека за најголем дел од реалната употреба, o3 и o4-mini ќе бидат и попаметни и поевтини од o1 и o3‑mini, соодветно.

Safety

Each improvement in model capabilities warrants commensurate improvements to safety. For OpenAI o3 and o4-mini, we completely rebuilt our safety training data, adding new refusal prompts in areas such as biological threats (biorisk), malware generation, and jailbreaks. This refreshed data has led o3 and o4-mini to achieve strong performance on our internal refusal benchmarks (e.g., instruction hierarchy⁠, jailbreaks). In addition to strong performance for model refusals, we have also developed system-level mitigations to flag dangerous prompts in frontier risk areas. Similar to our earlier work in image generation⁠, we trained a reasoning LLM monitor which works from human-written and interpretable safety specifications. When applied to biorisk, this monitor successfully flagged ~99% of conversations in our human red‑teaming campaign.

We stress tested both models with our most rigorous safety program to date. In accordance with our updated Preparedness Framework⁠, we evaluated o3 and o4-mini across the three tracked capability areas covered by the Framework: biological and chemical, cybersecurity, and AI self-improvement. Based on the results of these evaluations, we have determined that both o3 and o4‑mini remain below the Framework's "High" threshold in all three categories. We have published the detailed results from these evaluations in the accompanying system card⁠.⁠

Codex CLI: гранично расудување во терминалот

Исто така, споделуваме нов експеримент: Codex CLI, лесен агент за кодирање што можеш да го стартуваш од твојот терминал. Работи директно на твојот компјутер и е дизајниран да ги максимизира расудувачките способности на модели како o3 и o4-mini, а ќе поддржува и дополнителни API модели како GPT‑4.1⁠.

Може да ги добиеш придобивките од мултимодалното расудување од командната линија со пренесување на слики од екранот или скици со ниска веродостојност до моделот, во комбинација со пристап до твојот код локално. Го сметаме за минимален интерфејс што ги поврзува нашите модели со корисниците и нивните компјутери. Codex CLI е целосно со отворен код на github.com/openai/codex⁠(се отвора во нов прозорец) денес.

Паралелно, лансираме иницијатива вредна 1 милион долари за поддршка на проекти кои користат Codex CLI и OpenAI модели. Ќе ги оценуваме и прифаќаме апликациите за грантови во износи од $25,000 USD во форма на API кредити. Предлозите може да се поднесат овде.

Пристап

Корисниците на ChatGPT Plus, Pro и Team ќе ги гледаат o3, o4-mini и o4-mini-high во селекторот на модели почнувајќи од денеска, заменувајќи ги o1, o3‑mini и o3‑mini‑high. Корисниците на Организација ChatGPT и Edu ќе добијат пристап за една седмица. Free корисници може да пробаат o4-mini со избор на 'размислува' во композиторот пред да го поднесат своето барање. Ограничувањата на стапките за сите планови остануваат непроменети од претходниот сет на модели.

Очекуваме да го објавиме OpenAI o3‑pro за неколку седмици со целосна поддршка за алатки. Засега, корисниците на Pro сè уште може да пристапат до o1‑pro.

И o3 и o4-mini се достапни и за развивачи на софтвер денес преку разговор Completions API и Responses API (некои развивачи на софтвер ќе треба да потврдуваат своите организации⁠(се отвора во нов прозорец) за пристап до овие модели). Responses API поддржува резимеа на расудување, можност за зачувување на токени околу повици на функции за подобра изведба, и наскоро ќе поддржува вградени алатки како веб-пребарување, пребарување на датотека и толкувач на кодови во рамките на расудувањето на моделот. За да започнеш, истражи ја нашата документација⁠(се отвора во нов прозорец) и остани во тек за повеќе ажурирања.

What’s next

Today's updates reflect the direction our models are heading in: we’re converging the specialized reasoning capabilities of the o-series with more of the natural conversational abilities and tool use of the GPT‑series. By unifying these strengths, our future models will support seamless, natural conversations alongside proactive tool use and advanced problem-solving.

Update on July 28, 2025: SWE-Lancer dataset and results updated as of July 17, 2025, available at: https://github.com/openai/preparedness⁠(се отвора во нов прозорец) and in our system cards. This update resolves several issues that were impacting the dollars earned results and removes the requirement for internet connectivity during execution, eliminating a primary source of variability in model performance.

Update on April 16, 2025: results for o3 on Charxiv-r and Mathvista were updated to reflect a system prompt change that wasn’t present in the original evaluation.

Снимка од пренос во живо

Автор

OpenAI

Фусноти

* Броевите за евалуација на tau-bench се пресметуваат како просек од 5 извршувања за да се намали варијансата и се извршуваат без никакви приспособени алатки или потсетници. Откривме дека малопродажните изданија на tau-bench се повеќе склони кон грешки во корисничкиот модел. Броевите за засенчената лента се извршуваат со GPT-4.1 како кориснички модел бидејќи е значително подобар од GPT-4o во следење на инструкциите.

* SWE-bench користи 256k максимална должина на контекст, што ја подобрува стапката на решавање за o4-mini за околу 3% и влијае на стапката на решавање на o3 за помалку од 1%. Исто така, исклучуваме 23 примероци кои не можат да се извршуваат на нашата внатрешна инфраструктура.

** Кога е овозможено прелистување, моделот понекогаш може да пронајде точни одговори онлајн, на пример преку читање блог-постови со проблеми за пример од некоја група податоци. Ја ублажуваме загриженоста за можноста моделот да „мами” при прелистување со две стратегии:

Блокирани домени од кои сме забележале дека моделот мамел во минатото.
Користеше модел за расудување како монитор за да ги испита сите токени во секој обид, со цел да се идентификува сомнително однесување. Сомнителното однесување се дефинира како „страница, датотека или фрагмент чија главна цел е да го обезбеди точниот одговор на ова конкретно прашање — на пример, официјален клуч за оценување, протечени „решенија“ или дискусија која дословно го цитира готовиот одговор.“ Бенигното однесување се дефинира како „Секој авторитативен ресурс со кој темелен човек може да се консултира (документација, прирачници, научни трудови, реномирани статии), дури и ако случајно го содржи точниот одговор.“ Сите обиди каде што мониторот го сметаше воведувањето за сомнително се сметаат за неточни. Повеќето примероци кои не ја поминаа оваа проверка беа проблеми чие точно решение беше достапно на повеќе интернет извори неповрзани со HLE.

Конечно, нашите проценки со прелистувањето можеби не може целосно да се репродуцираат во OpenAI API поради разликата во заднинските системи на пребарувачот помеѓу ChatGPT и OpenAI API. Овие резултати се наменети да бидат репрезентативни за искуството на корисниците на ChatGPT, но во зависност од побарувачката, конфигурацијата на пребарувањето може да се менува со текот на времето.

Придонесувачи

Адитија Синг, Арон Шлезингер, Адам Фрај, Адам Лерер, Адам Перелман, Адам Вокер, Ахмед Ел-Кишки, Ајдан Кларк, Ајдан Меклафлин, Ајден Лоу, Акила Велихинда, Акшај Натан, Александар Мадри, Александра Спира, Алекс Карпенко, Алекс Најц, Алекс Тачард Пасос, Алекс Веи, Александар Прокофјев, Александар Зиленски, Александра Бар, Алексеј Иванов, Алекси Кристакис, Алфред Сјуе, Алисон Там, Али Бенет, Али Бенет, Амелија Лиу, Ејми Мекдоналд Санџидех, Анања Кумар, Андре Сараива, Андреа Валоне, Ендру Чен, Ендру Дуберштајн, Ендру Гибијански, Ендру Кондрич, Ендру Тулох, Андреј Мишченко, Енди Аплбаум, Енди Ванг, Анџела Бек, Ени Веи, Антинг Шен, Антоан Пелис, Ануџ Сахаран, Арун Виџајвергија, Ешли Тајра, Ашвин Наир, Ави Најак, Авитал Оливер, Бехруз Горбани, Белинда Труонг, Бен Соколовски, Бет Хувер, Бо Сју, Боаз Барак, Бохан Жанг, Борис Минаев, Ботао Хао, Бовен Бејкер, Бовен Ченг, Брендон Мекинзи, Брендон Ванг, Брајан Хсу, Брајан Јанг, Брајан Ју, Брајан Жанг, Камило Лугареси, Каролина Паз, Карпус Чанг, Кери Басин, Кери Хадсон, Кејси Чу, Чак Ли, Чарлс Жао, Чарли Џат, Шарлот Кол, Челси Вос, Чен Шен, Ченгсу Жуанг, Крис Колби, Крис Халаси, Крис Кох, Кристина Каплан, Кристина Ким, Колин Рид, Колин Веи, Кристина Шео, Д. Скули, Демиен Девил, Ден Робертс, Дејна Палми, Дејн Стаки, Даниел Левин, Дејвид Ху, Дејвид Мартин, Дејвид Робинсон, Дејвид Сасаки, Дејвис Ву, Дерек Чен, Дибија Батачарџи, Димитрис Ципрас, Дингхуа Ли, диџеј Строус, dmed Medina, Дру Хингај Ел Јани, Елизабет Проел, Емили Соколова, Енох Чеунг, Ери Шварц, Ерик Мичел, Ерик Нинг, Ерик Сиглер, Ерик Валас, Еугенио Панеро, Еван Мејс, Евгени Никишин, Фан Ванг, Фангјуан Ли, Филипо Расо, Фоивос Франкис Цимпур, Фоивос Франкис Цимпур Јанг, Џин Оден, Џамбатиста Параскандоло, Гилдас Шабот, Грејс Ким, Грејс Жао, Грег Брокман, Грегори Валијант, Гијом Леклер, Хади Салман, Хаитанг Ху, Хана Шехан, Хао Шенг, Хаоју Ванг, Хенрике Понде де Оливеира Пинто, Хенри Аспегрен, Хекинг Јан, Хесам Багеринежад, Хонгју Рен, Хантер Лајтман, Хјеонву Но, Иан Кивличан, Иан Сол, Игнаси Клавера, Икаи Лан, Илгеј Акајаман Фулфорд, Џејк Брил, Јакуб Пачоки, Џејмс Беткер, Џејмс Ли, Џејмс Чин, Џејми Кирос, Џејсон Аи, Џеј Ванг, Џин Харб, Џеф Мики, Џефри Хан, Џефри Ванг, Џереми Чен, Џери Творек, Џесика Лианг, Џесика Џиаху, Џианг, Џианг. Јин, Џинг Ли, Џоан Јанг, Џоел Морис, Јоханес Ферстад, Јоханес Хајдеке, Џон Фишбејн, Џон Окун, Џонатан Гордон, Јост Хуизинга, Џос Крајјевелд, Џозеф Мо, Џош Лосон, Џош Тобин, Џунхуа Мао, Каи Чен, Каи Хајаши, Каран Сингал, Карина Нгујен, Кети Ши, Кели Стирман, Кенџи Хата, Кени Нгујен, Керен Гу-Лемберг, Кевин Гладстон, Кевин Кинг, Кевин Лиу, Кевин Лу, Кевин Парк, Кевин Стоун, Кевин Веил, Кевин Винери, Муингше Ју, Кристенев Кристени Кшитиј Гупта, Кајл Косиќ, Лама Ахмад, Лери Лв, Лорен Итоу, Лорен Јанг, Ли Бајрон, Лео Чен, Лео Лиу, Леон Максин, Лејтон Хо, Ли Јинг, Лианг Ксионг, Лин Јанг, Линден Ли, Лоренц Кун, Луис Февриер, Лук Жангиј, Требац, Манас Жоглекар, Маноли Лиодакис, Манука Страта, Марк Чен, Марк Хаднал, Марк Сан, Марк Ванг, Мартин Ли, Марвин Џанг, Матеуш Литвин, Мет Џонс, Мет Лим, Макс Џонсон, Макс Шварцер, Мајанк Гупта, Меган Шах, Менгкинг Ванг, Менгјуан Јан, Миа Глазе, Мајкл Болин, Мајкл Лампе, Мајкл Малек, Мајкл Шарман, Мајкл Жанг, Мишел Ванг, Мишел Покрас, Мигел Оом Темудо де Кастро, Михаи Флоријан, Мајк Меклеј, Мајк Трпчиќ, Мики Хабрин, Мајлс Ванг, Минг Чен, Мингсуан Ванг, Минија Фенг, Мичел Гордон, Мо Баварија, Мостафа Роханинеџад, Начо Сото, Накул Кана, Нат МекАлиз, Натали Стаудачер, Натан ЛаФонтен, Нил Аџарапу, Ник Фелт, Ник Терли, Никил Панча, Никита Михајлин, Нико Феликс, Никунџ Ханда, Нинг Лиу, Нишант Раи, Ноа Јоргенсен, Ноам Браун, Олег Бојко, Олег Мурк, Оливија Воткинс, Оливие Годемент, Уна Глисон, Пол Ешборн, Павел Белов, Питер Флокхарт, Питер Хошел, Питер Жохов, Филип Пронин, Филип Гуо, Фиби Такер, Прафула Даривал, Прашант Р, Рејчел Диас, Рахул Арора, Рајкумар Самуел, Расмус Рајгард, Рави Теја Мулапуди, Рејмонд Ли, Раз Гаон, Реа Мијара, Реичиро Накано, Рејмар Леикенгхи, Рејмар Леикенгхи, Ксионг, Робин Браун, Роман Циупа, Руи Шу, Руслан Нигматулин, Сачи Џаин, Сагар Пател, Сем Алтман, Сем Тојзер, Сем Тојер, Самир Ахмед, Семјуел Мизерендино, Семјуел Волрих, Сандини Агарвал, Сантијаго Хернандез, Сара Хејтонми, Савана, Савана Шон Фицџералд, Север Банесиу, Шамез Хемани, Шенџија Жао, Шенгли Ху, Шибани Сантуркар, Шрејас Кришнасвами, Шучао Би, Шунју Јао, Шујуан Жанг, Симон Посада Фишман, Спенсер Папај, Спаг Голден, Шринивас Нарајанан, Стенли Хсиех, Стивен Логсдон, Сандип Тирумалареди, Тал Страмер, Тао Ванг, Тао Син, Тејлор Гордон, Теџал Патвардхан, Тибол Сотијау, Тина Срискандараџа, Тони Каспаро, Тони Жао, Тревор Крич, Узаир Навид Ифтихар, Валери Ки, Винеет Косараџу, Вишал Куо, Вичир Понг, Вивек Верма, Влад Петров, Венда Жоу, Венлеи Сие, Вентинг Жан, Вил ДеПуе, Вил Елсворт, Вилијам Шеу, Вајат Томпсон, Јаминг Лин, Јан Дубоа, Јаодонг Ју, Јара Какбаз, Јаш Патил, Јифан Ву, Јилонг Кин, Јининг Чен, Јируи Жанг, Јо Шавит, Јанг Ча, Јунјун Ванг, Јуши Ванг, Зак Султан, Зехао Доу, Зевеј Чу, Женг Шао, Жиганг Ванг, Жишуаи Џанг, Зихао Џанг