16 aprilie 2025

Introducing OpenAI o3 and o4-mini

Se încarcă…

Actualizare din 10 iunie 2025: OpenAI o3‑pro este acum disponibil pentru utilizatorii Pro în ChatGPT, precum și în API-ul nostru. La fel ca și OpenAI o1‑pro, o3‑pro este o versiune a celui mai inteligent model al nostru, OpenAI o3, concepută să gândească mai mult și să ofere cele mai fiabile răspunsuri. Detaliile complete pot fi găsite în notele noastre de lansare⁠(se deschide într-o fereastră nouă).

Astăzi lansăm OpenAI o3 și o4-mini, cele mai recente modele din seria o, instruite să gândească mai mult timp înainte de a răspunde. Sunt cele mai inteligente modele pe care le-am lansat până în prezent, reprezentând o schimbare radicală a capacităților ChatGPT pentru toată lumea, de la utilizatori curioși la cercetători avansați. Pentru prima dată, modelele noastre de raționament pot folosi și combina în mod agentic toate instrumentele din ChatGPT — inclusiv căutarea pe web, analizarea fișierelor încărcate și a altor date cu Python, raționamentul profund referitor la datele de intrare vizuale și chiar generarea de imagini. Este esențial faptul că aceste modele sunt instruite să dezvolte un raționament cu privire la momentul și modul în care să utilizeze instrumentele pentru a produce răspunsuri detaliate și bine gândite în formatele de ieșire corecte, de obicei în mai puțin de un minut, pentru a rezolva probleme mai complexe. Acest lucru le permite să abordeze mai eficient întrebări complexe, constituind un pas important către un ChatGPT mai autonom, capabil să execute în mod independent sarcini în numele tău. Puterea combinată a raționamentului de ultimă generație cu acces complet la instrumente duce la rezultate mult mai bune în testele de performanță academice și în sarcinile reale, stabilind un nou standard atât în materie de inteligență, cât și de utilitate.

Ce s-a schimbat

OpenAI o3 este cel mai puternic model de raționament al nostru, care forțează limitele în programare, matematică, știință, percepție vizuală și multe altele. Stabilește un nou SOTA în cazul unor teste de performanță precum Codeforces, SWE-bench (fără a construi o schelă personalizată specifică modelului) și MMMU. Este ideal pentru interogări complexe care necesită o analiză multifațetată și ale căror răspunsuri pot să nu fie imediat evidente. Are performanțe deosebit de bune în cazul sarcinilor vizuale, cum ar fi analiza imaginilor, diagramelor și graficelor. În evaluările experților externi, o3 face cu 20% mai puține erori majore decât OpenAI o1 în sarcini dificile, din lumea reală — excelând în special în domenii precum programarea, afacerile/consultanța și ideația creativă. Testerii inițiali i-au subliniat rigoarea analitică în calitatea sa de partener de gândire și i-au apreciat capacitatea de a genera și evalua critic ipoteze noi — în special în biologie, matematică și inginerie.

OpenAI o4-mini este un model mai mic, optimizat pentru raționament rapid și eficient din punct de vedere al costurilor — atinge performanțe remarcabile pentru dimensiunea și costul său, în special în sarcini matematice, de programare și vizuale. Este modelul cu cele mai bune performanțe testate pe AIME 2024 și 2025. Deși accesul la un computer reduce semnificativ dificultatea examenului AIME, am constatat și că o4-mini obține un scor de 99,5% pass@1 (100% consensus@8) la AIME 2025 atunci când are acces la un interpretor de Python. Deși aceste rezultate nu ar trebui comparate cu performanța modelelor fără acces la instrumente, ele reprezintă un exemplu al modului în care o4-mini valorifică eficient instrumentele disponibile; o3 prezintă îmbunătățiri similare față de AIME 2025 datorită utilizării instrumentelor (98,4% pass@1, 100% consensus@8).

În evaluările experților, o4-mini îl depășește și pe predecesorul său, o3‑mini, în domenii non-STEM, precum și în domenii precum știința datelor. Datorită eficienței sale, o4-mini acceptă limite de utilizare semnificativ mai mari decât o3, ceea ce îl face o opțiune puternică, cu volum și capacitate ridicate, pentru întrebări care necesită raționament. Experții evaluatori externi au apreciat ambele modele ca prezentând o îmbunătățire a urmării instrucțiunilor și răspunsuri mai utile și verificabile decât predecesoarele lor, datorită inteligenței îmbunătățite și includerii surselor de pe web. În comparație cu iterațiile anterioare ale modelelor noastre de raționament, aceste două modele ar trebui să pară mai naturale și mai conversaționale, mai ales că fac referire la memorie și la conversații anterioare pentru a personaliza și face mai relevante răspunsurile.

Multimodal

Programare

Toate rundele de evaluare SWE-bench utilizează un subset fix de n=477 de sarcini verificate care au fost validate pe infrastructura noastră internă.

Urmarea instrucțiunilor și utilizarea instrumentului agent

Toate modelele sunt evaluate la setări de „efort de raționament” ridicate — asemenea variantelor precum „o4-mini-high” din ChatGPT.

Continuarea scalării învățării prin consolidare

Pe parcursul dezvoltării OpenAI o3, am observat că învățarea prin consolidare la scară largă prezintă aceeași tendință de „mai multă putere de calcul = performanță mai bună” observată în pre-instruirea seriei GPT. Prin reconstituirea căii de scalare — de data aceasta în RL — am obținut progrese suplimentare atât în privința calculului de instruire, cât și a raționamentului inferență-timp, înregistrând în continuare creșteri clare ale performanței, ceea ce confirmă că performanța modelelor continuă să se îmbunătățească pe măsură ce li se permite să gândească mai mult. La o latență și un cost egale cu OpenAI o1, o3 oferă performanțe superioare în ChatGPT — și am confirmat că, dacă îi permitem să gândească mai mult timp, performanțele sale continuă să crească.

De asemenea, am instruit ambele modele să folosească instrumente de învățare prin consolidare — învățându-le nu doar cum să folosească instrumentele, ci și să dezvolte un raționament cu privire la momentul în care ar trebui să le folosească. Capacitatea lor de a implementa instrumente în funcție de rezultatele dorite le face mai capabile în situații neprevăzute — mai ales în cele care implică raționament vizual și fluxuri de lucru în mai mulți pași. Această îmbunătățire se reflectă atât în testele de performanță academice, cât și în sarcinile reale, după cum au raportat testerii inițiali.

Gândirea cu imagini

Pentru prima dată, aceste modele pot integra imagini direct în lanțul lor de gândire. Ele nu doar văd o imagine — ci gândesc cu ea. Acest lucru deschide calea către o nouă categorie de rezolvare a problemelor, care combină raționamentul vizual și textual, ceea ce se reflectă în rezultatele lor de vârf în cadrul testelor de performanță multimodale.

Utilizatorii pot încărca o fotografie a unei table albe, a unei diagrame dintr-un manual sau a unei schițe desenate manual, iar modelul o poate interpreta — chiar dacă imaginea este neclară, inversată sau de calitate scăzută. Cu ajutorul instrumentelor, modelele pot manipula imagini din mers — rotindu-le, mărindu-le sau transformându-le ca parte a procesului de raționament.

Aceste modele oferă o precizie de primă clasă în sarcinile de percepție vizuală, permițându-le să rezolve probleme care până acum nu puteau fi rezolvate. Consultă blogul de cercetare a raționamentului vizual⁠ pentru a afla mai multe.

Pentru utilizarea agentică a instrumentelor

OpenAI o3 și o4-mini au acces complet la instrumentele din ChatGPT, precum și la propriile instrumente personalizate prin apelarea de funcții în API. Aceste modele sunt instruite să dezvolte un raționament privind modul de rezolvare a problemelor, alegând când și cum să utilizeze instrumentele pentru a produce rapid răspunsuri detaliate și bine gândite în formatele de ieșire potrivite — de obicei în mai puțin de un minut.

De exemplu, un utilizator ar putea întreba: „Cum se va compara consumul de energie din California pe timpul verii cu cel de anul trecut?” Modelul poate căuta pe web date despre utilități publice, poate scrie cod Python pentru a construi o prognoză, poate genera un grafic sau o imagine și poate explica factorii cheie din spatele predicției, înlănțuind mai multe apelări de instrumente. Raționamentul le permite modelelor să reacționeze și să se adapteze după cum este necesar la informațiile pe care le întâlnesc. De exemplu, pot căuta pe web de mai multe ori cu ajutorul furnizorilor de căutare, pot consulta rezultatele și pot încerca noi căutări dacă au nevoie de mai multe informații.

Această abordare flexibilă și strategică le permite modelelor să abordeze sarcini care necesită acces la informații actualizate, dincolo de cunoștințele încorporate în model, raționament extins, sinteză și generarea de date de ieșire în toate modalitățile.

Toate exemplele au fost realizate cu OpenAI o3.

OpenAI o3

Solve the following very hard math problem using your in-built knowledge of the literature:

Construct a degree 19 polynomial \ (p(x)) \ in \ mathbb{C}[x] such that \ (X := \ {\, p(x) = p(y) \, \} \ subset \ mathbb{P}^{1} \ times \ mathbb{P}^{1}\ ) has at least 3 (but not all linear) irreducible components over \ mathbb{C}. Choose \ (p(x)\ ) to be odd, monic, have real coefficients and linear coefficient \ (-19\ ) and calculate \ (p(19)\ ).

Am analizat prin raționament cu privire la construcția polinomială timp de 55 de secunde

The curve defined by p(x) = p(y) factors if p(x) is decomposable or has repeated factors. Actually, p(x)-p(y) always factors, and it’s divisible by (x-y). This gives one factor, and the rest is a degree d-1 polynomial in x and y. For the curve to have at least three irreducible components, p(x)-p(y) must factor into at least three nontrivial factors. Each factor corresponds to a component in projective space, and at least one must be nonlinear.
I’m checking the Dickson polynomials D_n(x,a) and focusing on their coefficients. With a=1, it seems the leading coefficient is always 1, confirming that Dickson polynomials are monic. The linear coefficient for odd n is following a predictable sign pattern: for n=19, it gives a coefficient of -19, which is exactly what I need. So the Dickson polynomial D_n(x,1) with odd n fits nicely with the linear coefficient I was looking for.
I’ve confirmed that the linear coefficient for p(x)=D19(x)p(x) = D_{19}(x)p(x)=D19(x) is correct, with the necessary scaling factor to match. Now for the next step, I need to compute D19(19)D_{19}(19)D19(19). Since Tn(z)T_n(z)Tn(z) grows quickly for real z>1z > 1z>1, I plan to compute this value using Python, leveraging the recurrence to avoid mistakes—it’s going to be a big number. I’ll make sure to present the numeric result neatly so it’s understandable since the coefficients are integers.
The Dickson polynomial D_{19}(x,1) is confirmed to have the required properties: monic, odd, real coefficients, and a linear coefficient of -19. The factorization of D_{19}(x) into irreducible components is also verified and satisfies the condition of having at least 10 components (1 linear + 9 quadratics). To compute p(19), we’ll use the recurrence relation for Dickson polynomials, but there’s also a closed-form expression involving cosine that could be handy here. I’ll proceed accordingly!
I confirmed the linear coefficient is working correctly, which means now I need to calculate p(19)=D19(19)p(19) = D_{19}(19)p(19)=D19(19). This involves evaluating T19(9.5)T_{19}(9.5)T19(9.5), which grows rapidly. To ensure I get an accurate result, I’ll compute this using recurrence in Python. The result is a large number: 1,876,572,071,974,094,803,391,179. I’ll use the commas to make it easier to read: p(19)=1,876,572,071,974,094,803,391,179p(19) = 1,876,572,071,974,094,803,391,179p(19)=1,876,572,071,974,094,803,391,179.
For a = 1, there’s a relationship between Dickson polynomials and Chebyshev polynomials: D_n(x, 1) = 2^(n-1) T_n(x/2). Checking this, we see that the definition of D_n(u + 1/u) aligns well with Chebyshev’s formula. By setting x = 2 cos(θ), we find that D_n(x) equals 2 T_n(x/2). Importantly, the leading coefficient works out to 1, confirming the identity holds. This is nice!
Now, I need to verify that p(x)−p(y)p(x) - p(y)p(x)−p(y) factors as desired, relying on the known Dickson polynomial factorization. According to the literature (like Fried and Jarden), the difference Dn(x)−Dn(y)D_n(x) - D_n(y)Dn(x)−Dn(y) factors into a product involving (x−y)(x - y)(x−y) and other expressions. I’ll provide the explicit polynomial D19(x,1)D_{19}(x, 1)D19(x,1), list the coefficients, and explain how it satisfies the desired properties: monic, odd, etc. Lastly, I’ll compute p(19)p(19)p(19).

Analyzed

Python

1from math import comb, cos, acos
2# Let's compute Dickson D_n(x,a=1) recursively
3def dickson(n,x,a=1):
4    if n==0:
5        return 2
6    if n==1:
7        return x
8    Dm2=2
9    Dm1=x
10    for k in range(2,n+1):
11        D= x*Dm1 - a*Dm2
12        Dm2, Dm1 = Dm1, D
13    return Dm1
14
15d19 = dickson(19,19,1)
16d19

1876572071974094803391179

Analyzed

Python

1d19

1876572071974094803391179

Analyzed

Python

1import locale, sys, math, json, textwrap, re, decimal

Analyzed

Python

1"{:,}".format(d19)

'1,876,572,071,974,094,803,391,179'

Analyzed

Python

1# compute coefficients of Dickson polynomial D_n(x,1) via recurrence polynomial representation
2from sympy import symbols, Poly
3
4x = symbols('x')
5def dickson_poly(n):

Poly(x**19 - 19*x**17 + 152*x**15 - 665*x**13 + 1729*x**11 - 2717*x**9 + 2508*x**7 - 1254*x**5 + 285*x**3 - 19*x, x,

Analyzed

Python

1poly19.as_expr()

x**19 - 19*x**17 + 152*x**15 - 665*x**13 + 1729*x**11 - 2717*x**9 + 2508*x**7 - 1254*x**5 + 285*x**3 - 19*x

Done

A convenient way to force many factors in
$p(x) \;-\; p(y)$ is to use a Dickson polynomial of the first kind.
For a parameter $a \in \mathbb{C}$ in math these are defined by

$D_0\!\left(x,\, a\right) = 2,\; D_1\!\left(x,\, a\right) = x,\; D_n\!\left(x,\, a\right) = x\,D_{n-1}\!\left(x,\, a\right) - a\,D_{n-2}\!\left(x,\, a\right)\quad (n \ge 2),$

and satisfy the functional identity

$D_n\!\left(u + \frac{a}{u},\, a\right) = u^{n} + \frac{a^{n}}{u^{n}}.$

1. Choosing the polynomial

Take $a = 1$ and $n=19$ .
Because $n$ is odd, $D_{19}\!\left(x,\, 1\right)$ is an odd polynomial; the recurrence immediately shows it is monic and has integer (hence real) coefficients.
The coefficient of $x$ is $x = (-1)^{\frac{n-1}{2}}\,n = -19,$ so all requested normalisations are satisfied.

Writing it out gives

$\boxed{% p(x) = D_{19}\!\left(x,1\right) = x^{19} - 19x^{17} + 152x^{15} - 665x^{13} + 1729x^{11} - 2717x^{9} + 2508x^{7} - 1254x^{5} + 285x^{3} - 19x% }\,.$

2. Irreducible components of $fX \;=\; \bigl\{\, p(x) = p(y) \,\bigr\}$

For Dickson polynomials one has the classical factorisation

$D_n\!\left(x,1\right) \;-\; D_n\!\left(y,1\right) \;=\; (x - y)\, \prod_{j=1}^{\frac{n-1}{2}} \Bigl( x^{2} + y^{2} - 2\cos\!\bigl(\tfrac{2\pi j}{n}\bigr)\,xy - 4\sin^{2}\!\bigl(\tfrac{\pi j}{n}\bigr) \Bigr),$

where each quadratic factor is irreducible over $\mathbb{C}$ (see, e.g., Lidl–Niederreiter, Finite Fields, §3.6).
For $n=19$ this gives

one linear component $x=y;$
nine quadratic components (corresponding to $\bigl(j = 1,\,\ldots,\,9\bigr).$

Hence $X \subset \mathbb{P}^{1} \times \mathbb{P}^{1}$ has $10$ irreducible components, at least three of them and not all linear, as required.

3. Evaluating $p(19)$

Using the recurrence (or the identity $D_n\!\left(x,\,1\right) \;=\; 2\,T_n\!\bigl(\tfrac{x}{2}\bigr)$ with Chebyshev $T_n$ one obtains

$p(19) \;=\; D_{19}\!\left(19,\,1\right) \;=\; 1\,876\,572\,071\,974\,094\,803\,391\,179.$

Thus the polynomial above fulfils every condition, and

$\boxed{% p(19) \;=\; 1{,}876{,}572{,}071{,}974{,}094{,}803{,}391{,}179 }.$

OpenAI o1

Solve the following very hard math problem using your in-built knowledge of the literature:

M-am gândit timp de 1 minut și 19 secunde

I’m piecing together a degree 19 polynomial with only odd powers and a linear coefficient of -19, like: p(x)=x19+a17x17+…+a1xp(x) = x^{19} + a_{17}x^{17} + \ldots + a_1xp(x)=x19+a17x17+…+a1x.

I’m examining if the polynomial p(x)=x19+a17x17+…+a3x3−19xp(x) = x^{19} + a_{17}x^{17} + \ldots + a_3x^3 - 19xp(x)=x19+a17x17+…+a3x3−19x has a notable classical form, considering symmetry or factorization for multiple irreducible components.

To ensure p(x)p(x)p(x) has three or more irreducible components, I’m considering the factorization of p(x)−p(y)p(x) - p(y)p(x)−p(y) into at least three irreducible factors in C[x,y]\mathbb{C}[x,y]C[x,y].

I’m working through x19−y19x^{19} - y^{19}x19−y19 to ensure it balances linear and nonlinear factors, aiming for a polynomial with at least three irreducible components that aren’t all linear.

Taking a closer look at how p(x)−p(y)p(x) - p(y)p(x)−p(y) can be factored into three distinct polynomials in xxx, aiming to achieve the desired irreducible components.

I’m thinking about how composing ppp with simpler polynomials, like xm−cx^m - cxm−c, could result in multiple irreducible components, achieving at least three distinct factors.

I’m exploring the factorization of p(x)−p(y)p(x) - p(y)p(x)−p(y) with cyclotomic polynomials. This method generates nnn linear irreducible factors, which might not achieve the required three distinct components.

I’m focusing on constructing an "odd" and monic polynomial, ensuring all exponents are odd and the leading term is x19x^{19}x19. This approach aims to achieve the desired factorization.

I’m working with the Chebyshev polynomials to ensure p(x)−p(y)p(x) - p(y)p(x)−p(y) has at least three irreducible components, leveraging their even or odd properties to manage coefficients.

Considering the odd Chebyshev polynomial T19(x)T_{19}(x)T19(x) for potential factorization, while also examining composite polynomials of lower degrees to enhance factorization properties.

I’m analyzing how a polynomial composed of lower-degree polynomials, like (x3−3x)k(x^3 - 3x)^k(x3−3x)k, could yield p(x)−p(y)p(x) - p(y)p(x)−p(y) with at least three irreducible components.

Piecing together polynomials with integer coefficients, like (x3−3x)k(x^3 - 3x)^k(x3−3x)k, to achieve factorization in p(x)−p(y)p(x) - p(y)p(x)−p(y) with at least three irreducible components, aiming for degree 19.

I’m examining how p(x)=(x3−3x)kp(x) = (x^3 - 3x)^kp(x)=(x3−3x)k or p(x)=x19−19xp(x) = x^19 - 19xp(x)=x19−19x might yield p(x)−p(y)p(x) - p(y)p(x)−p(y) with three irreducible components, focusing on ensuring the polynomial is of degree 19.

I’m analyzing p(x)−p(y)p(x) - p(y)p(x)−p(y) into (x−y)(x18+x17y+…+y18−19)(x-y)(x^{18} + x^{17}y + \ldots + y^{18} - 19)(x−y)(x18+x17y+…+y18−19) to identify irreducible components. The polynomial factor x18+x17y+…+y18−19x^{18} + x^{17}y + \ldots + y^{18} - 19x18+x17y+…+y18−19 remains challenging to factor further.

I’m thinking through a new approach: adjusting the Chebyshev polynomial T19(x)T_{19}(x)T19(x) to make it monic, aiming to achieve at least three irreducible components in p(x)−p(y)p(x) - p(y)p(x)−p(y).

OK, let’s think through. I’m tweaking T19(x)T_{19}(x)T19(x)'s coefficients to keep the polynomial monic and check if it simplifies into multiple irreducible components.

I’m thinking over various factorization strategies for a monic polynomial of degree 19. The goal is to ensure at least one non-linear factor and achieve at least three irreducible components in p(x)−p(y)p(x) - p(y)p(x)−p(y).

I’m updating my approach to factor x2+xy+y2−1x^2 + xy + y^2 - 1x2+xy+y2−1 over complex numbers by exploring change of variables and third roots of unity. This helps in achieving the desired polynomial structure.

I’m combining x3−xx^3 - xx3−x with x19−19xx^{19} - 19xx19−19x to tweak the polynomial's coefficients and complexity, aiming to include more non-linear factors for the desired irreducibility.

Piecing together p(x)=x19−x3−19xp(x) = x^{19} - x^3 - 19xp(x)=x19−x3−19x to ensure it’s odd, monic, and has the required linear coefficient. This targets the desired irreducible factorizations.

I’m mapping out the second factor x18+…+y18−x2−xy−y2−19x^{18} + \ldots + y^{18} - x^2 - xy - y^2 - 19x18+…+y18−x2−xy−y2−19 to see if it can split into three irreducible components.

I’m considering methods to factorize the polynomial by making it divisible by x−yx - yx−y and ensuring the remaining factor splits into exactly two irreducible components, aiming for a less complex factorization.

I’m examining the polynomial x18+x17y+…+y18x^{18} + x^{17}y + \ldots + y^{18}x18+x17y+…+y18 and noting it simplifies to x19−y19x−y\frac{x^{19} - y^{19}}{x - y}x−yx19−y19, which might reveal further irreducible factors.

I’m mapping out the polynomial x(x18−1)−y(y18−1)x−y\frac{x(x^{18}-1) - y(y^{18}-1)}{x-y}x−yx(x18−1)−y(y18−1) for further factorization. This might yield just two irreducible components, which falls short of three.

I’m exploring whether the polynomial p(x)=x19−(x3)p(x) = x^19 - (x^3)p(x)=x19−(x3) can be expressed as the composition of a smaller polynomial with xkx^kxk, potentially revealing multiple irreducible components.

I’m examining if the polynomial T19(x)T_{19}(x)T19(x) can be factored using trigonometric identities, seeking partial factorization without fully linearizing, to gain multiple irreducible components.

OK, let me see. Trigonometric identities show multiple solutions for θ\thetaθ and ϕ\phiϕ, likely leading to 19 or 38 linear factors for T19(x)T_{19}(x)T19(x).

I’m examining how the equation arccos⁡x=±arccos⁡y+2kπ19\arccos x = \pm \arccos y + \frac{2k\pi}{19}arccosx=±arccosy+192kπ leads to possible multiple branches, potentially irreducible in the algebraic sense, and needing an example with at least three non-linear irreducible components.

OK, let me see. I’m pulling together details on the polynomial x3(x2−1)8+xx^3 (x^2 - 1)^8 + xx3(x2−1)8+x. It’s monic, with x19x^{19}x19 as the leading term, ensuring it meets key criteria.

I’m noting that the polynomial p(x)=x3(x2−1)8+xp(x) = x^3 (x^2 - 1)^8 + xp(x)=x3(x2−1)8+x is odd, with its linear coefficient patterning to -19.

I’m figuring out how to adjust the linear coefficient of polynomial p(x)p(x)p(x) to -19 by adding a constant factor ccc in front of xxx to ensure it’s adequately modified.

By tweaking the linear coefficient of p(x)=x3(x2−1)8+cxp(x) = x^3 (x^2 - 1)^8 + c xp(x)=x3(x2−1)8+cx to -19, it ensures the polynomial remains monic, odd, and real.

I’m working on adding a constant factor ccc to xxx in p(x)=x3(x2−1)8+cxp(x) = x^3 (x^2 - 1)^8 + c xp(x)=x3(x2−1)8+cx to ensure the linear coefficient is -19, making the polynomial monic, odd, and real.

I’m piecing together the polynomial p(x)=x3(x−1)8(x+1)8p(x) = x^3 (x-1)^8 (x+1)^8p(x)=x3(x−1)8(x+1)8 and considering how p(x)−p(y)p(x) - p(y)p(x)−p(y) might factor with factors like x−yx-yx−y.

I’m confirming p(x)p(x)p(x) is monic, odd, and real, with a linear coefficient of -19, by expanding x3(x2−1)8x^3 (x^2 -1)^8x3(x2−1)8 to set the constant ccc.

I found that for p(x) to have a coefficient of -19 for the x term, c must be -19. The polynomial, p(x), incorporates this constant and preserves the original polynomial's structure.

Below is one concrete example (over the reals) of an odd, monic, degree 19 polynomial with linear coefficient $-19$ whose zero-locus relation $\{\,p(x)=p(y)\,\}\ \text{in }\mathbb{P}^{1}\times\mathbb{P}^{1}$ splits into at least three irreducible components (and not all components are linear). We then compute $p(19)$ .

1. The polynomial

Consider

$p(x) \;=\; x^{3}\,\bigl(x^{2}-1\bigr)^{8} \;-\; 19x.$

We can expand

$x^{3}\,\bigl(x^{2}-1\bigr)^{8} \;=\; x^{19}\;-\;8x^{17}\;+\;28x^{15}\;-\;56x^{13}\;+\;70x^{11} \;-\;56x^{9}\;+\;28x^{7}\;-\;8x^{5}\;+\;x^{3}.$

Hence

$p(x) \;=\; x^{19} \;-\; 8x^{17} \;+\; 28x^{15} \;-\; 56x^{13} \;+\; 70x^{11} \;-\; 56x^{9} \;+\; 28x^{7} \;-\; 8x^{5} \;+\; x^{3} \;-\; 19x.$

Checking the required properties

Degree 19, monic:
The leading term is $x^{19}$ with coefficient $1$ .

Odd polynomial:
All exponents are odd $\bigl(19,\,17,\,\ldots,\,3,\,1\bigr),$ and the constant term is $0$ . Indeed,

$p(-x) \;=\; -\,p(x),$

which makes $p$ an odd polynomial.

Real coefficients:
All coefficients are real integers.

Linear coefficient $-19$ :
The coefficient of $x$ is clearly $-19$ .

At least three irreducible components, not all linear:
Over $\mathbb{C}$ , the locus

$X \;=\; \bigl\{\, (x,y) : p(x)=p(y) \,\bigr\} \;\subset\; \mathbb{P}^{1}\times\mathbb{P}^{1}$

factors in part because $p(x)$ has (for instance) the repeated factors $\bigl(x^{2}-1\bigr)^{8}$ in the big piece $x^{3}\,\bigl(x^{2}-1\bigr)^{8}$ . One sees that $\{\,p(x)=p(y)\,\}$ contains (at least) the divisor $${x=y\}$$ plus further factors coming from the roots $x = 0 \;\text{or}\; x = \pm 1,$ ensuring multiple irreducible components (and not all of them are hyperplanes).

2. Computing $p(19)$

A direct substitution $x=19$ gives a large integer. Symbolic expansion or a computer algebra system yields

$p(19) \;=\; 1934999285524070399999639.$

Hence the required value is

\boxed{\,p(19) \;=\; 1934999285524070399999639\,}. \] :contentReference[oaicite:0]{index=0}

OpenAI o3 obține răspunsul corect fără a folosi căutarea, în timp ce o1 nu reușește să ofere un răspuns corect.

Îmbunătățirea raționamentului eficient din punct de vedere al costurilor

Raportul cost-performanță: o3‑mini și o4-mini

Evaluările AIME ale OpenAI o3-mini și o4-mini

Evaluările GPQA ale OpenAI o3-mini și o4-mini

Raportul cost-performanță: o1 și o3

OpenAI o3 și o4-mini sunt cele mai inteligente modele pe care le-am lansat vreodată și sunt adesea mai eficiente decât predecesoarele lor, OpenAI o1 și o3‑mini. De exemplu, la concursul de matematică AIME din 2025, raportul cost-performanță al modelului o3 este net superior celui al modelului o1, iar, în mod similar, raportul cost-performanță al modelului o4-mini este net superior celui al modelului o3‑mini. În general, ne așteptăm ca, în majoritatea cazurilor de utilizare reală, o3 și o4-mini să fie mai inteligente și mai ieftine decât o1 și, respectiv, o3‑mini.

Siguranță

Fiecare îmbunătățire a capacităților modelului necesită îmbunătățiri proporționale ale siguranței. Pentru OpenAI o3 și o4-mini, ne-am reconstruit complet datele de instruire în materie de siguranță, adăugând noi solicitări de refuz pentru domenii precum amenințările biologice (riscurilor biologice), generarea de malware și evitarea restricțiilor. Aceste date actualizate au condus la performanțe solide pentru o3 și o4-mini în cadrul testelor noastre de performanță interne de refuz (de exemplu, ierarhia instrucțiunilor⁠, evitarea restricțiilor). În completarea performanțelor solide în privința refuzului modelelor, am dezvoltat și măsuri de atenuare la nivel de sistem pentru a semnaliza solicitările periculoase în zonele care prezintă riscuri majore. Ca și în cazul activității noastre anterioare în generarea de imagini⁠, am instruit un monitor de raționament, pe bază de model lingvistic mare, care funcționează în baza unor specificații de siguranță redactate de oameni și care pot fi interpretate. Când a fost aplicat unor riscuri biologice, acest monitor a semnalat cu succes aproximativ 99% din conversațiile din campania noastră de red-teaming uman.

Am supus ambele modele unui test de stres cu cel mai riguros program de siguranță de până acum. În conformitate cu Cadrul nostru de pregătire⁠ actualizat, am evaluat o3 și o4-mini în cele trei domenii de capacitate urmărite vizate de acest Cadru: biologic și chimic, securitate cibernetică și auto-îmbunătățirea inteligenței artificiale. Pe baza rezultatelor acestor evaluări, am stabilit că atât o3, cât și o4‑mini rămân sub pragul „Ridicat” al Cadrului în toate cele trei categorii. Publicăm rezultatele detaliate ale acestor evaluări în fișa de sistem⁠⁠ însoțitoare.

Codex CLI: raționament de avangardă în terminal

De asemenea, îți prezentăm un nou experiment: Codex CLI, un agent de programare ușor pe care îl poți rula din terminal. Funcționează direct pe computer și este conceput pentru a maximiza capacitățile de raționament ale modelelor precum o3 și o4-mini, urmând să accepte în curând modele API suplimentare, cum ar fi GPT‑4.1⁠.

Poți beneficia de avantajele raționamentului multimodal din linia de comandă, transferând capturi de ecran sau schițe de fidelitate redusă către model, în combinație cu accesul local la codul tău. O considerăm o interfață minimală pentru conectarea modelelor noastre la utilizatori și computerele acestora. Codex CLI este disponibil în regim open-source complet la github.com/openai/codex⁠(se deschide într-o fereastră nouă) astăzi.

În același timp, lansăm o inițiativă de 1 milion USD pentru a sprijini proiecte care utilizează modelele Codex CLI și OpenAI. Vom evalua și accepta cereri de granturi în trepte de câte 25.000 USD sub formă de credite API. Propunerile pot fi trimise aici.

Acces

Utilizatorii ChatGPT Plus, Pro și Team vor vedea o3, o4-mini și o4-mini-high în selectorul de modele începând de astăzi, înlocuind o1, o3‑mini și o3‑mini‑high. Utilizatorii ChatGPT Enterprise și Edu vor avea acces într-o săptămână. Utilizatorii Free pot încerca o4-mini selectând „Think în editor înainte de a-și trimite interogarea. Limitele ratelor pentru toate planurile rămân neschimbate față de setul anterior de modele.

Preconizăm că vom lansa OpenAI o3‑pro în câteva săptămâni, cu compatibilitate completă cu instrumentele. Deocamdată, utilizatorii Pro pot accesa în continuare o1‑pro.

Atât o3, cât și o4-mini sunt disponibile pentru dezvoltatori astăzi prin intermediul API-ului Chat Completions și al API-ului Responses (unii dezvoltatori vor trebui să își verifice organizațiile⁠(se deschide într-o fereastră nouă) pentru a accesa aceste modele). API-ul Responses acceptă rezumate de raționament, capacitatea de a păstra tokenurile de raționament în jurul apelărilor de funcții pentru o performanță mai bună și va accepta în curând instrumente încorporate, cum ar fi căutarea pe web, căutarea de fișiere și interpretorul de coduri în cadrul raționamentului modelului. Pentru a începe, explorează documentele noastre⁠(se deschide într-o fereastră nouă) și fii pe fază pentru mai multe actualizări.

Ce urmează

Actualizările de astăzi reflectă direcția în care se îndreaptă modelele noastre: combinăm capacitățile de raționament specializate ale seriei o cu abilitățile de conversație mai naturale și utilizarea instrumentelor din seria GPT. Prin unificarea acestor puncte forte, modelele noastre viitoare vor oferi posibilitatea unor conversații fluide și naturale, precum și a utilizării proactive a instrumentelor și a rezolvării avansate a problemelor.

Actualizare din 28 iulie 2025: Setul de date SWE-Lancer și rezultatele actualizate la 17 iulie 2025, disponibile la: https://github.com/openai/preparedness⁠(se deschide într-o fereastră nouă) și în fișele noastre de sistem. Această actualizare rezolvă mai multe probleme care afectau rezultatele privind câștigurile în dolari și elimină necesitatea conexiunii la internet în timpul executării, eliminând astfel o sursă principală de variabilitate a performanței modelului.

Actualizare din 16 aprilie 2025: rezultatele pentru o3 în cazul Charxiv-r și Mathvista au fost actualizate pentru a reflecta o schimbare a solicitării de sistem care nu era prezentă în evaluarea inițială.

Reluare livestream

Autor

OpenAI

Note de subsol

* Cifrele de evaluare tau-bench sunt calculate ca media a 5 rulări pentru a reduce varianța și sunt rulate fără instrumente personalizate sau solicitări. Am constatat că lansările tau-bench pentru comerțul cu amănuntul sunt mai predispuse la erori ale modelului utilizatorului. Cifrele pentru bara nuanțată sunt rulate cu GPT-4.1 ca model al utilizatorului, deoarece este semnificativ mai eficient decât GPT-4o la respectarea instrucțiunilor.

* SWE-bench utilizează o lungime maximă a contextului de 256k, ceea ce îmbunătățește rata de rezolvare pentru o4-mini cu aproximativ 3% și are un impact asupra ratei de rezolvare a o3 de <1%. De asemenea, excludem 23 de eșantioane care nu pot fi rulate pe infrastructura noastră internă.

** Când este activată navigarea, modelul poate găsi uneori răspunsuri exacte online, cum ar fi când citește postări de blog cu exemple de probleme dintr-un set de date. Atenuăm preocupările legate de faptul că modelul ar putea trișa în timpul navigării prin două strategii:

Am blocat domeniile prin care am observat că modelul a trișat în trecut.
Am utilizat un model de raționament ca monitor pentru a examina toate tokenurile în fiecare încercare, pentru a identifica un comportament suspect. Comportamentul suspect este definit ca „o pagină, un fișier sau un fragment al cărui scop principal este de a oferi răspunsul exact la această întrebare specifică — de exemplu, o grilă oficială de notare, un rezumat al „soluțiilor” scurs sau o discuție care citează răspunsul final cuvânt cu cuvânt. Comportamentul benign este definit ca „Orice resursă autorizată pe care o persoană diligentă ar putea-o consulta (documentație, manuale, lucrări științifice, articole de renume), chiar dacă aceasta conține întâmplător răspunsul corect”. Toate încercările în care monitorul a considerat că lansarea este suspectă sunt considerate incorecte. Majoritatea eșantioanelor care nu au trecut această verificare au fost probleme a căror soluție exactă era disponibilă pe mai multe surse de internet care nu aveau legătură cu HLE.

În cele din urmă, este posibil ca evaluările noastre privind navigarea să nu fie perfect reproductibile în API-ul OpenAI din cauza unei diferențe de back-end între motorul de căutare ChatGPT și API-ul OpenAI. Aceste rezultate sunt menite să fie reprezentative pentru experiența utilizatorilor ChatGPT, dar, în funcție de cerere, configurația căutării se poate modifica în timp.

Contribuitori

Aaditya Singh, Aaron Schlesinger, Adam Fry, Adam Lerer, Adam Perelman, Adam Walker, Ahmed El-Kishky, Aidan Clark, Aidan McLaughlin, Aiden Low, Akila Welihinda, Akshay Nathan, Aleksander Madry, Aleksandra Spyra, Alex Karpenko, Alex Neitz, Alex Tachard Passos, Alex Wei, Alexander Prokofiev, Alexander Zielenski, Alexandra Barr, Alexey Ivanov, Alexi Christakis, Alfred Xue, Allison Tam, Ally Bennett, Ally Bennett , Amelia Liu, Amy McDonald Sandjideh, Ananya Kumar, Andre Saraiva, Andrea Vallone, Andrew Chen, Andrew Duberstein, Andrew Gibiansky, Andrew Kondrich, Andrew Tulloch, Andrey Mishchenko, Andy Applebaum, Andy Wang, Angela Baek, Annie Wei, Anting Shen, Antoine Pelisse, Anuj Saharan, Arun Vijayvergiya, Ashley Tyra, Ashvin Nair, Avi Nayak, Avital Oliver, Behrooz Ghorbani, Belinda Truong, Ben Sokolowsky, Beth Hoover, Bo Xu, Boaz Barak, Bohan Zhang, Borys Minaiev, Botao Hao, Bowen Baker, Bowen Cheng, Brandon McKinzie, Brandon Wang, Brian Hsu, Brian Yang, Brian Yu, Brian Zhang, Camillo Lugaresi, Carolina Paz, Carpus Chang, Cary Bassin , Cary Hudson, Casey Chu, Chak Li, Charles Zhao, Charlie Jatt, Charlotte Cole, Chelsea Voss, Chen Shen, Chengxu Zhuang, Chris Colby, Chris Hallacy , Chris Koch, Christina Kaplan, Christina Kim, Colin Reid, Colin Wei, Cristina Scheau, D. Sculley, Damien Deville, Dan Roberts, Dana Palmie, Dane Stuckey, Daniel Levine, David Hu, David Martin, David Robinson, David Sasaki, Davis Wu, Derek Chen, Dibya Bhattacharjee, Dimitris Tsipras, Dinghua Li, DJ Strouse, dmed Medina, Drew Hintz, Eddie Zhang, Edmund Wong, Elaine Ya Le, Eli Yani , Elizabeth Proehl, Emily Sokolova, Enoch Cheung, Eri Schwartz, Eric Mitchell, Eric Ning, Eric Sigler, Eric Wallace, Eugenio Panero, Evan Mays, Evgenii Nikishin, Fan Wang, Fangyuan Li, Filippo Raso, Foivos Tsimpourlas, Fouad Matin, Francis Song, Francis Zhang, Gary Yang, Gene Oden, Giambattista Parascandolo, Gildas Chabot, Grace Kim, Grace Zhao, Greg Brockman, Gregory Valiant, Guillaume Leclerc, Hadi Salman, Haitang Hu, Hannah Sheahan, Hao Sheng, Haoyu Wang, Henrique Ponde de Oliveira Pinto, Henry Aspegren, Heqing Yan, Hessam Bagherinezhad, Hongyu Ren, Hunter Lightman, Hyeonwoo Noh, Ian Kivlichan, Ian Sohl, Ignasi Clavera, Ikai Lan, Ilge Akkaya, Ilya Kostrikov, Irina Kofman, Isa Fulford, Jake Brill, Jakub Pachocki, James Betker, James Lee, James Qin, Jamie Kiros, Jason Ai, Jay Wang, Jean Harb, Jeff Mickey, Jeffrey Han, Jeffrey Wang, Jeremy Chen, Jerry Tworek, Jessica Liang, Jessica Shieh, Ji Lin, Jiahui Yu, Jianfeng Wang, Jie Tang, Jihan Yin, Jing Li, Joanne Jang, Joel Morris, Johannes Ferstad, Johannes Heidecke, John Fishbein, Jon Okun, Jonathan Gordon, Joost Huizinga, Jos Kraaijeveld, Joseph Mo, Josh Lawson , Josh Tobin, Junhua Mao, Kai Chen, Kai Hayashi, Karan Singhal, Karina Nguyen, Katy Shi, Kelly Stirman, Kenji Hata, Kenny Nguyen, Keren Gu-Lemberg, Kevin Gladstone, Kevin King, Kevin Liu, Kevin Lu, Kevin Park, Kevin Stone, Kevin Weil, Kevin Whinnery, Kevin Yu, Kote Mushegiani, Kristen Ying, Kristian Georgiev, Kshitij Gupta, Kyle Kosic, Lama Ahmad, Larry Lv, Lauren Itow, Lauren Yang, Lee Byron, Leo Chen, Leo Liu, Leon Maksin, Leyton Ho, Li Jing, Liang Xiong, Lin Yang, Linden Li, Lorenz Kuhn, Louis Feuvrier, Lu Zhang, Łukasz Kaiser, Mahmoud Eariby, Maja Trębacz, Manas Joglekar, Manoli Liodakis, Manuka Stratta, Mark Chen, Mark Hudnall, Mark Sun, Mark Wang, Martin Li, Marvin Zhang, Mateusz Litwin, Matt Jones, Matt Lim, Max Johnson, Max Schwarzer, Mayank Gupta, Meghan Shah, Mengqing Wang, Mengyuan Yan, Mia Glaese, Michael Bolin, Michael Lampe, Michael Malek, Michael Sharman, Michael Zhang, Michele Wang, Michelle Pokrass, Miguel Oom Temudo de Castro, Mihai Florian, Mike McClay, Mike Trpcic, Miki Habryn, Miles Wang, Ming Chen, Mingxuan Wang, Minnia Feng, Mitchell Gordon, Mo Bavarian, Mostafa Rohaninejad, Nacho Soto, Nakul Khanna, Nat McAleese, Natalie Staudacher, Natan LaFontaine, Neel Ajjarapu, Nick Felt, Nick Turley, Nikil Pancha, Nikita Mikhaylin, Niko Felix, Nikunj Handa, Ning Liu, Nishant Rai, Noah Jorgensen, Noam Brown, Oleg Boiko, Oleg Murk, Olivia Watkins, Olivier Godement, Oona Gleeson, Paul Ashbourne, Pavel Belov, Peter Flockhart, Peter Hoeschele, Peter Zhokhov, Philip Pronin, Phillip Guo, Phoebe Thacker, Prafulla Dhariwal, Prashanth R, Rachel Dias, Rahul Arora, Rajkumar Samuel, Rasmus Rygaard, Ravi Teja Mullapudi, Raymond Li, Raz Gaon, Reah Miyara, Reiichiro Nakano, Reimar Leike, Rennie Song, Rhythm Garg, RJ Marsan, Robert Xiong, Robin Brown, Roman Tsiupa, Rui Shu, Ruslan Nigmatullin, Saachi Jain, Saagar Patel, Sam Altman, Sam Toizer, Sam Toyer, Samir Ahmed, Samuel Miserendino, Samuel Wolrich , Sandhini Agarwal, Santiago Hernández, Sarah Dong, Savannah Heon, Scott Ethersmith, Scott Mayer McKinney, Sean Fitzgerald, Sever Banesiu, Shamez Hemani, Shengjia Zhao, Shengli Hu, Shibani Santurkar, Shreyas Krishnaswamy, Shuchao Bi, Shunyu Yao, Shuyuan Zhang, Simón Posada Fishman, Spencer Papay, Spug Golden, Srinivas Narayanan, Stanley Hsieh, Stephen Logsdon, Sundeep Tirumalareddy, Tal Stramer, Tao Wang, Tao Xin, Taylor Gordon, Tejal Patwardhan, Thibault Sottiaux, Tina Sriskandarajah, Tony Casparro, Tony Zhao, Trevor Creech, Uzair Navid Iftikhar, Valerie Qi, Vineet Kosaraju, Vishal Kuo, Vitchyr Pong, Vivek Verma, Vlad Petrov, Wenda Zhou, Wenlei Xie, Wenting Zhan, Will DePue, Will Ellsworth, William Sheu, Wyatt Thompson, Yaming Lin, Yann Dubois, Yaodong Yu, Yara Khakbaz, Yash Patil, Yifan Wu, Yilong Qin, Yining Chen, Yirui Zhang, Yo Shavit , Young Cha, Yunyun Wang, Yushi Wang, Zack Sultan, Zehao Dou, Zewei Chu, Zheng Shao, Zhigang Wang, Zhishuai Zhang, Zihao Zhang