16 April 2025

Memperkenalkan OpenAI o3 dan o4-mini

Model kami yang paling cerdas dan mampu hingga saat ini dengan akses alat bantu lengkap

Memuat…

Diperbarui pada 10 Mei 2025: OpenAI o3‑pro sekarang tersedia bagi pengguna Pro di ChatGPT, serta di API kami. Seperti OpenAI o1‑pro, o3‑pro adalah versi model kami yang paling cerdas, OpenAI o3, yang dirancang untuk berpikir lebih panjang dan memberikan respons yang paling dapat diandalkan. Detail selengkapnya dapat ditemukan di catatan rilis⁠(terbuka di jendela baru) kami.

Hari ini, kami sedang meluncurkan OpenAI o3 dan o4-mini, model terbaru dalam seri o kami yang dilatih untuk berpikir lebih panjang sebelum merespons. Ini adalah model terpintar yang pernah kami luncurkan hingga saat ini, yang mewakili perubahan besar dalam kemampuan ChatGPT bagi semua orang, mulai dari pengguna yang penasaran hingga peneliti lanjutan. Untuk pertama kali, model penalaran kami secara agen dapat menggunakan dan menggabungkan setiap alat bantu dalam ChatGPT—ini termasuk mencari di web, menganalisis file yang diunggah dan data lainnya dengan Python, menalarkan secara mendalam tentang masukan visual, dan bahkan menghasilkan gambar. Yang terpenting, model-model ini dilatih untuk memiliki nalar tentang waktu dan cara menggunakan alat bantu agar menghasilkan jawaban terperinci dan bijaksana dalam format keluaran yang tepat, biasanya dalam waktu kurang dari satu menit, untuk memecahkan masalah yang lebih rumit. Ini mengizinkan mereka untuk menangani pertanyaan banyak aspek secara lebih efektif, langkah menuju ChatGPT yang lebih mendukung agen sehingga secara independen dapat melaksanakan tugas atas nama Anda. Gabungan kekuatan penalaran canggih dengan akses alat bantu lengkap menghasilkan kinerja yang jauh lebih kuat di seluruh tolok ukur akademis dan tugas dunia nyata, sehingga menetapkan standar baru dalam kecerdasan dan kegunaan.

Hal yang berubah

OpenAI o3 merupakan model penalaran kami yang paling kuat sehingga mendorong batas pemrograman, matematika, ilmu pengetahuan, persepsi visual, dan lainnya. Ini menetapkan SOTA baru pada tolok ukur termasuk Codeforces, SWE-bench (tanpa membangun perancah khusus model kustom), dan MMMU. Ideal untuk pertanyaan rumit yang memerlukan analisis banyak aspek dan jawabannya mungkin tidak langsung terlihat jelas. Kinerjanya sangat kuat terutama pada tugas visual seperti menganalisis gambar, bagan, dan grafik. Dalam evaluasi oleh pakar eksternal, o3 membuat 20 persen lebih sedikit kesalahan besar dibandingkan OpenAI o1 pada tugas yang sulit di dunia nyata—terutama unggul dalam bidang seperti pemrograman, bisnis/konsultasi, dan ide kreatif. Penguji awal menyoroti ketelitian analitisnya sebagai mitra berpikir dan menekankan kemampuannya untuk membuat dan mengevaluasi secara kritis hipotesis baru—terutama dalam konteks biologi, matematika, dan rekayasa.

OpenAI o4-mini adalah model lebih kecil yang dioptimalkan untuk penalaran yang cepat dan hemat biaya—itu mencapai kinerja yang luar biasa untuk ukuran dan biayanya, khususnya dalam tugas matematika, pemrograman, dan visual. Ini adalah model tolok ukur dengan kinerja terbaik pada AIME tahun 2024 dan 2025. Meskipun akses ke komputer secara signifikan mengurangi kesulitan ujian AIME, kami juga menemukan bahwa o4-mini mencapai 99,5% lulus@1 (100% konsensus@8) pada AIME tahun 2025 saat diberi akses ke penafsir Python. Meskipun hasil ini tidak dapat dibandingkan dengan kinerja model tanpa akses alat bantu, itu merupakan salah satu contoh seberapa efektif o4-mini memanfaatkan alat bantu yang tersedia; o3 menunjukkan peningkatan serupa pada AIME tahun 2025 dari penggunaan alat bantu (98,4% lulus@1, 100% konsensus@8).

Dalam evaluasi pakar, o4-mini juga mengungguli pendahulunya, o3‑mini, pada tugas non-STEM serta domain seperti ilmu pengetahuan tentang data. Berkat efisiensinya, o4-mini mendukung batasan penggunaan yang jauh lebih tinggi dari o3, sehingga menjadikannya opsi bervolume tinggi dan throughput tinggi yang kuat untuk pertanyaan yang mendapatkan manfaat dari penalaran. Penilai pakar eksternal menilai kedua model menunjukkan peningkatan dalam mengikuti instruksi serta respons yang lebih berguna dan dapat diverifikasi dibandingkan pendahulunya, berkat peningkatan kecerdasan dan pencantuman sumber web. Dibandingkan dengan iterasi model penalaran kami sebelumnya, kedua model ini seharusnya terasa lebih alami dan bersifat percakapan, terutama karena menyebutkan memori dan percakapan di masa lalu untuk membuat respons yang lebih dipersonalisasi dan relevan.

Multimodal

Koding

All SWE-bench evaluation runs use a fixed subset of n=477 verified tasks which have been validated on our internal infrastructure.

Instruksi berikut dan penggunaan alat bantu agen

Semua model dievaluasi pada pengaturan ‘upaya penalaran’ yang tinggi—serupa dengan varian seperti ‘o4-mini-high’ di ChatGPT.

Terus meningkatkan skala pembelajaran penguatan

Di seluruh pengembangan OpenAI o3, kami mengamati bahwa pembelajaran penguatan skala besar menunjukkan tren “lebih banyak komputasi = kinerja lebih baik” yang sama seperti diamati dalam pra-pelatihan seri GPT. Dengan menelusuri kembali jalur peningkatan skala—kali ini dalam RL—kami telah meningkatkan urutan besaran tambahan dalam komputasi pelatihan dan penalaran waktu inferensi, tetapi masih melihat peningkatan kinerja yang jelas, sehingga memvalidasi bahwa kinerja model terus meningkat dan makin banyak model diizinkan untuk berpikir. Pada latensi dan biaya yang sama dengan OpenAI o1, o3 memberikan kinerja yang lebih tinggi di ChatGPT—dan kami telah memvalidasi bahwa jika kami membiarkannya berpikir lebih panjang, kinerjanya terus meningkat.

Kami juga melatih kedua model untuk menggunakan alat bantu melalui pembelajaran penguatan—mengajari mereka bukan hanya cara menggunakan alat bantu, tetapi juga menalarkan tentang waktu penggunaannya. Kemampuan mereka untuk menyebarkan alat bantu didasarkan pada hasil yang diinginkan membuat mereka lebih mampu dalam situasi terbuka—terutama yang melibatkan penalaran visual dan alur kerja banyak langkah. Peningkatan ini tercermin baik dalam tolok ukur akademis maupun tugas dunia nyata, seperti dilaporkan oleh penguji awal.

Berpikir dengan gambar

Untuk pertama kali, model-model ini dapat mengintegrasikan gambar secara langsung ke rantai pemikirannya. Model-model tersebut tidak hanya melihat gambar—tetapi memikirkannya. Ini membuka kelas baru pemecahan masalah yang memadukan penalaran visual dan tekstual, yang tercermin dalam kinerja canggih di seluruh tolok ukur multimodal.

Orang dapat mengunggah foto papan tulis, diagram buku teks, atau sketsa lukisan tangan, dan model dapat menafsirkannya—meskipun gambar buram, terbalik, atau berkualitas rendah. Dengan penggunaan alat bantu, model dapat memanipulasi gambar dengan cepat—memutar, memperbesar, atau mengubahnya sebagai bagian dari proses penalaran.

Model-model ini memberikan keakuratan terbaik di kelasnya pada tugas persepsi visual, sehingga memungkinkannya untuk memecahkan pertanyaan yang sebelumnya tidak dapat dicapai. Kunjungi blog riset penalaran visual⁠⁠ untuk mempelajari selengkapnya.

Menuju penggunaan alat bantu agen

OpenAI o3 dan o4-mini memiliki akses penuh ke alat bantu dalam ChatGPT, serta alat bantu kustom Anda sendiri melalui pemanggilan fungsi dalam API. Model-model ini dilatih untuk memiliki nalar tentang cara memecahkan masalah, memilih waktu dan cara menggunakan alat bantu agar menghasilkan jawaban terperinci dan bijaksana dalam format keluaran yang tepat secara cepat—biasanya dalam waktu kurang dari satu menit.

Misalnya, pengguna dapat bertanya: “Bagaimana penggunaan energi musim panas di California dibandingkan dengan tahun lalu?” Model dapat melakukan pencarian data utilitas publik di web, menulis kode Python untuk membangun perkiraan, membuat grafik atau gambar, dan menjelaskan faktor-faktor utama di balik prediksi, serta menggabungkan beberapa panggilan alat bantu. Penalaran mengizinkan model untuk bereaksi dan berputar sebagaimana dibutuhkan terhadap informasi yang ditemukan. Misalnya, model dapat melakukan pencarian di web beberapa kali dengan bantuan penyedia pencarian, melihat hasilnya, dan mencoba pencarian baru jika membutuhkan informasi selengkapnya.

Pendekatan yang fleksibel dan strategis ini mengizinkan model untuk menangani tugas yang memerlukan akses ke informasi terkini di luar pengetahuan bawaan model, penalaran yang diperluas, sintesis, dan pembuatan keluaran di seluruh modalitas.

Semua contoh diselesaikan dengan OpenAI o3.

OpenAI o3

Solve the following very hard math problem using your in-built knowledge of the literature:

Construct a degree 19 polynomial \ (p(x)) \ in \ mathbb{C}[x] such that \ (X := \ {\, p(x) = p(y) \, \} \ subset \ mathbb{P}^{1} \ times \ mathbb{P}^{1}\ ) has at least 3 (but not all linear) irreducible components over \ mathbb{C}. Choose \ (p(x)\ ) to be odd, monic, have real coefficients and linear coefficient \ (-19\ ) and calculate \ (p(19)\ ).

Bernalar tentang konstruksi polinomial selama 55 detik

The curve defined by p(x) = p(y) factors if p(x) is decomposable or has repeated factors. Actually, p(x)-p(y) always factors, and it’s divisible by (x-y). This gives one factor, and the rest is a degree d-1 polynomial in x and y. For the curve to have at least three irreducible components, p(x)-p(y) must factor into at least three nontrivial factors. Each factor corresponds to a component in projective space, and at least one must be nonlinear.
I’m checking the Dickson polynomials D_n(x,a) and focusing on their coefficients. With a=1, it seems the leading coefficient is always 1, confirming that Dickson polynomials are monic. The linear coefficient for odd n is following a predictable sign pattern: for n=19, it gives a coefficient of -19, which is exactly what I need. So the Dickson polynomial D_n(x,1) with odd n fits nicely with the linear coefficient I was looking for.
I've confirmed that the linear coefficient for p(x)=D19(x)p(x) = D_{19}(x)p(x)=D19(x) is correct, with the necessary scaling factor to match. Now for the next step, I need to compute D19(19)D_{19}(19)D19(19). Since Tn(z)T_n(z)Tn(z) grows quickly for real z>1z > 1z>1, I plan to compute this value using Python, leveraging the recurrence to avoid mistakes—it's going to be a big number. I'll make sure to present the numeric result neatly so it's understandable since the coefficients are integers.
The Dickson polynomial D_{19}(x,1) is confirmed to have the required properties: monic, odd, real coefficients, and a linear coefficient of -19. The factorization of D_{19}(x) into irreducible components is also verified and satisfies the condition of having at least 10 components (1 linear + 9 quadratics). To compute p(19), we'll use the recurrence relation for Dickson polynomials, but there's also a closed-form expression involving cosine that could be handy here. I'll proceed accordingly!
I confirmed the linear coefficient is working correctly, which means now I need to calculate p(19)=D19(19)p(19) = D_{19}(19)p(19)=D19(19). This involves evaluating T19(9.5)T_{19}(9.5)T19(9.5), which grows rapidly. To ensure I get an accurate result, I'll compute this using recurrence in Python. The result is a large number: 1,876,572,071,974,094,803,391,179. I'll use the commas to make it easier to read: p(19)=1,876,572,071,974,094,803,391,179p(19) = 1,876,572,071,974,094,803,391,179p(19)=1,876,572,071,974,094,803,391,179.
For a = 1, there’s a relationship between Dickson polynomials and Chebyshev polynomials: D_n(x, 1) = 2^(n-1) T_n(x/2). Checking this, we see that the definition of D_n(u + 1/u) aligns well with Chebyshev’s formula. By setting x = 2 cos(θ), we find that D_n(x) equals 2 T_n(x/2). Importantly, the leading coefficient works out to 1, confirming the identity holds. This is nice!
Now, I need to verify that p(x)−p(y)p(x) - p(y)p(x)−p(y) factors as desired, relying on the known Dickson polynomial factorization. According to the literature (like Fried and Jarden), the difference Dn(x)−Dn(y)D_n(x) - D_n(y)Dn(x)−Dn(y) factors into a product involving (x−y)(x - y)(x−y) and other expressions. I'll provide the explicit polynomial D19(x,1)D_{19}(x, 1)D19(x,1), list the coefficients, and explain how it satisfies the desired properties: monic, odd, etc. Lastly, I'll compute p(19)p(19)p(19).

Analyzed

Python

1from math import comb, cos, acos
2# Let's compute Dickson D_n(x,a=1) recursively
3def dickson(n,x,a=1):
4    if n==0:
5        return 2
6    if n==1:
7        return x
8    Dm2=2
9    Dm1=x
10    for k in range(2,n+1):
11        D= x*Dm1 - a*Dm2
12        Dm2, Dm1 = Dm1, D
13    return Dm1
14
15d19 = dickson(19,19,1)
16d19

1876572071974094803391179

Analyzed

Python

1d19

1876572071974094803391179

Analyzed

Python

1import locale, sys, math, json, textwrap, re, decimal

Analyzed

Python

1"{:,}".format(d19)

'1,876,572,071,974,094,803,391,179'

Analyzed

Python

1# compute coefficients of Dickson polynomial D_n(x,1) via recurrence polynomial representation
2from sympy import symbols, Poly
3
4x = symbols('x')
5def dickson_poly(n):

Poly(x**19 - 19*x**17 + 152*x**15 - 665*x**13 + 1729*x**11 - 2717*x**9 + 2508*x**7 - 1254*x**5 + 285*x**3 - 19*x, x,

Analyzed

Python

1poly19.as_expr()

x**19 - 19*x**17 + 152*x**15 - 665*x**13 + 1729*x**11 - 2717*x**9 + 2508*x**7 - 1254*x**5 + 285*x**3 - 19*x

Done

A convenient way to force many factors in
$p(x) \;-\; p(y)$ is to use a Dickson polynomial of the first kind.
For a parameter $a \in \mathbb{C}$ in math these are defined by

$D_0\!\left(x,\, a\right) = 2,\; D_1\!\left(x,\, a\right) = x,\; D_n\!\left(x,\, a\right) = x\,D_{n-1}\!\left(x,\, a\right) - a\,D_{n-2}\!\left(x,\, a\right)\quad (n \ge 2),$

and satisfy the functional identity

$D_n\!\left(u + \frac{a}{u},\, a\right) = u^{n} + \frac{a^{n}}{u^{n}}.$

1. Choosing the polynomial

Take $a = 1$ and $n=19$ .
Because $n$ is odd, $D_{19}\!\left(x,\, 1\right)$ is an odd polynomial; the recurrence immediately shows it is monic and has integer (hence real) coefficients.
The coefficient of $x$ is $x = (-1)^{\frac{n-1}{2}}\,n = -19,$ so all requested normalisations are satisfied.

Writing it out gives

$\boxed{% p(x) = D_{19}\!\left(x,1\right) = x^{19} - 19x^{17} + 152x^{15} - 665x^{13} + 1729x^{11} - 2717x^{9} + 2508x^{7} - 1254x^{5} + 285x^{3} - 19x% }\,.$

2. Irreducible components of $fX \;=\; \bigl\{\, p(x) = p(y) \,\bigr\}$

For Dickson polynomials one has the classical factorisation

$D_n\!\left(x,1\right) \;-\; D_n\!\left(y,1\right) \;=\; (x - y)\, \prod_{j=1}^{\frac{n-1}{2}} \Bigl( x^{2} + y^{2} - 2\cos\!\bigl(\tfrac{2\pi j}{n}\bigr)\,xy - 4\sin^{2}\!\bigl(\tfrac{\pi j}{n}\bigr) \Bigr),$

where each quadratic factor is irreducible over $\mathbb{C}$ (see, e.g., Lidl–Niederreiter, Finite Fields, §3.6).
For $n=19$ this gives

one linear component $x=y;$
nine quadratic components (corresponding to $\bigl(j = 1,\,\ldots,\,9\bigr).$

Hence $X \subset \mathbb{P}^{1} \times \mathbb{P}^{1}$ has $10$ irreducible components, at least three of them and not all linear, as required.

3. Evaluating $p(19)$

Using the recurrence (or the identity $D_n\!\left(x,\,1\right) \;=\; 2\,T_n\!\bigl(\tfrac{x}{2}\bigr)$ with Chebyshev $T_n$ one obtains

$p(19) \;=\; D_{19}\!\left(19,\,1\right) \;=\; 1\,876\,572\,071\,974\,094\,803\,391\,179.$

Thus the polynomial above fulfils every condition, and

$\boxed{% p(19) \;=\; 1{,}876{,}572{,}071{,}974{,}094{,}803{,}391{,}179 }.$

OpenAI o1

Solve the following very hard math problem using your in-built knowledge of the literature:

Selesai berpikir selama 1 menit 19 detik

I’m piecing together a degree 19 polynomial with only odd powers and a linear coefficient of -19, like: p(x)=x19+a17x17+…+a1xp(x) = x^{19} + a_{17}x^{17} + \ldots + a_1xp(x)=x19+a17x17+…+a1x.

I'm examining if the polynomial p(x)=x19+a17x17+…+a3x3−19xp(x) = x^{19} + a_{17}x^{17} + \ldots + a_3x^3 - 19xp(x)=x19+a17x17+…+a3x3−19x has a notable classical form, considering symmetry or factorization for multiple irreducible components.

To ensure p(x)p(x)p(x) has three or more irreducible components, I’m considering the factorization of p(x)−p(y)p(x) - p(y)p(x)−p(y) into at least three irreducible factors in C[x,y]\mathbb{C}[x,y]C[x,y].

I'm working through x19−y19x^{19} - y^{19}x19−y19 to ensure it balances linear and nonlinear factors, aiming for a polynomial with at least three irreducible components that aren't all linear.

Taking a closer look at how p(x)−p(y)p(x) - p(y)p(x)−p(y) can be factored into three distinct polynomials in xxx, aiming to achieve the desired irreducible components.

I'm thinking about how composing ppp with simpler polynomials, like xm−cx^m - cxm−c, could result in multiple irreducible components, achieving at least three distinct factors.

I’m exploring the factorization of p(x)−p(y)p(x) - p(y)p(x)−p(y) with cyclotomic polynomials. This method generates nnn linear irreducible factors, which might not achieve the required three distinct components.

I'm focusing on constructing an "odd" and monic polynomial, ensuring all exponents are odd and the leading term is x19x^{19}x19. This approach aims to achieve the desired factorization.

I'm working with the Chebyshev polynomials to ensure p(x)−p(y)p(x) - p(y)p(x)−p(y) has at least three irreducible components, leveraging their even or odd properties to manage coefficients.

Considering the odd Chebyshev polynomial T19(x)T_{19}(x)T19(x) for potential factorization, while also examining composite polynomials of lower degrees to enhance factorization properties.

I'm analyzing how a polynomial composed of lower-degree polynomials, like (x3−3x)k(x^3 - 3x)^k(x3−3x)k, could yield p(x)−p(y)p(x) - p(y)p(x)−p(y) with at least three irreducible components.

Piecing together polynomials with integer coefficients, like (x3−3x)k(x^3 - 3x)^k(x3−3x)k, to achieve factorization in p(x)−p(y)p(x) - p(y)p(x)−p(y) with at least three irreducible components, aiming for degree 19.

I’m examining how p(x)=(x3−3x)kp(x) = (x^3 - 3x)^kp(x)=(x3−3x)k or p(x)=x19−19xp(x) = x^19 - 19xp(x)=x19−19x might yield p(x)−p(y)p(x) - p(y)p(x)−p(y) with three irreducible components, focusing on ensuring the polynomial is of degree 19.

I’m analyzing p(x)−p(y)p(x) - p(y)p(x)−p(y) into (x−y)(x18+x17y+…+y18−19)(x-y)(x^{18} + x^{17}y + \ldots + y^{18} - 19)(x−y)(x18+x17y+…+y18−19) to identify irreducible components. The polynomial factor x18+x17y+…+y18−19x^{18} + x^{17}y + \ldots + y^{18} - 19x18+x17y+…+y18−19 remains challenging to factor further.

I’m thinking through a new approach: adjusting the Chebyshev polynomial T19(x)T_{19}(x)T19(x) to make it monic, aiming to achieve at least three irreducible components in p(x)−p(y)p(x) - p(y)p(x)−p(y).

OK, let's think through. I’m tweaking T19(x)T_{19}(x)T19(x)'s coefficients to keep the polynomial monic and check if it simplifies into multiple irreducible components.

I'm thinking over various factorization strategies for a monic polynomial of degree 19. The goal is to ensure at least one non-linear factor and achieve at least three irreducible components in p(x)−p(y)p(x) - p(y)p(x)−p(y).

I’m updating my approach to factor x2+xy+y2−1x^2 + xy + y^2 - 1x2+xy+y2−1 over complex numbers by exploring change of variables and third roots of unity. This helps in achieving the desired polynomial structure.

I'm combining x3−xx^3 - xx3−x with x19−19xx^{19} - 19xx19−19x to tweak the polynomial's coefficients and complexity, aiming to include more non-linear factors for the desired irreducibility.

Piecing together p(x)=x19−x3−19xp(x) = x^{19} - x^3 - 19xp(x)=x19−x3−19x to ensure it’s odd, monic, and has the required linear coefficient. This targets the desired irreducible factorizations.

I’m mapping out the second factor x18+…+y18−x2−xy−y2−19x^{18} + \ldots + y^{18} - x^2 - xy - y^2 - 19x18+…+y18−x2−xy−y2−19 to see if it can split into three irreducible components.

I’m considering methods to factorize the polynomial by making it divisible by x−yx - yx−y and ensuring the remaining factor splits into exactly two irreducible components, aiming for a less complex factorization.

I’m examining the polynomial x18+x17y+…+y18x^{18} + x^{17}y + \ldots + y^{18}x18+x17y+…+y18 and noting it simplifies to x19−y19x−y\frac{x^{19} - y^{19}}{x - y}x−yx19−y19, which might reveal further irreducible factors.

I’m mapping out the polynomial x(x18−1)−y(y18−1)x−y\frac{x(x^{18}-1) - y(y^{18}-1)}{x-y}x−yx(x18−1)−y(y18−1) for further factorization. This might yield just two irreducible components, which falls short of three.

I’m exploring whether the polynomial p(x)=x19−(x3)p(x) = x^19 - (x^3)p(x)=x19−(x3) can be expressed as the composition of a smaller polynomial with xkx^kxk, potentially revealing multiple irreducible components.

I'm examining if the polynomial T19(x)T_{19}(x)T19(x) can be factored using trigonometric identities, seeking partial factorization without fully linearizing, to gain multiple irreducible components.

OK, let me see. Trigonometric identities show multiple solutions for θ\thetaθ and ϕ\phiϕ, likely leading to 19 or 38 linear factors for T19(x)T_{19}(x)T19(x).

I’m examining how the equation arccos⁡x=±arccos⁡y+2kπ19\arccos x = \pm \arccos y + \frac{2k\pi}{19}arccosx=±arccosy+192kπ leads to possible multiple branches, potentially irreducible in the algebraic sense, and needing an example with at least three non-linear irreducible components.

OK, let me see. I’m pulling together details on the polynomial x3(x2−1)8+xx^3 (x^2 - 1)^8 + xx3(x2−1)8+x. It’s monic, with x19x^{19}x19 as the leading term, ensuring it meets key criteria.

I’m noting that the polynomial p(x)=x3(x2−1)8+xp(x) = x^3 (x^2 - 1)^8 + xp(x)=x3(x2−1)8+x is odd, with its linear coefficient patterning to -19.

I’m figuring out how to adjust the linear coefficient of polynomial p(x)p(x)p(x) to -19 by adding a constant factor ccc in front of xxx to ensure it’s adequately modified.

By tweaking the linear coefficient of p(x)=x3(x2−1)8+cxp(x) = x^3 (x^2 - 1)^8 + c xp(x)=x3(x2−1)8+cx to -19, it ensures the polynomial remains monic, odd, and real.

I’m working on adding a constant factor ccc to xxx in p(x)=x3(x2−1)8+cxp(x) = x^3 (x^2 - 1)^8 + c xp(x)=x3(x2−1)8+cx to ensure the linear coefficient is -19, making the polynomial monic, odd, and real.

I'm piecing together the polynomial p(x)=x3(x−1)8(x+1)8p(x) = x^3 (x-1)^8 (x+1)^8p(x)=x3(x−1)8(x+1)8 and considering how p(x)−p(y)p(x) - p(y)p(x)−p(y) might factor with factors like x−yx-yx−y.

I’m confirming p(x)p(x)p(x) is monic, odd, and real, with a linear coefficient of -19, by expanding x3(x2−1)8x^3 (x^2 -1)^8x3(x2−1)8 to set the constant ccc.

I found that for p(x) to have a coefficient of -19 for the x term, c must be -19. The polynomial, p(x), incorporates this constant and preserves the original polynomial's structure.

Below is one concrete example (over the reals) of an odd, monic, degree 19 polynomial with linear coefficient $-19$ whose zero-locus relation $\{\,p(x)=p(y)\,\}\ \text{in }\mathbb{P}^{1}\times\mathbb{P}^{1}$ splits into at least three irreducible components (and not all components are linear). We then compute $p(19)$ .

1. The polynomial

Consider

$p(x) \;=\; x^{3}\,\bigl(x^{2}-1\bigr)^{8} \;-\; 19x.$

We can expand

$x^{3}\,\bigl(x^{2}-1\bigr)^{8} \;=\; x^{19}\;-\;8x^{17}\;+\;28x^{15}\;-\;56x^{13}\;+\;70x^{11} \;-\;56x^{9}\;+\;28x^{7}\;-\;8x^{5}\;+\;x^{3}.$

Hence

$p(x) \;=\; x^{19} \;-\; 8x^{17} \;+\; 28x^{15} \;-\; 56x^{13} \;+\; 70x^{11} \;-\; 56x^{9} \;+\; 28x^{7} \;-\; 8x^{5} \;+\; x^{3} \;-\; 19x.$

Checking the required properties

Degree 19, monic:
The leading term is $x^{19}$ with coefficient $1$ .

Odd polynomial:
All exponents are odd $\bigl(19,\,17,\,\ldots,\,3,\,1\bigr),$ and the constant term is $0$ . Indeed,

$p(-x) \;=\; -\,p(x),$

which makes $p$ an odd polynomial.

Real coefficients:
All coefficients are real integers.

Linear coefficient $-19$ :
The coefficient of $x$ is clearly $-19$ .

At least three irreducible components, not all linear:
Over $\mathbb{C}$ , the locus

$X \;=\; \bigl\{\, (x,y) : p(x)=p(y) \,\bigr\} \;\subset\; \mathbb{P}^{1}\times\mathbb{P}^{1}$

factors in part because $p(x)$ has (for instance) the repeated factors $\bigl(x^{2}-1\bigr)^{8}$ in the big piece $x^{3}\,\bigl(x^{2}-1\bigr)^{8}$ . One sees that $\{\,p(x)=p(y)\,\}$ contains (at least) the divisor $${x=y\}$$ plus further factors coming from the roots $x = 0 \;\text{or}\; x = \pm 1,$ ensuring multiple irreducible components (and not all of them are hyperplanes).

2. Computing $p(19)$

A direct substitution $x=19$ gives a large integer. Symbolic expansion or a computer algebra system yields

$p(19) \;=\; 1934999285524070399999639.$

Hence the required value is

\boxed{\,p(19) \;=\; 1934999285524070399999639\,}. \] :contentReference[oaicite:0]{index=0}

OpenAI o3 mendapatkan respons yang benar tanpa menggunakan pencarian, sedangkan o1 gagal memberikan respons yang benar.

Mengembangkan penalaran yang hemat biaya

Biaya versus kinerja: o3‑mini dan o4-mini

Evaluasi AIME OpenAI o3-mini dan o4-mini

Evaluasi GPQA OpenAI o3-mini dan o4-mini

Biaya versus kinerja: o1 dan o3

OpenAI o3 dan o4-mini adalah model paling pintar yang pernah kami luncurkan, dan keduanya juga sering kali lebih efisien dibandingkan pendahulunya, OpenAI o1 dan o3‑mini. Misalnya, pada kompetisi matematika AIME tahun 2025, batas biaya-kinerja untuk o3 secara ketat membaik dibandingkan o1, dan demikian pula, batas o4-mini secara ketat membaik dibandingkan o3‑mini. Secara lebih umum, kami perkirakan untuk sebagian besar penggunaan di dunia nyata, o3 dan o4-mini juga akan lebih pintar dan lebih murah dibandingkan o1 dan o3‑mini.

Keselamatan

Setiap peningkatan kemampuan model memerlukan peningkatan yang sepadan pada aspek keselamatan. Untuk OpenAI o3 dan o4-mini, kami sepenuhnya membangun kembali data pelatihan keselamatan kami, menambahkan prompt penolakan baru di bidang seperti ancaman biologis (biorisiko), pembuatan malware, dan jailbreak. Data yang diperbarui ini telah menyebabkan o3 dan o4-mini mencapai kinerja yang kuat pada tolok ukur penolakan internal kami (misalnya, hierarki instruksi⁠⁠⁠, jailbreak). Selain kinerja yang kuat untuk penolakan model, kami juga telah mengembangkan mitigasi tingkat sistem untuk menandai prompt berbahaya di bidang batas risiko. Serupa dengan pekerjaan kami sebelumnya dalam pembuatan gambar⁠, kami melatih pemantauan LLM penalaran yang bekerja dari spesifikasi keselamatan yang ditulis dan dapat ditafsirkan oleh manusia. Saat diterapkan pada biorisiko, pemantauan ini berhasil menandai ~99% percakapan dalam kampanye red-teaming manusia kami.

Kami menguji ketahanan kedua model dengan program keselamatan kami yang paling ketat hingga saat ini. Sesuai dengan Kerangka Kerja Kesiapan⁠, kami yang diperbarui⁠, kami mengevaluasi o3 dan o4-mini di tiga bidang kemampuan yang dilacak dan dicakup oleh Kerangka Kerja: biologi dan kimia, keamanan siber, dan peningkatan diri AI. Didasarkan pada hasil evaluasi ini, kami telah menentukan bahwa o3 dan o4‑mini tetap berada di bawah ambang batas "Tinggi" dari Kerangka Kerja di ketiga kategori. Kami telah memublikasikan hasil terperinci dari evaluasi-evaluasi ini di kartu sistem⁠ terlampir.

Codex CLI: penalaran batas di terminal

Kami juga membagikan eksperimen baru: Codex CLI, agen pemrograman ringan yang dapat Anda jalankan dari terminal Anda. Itu bekerja secara langsung di komputer Anda dan dirancang untuk memaksimalkan kemampuan penalaran dari model seperti o3 dan o4-mini, dengan dukungan mendatang untuk model API tambahan seperti GPT‑4.1⁠.

Anda bisa mendapatkan manfaat penalaran multimodal dari baris perintah dengan meneruskan tangkapan layar atau sketsa fidelitas rendah ke model, yang digabungkan dengan akses ke kode Anda secara lokal. Kami menganggapnya sebagai antarmuka minimal untuk menghubungkan model kami kepada pengguna dan komputer mereka. Codex CLI sepenuhnya merupakan sumber terbuka di github.com/openai/codex⁠(terbuka di jendela baru) saat ini.

Di samping itu, kami meluncurkan inisiatif $1 juta untuk mendukung proyek yang menggunakan model Codex CLI dan OpenAI. Kami akan mengevaluasi dan menerima aplikasi hibah dalam kelipatan $25.000 USD dalam bentuk kredit API. Proposal dapat diserahkan di sini.

Akses

Pengguna ChatGPT Plus, Pro, dan Team akan melihat o3, o4-mini, dan o4-mini-high di pemilih model mulai hari ini, yang menggantikan o1, o3‑mini, dan o3‑mini‑high. Pengguna ChatGPT Enterprise dan Edu akan mendapatkan akses dalam waktu satu minggu. Pengguna gratis dapat mencoba o4-mini dengan memilih 'Pikirkan' di penyusun sebelum menyerahkan pertanyaan mereka. Batas penggunaan di seluruh paket tetap tidak berubah dari rangkaian model sebelumnya.

Kami berharap dapat meluncurkan OpenAI o3‑pro dalam waktu beberapa minggu dengan dukungan alat bantu penuh. Untuk saat ini, pengguna Pro masih dapat mengakses o1‑pro.

Baik o3 maupun o4-mini juga tersedia bagi pengembang saat ini melalui API Penyelesaian Obrolan dan API Respons (beberapa pengembang perlu memverifikasi organisasi mereka⁠(terbuka di jendela baru) untuk mengakses model ini). API Respons mendukung ringkasan penalaran, kemampuan untuk menyimpan token penalaran di sekitar panggilan fungsi untuk kinerja yang lebih baik, dan akan segera mendukung alat bantu bawaan seperti pencarian web, pencarian file, dan penerjemah kode dalam penalaran model. Untuk memulai, jelajahi dokumentasi kami⁠⁠(terbuka di jendela baru) dan nantikan pembaruan lainnya.

Selanjutnya

Pembaruan hari ini mencerminkan arah yang dituju model kami: kami menggabungkan kemampuan penalaran khusus dari seri o dengan lebih banyak kemampuan percakapan alami dan penggunaan alat bantu dari seri GPT. Dengan menyatukan kekuatan-kekuatan ini, model masa depan kami akan mendukung percakapan yang lancar dan alami di samping penggunaan alat bantu yang proaktif dan pemecahan masalah lanjutan.

Pembaruan 16 April: hasil untuk o3 pada Charxiv-r dan Mathvista diperbarui untuk mencerminkan perubahan prompt sistem yang tidak ada dalam evaluasi awal.

Putar ulang streaming langsung

Penulis

OpenAI

Catatan kaki

* angka evaluasi tau-bench dirata-ratakan dalam 5 kali pengujian untuk mengurangi varians, dan dijalankan tanpa alat bantu khusus atau prompt. Kami menemukan peluncuran ritel tau-bench lebih rentan terhadap kesalahan model pengguna. Angka untuk batang berbayang dijalankan dengan GPT-4.1 sebagai model pengguna karena ini secara signifikan lebih baik dari GPT-4o dalam mengikuti instruksi.

* SWE-bench menggunakan panjang konteks maksimal 256 ribu, sehingga meningkatkan tingkat penyelesaian untuk o4-mini sekitar 3% dan memengaruhi tingkat penyelesaian o3 <1%. Kami juga mengecualikan 23 sampel yang tidak dapat dijalankan pada infrastruktur internal kami.

** Saat memungkinkan untuk menjelajah, model kadang-kadang dapat menemukan jawaban yang tepat secara online, misalnya, dengan membaca postingan blog dengan contoh masalah dari kumpulan data. Kami mengurangi masalah kecurangan model saat menjelajah dengan dua strategi:

Domain yang diblokir, yang modelnya selama ini kami lihat curang.
Menggunakan model penalaran sebagai pemantauan untuk memeriksa semua token pada setiap upaya, untuk mengidentifikasi perilaku yang mencurigakan. Perilaku mencurigakan didefinisikan sebagai "halaman, file, atau cuplikan yang tujuan utamanya adalah memberikan jawaban yang tepat untuk pertanyaan tertentu—misalnya, kunci penilaian resmi, inti “solusi” yang bocor, atau pembahasan yang mengutip jawaban akhir kata demi kata." Perilaku baik didefinisikan sebagai "Sumber terpercaya yang dapat dirujuk oleh manusia yang tekun (dokumen, manual, makalah ilmiah, artikel bereputasi baik) meskipun secara kebetulan terdiri atas jawaban yang benar." Upaya apabila pemantauan menganggap peluncuran tersebut mencurigakan akan dihitung sebagai jawaban yang salah. Kebanyakan contoh yang gagal dalam pemeriksaan ini adalah masalah yang solusi pastinya tersedia di berbagai sumber internet yang tidak terkait dengan HLE.

Akhirnya, evaluasi kami dengan menjelajah mungkin tidak dapat direproduksi secara sempurna di OpenAI API karena terdapat perbedaan pada backend mesin pencarian antara ChatGPT dan OpenAI API. Hasil-hasil ini dimaksudkan untuk mewakili pengalaman pengguna ChatGPT, tetapi bergantung pada permintaan, konfigurasi pencarian dapat berubah seiring waktu.

Contributors

Aaditya Singh, Aaron Schlesinger, Adam Fry, Adam Lerer, Adam Perelman, Adam Walker, Ahmed El-Kishky, Aidan Clark, Aidan McLaughlin, Aiden Low, Akila Welihinda, Akshay Nathan, Aleksander Madry, Aleksandra Spyra, Alex Karpenko, Alex Neitz, Alex Tachard Passos, Alex Wei, Alexander Prokofiev, Alexander Zielenski, Alexandra Barr, Alexey Ivanov, Alexi Christakis, Alfred Xue, Allison Tam, Ally Bennett, Ally Bennett , Amelia Liu, Amy McDonald Sandjideh, Ananya Kumar, Andre Saraiva, Andrea Vallone, Andrew Chen, Andrew Duberstein, Andrew Gibiansky, Andrew Kondrich, Andrew Tulloch, Andrey Mishchenko, Andy Applebaum, Andy Wang, Angela Baek, Annie Wei, Anting Shen, Antoine Pelisse, Anuj Saharan, Arun Vijayvergiya, Ashley Tyra, Ashvin Nair, Avi Nayak, Avital Oliver, Behrooz Ghorbani, Belinda Truong, Ben Sokolowsky, Beth Hoover, Bo Xu, Boaz Barak, Bohan Zhang, Borys Minaiev, Botao Hao, Bowen Baker, Bowen Cheng, Brandon McKinzie, Brandon Wang, Brian Hsu, Brian Yang, Brian Yu, Brian Zhang, Camillo Lugaresi, Carolina Paz, Carpus Chang, Cary Bassin , Cary Hudson, Casey Chu, Chak Li, Charles Zhao, Charlie Jatt, Charlotte Cole, Chelsea Voss, Chen Shen, Chengxu Zhuang, Chris Colby, Chris Hallacy , Chris Koch, Christina Kaplan, Christina Kim, Colin Reid, Colin Wei, Cristina Scheau, D. Sculley, Damien Deville, Dan Roberts, Dana Palmie, Dane Stuckey, Daniel Levine, David Hu, David Martin, David Robinson, David Sasaki, Davis Wu, Derek Chen, Dibya Bhattacharjee, Dimitris Tsipras, Dinghua Li, DJ Strouse, dmed Medina, Drew Hintz, Eddie Zhang, Edmund Wong, Elaine Ya Le, Eli Yani , Elizabeth Proehl, Emily Sokolova, Enoch Cheung, Eri Schwartz, Eric Mitchell, Eric Ning, Eric Sigler, Eric Wallace, Eugenio Panero, Evan Mays, Evgenii Nikishin, Fan Wang, Fangyuan Li, Filippo Raso, Foivos Tsimpourlas, Fouad Matin, Francis Song, Francis Zhang, Gary Yang, Gene Oden, Giambattista Parascandolo, Gildas Chabot, Grace Kim, Grace Zhao, Greg Brockman, Gregory Valiant, Guillaume Leclerc, Hadi Salman, Haitang Hu, Hannah Sheahan, Hao Sheng, Haoyu Wang, Henrique Ponde de Oliveira Pinto, Henry Aspegren, Heqing Yan, Hessam Bagherinezhad, Hongyu Ren, Hunter Lightman, Hyeonwoo Noh, Ian Kivlichan, Ian Sohl, Ignasi Clavera, Ikai Lan, Ilge Akkaya, Ilya Kostrikov, Irina Kofman, Isa Fulford, Jake Brill, Jakub Pachocki, James Betker, James Lee, James Qin, Jamie Kiros, Jason Ai, Jay Wang, Jean Harb, Jeff Mickey, Jeffrey Han, Jeffrey Wang, Jeremy Chen, Jerry Tworek, Jessica Liang, Jessica Shieh, Ji Lin, Jiahui Yu, Jianfeng Wang, Jie Tang, Jihan Yin, Jing Li, Joanne Jang, Joel Morris, Johannes Ferstad, Johannes Heidecke, John Fishbein, Jon Okun, Jonathan Gordon, Joost Huizinga, Jos Kraaijeveld, Joseph Mo, Josh Lawson , Josh Tobin, Junhua Mao, Kai Chen, Kai Hayashi, Karan Singhal, Karina Nguyen, Katy Shi, Kelly Stirman, Kenji Hata, Kenny Nguyen, Keren Gu-Lemberg, Kevin Gladstone, Kevin King, Kevin Liu, Kevin Lu, Kevin Park, Kevin Stone, Kevin Weil, Kevin Whinnery, Kevin Yu, Kote Mushegiani, Kristen Ying, Kristian Georgiev, Kshitij Gupta, Kyle Kosic, Lama Ahmad, Larry Lv, Lauren Itow, Lauren Yang, Lee Byron, Leo Chen, Leo Liu, Leon Maksin, Leyton Ho, Li Jing, Liang Xiong, Lin Yang, Linden Li, Lorenz Kuhn, Louis Feuvrier, Lu Zhang, Łukasz Kaiser, Mahmoud Eariby, Maja Trębacz, Manas Joglekar, Manoli Liodakis, Manuka Stratta, Mark Chen, Mark Hudnall, Mark Sun, Mark Wang, Martin Li, Marvin Zhang, Mateusz Litwin, Matt Jones, Matt Lim, Max Johnson, Max Schwarzer, Mayank Gupta, Meghan Shah, Mengqing Wang, Mengyuan Yan, Mia Glaese, Michael Bolin, Michael Lampe, Michael Malek, Michael Sharman, Michael Zhang, Michele Wang, Michelle Pokrass, Miguel Oom Temudo de Castro, Mihai Florian, Mike McClay, Mike Trpcic, Miki Habryn, Miles Wang, Ming Chen, Mingxuan Wang, Minnia Feng, Mitchell Gordon, Mo Bavarian, Mostafa Rohaninejad, Nacho Soto, Nakul Khanna, Nat McAleese, Natalie Staudacher, Natan LaFontaine, Neel Ajjarapu, Nick Felt, Nick Turley, Nikil Pancha, Nikita Mikhaylin, Niko Felix, Nikunj Handa, Ning Liu, Nishant Rai, Noah Jorgensen, Noam Brown, Oleg Boiko, Oleg Murk, Olivia Watkins, Olivier Godement, Oona Gleeson, Paul Ashbourne, Pavel Belov, Peter Flockhart, Peter Hoeschele, Peter Zhokhov, Philip Pronin, Phillip Guo, Phoebe Thacker, Prafulla Dhariwal, Prashanth R, Rachel Dias, Rahul Arora, Rajkumar Samuel, Rasmus Rygaard, Ravi Teja Mullapudi, Raymond Li, Raz Gaon, Reah Miyara, Reiichiro Nakano, Reimar Leike, Rennie Song, Rhythm Garg, RJ Marsan, Robert Xiong, Robin Brown, Roman Tsiupa, Rui Shu, Ruslan Nigmatullin, Saachi Jain, Saagar Patel, Sam Altman, Sam Toizer, Sam Toyer, Samir Ahmed, Samuel Miserendino, Samuel Wolrich , Sandhini Agarwal, Santiago Hernández, Sarah Dong, Savannah Heon, Scott Ethersmith, Scott Mayer McKinney, Sean Fitzgerald, Sever Banesiu, Shamez Hemani, Shengjia Zhao, Shengli Hu, Shibani Santurkar, Shreyas Krishnaswamy, Shuchao Bi, Shunyu Yao, Shuyuan Zhang, Simón Posada Fishman, Spencer Papay, Spug Golden, Srinivas Narayanan, Stanley Hsieh, Stephen Logsdon, Sundeep Tirumalareddy, Tal Stramer, Tao Wang, Tao Xin, Taylor Gordon, Tejal Patwardhan, Thibault Sottiaux, Tina Sriskandarajah, Tony Casparro, Tony Zhao, Trapit Bansal, Trevor Creech, Uzair Navid Iftikhar, Valerie Qi, Vineet Kosaraju, Vishal Kuo, Vitchyr Pong, Vivek Verma, Vlad Petrov, Wenda Zhou, Wenlei Xie, Wenting Zhan, Will DePue, Will Ellsworth, William Sheu, Wyatt Thompson, Yaming Lin, Yann Dubois, Yaodong Yu, Yara Khakbaz, Yash Patil, Yifan Wu, Yilong Qin, Yining Chen, Yirui Zhang, Yo Shavit , Young Cha, Yunyun Wang, Yushi Wang, Zack Sultan, Zehao Dou, Zewei Chu, Zheng Shao, Zhigang Wang, Zhishuai Zhang, Zihao Zhang