OpenAI o3 மற்றும் o4-mini அறிமுகம்.
இன்றுவரை எங்களின் மிகவும் புத்திசாலியும் திறன்மிக்கதும் ஆன மாடல்ஸ்; முழு டூல் ஆக்சஸ் உடன்.
ஜூன் 10, 2025 இல் புதுப்பிக்கப்பட்டது: OpenAI o3‑pro இப்போது ChatGPT மற்றும் எங்கள் API இல் உள்ள Pro பயனர்களுக்கு கிடைக்கிறது. OpenAI o1‑pro வைப் போலவே, o3‑pro என்பது எங்கள் மிகவும் புத்திசாலித்தனமான மாடலான OpenAI o3 இன் பதிப்பாகும், இது நீண்ட நேரம் சிந்தித்து மிகவும் நம்பகமான பதில்களை வழங்குவதற்காக வடிவமைக்கப்பட்டுள்ளது. முழு விவரங்களை எங்கள் வெளியீட்டுக் குறிப்புகளில் (புதிய சாளரத்தில் திறக்கும்)காணலாம்.
இன்று, நாங்கள் OpenAI o3 மற்றும் o4-mini ஐவெளியிடுகிறோம், இது எங்கள் o-சீரிஸ் மாடல்களில் சமீபத்தியது, பதிலளிப்பதற்கு முன் நீண்ட நேரம் சிந்திக்க பயிற்சி அளிக்கப்பட்டது. இவை இதுவரை நாங்கள் வெளியிட்டுள்ள புத்திசாலித்தனமான மாதிரிகள், ஆர்வமுள்ள பயனர்கள் முதல் மேம்பட்ட ஆராய்ச்சியாளர்கள் வரை அனைவருக்கும் ChatGPT இன் திறன்களில் ஒரு படி மாற்றத்தைக் குறிக்கின்றன. முதல் முறையாக, எங்கள் பகுத்தறிவு மாதிரிகள் ChatGPT‑க்குள் உள்ள ஒவ்வொரு கருவியையும் முகவராகப் பயன்படுத்தலாம் மற்றும் இணைக்கலாம் — இதில் வலையில் தேடுதல், பதிவேற்றப்பட்ட கோப்புகள் மற்றும் பிற தரவை Python-ஐப் பயன்படுத்தி பகுப்பாய்வு செய்தல், காட்சி உள்ளீடுகள் பற்றி ஆழமாக பகுத்தறிதல் மற்றும் படங்களை உருவாக்குதல் ஆகியவை அடங்கும். விமர்சன ரீதியாக, இந்த மாதிரிகள் எப்போது,எப்படி கருவிகளைப் பயன்படுத்தி சரியான வெளியீட்டு வடிவங்களில் விரிவான மற்றும் சிந்தனைமிக்க பதில்களை உருவாக்குவது என்பது குறித்து பகுத்தறிய பயிற்சி அளிக்கப்படுகின்றன, பொதுவாக ஒரு நிமிடத்திற்குள், மிகவும் சிக்கலான சிக்கல்களைத் தீர்க்க. இது பல பரிமாண கேள்விகளை மேலும் திறமையாக கையாள அனுமதிக்கிறது, உங்கள் சார்பாக சுயமாக பணிகளை நிறைவேற்றும், மேலும் agentic ChatGPT நோக்கத்திற்கான ஒரு முன்னேற்றம். நவீன ரீசனிங் திறனுடன் முழு கருவி அணுகலை இணைத்த சக்தி கல்வித் தரங்கள் மற்றும் நடைமுறை பணிகளில் குறிப்பிடத்தக்க செயல்திறனை வழங்கி, நுண்ணறிவு மற்றும் பயன்தன்மையில் புதிய தரநிலையை உருவாக்குகிறது.
OpenAI o3 என்பது குறியிடுதல், கணிதம், அறிவியல், காட்சி உணர்தல் மற்றும் பலவற்றில் நவீனத்தைப் புகுத்தும் எங்களுடைய மிகவும் சக்திவாய்ந்த காரணவிளக்கமளித்தல் மாடலாகும். இது Codeforces, SWE-bench (கஸ்டம் மாடல் சார்ந்த சாரக்கட்டு உருவாக்காமல்) மற்றும் MMMU உள்ளிட்ட அளவுகோல்களில் ஒரு புதிய SOTA ஐ அமைக்கிறது. பன்முக பகுப்பாய்வு தேவைப்படும் சிக்கலான கேள்விகளுக்கும், உடனடியாக பதில்கள் வெளிப்படையாகத் தெரியாமல் போகக்கூடிய கேள்விகளுக்கும் இது சிறந்ததாக உள்ளது. இது படங்கள், விளக்கப்படங்கள் மற்றும் கிராபிக்ஸ் பகுப்பாய்வு போன்ற காட்சிப் பணிகளில் மிகவும் வலுவாகச் செயல்படுகிறது. வெளிப்புற நிபுணர்களின் மதிப்பீடுகளில், o3 கடினமான, நிஜ உலகப் பணிகளில் OpenAI o1 ஐ விட 20 சதவீதம் குறைவாகவே பெரிய பிழைகளைச் செய்கிறது, குறிப்பாக புரோகிராமிங், வணிகம்/ஆலோசனை மற்றும் ஆக்கப்பூர்வமான சிந்தனை போன்ற துறைகளில் சிறந்து விளங்குகிறது. ஆரம்பகால சோதனையாளர்கள் ஒரு சிந்தனைக் கூட்டாளியாக அதன் பகுப்பாய்வுக் கடுமையை சுட்டிக்காட்டினர், குறிப்பாக உயிரியல், கணிதம் மற்றும் பொறியியல் சூழல்களுக்குள் புதிய கருத்துக்களை உருவாக்கி விமர்சன ரீதியாக மதிப்பிடும் அதன் திறனை வலியுறுத்தினர்.
OpenAI o4-mini என்பது வேகமான, செலவு குறைந்த காரணவிளக்கமளித்தலுக்கு ஏற்றதாக இருக்கும் ஒரு சிறிய மாடல் ஆகும், இது குறிப்பாக கணிதம், குறியீட்டு முறை மற்றும் காட்சிப் பணிகளில் அதன் அளவு மற்றும் செலவில் குறிப்பிடத்தக்க செயல்திறனை அடைகிறது. இது AIME 2024 மற்றும் 2025 இல் சிறப்பாகச் செயல்படுவதற்குத் தரப்படுத்தப்பட்ட மாடலாகும். கணினியை அணுகுவது AIME தேர்வின் சிரமத்தை குறிப்பிடத்தக்க வகையில் குறைத்தாலும், பைதான் இன்டர்பிரட்டருக்கு அணுகலை வழங்கும்போது o4-mini AIME 2025 இல் 99.5% தேர்ச்சி@1 (100% ஒருமித்த கருத்து@8) பெறுகிறது என்பதையும் நாங்கள் குறிப்பாகக் கண்டறிந்தோம். கருவி அணுகல் இல்லாத மாடல்களின் செயல்திறனுடன் இந்த முடிவுகளை ஒப்பிடக்கூடாது என்றாலும், கிடைக்கக்கூடிய கருவிகளை o4-mini எவ்வளவு திறம்பட பயன்படுத்துகிறது என்பதற்கு இவை ஒரு எடுத்துக்காட்டாகும்; கருவி பயன்பாட்டிலிருந்து AIME 2025 இல் o3 இதே போன்ற மேம்பாடுகளைக் (98.4% pass@1, 100% consensus@8) காட்டுகிறது.
நிபுணர் மதிப்பீடுகளில், STEM அல்லாத பணிகளிலும், தரவு அறிவியல் போன்ற பிரிவு களிலும் o4-mini அதன் முன்னோடியான o3‑mini ஐ விடச் சிறப்பாகச் செயல்படுகிறது. அதன் செயல்திறன் காரணமாக, o3 ஐ விட o4-mini கணிசமான அளவு அதிக பயன்பாட்டு வரம்புகளை ஆதரிக்கிறது, இது காரணவிளக்கமளித்தலிலிருந்து பயனடையும் கேள்விகளுக்கு வலுவான அதிக அளவு, அதிக செயல்திறன் கொண்ட விருப்பமாக அமைகிறது. மேம்பட்ட நுண்ணறிவு மற்றும் சேர்க்கப்பட்ட வலைத்தள ஆதாரங்கள் நிமித்தமாக, இரண்டு மாடல்களும் மேம்பட்ட அறிவுறுத்தல் பின்பற்றலையும், அவற்றின் முன்னோடிகளை விட மிகவும் பயனுள்ள, சரிபார்க்கக்கூடிய பதில்களையும் காட்டுவதாக வெளிப்புற நிபுணர் மதிப்பீட்டாளர்கள் மதிப்பிட்டனர். எங்களுடைய காரணவிளக்கமளித்தல் மாடல்களின் முந்தைய மறு செய்கைகளுடன் ஒப்பிடும்போது, இந்த இரண்டு மாடல்களும் மிகவும் இயல்பானதாகவும் உரையாடல் சார்ந்ததாகவும் உணர வேண்டும், குறிப்பாக அவை நினைவகம் மற்றும் கடந்த கால உரையாடல்களைக் குறிப்பிடுவதால், பதில்களை மிகவும் தனிப்பயனாக்கப்பட்டதாகவும் பொருத்தமானதாகவும் மாற்றுகின்றன.
பலவகைமை
குறியீடாக்கம்
அனைத்து SWE-bench மதிப்பீட்டுச் சோதனைகளும் n=477 என்ற எண்ணிக்கையிலான சரிபார்க்கப்பட்ட பணிகளின் நிலையான துணைக்குழுவைப் பயன்படுத்துகின்றன. இவை எங்கள் உள் கட்டமைப்பில் சரிபார்க்கப்பட்டுள்ளன.
அறிவுறுத்தல்களைப் பின்பற்றுதல் மற்றும் முகமை கருவிப் பயன்பாடு
ChatGPT இல் உள்ள 'o4-mini-high' போன்ற மாறுபாடுகளைப் போலவே அனைத்து மாடல்களும் உயர் 'காரணவிளக்கமளித்தல் முயற்சி' அமைப்புகளில் மதிப்பீடு செய்யப்படுகின்றன.
OpenAI o3 இன் வளர்ச்சி முழுவதும், GPT தொடரின் முன் பயிற்சியில் காணப்பட்ட அதே "அதிக கணக்கீடு = சிறந்த செயல்திறன்" போக்கை பெரிய அளவிலான வலுவூட்டல் கற்றல் வெளிப்படுத்துவதை நாங்கள் கவனித்துள்ளோம். இந்த முறை RL இல் விரிவுபடுத்துதல் முறையை மீண்டும் கண்டுபிடிப்பதன் மூலம், பயிற்சி கணக்கீடு மற்றும் அனுமான நேர காரணவிளக்கமளித்தல் இரண்டிலும் கூடுதல் அளவு வரிசையை நாங்கள் தவிர்த்தோம், ஆனாலும் தெளிவான செயல்திறன் ஆதாயங்களைக் காண்கிறோம், இது மாடல்களை அதிகமாக சிந்திக்க அனுமதிக்கும்போது அவற்றின் செயல்திறனும் தொடர்ந்து மேம்படுவதை உறுதிப்படுத்துகிறது. OpenAI o1 மூலம் சமமான தாமதம் மற்றும் செலவில், o3 ChatGPT இல் அதிக செயல்திறனை வழங்குகிறது, மேலும் நாங்கள் அதை நீண்ட நேரம் சிந்திக்க வைத்தால், அதன் செயல்திறன் தொடர்ந்து உயர்ந்து கொண்டே இருக்கும் என்பதை நாங்கள் உறுதிப்படுத்தியுள்ளோம்.
கருவிகளை எவ்வாறு பயன்படுத்துவது என்பது மட்டுமல்லாமல், அவற்றை எப்போது பயன்படுத்த வேண்டும் என்பது பற்றி சிந்திக்கவும் கற்றுக்கொடுத்து, மீளுறுதிக் கற்றல் மூலம் கருவிகளைப் பயன்படுத்த இரண்டு மாடல்களுக்கும் நாங்கள் பயிற்சி அளித்தோம். விரும்பிய விளைவுகளின் அடிப்படையில் கருவிகளைப் பயன்படுத்துவதற்கான அவற்றின் திறன், திறந்த-முடிவு சூழ்நிலைகளில், குறிப்பாக காட்சி காரணவிளக்கமளித்தல் மற்றும் பல-படி பணிநிலைகளை உள்ளடக்கியவற்றில் அவற்றை மிகவும் திறமையானவையாக மாற்றுகிறது. ஆரம்பகால சோதனையாளர்களால் தெரிவிக்கப்பட்டபடி, இந்த முன்னேற்றமானது கல்வி அளவுகோல்கள் மற்றும் நிஜ உலகப் பணிகளில் பிரதிபலிக்கிறது.

முதல் முறையாக, இந்த மாடல்களால் தங்கள் சிந்தனைச் சங்கிலியிலேயே படங்களை நேரடியாக ஒருங்கிணைக்க முடியும். இவை ஒரு படத்தை பார்ப்பது மட்டுமல்லாமல், அதைப் பற்றி சிந்திக்கின்றன. இது காட்சி மற்றும் உரை சார்ந்த காரணவிளக்கமளித்தலை சேர்க்கும் ஒரு புதிய வகை சிக்கல் தீர்க்கும் முறையை உருவாக்குகிறது, இது மல்டிமாடல் அளவுகோல்களில் அவற்றின் அதிநவீன செயல்திறனில் பிரதிபலிக்கிறது.
ஒரு வெண்பலகைப் புகைப்படம், ஒரு பாடப்புத்தக வரைபடம் அல்லது கையால் வரையப்பட்ட ஓவியத்தை மக்கள் பதிவேற்றலாம், மேலும் படம் மங்கலாக இருந்தாலும், தலைகீழாக இருந்தாலும் அல்லது குறைந்த தரத்தில் இருந்தாலும் கூட மாடலால் அதை விவரிக்க முடியும். கருவிகளைப் பயன்படுத்தி, படங்களைச் சுழற்றுவதன் மூலமாகவோ, பெரிதாக்குவதன் மூலமாகவோ அல்லது அவற்றின் காரணவிளக்கமளித்தல் செயல்முறையின் ஒரு பகுதியாக மாற்றுவதன் மூலமாகவோ மாடல்கள் பல படங்களை உடனடியாகக் கையாள முடியும்.
இந்த மாடல்கள் காட்சியைப் புரிந்துகொள்ளுதல் பணிகளில் சிறந்த துல்லியத்தை வழங்குகின்றன, இது முன்பு கண்டறியப்படாத கேள்விகளுக்குத் தீர்வு காண உதவுகிறது. மேலும் அறிய காட்சி காரணவிளக்கமளித்தல் ஆராய்ச்சி வலைப்பதிவைப் பார்க்கவும்.
OpenAI o3 மற்றும் o4-mini ஆகியவை ChatGPT‑க்குள் உள்ள கருவிகளுக்கான முழு அணுகலைக் கொண்டுள்ளன, மேலும் API-யில் செயல்பாட்டு அழைப்பு வழியாக உங்களுக்கான சொந்த தனிப்பயன் கருவிகளையும் கொண்டுள்ளன. இந்த மாடல்களுக்குப் பொதுவாக ஒரு நிமிடத்திற்குள் சிக்கல்களை எவ்வாறு தீர்ப்பது, எப்போது, எப்படி கருவிகளைப் பயன்படுத்துவது என்பதைத் தேர்ந்தெடுத்து, சரியான வெளியீட்டு வடிவங்களில் விரிவான மற்றும் சிந்தனைமிக்க பதில்களை விரைவாக உருவாக்க பயிற்சி அளிக்கப்படுகின்றன.
உதாரணமாக, "கலிபோர்னியாவில் கோடைகாலத்திற்கான மின்சார பயன்பாடு கடந்த ஆண்டை விட எவ்வாறு இருக்கும்?" என்று ஒரு பயனர் கேட்கலாம். இந்த மாடல் பொது பயன்பாட்டுத் தரவை இணையத்தில் தேடலாம், முன்னறிவிப்பை உருவாக்க பைதான் குறியீட்டை எழுதலாம், ஒரு வரைபடத்தையோ அல்லது படத்தையோ உருவாக்கலாம், மேலும் கணிப்புக்குப் பின்னால் உள்ள முக்கிய காரணிகளை விவரிக்கலாம், பல கருவி அழைப்புகளை ஒன்றாக இணைக்கலாம். தனக்குக் கிடைக்கும் தகவல்களுக்குத் தேவையானபடி மாடல்களை எதிர்வினையாற்றவும் சுழலவும் காரணவிளக்கமளித்தல் அனுமதிக்கிறது. உதாரணமாக, அவர்கள் தேடல் வழங்குநர்களின் உதவியுடன் பலமுறை இணையத்தில் தேடி, முடிவுகளைப் பார்வையிட்டு, கூடுதல் தகவல்கள் தேவைப்பட்டால் புதிய தேடல்களையும் முயற்சிக்கலாம்.
மாடலின் உள்ளமைக்கப்பட்ட அறிவு, நீட்டிக்கப்பட்ட காரணவிளக்கமளித்தல், தொகுப்பு மற்றும் முறைகள் முழுவதும் வெளியீட்டு உருவாக்கம் ஆகியவற்றைத் தாண்டி, புதுப்பிக்கப்பட்ட தகவல்களை அணுக வேண்டிய பணிகளைச் சமாளிக்க இந்த நெகிழ்வான, மூலோபாய அணுகுமுறையானது மாடல்களை அனுமதிக்கிறது.
OpenAI o3 மூலம் அனைத்து உதாரணங்களும் முடிக்கப்பட்டன.
OpenAI o3
OpenAI o1
தேடலைப் பயன்படுத்தாமலேயே OpenAI o3 சரியான பதிலை வழங்குகிறது, அதே நேரத்தில் o1 சரியான பதிலை வழங்கத் தவறிவிடுகிறது.
செலவு குறைந்த காரணவிளக்கமளித்தலை மேம்படுத்துதல்
செலவு மற்றும் செயல்திறன் ஒப்பீடு: o3‑mini மற்றும் o4-mini


செலவு மற்றும் செயல்திறன் ஒப்பீடு: o1 மற்றும் o3


நாங்கள் இதுவரை வெளியிட்ட மாடல்களில் OpenAI o3 மற்றும் o4-mini ஆகியவை மிகவும் புத்திசாலித்தனமானவையாகும், மேலும் இவை பெரும்பாலும் இவற்றின் முன்னோடிகளான OpenAI o1 மற்றும் o3‑mini ஐ விட அதிக செயல்திறன் கொண்டவையாக உள்ளன. எடுத்துக்காட்டாக, 2025 AIME கணிதப் போட்டியில், o3 க்கான செலவு சார்ந்த செயல்திறன் வரம்பானது o1 ஐ விட கடுமையாக மேம்படுகிறது, அதேபோல், o4-mini இன் வரம்பானது o3‑mini ஐ விட கடுமையாக மேம்படுகிறது. பொதுவாக, பெரும்பாலான நிஜ உலக பயன்பாட்டில், o3 மற்றும் o4-mini ஆகியவை முறையே o1 மற்றும் o3‑mini ஐ விட புத்திசாலித்தனமாகவும் மலிவாகவும் இருக்கும் என்று நாங்கள் எதிர்பார்க்கிறோம்.
மாடலின் திறன்களில் ஏற்படும் ஒவ்வொரு முன்னேற்றமும் பாதுகாப்பிற்கான முன்னேற்றங்களுக்கு உத்தரவாதம் அளிக்கிறது. OpenAI o3 மற்றும் o4-mini ஆகியவற்றிற்காக, உயிரியல் அச்சுறுத்தல்கள் (பயோரிஸ்க்), தீயவற்றை உருவாக்குதல் மற்றும் ஜெயில்பிரேக்குகள் போன்ற பகுதிகளில் புதிய மறுப்புப் ப்ராம்ட்களைச் சேர்த்து, எங்கள் பாதுகாப்புப் பயிற்சித் தரவை நாங்கள் முழுமையாக மீண்டும் உருவாக்கியுள்ளோம். இந்தப் புதுப்பிக்கப்பட்ட தரவானது எங்கள் உள்ளக மறுப்பு அளவுகோல்களில் (எ.கா., அறிவுறுத்தல் படிநிலை, ஜெயில்பிரேக்குகள்) o3 மற்றும் o4-mini ஆகியவற்றை வலுவான செயல்திறனை அடைய வைத்தது. மாடலின் மறுப்புகளுக்கான வலுவான செயல்திறன் தவிர, முக்கியமான ஆபத்துப் பகுதிகளில் ஆபத்தான தூண்டுதல்களைக் குறைப்பதற்கான அமைப்பு அளவிலான தீர்வுகளையும் நாங்கள் உருவாக்கியுள்ளோம். எங்களுடைய முந்தைய பட உருவாக்கப் பணியைப் போலவே, மனிதனால் எழுதப்பட்டு விளக்கப்படக்கூடிய பாதுகாப்பு விவரக்குறிப்புகளில் செயல்படும் ஒரு காரணவிளக்கமளித்தல் LLM மானிட்டருக்கு நாங்கள் பயிற்சி அளித்தோம். பயோரிஸ்க்கைப் பொருத்தவரையில், எங்கள் மனித சிவப்புக் குழுப் பிரச்சாரத்தில் ~99% உரையாடல்களை இந்த மானிட்டர் வெற்றிகரமாக வெளியிடுகிறது.
இதுவரையிலும் நாங்கள் மேற்கொண்ட மிகவும் கடுமையான பாதுகாப்புத் திட்டத்தையும் பயன்படுத்தி இரண்டு மாடல்களையும் சோதித்தோம். எங்கள் புதுப்பிக்கப்பட்ட தயார்நிலை கட்டமைப்புக்கு ஏற்ப, கட்டமைப்பை உள்ளடக்கிய உயிரியல் மற்றும் வேதியியல், சைபர் பாதுகாப்பு மற்றும் AI சுய முன்னேற்றம் ஆகிய மூன்று கண்காணிக்கப்பட்ட திறன் பகுதிகளில் o3 மற்றும் o4-mini ஐ மதிப்பீடு செய்தோம். இந்த மதிப்பீடுகளின் முடிவுகளின் அடிப்படையில், மூன்று வகைகளிலும் o3 மற்றும் o4‑mini இரண்டும் கட்டமைப்பின் "உயர்" வரம்பிற்குக் கீழே இருப்பதை நாங்கள் கண்டறிந்துள்ளோம். அதனுடன் வரும் சிஸ்டம் கார்டில்இந்த மதிப்பீடுகளில் கிடைத்த விரிவான முடிவுகளை வெளியிட்டுள்ளோம்.
உங்கள் முனையத்திலிருந்து இயக்கக்கூடிய இலகுரக குறியீட்டு ஏஜன்டான Codex CLI என்ற ஒரு புதிய பரிசோதனையையும் நாங்கள் பகிர்ந்து கொள்கிறோம். இது உங்கள் கணினியில் நேரடியாக வேலை செய்கிறது மற்றும் GPT‑4.1 போன்ற கூடுதல் API மாடல்களில் வரவிருக்கும் ஆதரவுடன் o3 மற்றும் o4-mini போன்ற மாடல்களின் காரணவிளக்கமளித்தல் திறன்களை அதிகப்படுத்தும் வகையில் வடிவமைக்கப்பட்டுள்ளது.
உங்கள் குறியீட்டை உள்ளுக்குள்ளேயே அணுகுவதோடு, ஸ்கிரீன்ஷாட்கள் அல்லது குறைந்த நம்பகத்தன்மையான வரைபடங்களை மாடலுக்கு அனுப்புவதன் மூலம் கட்டளை வரியிலிருந்து மல்டிமாடல் காரணவிளக்கமளித்தல் நன்மைகளை நீங்கள் பெறலாம். எங்கள் மாடல்களை பயனர்களுடனும் அவர்களுடைய கணினிகளுடனும் இணைப்பதற்கான குறைந்தபட்ச இடைமுகமாக நாங்கள் இதை நினைக்கிறோம். Codex CLI இன்று github.com/openai/codex(புதிய சாளரத்தில் திறக்கும்) இல் முழுவதும் பொதுவில் பயன்படுத்துவதற்காக உள்ளது.
இதனுடன், Codex CLI மற்றும் OpenAI மாடல்களைப் பயன்படுத்தும் திட்டங்களுக்கு ஆதரவளிப்பதற்காக $1 மில்லியன் டாலர் திட்டத்தை நாங்கள் துவங்குகிறோம். நாங்கள் மானியங்களுக்கான விண்ணப்பங்களை API கிரெடிட்கள் வடிவில் $25,000 USD என்ற அதிகரிப்புகளில் மதிப்பீடு செய்து ஏற்றுக்கொள்வோம். முன்மொழிவுகளை இங்கே சமர்ப்பிக்கலாம்.
இன்று முதல் ChatGPT Plus, Pro மற்றும் Team பயனர்கள் மாடல் செலக்டரில் o3, o4-mini மற்றும் o4-mini-high ஆகியவற்றைப் பார்ப்பார்கள், இவை o1, o3‑mini மற்றும் o3‑mini‑high ஆகியவற்றிற்குப் பதிலாக இருக்கும். ஒரு வாரத்திற்குள் ChatGPT Enterprise மற்றும் Edu பயனர்களுக்கு அணுகல் வழங்கப்படும். Free பயனர்கள் தங்களது கேள்வியை அனுப்புவதற்கு முன் கம்போசரில் 'Think' என்பதைத் தேர்வு செய்து o4-mini ஐப் பயன்படுத்தலாம். அனைத்துத் திட்டங்களிலும் வரம்பு விகிதங்கள் முந்தைய மாடல்களின் தொகுப்பைப் போலவே மாற்றமின்றி தொடர்கின்றன.
சில வாரங்களில் முழு கருவி ஆதாரவுடன் OpenAI o3‑pro ஐ வெளியிடுவோம் என்று எதிர்பார்க்கிறோம். தற்போதைக்கு, Pro பயனர்கள் o1‑pro ஐ இன்னும் அணுகலாம்.
o3 மற்றும் o4-mini இரண்டும் இன்று உருவாக்குபவர்களுக்கு Chat Completions API மற்றும் Responses API வழியாகக் கிடைக்கின்றன (சில உருவாக்குபவர்கள் இந்த மாடல்களை அணுக தங்கள் நிறுவனங்களைச் சரிபார்க்க(புதிய சாளரத்தில் திறக்கும்) வேண்டும்). Response API காரணவிளக்கமளித்தல் சுருக்கங்களை ஆதரிக்கிறது, செயல்பாட்டைப் பற்றிய காரணவிளக்கமளித்தல் டோக்கன்களைப் பாதுகாக்கும் திறனுக்கு சிறந்த செயல்திறன் தேவைப்படுகிறது, மேலும் மாடலின் காரணவிளக்கமளித்தலுக்குள் வலைத் தேடல், கோப்பு தேடல் மற்றும் குறியீடு மொழிபெயர்ப்பாளர் போன்ற உள்ளமைக்கப்பட்ட கருவிகளை விரைவில் ஆதரிக்கும். ஆரம்பிப்பதற்கு, எங்கள் ஆவணங்களை ஆய்வு செய்துவிட்டு(புதிய சாளரத்தில் திறக்கும்) அதிக புதுப்பிப்புகளுக்காக காத்திருங்கள்.
இன்றைய புதுப்பிப்புகள் எங்கள் மாடல்கள் செல்லும் திசையைப் பிரதிபலிக்கின்றன: GPT தொடரின் இயல்பான உரையாடல் திறன்கள் மற்றும் கருவி பயன்பாடு ஆகியவற்றுடன் o-தொடரின் சிறப்பு காரணவிளக்கமளித்தல் திறன்களை நாங்கள் ஒருங்கிணைக்கிறோம். இந்த பலங்களை ஒன்றிணைப்பதன் மூலம், முன்னெச்சரிக்கை கருவி பயன்பாடு மற்றும் மேம்பட்ட சிக்கல் தீர்க்கும் முறை மூலம் தடையற்ற, இயல்பான உரையாடல்களை எங்கள் எதிர்கால மாடல்கள் ஆதரிக்கும்.
ஜூலை 28, 2025 அன்று புதுப்பிக்கப்பட்டது: SWE-Lancer தரவுத்தொகுப்பு மற்றும் முடிவுகள் ஜூலை 17, 2025 அன்று புதுப்பிக்கப்பட்டன, https://github.com/openai/preparedness(புதிய சாளரத்தில் திறக்கும்)என்ற முகவரியிலும் எங்கள் சிஸ்டம் கார்டுகளிலும் இவை கிடைக்கின்றன. இந்தப் புதுப்பிப்பு டாலர்கள் சம்பாதித்த முடிவுகளைப் பாதித்த பல பிரச்சனைகளைத் தீர்க்கிறது மற்றும் செயல்படுத்தும் போது இணைய இணைப்புக்கான தேவையை நீக்குகிறது, இது மாடலின் செயல்திறனில் உள்ள மாறுபாட்டின் முதன்மை ஆதாரத்தை நீக்குகிறது.
ஏப்ரல் 16, 2025 அன்று புதுப்பிக்கப்பட்டது: Charxiv-r மற்றும் Mathvista இல் o3 க்கான முடிவுகள் உண்மையான மதிப்பீட்டில் இல்லாத ஒரு சிஸ்டம் ப்ராம்ட் மாற்றத்தை பிரதிபலிக்கும் வகையில் புதுப்பிக்கப்பட்டன.
ஆசிரியர்
அடிக்குறிப்புகள்
* மாறுபாட்டைக் குறைக்க டௌ-பெஞ்ச் மதிப்பீட்டு எண்கள் 5 முறை இயக்கப்பட்டு சராசரியாகக் கணக்கிடப்படுகின்றன, மேலும் அவை எந்தத் தனிப்பயன் கருவிகளோ அல்லது தூண்டுதலோ இல்லாமல் இயக்கப்படுகின்றன. டௌ-பெஞ்ச் சில்லறை வெளியீடுகள் பயனர் மாடல் பிழைகளுக்கு அதிகமாக உட்படுகின்றன என்பதை நாங்கள் கண்டறிந்தோம். நிறமிடப்பட்ட பட்டைக்கான எண்கள் GPT-4.1 பயனர் மாடலாக இயக்கப்படுகின்றன, ஏனென்றால் இது அறிவுறுத்தல்களைப் பின்பற்றுவதில் GPT-4o ஐ விட குறிப்பிடத்தக்க அளவு சிறந்ததாக விளங்குகிறது.
* SWE-பெஞ்ச் 256k அதிகபட்ச சூழல் நீளத்தைப் பயன்படுத்துகிறது, இது o4-mini க்கான தீர்வு விகிதத்தை சுமார் 3% மேம்படுத்துகிறது மற்றும் o3 இன் தீர்வு விகிதத்தை <1% என்ற அளவிற்குப் பாதிக்கிறது. நாங்கள் எங்கள் உள்ளக உள்கட்டமைப்பில் செயல்பட முடியாத 23 மாடல்களையும் நீக்குகிறோம்.
** உலாவியை இயக்கும்போது, எடுத்துக்காட்டாக, தரவுத்தொகுப்பிலிருந்து மாதிரி பிரச்சனைகளைக் கொண்ட வலைப்பதிவிலுள்ள பதில்களைப் படிப்பதன் மூலம மாடல் சில நேரங்களில் ஆன்லைனில் சரியான பதில்களைக் கண்டறியக்கூடும். இரண்டு உத்திகளைப் பயன்படுத்தி ப்ரவுஸிங் செய்யும்போது மாடலின் மோசடி குறித்த பிரச்சனைகளை நாங்கள் தீர்க்கிறோம்:
கடந்த காலத்தில் மாடல் மோசடி செய்வதை நாங்கள் கவனித்து தடை செய்த களங்கள்.
சந்தேகத்திற்கிடமான நடத்தையைக் கண்டறிய, ஒவ்வொரு முயற்சியிலும் அனைத்து டோக்கன்களையும் ஆய்வு செய்ய ஒரு கண்காணிப்பாளராக ஒரு காரணவிளக்கமளித்தல் மாடலைப் பயன்படுத்தியது. சந்தேகத்திற்கிடமான நடத்தை என்பது "இந்தக் குறிப்பிட்ட கேள்விக்கு சரியான பதிலை வழங்குவதே முக்கிய நோக்கமாக இருக்கும் ஒரு பக்கம், கோப்பு அல்லது துணுக்கு" என்று வரையறுக்கப்படுகிறது - எ.கா., அதிகாரப்பூர்வ தரப்படுத்தல் விசை, கசிந்த "தீர்வுகள்" சுருக்கம் அல்லது முடிக்கப்பட்ட பதிலை வார்த்தைகளில் மேற்கோள் காட்டிய விவாதம்." தற்செயலாக சரியான பதிலைக் கொண்டிருந்தாலும் கூட "ஒரு விடாமுயற்சியுள்ள மனிதன் ஆலோசிக்கக்கூடிய எந்தவொரு அதிகாரப்பூர்வ ஆதாரமும் (ஆவணங்கள், கையேடுகள், அறிவார்ந்த ஆவணங்கள், புகழ்பெற்ற கட்டுரைகள்)" தீங்கற்ற நடத்தை என்று வரையறுக்கப்படுகிறது. கண்காணிப்பு வெளியீட்டை சந்தேகத்திற்குரியதாகக் கருதும் எந்தவொரு முயற்சியும் தவறானதாகக் கணக்கிடப்படும். இந்தச் சரிபார்ப்பால் தோல்வியடைந்த பெரும்பாலான மாடல்கள் HLE உடன்தொடர்பில்லாதபல இணைய ஆதாரங்களில் சரியான தீர்வு கிடைத்த பிரச்சனைகளாகும்.
கடைசியாக, ChatGPT மற்றும் OpenAI API இடையிலான தேடுபொறி பின்புலங்களில் உள்ள வேறுபாடு காரணமாக, OpenAI API இல் ப்ரவுஸிங் சம்பந்தமான எங்கள் மதிப்பீடுகள் முழுமையாக மீண்டும் உருவாக்கப்படாமல் போகலாம். ChatGPT பயனர் அனுபவத்தையே இந்த முடிவுகள் பிரதிநிதித்துவப்படுத்தும் நோக்கம் கொண்டுள்ளன, ஆனால் தேவையைப் பொறுத்து, காலப்போக்கில் தேடல் உள்கட்டமைப்பு மாறக்கூடும்.
பங்களிப்பாளர்கள்
ஆதித்யா சிங், ஆரோன் ஷ்லெசிங்கர், ஆடம் ஃப்ரை, ஆடம் லெரர், ஆடம் பெரல்மேன், ஆடம் வாக்கர், அகமது எல்-கிஷ்கி, எய்டன் கிளார்க், எய்டன் மெக்லாலின், எய்டன் லோ, அகிலா வெலிஹிந்தா, அக்ஷய் நாதன், அலெக்ஸாண்டர் மாட்ரி, அலெக்சாண்ட்ரா ஸ்பைரா, அலெக்ஸ் கார்பென்கோ, அலெக்ஸ் நீட்ஸ், அலெக்ஸ் டச்சர்ட் பாஸோஸ், அலெக்ஸ் வெய், அலெக்சாண்டர் ப்ரோகோஃபீவ், அலெக்சாண்டர் ஜீலென்ஸ்கி, அலெக்ஸாண்ட்ரா பார், அலெக்ஸி இவனோவ், அலெக்ஸி கிறிஸ்டாகீஸ், ஆல்ஃபிரட் ஸூ, அலிசன் டாம், அல்லி பென்னட், அல்லி பென்னட், அமெலியா லியு, ஏமி மெக்டொனால்ட் சாண்ட்ஜிதே, அனன்யா குமார், ஆண்ட்ரே சரெய்வா, ஆண்ட்ரியா வல்லோன், ஆண்ட்ரூ சென், ஆண்ட்ரூ டூபர்ஸ்டைன், ஆண்ட்ரூ கிபியன்ஸ்கி, ஆண்ட்ரூ கொண்ட்ரிச், ஆண்ட்ரூ துல்லோச், ஆண்ட்ரே மிஷ்செங்கோ, ஆண்டி ஆப்பிள்பாம், ஆண்டி வாங், ஏஞ்சலா பேக், ஆனி வெய், அண்டிங் ஷென், அன்டாயின் பெலிஸ்ஸே, அனுஜ் சஹாரன், அருண் விஜயவர்ஜியா, ஆஷ்லி டைரா, அஷ்வின் நாயர், அவி நாயக், அவிட்டல் ஆலிவர், பெஹ்ரூஸ் கோர்பானி, பெலிண்டா ட்ரூங், பென் சொகொலவ்ஸ்கி, பெத் ஹூவர், போ ஸு, போவாஸ் பராக், போஹன் ஸாங், போரிஸ் மினாவிவ், போடாவோ ஹாவோ, போவன் பேக்கர், போவன் செங், பிராண்டன் மெக்கின்ஸி, பிராண்டன் வாங், பிரையன் ஹ்ஸு, பிரையன் யாங், பிரையன் யு, பிரையன் ஸாங், கமில்லோ லுகரேஸி, கரோலினா பாஸ், கார்பஸ் சாங், கேரி பாஸின், கேரி ஹட்சன், கேஸி சூ, சாக் லி, சார்லஸ் ஸாவோ, சார்லி ஜாட், சார்லோட் கோல், செல்சியா வோஸ், சென் ஷென், செங்ஸு ஸ்வாங்க், கிறிஸ் கோல்பி, கிறிஸ் ஹால்லசி, கிறிஸ் கோச், கிறிஸ்டினா ன், கிறிஸ்டினா கிம், காலின் ரீட், காலின் வெய், கிறிஸ்டினா ஸ்கோ, டி. ஸ்கல்லே, டேமியன் டெவில்லே, டான் ராபர்ட்ஸ், டானா பால்மி, டேனி ஸ்டக், டேனியல் லெவின், டேவிட் ஹு, டேவிட் மார்ட்டின், டேவிட் ராபின்சன், டேவிட் சசாகி, டேவிஸ் வு, டெரெக் சென், திப்யா பட்டாச்சார்ஜி, டிமிட்ரிஸ் ஸிப்ராஸ், டிங்ஹுவா லி, டி.ஜே. ஸ்ட்ரௌஸ், டிமட் மெதினா, ட்ரூ ஹின்ட்ஸ், எடி ஸாங், எட்மண்ட் வோங், எலைன் யா லெ, எலி யானி, எலிசபெத் ப்ரொஹல், எமிலி சொகொலோவா, ஏனோக் சியுங், எரி ஷுவார்ட்ஸ், எரிக் மிட்செல், எரிக் நிங், எரிக் சிக்லர், எரிக் வாலஸ், யூஜெனியோ பனேரோ, எவன் மேஸ், எவ்ஜெனி நிகிஷின், ஃபேன் வாங், ஃபாங்யுவான் லி, ஃபிலிப்போ ரசோ, ஃபாயிவோஸ் சிம்பூர்லாஸ், ஃபோவாட் மாட்டின், ஃபிரான்சிஸ் சாங், ஃபிரான்சிஸ் ஸாங், கேரி யாங், ஜீன் ஓடன், ஜியாம்பட்டிஸ்டா பரஸ்காண்டோலோ, கில்டாஸ் சாபோட், கிரேஸ் கிம், கிரேஸ் ஸாவோ, கிரெக் ப்ராக்மன், கிரிகரி வேலியன்ட், கில்லாமே லெக்லெர்க், ஹாடி சல்மான், ஹைடாங் ஹு, ஹன்னா ஷீஹான், ஹாவோ ஷெங், ஹாயு வாங், ஹென்ரிக் போண்டே டி ஒலிவேரா பின்டோ, ஹென்றி அஸ்பெக்ரென், ஹெகிங் யான், ஹெஸ்ஸம் பாக்ஹெரினெஜாத், ஹொங்யு ரென், ஹன்டர் லைட்மேன், ஹியோன்வூ நோ, இயான் கிவ்லிச்சான், இயான் சோல், இக்னாஸி கிளேவரா, இகாய் லான், இலே அக்காக்யா, இல்யா கோஸ்ட்ரிகோவ், இரினா கோஃப்மேன், இசா ஃபுல்ஃபோர்ட், ஜேக் பிரில், ஜாகூப் பச்சோக்கி, ஜேம்ஸ் பெட்கர், ஜேம்ஸ் லீ, ஜேம்ஸ் சின், ஜேமி கிரோஸ், ஜேசன் ஏஐ, ஜே வாங், ஜீன் ஹார்ப், ஜெஃப் மிக்கி, ஜெஃப்ரி ஹான், ஜெஃப்ரி வாங், ஜெரமி சென், ஜெர்ரி ட்வோரெக், ஜெசிகா லியாங், ஜெசிகா ஷிஹ், ஜி லின், ஜியாஹுய் யு, ஜியான்ஃபெங் வாங், ஜீ டாங், ஜிஹான் யின், ஜிங் லி, ஜோவான் ஜாங், ஜோயல் மோரிஸ், ஜோஹன்னஸ் ஃபெர்ஸ்டாட், ஜோஹன்னஸ் ஹிடெக், ஜான் ஃபிஷ்பைன், ஜான் ஓகுன், ஜொனாதன் கோர்டன், ஜூஸ்ட் ஹுயிஸிங்கா, ஜோஸ் கிராய்ஜெவெல்ட், ஜோசப் மோ, ஜோஷ் லாஸன், ஜோஷ் டோபின், ஜுன்ஹுவா மாவோ, கை சென், கை ஹயாஷி, கரன் சின்ஹால், கரினா நகுயென், கேட்டி ஷி, கெல்லி ஸ்டிர்மேன், கென்ஜி ஹட்டா, கென்னி நகுயென், கெரென் கு-லெம்பர்க், கெவின் கிளாட்ஸ்டோன், கெவின் கிங், கெவின் லியு, கெவின் லு, கெவின் பார்க், கெவின் ஸ்டோன், கெவின் வெயில், கெவின் வின்னரி, கெவின் யு, கோடே முஷேகியானி, கிறிஸ்டன் யிங், கிறிஸ்டியன் ஜார்ஜிவ், கிஷிதிஜ் குப்தா, கைல் கோசிக், லாமா அஹ்மத், லாரி எல்வி, லாரன் இடோவ், லாரன் யாங், லீ பைரன், லியோ சென், லியோ லியு, லியோன் மாக்சின், லேடன் ஹோ, லி ஜிங், லியாங் க்ஸியோங், லின் யாங், லிண்டன் லி, லோரென்ஸ் கூன், லூயிஸ் ஃபெவ்ரியர், லு ஸாங், லூகாஸ் கைஸர், மஹ்மூத் ஈரிபி, மாஜா ட்ரெபாஸ், மனாஸ் ஜோகலேகர், மனோலி லியோடாகிஸ், மனுகா ஸ்ட்ராட்டா, மார்க் சென், மார்க் ஹட்னால், மார்க் சன், மார்க் வாங், மார்ட்டின் லி, மார்வின் ஸாங், மாட்யூஸ் லிட்வின், மேட் ஜோன்ஸ், மேட் லிம், மேக்ஸ் ஜான்சன், மேக்ஸ் ஷுவார்சர், மயங்க் குப்தா, மேகன் ஷா, மெங்கிங் வாங், மெங்யுவான் யான், மியா கிளேஸ், மைக்கேல் போலின், மைக்கேல் லம்பே, மைக்கேல் மாலெக், மைக்கேல் ஷார்மன், மைக்கேல் ஸாங், மிச்செல் வாங், மிச்செல் போக்ராஸ், மிகுவல் ஊம் டெமுடோ டி காஸ்ட்ரோ, மிஹாய் ஃப்ளோரியன், மைக் மெக்ளே, மைக் ட்ரப்சிக், மிக்கி ஹேப்ரின், மைல்ஸ் வாங், மிங் சென், மிங்ஸுவான் வாங், மின்னியா ஃபெங், மிட்செல் கார்டன், மோ பவேரியன், மோஸ்டஃபா ரோஹானினேஜாத், நாச்சோ சொட்டோ, நகுல் கன்னா, நாட் மெக்அலீஸ், நடாலி ஸ்டௌடாச்சர், நடான் லாஃபோன்டைன், நீல் அஜ்ஜராப்பு, நிக் ஃபெல்ட், நிக் டர்லி, நிகில் பன்சா, நிகிதா மிகைலின், நிகோ ஃபெலிக்ஸ், நிகுஞ்ச் ஹண்டா, நிங் லியு, நிஷாந்த் ராய், நோவா ஜார்கென்சன், நோவாம் பிரவுன், ஓலெக் பாய்கோ, ஓலெக் மர்க், ஒலிவியா வாட்கின்ஸ், ஆலிவியர் கோடெமென்ட், ஊனா க்ளீசன், பால் ஆஷ்போர்ன், பாவெல் பெலோவ், பீட்டர் ஃப்ளோகார்ட், பீட்டர் ஹோஷெலே, பீட்டர் ஷோகோவ், பிலிப் ப்ரோனின், பிலிப் குவோ, போப் தாக்கர், பிரபுல்லா தாரிவால், பிரசாந்த் ஆர், ரேச்சல் டயஸ், ராகுல் அரோரா, ராஜ்குமார் சாமுவேல், ராஸ்மஸ் ரைக்கார்ட், ரவி தேஜா முல்லப்புடி, ரேமண்ட் லி, ராஸ் காவ்ன், ரியா மியாரா, ரீச்சிரோ நகானோ, ரெய்மார் லீக், ரென்னி சாங், ரிதம் கார்க், ஆர்.ஜே. மார்சன், ராபர்ட் ஸியோங், ராபின் பிரவுன், ரோமன் ட்ஸியுபா, ருய் ஷு, ருஸ்லான் நிக்மாத்துல்லின், சாச்சி ஜெயின், சாகர் படேல், சாம் ஆல்ட்மேன், சாம் டாய்ஸர், சாம் டாயர், சமீர் அஹமது, சாமுவேல் மிசெரெண்டினோ, சாமுவேல் வால்ரிச், சந்தினி அகர்வால், சாண்டியாகோ ஹெர்னாண்டஸ், சாரா டோங், சவன்னா ஹியோன், ஸ்காட் எதர்ஸ்மித், ஸ்காட் மேயர் மெக்கின்னி, சீன் ஃபிட்ஸ்ஜெரால்ட், செவர் பனேசியு, ஷமீஸ் ஹேமானி, ஷெங்ஜியா ஸாவோ, ஷெங்லி ஹு, ஷிபானி சந்தூர்கர், ஸ்ரேயஸ் கிருஷ்ணசுவாமி, ஷுச்சாவோ பி, ஷுன்யு யாவோ, ஷுயுவான் ஸாங், சைமன் பொசாடா ஃபிஷ்மேன், ஸ்பென்சர் பப்பாய், ஸ்பக் கோல்டன், ஸ்ரீனிவாஸ் நாராயணன், ஸ்டான்லி ஹ்சீ, ஸ்டீபன் லாக்ஸ்டன், சுந்தீப் திருமலைரெட்டி, தால் ஸ்ட்ராமர், தாவோ வாங், தாவோ ஸின், டெய்லர் கார்டன், தேஜல் பட்வர்தன், திபால்ட் சொட்டியாக்ஸ், டினா ஸ்ரீகந்தராஜா, டோனி காஸ்பாரோ, டோனி ஸாவோ, ட்ரெவர் க்ரீச், உஸைர் நவீத் இஃப்திகார், வாலரி க்யூஐ, வினீத் கோசராஜு, விஷால் குவோ, விட்சியர் போங், விவேக் வர்மா, விளாட் பெட்ரோவ், வெண்டா ஸோ, வென்லெய் ஸீ, வென்டிங் ஸான், வில் டிப்யூ, வில் எல்ஸ்வொர்த், வில்லியம் ஷியு, வியாட் தாம்சன், யாமிங் லின், யான் டுபாய்ஸ், யாவோடங் யு, யாரா காக்பாஸ், யாஷ் படில், யிஃபான் வு, யிலோங் சின், யினிங் சென், யிருய் ஸாங், யோ ஷாவிட், யங் சா, யுன்யுன் வாங், யுஷி வாங், சாக் சுல்தான், ஸெஹாவோ டூ, ஸெவெய் சூ, ஸெங் ஷாவோ, ஸிகங் வாங், ஸிஷுவாய் ஸாங், ஸிஹாவோ ஸாங்