முக்கிய உள்ளடக்கத்திற்கு செல்க
OpenAI

13 நவம்பர், 2025

தயாரிப்பு

உருவாக்குபவர்களுக்கான GPT‑5.1 ஐ அறிமுகப்படுத்துகிறோம்

ஏற்றுகிறது…

இன்று நாங்கள் GPT‑5.1 ஐ API தளத்தில் வெளியிடுகிறோம், இது GPT‑5 தொடரின் அடுத்த மாதிரியாகும், இது பரந்த அளவிலான முகவர் மற்றும் குறியீட்டுப் பணிகளுக்கான நுண்ணறிவு மற்றும் வேகத்தை சமநிலைப்படுத்துகிறது. பணியின் சிக்கலான தன்மையைப் பொறுத்து சிந்திக்க எவ்வளவு நேரம் செலவிடப்படுகிறது என்பதை GPT‑5.1 மாறும் வகையில் மாற்றியமைக்கிறது, இது மாதிரியை எளிமையான அன்றாடப் பணிகளில் கணிசமாக வேகமாகவும் டோக்கன்-திறனுள்ளதாகவும் ஆக்குகிறது. இந்த மாதிரி, GPT‑5.1 இன் முன்னணி நுண்ணறிவை பராமரிக்கும்போது, ஆழமான சிந்தனை தேவையற்ற பணிகளுக்கு வேகமாக பதிலளிக்க “காரணவிளக்கமளித்தல் இல்லா” பயன்முறையையும் கொண்டுள்ளது.

GPT‑5.1 ஐ இன்னும் திறமையானதாக்க, 24 மணிநேரம் வரை தற்காலிக சேமிப்பை தக்கவைத்துக்கொள்ள நீட்டிக்கப்பட்ட தூண்டி சேமிப்பை நாங்கள் வெளியிடுகிறோம், இது பின்தொடர்தல் கேள்விகளுக்கு குறைந்த செலவில் விரைவான பதில்களை வழங்குகிறது. எங்கள் முன்னுரிமை செயலாக்க(புதிய சாளரத்தில் திறக்கும்) வாடிக்கையாளர்கள் GPT‑5 ஐ விட GPT‑5.1 இல் குறிப்பிடத்தக்க அளவு வேகமான செயல்திறனை அனுபவிப்பார்கள்.

குறியீட்டு முறையில், GPT‑5.1 ஐ மேம்படுத்த கர்சர், காக்னிஷன், ஆக்மென்ட் கோட், ஃபேக்டரி மற்றும் வார்ப் போன்ற தொடக்க நிறுவனங்களுடன் நாங்கள் நெருக்கமாகப் பணியாற்றியுள்ளோம் குறியீட்டு ஆளுமை, வழிநடத்தும் தன்மை மற்றும் குறியீட்டுத் தரம். பொதுவாக, GPT‑5.1 குறியீட்டிற்கு பயன்படுத்த மிகவும் புத்திசாலித்தனமாக உணரப்படுகிறது மற்றும் பணிகளை முடிக்கும்போது பயனர் எதிர்கொள்ளும் புதுப்பிப்புகளுடன் மிகவும் தொடர்புடையதாக உள்ளது.

இறுதியாக, குறியீட்டை நம்பகமாக திருத்த வடிவமைக்கப்பட்ட apply_patch கருவி மற்றும் மாதிரி ஷெல் கட்டளைகளை இயக்க அனுமதிக்கும் ஷெல் கருவி என்ற இரண்டு புதிய கருவிகளை GPT‑5.1 உடன் அறிமுகப்படுத்துகிறோம்.

GPT‑5.1 என்பது GPT‑5 தொடரின் அடுத்த முன்னேற்றமாகும், மேலும் உருவாக்குபவர்கள் நம்பகமான முகவர் பணிநிலைகளை உருவாக்க உதவும் வகையில், அதிக அறிவார்ந்த மற்றும் திறமையான மாதிரிகளில் தொடர்ந்து முதலீடு செய்ய நாங்கள் திட்டமிட்டுள்ளோம்.

பணிகள் முழுவதும் திறமையான காரணவிளக்கமளித்தல்

சூழலுக்கேற்ற காரணவிளக்கமளித்தல்

GPT‑5.1 ஐ வேகமாக்க, அதை யோசிக்க வைக்க பயிற்சி அளிக்கும் முறையை நாங்கள் முழுமையாக மாற்றினோம். நேரடியான பணிகளில், GPT‑5.1 குறைவான அளவிலேயே சிந்திக்கச் செலவிடுகிறது, ஸ்னாப்பியர் தயாரிப்பு அனுபவங்களையும் குறைந்த அளவு பில்களையும் வழங்குகிறது. கூடுதல் சிந்தனை தேவைப்படும் கடினமான பணிகளில், GPT‑5.1 தொடர்ந்து செயல்படுகிறது, விருப்பங்களை ஆராய்கிறது, நம்பகத்தன்மையை அதிகரிக்க அதன் வேலையைச் சரிபார்க்கிறது.

"எங்கள் முழு டைனமிக் மதிப்பீட்டு தொகுப்பில் GPT‑4.1 மற்றும் GPT‑5 இரண்டையும் விட GPT‑5.1 சிறப்பாக செயல்பட்டது, அதே நேரத்தில் GPT‑5 ஐ விட 2-3 மடங்கு வேகமாக இயங்கியது" என்று பால்யாஸ்னி அசெட் மேனேஜ்மென்ட்(புதிய சாளரத்தில் திறக்கும்) தெரிவித்துள்ளது. அவர்கள் தங்கள் கருவி அளவிலான காரணவிளக்கமளித்தல் பணிகளில், GPT‑5.1 "ஒத்த அல்லது சிறந்த தரத்தில் முன்னணி போட்டியாளர்களை விட பாதி டோக்கன்களை தொடர்ந்து பயன்படுத்தியது" என்றும் கூறினர். இதேபோல், AI காப்பீடு BPO Pace(புதிய சாளரத்தில் திறக்கும்) இந்த மாதிரியை சோதித்தது மற்றும் தங்கள் ஏஜன்ட்கள் GPT‑5.1 இல் "50% வேகமாக இயக்குகின்றன, அதே நேரத்தில் GPT‑5 மற்றும் பிற முன்னணி மாதிரிகளின் துல்லியத்தை எங்கள் மதிப்பீடுகள் முழுவதும் விஞ்சியுள்ளன்."

GPT‑5.1 அதன் சிந்தனை நேரத்தை GPT‑5‑ஐவிட அதிகமாக மாறுபடுத்துகிறது. ChatGPT பணிகளின் பிரதிநிதி விநியோகத்தில், GPT‑5.1 எளிதான பணிகளில், அதிக பகுத்தறிவு முயற்சியில் கூட, மிக வேகமாக செயல்படுகிறது.

உதாரணமாக, "உலகளவில் நிறுவப்பட்ட தொகுப்புகளை பட்டியலிட ஒரு npm கட்டளையைக் காட்டு" என்று கேட்கப்படும் போது, 10 வினாடிகளுக்குப் பதிலாக 2 வினாடிகளிலேயே GPT‑5.1 பதிலளிக்கும்.

GPT-5 (நடுத்தரம்) ~250 டோக்கன்களை (~10 வினாடிகள்) எடுக்கிறது

show an npm command to list globally installed packages

npm list -g --depth=0

GPT-5.1 (நடுத்தரம்) ~50 டோக்கன்களை (~2 வினாடிகள்) எடுக்கிறது

show an npm command to list globally installed packages

You can list globally installed npm packages with:

  • Just package names: npm ls -g --depth=0
  • Including their install paths: npm ls -g

The first one is usually what you want.

புதிய "காரணவிளக்கமளித்தல் இல்லாத" பயன்முறை

reasoning_effort ஐ 'none' என்று அமைப்பதன் மூலம் உருவாக்குபவர்கள் இப்போது காரணவிளக்கமளித்தல் இல்லாமல் GPT‑5.1 ஐப் பயன்படுத்த முடியும். இது GPT‑5.1 இன் உயர் நுண்ணறிவு மற்றும் செயல்திறன் கொண்ட கருவி அழைப்பின் கூடுதல் நன்மையுடன், பதுங்குநிலை உணர்திறன் கொண்ட பயன்பாட்டு நிகழ்வுகளுக்கு காரணவிளக்கமளித்தல் இல்லாத மாதிரியாக செயல்படுகிறது. 'குறைந்தபட்ச' காரணவிளக்கமளித்தலுடன் கூடிய GPT‑5 உடன் ஒப்பிடும்போது, எந்த காரணவிளக்கமளித்தலும் இல்லாத GPT‑5.1, இணையான கருவி அழைப்பில் (இதுவே இறுதி முதல் இறுதி வரை பணி நிறைவு வேகத்தை அதிகரிக்கிறது), பணிகளைக் குறியீடு செய்தல், வழிமுறைகளைப் பின்பற்றுதல் மற்றும் தேடல் கருவிகளைப் பயன்படுத்துதல் ஆகியவற்றில் சிறந்து விளங்குகிறது - மேலும் எங்கள் API தளத்தில் வலைத் தேடலை(புதிய சாளரத்தில் திறக்கும்) ஆதரிக்கிறது. "காரணவிளக்கமளித்தல் இல்லா" பயன்முறையில் GPT‑5.1, "GPT‑5 குறைந்தபட்ச பகுத்தறிவுடன் ஒப்பிடும்போது குறைந்த தாமத கருவி அழைப்பு செயல்திறனில் 20% முன்னேற்றத்தைக்" காட்டியதாக சியரா(புதிய சாளரத்தில் திறக்கும்) நிஜ உலக மதிப்பீடுகளில் பகிர்ந்து கொண்டார்.

காரணவிளக்கமளித்தல் முயற்சியில் ஒரு மதிப்பாக 'none' என்று அறிமுகப்படுத்தப்பட்டதன் மூலம், உருவாக்குபவர்கள் இப்போது அவர்களின் பயன்பாட்டிற்கான வேகம், செலவு மற்றும் நுண்ணறிவு ஆகியவற்றுக்கு இடையிலான சமநிலையில் இன்னும் நெகிழ்வுத்தன்மையையும் கட்டுப்பாட்டையும் கொண்டுள்ளனர். GPT‑5.1 இயல்புநிலையாக 'none' என அமைக்கப்படுகிறது, இது தாமத உணர்திறன் பணிச்சுமைகளுக்கு ஏற்றது. நுண்ணறிவு மற்றும் நம்பகத்தன்மை வேகத்தை விட அதிகமாக இருக்கும்போது அதிக சிக்கலான பணிகளுக்கு 'குறைந்த' அல்லது 'நடுத்தர' என்பதைத் தேர்வுசெய்ய உருவாக்குபவர்கள் பரிந்துரைக்கிறார்கள்.

நீட்டிக்கப்பட்ட தூண்டி சேமிப்பு

நீட்டிக்கப்பட்ட தற்காலிக சேமிப்பு, இன்று ஆதரிக்கப்படும் சில நிமிடங்களுக்குப் பதிலாக, 24 மணிநேரம் வரை தற்காலிக சேமிப்பில் செயலில் இருக்க தூண்டிகளை அனுமதிப்பதன் மூலம் காரணவிளக்கமளித்தல் செயல்திறனை மேம்படுத்துகிறது. நீண்ட தக்கவைப்பு சாளரத்துடன், அதிகமான பின்தொடர்தல் கோரிக்கைகள் தற்காலிக சேமிப்பில் உள்ள சூழலைப் பயன்படுத்திக் கொள்ளலாம் - இதன் விளைவாக குறைந்த தாமதம், குறைந்த செலவு மற்றும் பல-திருப்ப அரட்டை, குறியீட்டு அமர்வுகள் அல்லது அறிவு மீட்டெடுப்பு பணிநிலைகள் போன்ற நீண்டகால தொடர்புகளுக்கு மென்மையான செயல்திறன் கிடைக்கும்.

தூண்டி சேமிப்பு விலையிடல் நிர்ணயம் மாறாமல் உள்ளது, தற்காலிக உள்ளீட்டு டோக்கன் சேமிக்கப்படாத டோக்கன்களை விட 90% மலிவானவை, மேலும் சேமிப்பு எழுதுதல் அல்லது சேமிப்பிற்கு கூடுதல் கட்டணம் இல்லை. GPT‑5.1 உடன் நீட்டிக்கப்பட்ட தற்காலிக சேமிப்பைப் பயன்படுத்த, பதில்கள் அல்லது அரட்டை நிறைவுகள் API இல் “prompt_cache_retention='24h'” அளவுருவைச் சேர்க்கவும். மேலும் விவரங்களுக்கு தூண்டி சேமிப்பு ஆவணங்களைப்(புதிய சாளரத்தில் திறக்கும்) பார்க்கவும்.

குறியீடாக்கம்

GPT‑5.1 ஆனது GPT‑5 இன் குறியீட்டுத் திறன்களை அடிப்படையாகக் கொண்டது, இது மிகவும் கட்டுப்படுத்தக்கூடிய குறியீட்டு ஆளுமை, குறைவான அதிகப்படியான சிந்தனை, மேம்பட்ட குறியீட்டு தரம், கருவி அழைப்புகளின் வரிசைகளின் போது சிறந்த பயனர்-இலக்கு புதுப்பிப்பு செய்திகள் (முன்னுரைகள்) மற்றும் குறிப்பாக குறைந்த காரணவிளக்கமளித்தல் முயற்சியில் அதிக செயல்பாட்டு முன்பக்க வடிவமைப்புகளைக் கொண்டுள்ளது.

விரைவான குறியீட்டு்த திருத்தங்கள் போன்ற எளிமையான குறியீட்டுப் பணிகளில், GPT‑5.1 இன் கடுமையான வேகம் முன்னும் பின்னுமாக மீண்டும் மீண்டும் செய்வதை எளிதாக்குகிறது. GPT‑5.1 இன் எளிய பணிகளில் அதிக வேகம் கடினமான பணிகளில் செயல்திறனைக் குறைக்காது. SWE-bench Verified இல், GPT‑5 ஐ விட GPT‑5.1 நீண்ட நேரம் வேலை செய்து 76.3% ஐ அடைகிறது.

SWE-bench Verified⁠ இல், ஒரு மாதிரிக்கு குறியீட்டு களஞ்சியம் மற்றும் சிக்கல் விளக்கம் வழங்கப்படுகிறது, மேலும் சிக்கலைத் தீர்க்க ஒரு பேட்சை உருவாக்க வேண்டும். லேபிள்கள் காரணவிளக்கமளித்தல் முயற்சியைக் குறிக்கின்றன. துல்லியம் அனைத்து 500 சிக்கல்களிலும் சராசரியாக உள்ளது. எல்லா மாதிரிகளும் JSON அடிப்படையிலான apply_patch கருவியுடன் ஒரு சேணத்தைப் பயன்படுத்தின.

சில குறியீட்டு நிறுவனங்களிடமிருந்து GPT‑5.1 குறித்த ஆரம்ப பின்னூட்டம் எங்களுக்கு கிடைத்தது. அவர்களின் கருத்துக்கள் இங்கே உள்ளன:

  • ஆக்மென்ட் குறியீடு(புதிய சாளரத்தில் திறக்கும்) GPT‑5.1 ஐ "குறைவான வீணான செயல்கள், அதிக திறமையான காரணவிளக்கமளித்தல் மற்றும் சிறந்த பணி கவனம் செலுத்துதலுடன் அதிக திட்டமிட்டது" என்று அழைத்தது, மேலும் அவர்கள் "பல கோப்பு திட்டங்களில் மிகவும் துல்லியமான மாற்றங்கள், மென்மையான இழுப்பு கோரிக்கைகள் மற்றும் வேகமான மறு செய்கை" ஆகியவற்றைக் காண்கிறார்கள்.
  • க்ளைன்(புதிய சாளரத்தில் திறக்கும்) தங்கள் மதிப்பீடுகளில், “GPT‑5.1 எங்கள் வேறுபாடு திருத்த அளவுகோல்களில் SOTA-வை 7% முன்னேற்றத்துடன் அடைந்தது, இது சிக்கலான குறியீட்டு பணிகளுக்கு மிகுந்த நம்பகத்தன்மையை வெளிப்படுத்துகிறது” என்று கூறியது.
  • CodeRabbit(புதிய சாளரத்தில் திறக்கும்) GPT‑5.1 ஐ அதன் “PR மதிப்புரைகளுக்கான முதன்மை மாதிரி” என்று அழைத்தது.
  • "நீங்கள் என்ன கேட்கிறீர்கள் என்பதைப் புரிந்துகொள்வதிலும், அதைச் செய்து முடிக்க உங்களுடன் இணைந்து பணியாற்றுவதிலும் GPT‑5.1 குறிப்பிடத்தக்க அளவில் சிறந்தது" என்று காக்னிஷன்(புதிய சாளரத்தில் திறக்கும்) கூறியது.
  • "GPT‑5.1 குறிப்பிடத்தக்க வகையில் விரைவான பதில்களை வழங்குகிறது மற்றும் அதன் காரணவிளக்கமளித்தல் ஆழத்தை பணிக்கு ஏற்ப மாற்றியமைக்கிறது, அதிகப்படியான சிந்தனையைக் குறைத்து ஒட்டுமொத்த உருவாக்குபவர் அனுபவத்தை மேம்படுத்துகிறது" என்று ஃபேக்டரி(புதிய சாளரத்தில் திறக்கும்) தெரிவித்துள்ளது.
  • புதிய பயனர்களுக்கு வார்ப்(புதிய சாளரத்தில் திறக்கும்) GPT‑5.1 ஐ இயல்புநிலையாக மாற்றுகிறது, இது "GPT‑5 தொடர் அறிமுகப்படுத்திய ஈர்க்கக்கூடிய நுண்ணறிவு ஆதாயங்களை உருவாக்குகிறது, அதே நேரத்தில் மிகவும் பதிலளிக்கக்கூடிய மாதிரியாக உள்ளது" என்று கூறுகிறது.
" GPT 5.1 என்பது மற்றொரு LLM மட்டுமல்ல, இது உண்மையிலேயே முகவராக செயல்படக்கூடியது, நான் இதுவரை சோதித்த மிகவும் இயற்கையான தன்னாட்சி கொண்ட மாதிரி. இது உங்களைப் போலவே எழுதுகிறது, உங்களைப் போலவே குறியீடுகளை உருவாக்குகிறது, சிரமமின்றி சிக்கலான வழிமுறைகளைப் பின்பற்றுகிறது, மேலும் முன்னணிப் பணிகளில் சிறந்து விளங்குகிறது, உங்கள் தற்போதுள்ள கோட் பேஸில் அழகாக பொருந்துகிறது. Responses API இல் அதன் முழு திறனையும் நீங்கள் உண்மையில் திறக்க முடியும், அதை எங்கள் IDE இல் வழங்குவதில் நாங்கள் மகிழ்ச்சியடைகிறோம்.
—டெனிஸ் ஷிரியாவ், AI DevTools சூழல் அமைப்பின் தலைவர், JetBrains

GPT‑5.1 இல் உள்ள புதிய கருவிகள்

Responses API இல் உள்ள மாதிரியிலிருந்து உருவாக்குபவர் அதிகப் பலன்களைப் பெற உதவும் வகையில் GPT‑5.1 உடன் இரண்டு புதிய கருவிகளை நாங்கள் அறிமுகப்படுத்துகிறோம்: JSON எஸ்கேப்பிங் தேவையில்லாமல் குறியீடு திருத்தங்களை இன்னும் நம்பகமானதாக மாற்றுவதற்கான தன்னிச்சையான apply_patch கருவி , மற்றும் உங்கள் உள்ளூர் கணினியில் மாதிரி எழுத கட்டளைகளை இயக்க அனுமதிக்கும் ஷெல் கருவி .

Apply_patch கருவி

தன்னிச்சையான apply_patch கருவி கட்டமைக்கப்பட்ட மாறுபாடுகளைப் பயன்படுத்தி கோப்புகளை உருவாக்கவும், இற்றைப்படுத்தல் மற்றும் நீக்கவும் GPT‑5.1‑ஐ அனுமதிக்கிறது. திருத்தங்களை மட்டுமே பரிந்துரைப்பதற்குப் பதிலாக, மாதிரி ஒரு செயலி பயன்படுத்தும் பேட்ச் செயல்பாடுகளை வெளியிடுகிறது மற்றும் மீண்டும் அறிக்கை செய்கிறது, இது மீண்டும் மீண்டும் நிகழும், பல படி குறியீடு திருத்த பணிகளை சாத்தியமாக்குகிறது.

Responses API இல் apply_patch கருவியைப் பயன்படுத்த, "tools": [{“type”: “apply_patch”}] உடன் கருவிகள் வரிசையில் சேர்த்து உங்கள் உள்ளீட்டில் கோப்பு உள்ளடக்கத்தைச் சேர்க்கவும் அல்லது உங்கள் கோப்பு அமைப்புடன் தொடர்பு கொள்ள மாதிரி கருவிகளை வழங்கவும். உங்கள் கோப்பு முறைமையில் நீங்கள் பயன்படுத்தும் வேறுபாடுகளைக் கொண்ட கோப்புகளை உருவாக்கவும், புதுப்பிப்பதற்கும் அல்லது நீக்கவும் இந்த மாதிரி apply_patch_call உருப்படிகளை உருவாக்கும். apply_patch கருவியுடன் ஒருங்கிணைப்பது பற்றிய கூடுதல் தகவலுக்கு, எங்கள் உருவாக்குபவர் ஆவணங்களைப்(புதிய சாளரத்தில் திறக்கும்) பாருங்கள்.

ஷெல் கருவி

ஷெல் கருவி கட்டுப்படுத்தப்பட்ட கட்டளை-வரி இடைமுகத்தின் மூலம் உள்ளூர் கணினியுடன் மாதிரியைத் தொடர்பு கொள்ள அனுமதிக்கிறது. மாதிரி ஷெல் கட்டளைகளை முன்மொழிகிறது; ஒரு உருவாக்குபவரின் ஒருங்கிணைப்பு அவற்றை செயல்படுத்தி வெளியீடுகளைத் திருப்பி வழங்குகிறது. இது ஒரு எளிய திட்டம் செயல்படுத்தும் வளையத்தை உருவாக்குகிறது, இது மாதிரிகள் அமைப்பை ஆய்வு செய்யவும், பயன்பாடுகளை இயக்கவும், பணியை முடிக்கும் வரை தரவைச் சேகரிக்கவும் அனுமதிக்கிறது.

Responses API இல் shell கருவியைப் பயன்படுத்த, உருவாக்குபவர்கள் அதை "tools": [{“type”: “shell”}] உடன் கருவிகள் வரிசையில் சேர்க்கலாம். API செயல்படுத்த ஷெல் கட்டளைகளை உள்ளடக்கிய "shell_call" உருப்படிகளை உருவாக்கும். உருவாக்குபவர்கள் உள்ளூர் சூழலில் கட்டளைகளை இயக்கி, அடுத்தது API கோரிக்கையில் "shell_call_output" உருப்படியில் செயல்படுத்தும் முடிவுகளை பின் செல்ல அனுப்புவார்கள். எங்கள் உருவாக்குபவர் ஆவணங்களில்(புதிய சாளரத்தில் திறக்கும்) மேலும் அறியவும்.

விலை மற்றும் கிடைக்கும் நிலை

GPT‑5.1 மற்றும் gpt-5.1-chat-latest ஆகியவை API இல் உள்ள அனைத்து கட்டண அடுக்குகளிலும் உருவாக்குபவர்களுக்குக் கிடைக்கின்றன. விலையிடல் மற்றும் விகித வரம்புகள்(புதிய சாளரத்தில் திறக்கும்) GPT‑5 போன்றவையே. நாங்கள் API-யில் gpt-5.1-codex மற்றும் gpt-5.1-codex-mini ஆகியவற்றை வெளியிடுகிறோம். பெரும்பாலான குறியீட்டுப் பணிகளில் GPT‑5.1 சிறந்து விளங்கினாலும், gpt-5.1-கோடெக்ஸ் மாதிரிகள் கோடெக்ஸ் அல்லது கோடெக்ஸ் போன்ற உபகரணங்களில் நீண்டகால, முகவர் குறியீட்டு பணிகளுக்கு உகந்ததாக உள்ளன.

உருவாக்குபவர்கள் எங்கள் GPT‑5.1 உருவாக்குபவர் ஆவணங்களை(புதிய சாளரத்தில் திறக்கும்) மற்றும் மாதிரி அறிவுறுத்தல் வழிகாட்டியை(புதிய சாளரத்தில் திறக்கும்) பயன்படுத்தி உருவாக்கத் தொடங்கலாம். நாங்கள் தற்போது API இல் GPT‑5 ஐ விலக்க திட்டமிடவில்லை, மேலும் அவ்வாறு செய்ய முடிவு செய்தால், உருவாக்குபவர்களுக்கு முன்கூட்டிய அறிவிப்போம்.

அடுத்தது என்ன

உண்மையான ஏஜன்ட் மற்றும் குறியீட்டுப் பணிகளுக்கு மிகவும் திறமையான, நம்பகமான மாதிரிகளை மீண்டும் மீண்டும் பயன்படுத்த நாங்கள் உறுதிபூண்டுள்ளோம், திறமையாக சிந்திக்கும், விரைவாக மீண்டும் மீண்டும் செயல்படும் மற்றும் சிக்கலான பணிகளை கையாளும் அதே வேளையில் உருவாக்குபவர்களை தொடர்ந்து செயல்பட வைக்கும் மாதிரிகளைப் பயன்படுத்துவோம். சூழலுக்கேற்ற காரணவிளக்கமளித்தல், வலுவான குறியீட்டு செயல்திறன், தெளிவான பயனர் எதிர்கொள்ளும் புதுப்பிப்புகள் மற்றும் apply_patch மற்றும் shell போன்ற புதிய கருவிகளுடன், குறைந்த உராய்வுடன் உருவாக்க உங்களுக்கு உதவும் வகையில் GPT‑5.1 வடிவமைக்கப்பட்டுள்ளது. நாங்கள் இங்கே தொடர்ந்து பெரிதும் முதலீடு செய்கிறோம்: அடுத்த வாரங்கள் மற்றும் மாதங்களில் அதிக திறன் கொண்ட ஏஜன்ட் மற்றும் குறியீட்டு மாதிரிகளை நீங்கள் எதிர்பார்க்கலாம்.

இணைப்பு: மாதிரி மதிப்பீடுகள்

மதிப்பீடு

GPT‑5.1 (high)

GPT‑5 (high)

SWE-bench Verified
(அனைத்து 500 சிக்கல்களும்)

76.3%

72.8%

GPQA Diamond
(கருவிகள் இல்லை)

88.1%

85.7%

AIME 2025
(கருவிகள் இல்லை)

94.0%

94.6%

FrontierMath
(பைதான் கருவி மூலம்)

26.7%

26.3%

MMMU

85.4%

84.2%

Tau2-பெஞ்ச் ஏர்லைன்

67.0%

62.6%

Tau2-பெஞ்ச் டெலிகாம்*

95.6%

96.7%

Tau2-பெஞ்ச் சில்லறை

77.9%

81.1%

BrowseComp Long சூழல் 128k

90.0%

90.0%

* Tau2-பெஞ்ச் டெலிகாமிற்கு, நாங்கள் GPT‑5.1 க்கு அதன் செயல்திறனை மேம்படுத்த ஒரு குறுகிய, பொதுவான உதவித் தூண்டியை வழங்கினோம்.

ஆசிரியர்

OpenAI