உருவாக்குபவர்களுக்கான GPT‑5.1 ஐ அறிமுகப்படுத்துகிறோம்
இன்று நாங்கள் GPT‑5.1 ஐ API தளத்தில் வெளியிடுகிறோம், இது GPT‑5 தொடரின் அடுத்த மாதிரியாகும், இது பரந்த அளவிலான முகவர் மற்றும் குறியீட்டுப் பணிகளுக்கான நுண்ணறிவு மற்றும் வேகத்தை சமநிலைப்படுத்துகிறது. பணியின் சிக்கலான தன்மையைப் பொறுத்து சிந்திக்க எவ்வளவு நேரம் செலவிடப்படுகிறது என்பதை GPT‑5.1 மாறும் வகையில் மாற்றியமைக்கிறது, இது மாதிரியை எளிமையான அன்றாடப் பணிகளில் கணிசமாக வேகமாகவும் டோக்கன்-திறனுள்ளதாகவும் ஆக்குகிறது. இந்த மாதிரி, GPT‑5.1 இன் முன்னணி நுண்ணறிவை பராமரிக்கும்போது, ஆழமான சிந்தனை தேவையற்ற பணிகளுக்கு வேகமாக பதிலளிக்க “காரணவிளக்கமளித்தல் இல்லா” பயன்முறையையும் கொண்டுள்ளது.
GPT‑5.1 ஐ இன்னும் திறமையானதாக்க, 24 மணிநேரம் வரை தற்காலிக சேமிப்பை தக்கவைத்துக்கொள்ள நீட்டிக்கப்பட்ட தூண்டி சேமிப்பை நாங்கள் வெளியிடுகிறோம், இது பின்தொடர்தல் கேள்விகளுக்கு குறைந்த செலவில் விரைவான பதில்களை வழங்குகிறது. எங்கள் முன்னுரிமை செயலாக்க(புதிய சாளரத்தில் திறக்கும்) வாடிக்கையாளர்கள் GPT‑5 ஐ விட GPT‑5.1 இல் குறிப்பிடத்தக்க அளவு வேகமான செயல்திறனை அனுபவிப்பார்கள்.
குறியீட்டு முறையில், GPT‑5.1 ஐ மேம்படுத்த கர்சர், காக்னிஷன், ஆக்மென்ட் கோட், ஃபேக்டரி மற்றும் வார்ப் போன்ற தொடக்க நிறுவனங்களுடன் நாங்கள் நெருக்கமாகப் பணியாற்றியுள்ளோம் குறியீட்டு ஆளுமை, வழிநடத்தும் தன்மை மற்றும் குறியீட்டுத் தரம். பொதுவாக, GPT‑5.1 குறியீட்டிற்கு பயன்படுத்த மிகவும் புத்திசாலித்தனமாக உணரப்படுகிறது மற்றும் பணிகளை முடிக்கும்போது பயனர் எதிர்கொள்ளும் புதுப்பிப்புகளுடன் மிகவும் தொடர்புடையதாக உள்ளது.
இறுதியாக, குறியீட்டை நம்பகமாக திருத்த வடிவமைக்கப்பட்ட apply_patch கருவி மற்றும் மாதிரி ஷெல் கட்டளைகளை இயக்க அனுமதிக்கும் ஷெல் கருவி என்ற இரண்டு புதிய கருவிகளை GPT‑5.1 உடன் அறிமுகப்படுத்துகிறோம்.
GPT‑5.1 என்பது GPT‑5 தொடரின் அடுத்த முன்னேற்றமாகும், மேலும் உருவாக்குபவர்கள் நம்பகமான முகவர் பணிநிலைகளை உருவாக்க உதவும் வகையில், அதிக அறிவார்ந்த மற்றும் திறமையான மாதிரிகளில் தொடர்ந்து முதலீடு செய்ய நாங்கள் திட்டமிட்டுள்ளோம்.
GPT‑5.1 ஐ வேகமாக்க, அதை யோசிக்க வைக்க பயிற்சி அளிக்கும் முறையை நாங்கள் முழுமையாக மாற்றினோம். நேரடியான பணிகளில், GPT‑5.1 குறைவான அளவிலேயே சிந்திக்கச் செலவிடுகிறது, ஸ்னாப்பியர் தயாரிப்பு அனுபவங்களையும் குறைந்த அளவு பில்களையும் வழங்குகிறது. கூடுதல் சிந்தனை தேவைப்படும் கடினமான பணிகளில், GPT‑5.1 தொடர்ந்து செயல்படுகிறது, விருப்பங்களை ஆராய்கிறது, நம்பகத்தன்மையை அதிகரிக்க அதன் வேலையைச் சரிபார்க்கிறது.
"எங்கள் முழு டைனமிக் மதிப்பீட்டு தொகுப்பில் GPT‑4.1 மற்றும் GPT‑5 இரண்டையும் விட GPT‑5.1 சிறப்பாக செயல்பட்டது, அதே நேரத்தில் GPT‑5 ஐ விட 2-3 மடங்கு வேகமாக இயங்கியது" என்று பால்யாஸ்னி அசெட் மேனேஜ்மென்ட்(புதிய சாளரத்தில் திறக்கும்) தெரிவித்துள்ளது. அவர்கள் தங்கள் கருவி அளவிலான காரணவிளக்கமளித்தல் பணிகளில், GPT‑5.1 "ஒத்த அல்லது சிறந்த தரத்தில் முன்னணி போட்டியாளர்களை விட பாதி டோக்கன்களை தொடர்ந்து பயன்படுத்தியது" என்றும் கூறினர். இதேபோல், AI காப்பீடு BPO Pace(புதிய சாளரத்தில் திறக்கும்) இந்த மாதிரியை சோதித்தது மற்றும் தங்கள் ஏஜன்ட்கள் GPT‑5.1 இல் "50% வேகமாக இயக்குகின்றன, அதே நேரத்தில் GPT‑5 மற்றும் பிற முன்னணி மாதிரிகளின் துல்லியத்தை எங்கள் மதிப்பீடுகள் முழுவதும் விஞ்சியுள்ளன்."
GPT‑5.1 அதன் சிந்தனை நேரத்தை GPT‑5‑ஐவிட அதிகமாக மாறுபடுத்துகிறது. ChatGPT பணிகளின் பிரதிநிதி விநியோகத்தில், GPT‑5.1 எளிதான பணிகளில், அதிக பகுத்தறிவு முயற்சியில் கூட, மிக வேகமாக செயல்படுகிறது.
உதாரணமாக, "உலகளவில் நிறுவப்பட்ட தொகுப்புகளை பட்டியலிட ஒரு npm கட்டளையைக் காட்டு" என்று கேட்கப்படும் போது, 10 வினாடிகளுக்குப் பதிலாக 2 வினாடிகளிலேயே GPT‑5.1 பதிலளிக்கும்.
GPT-5 (நடுத்தரம்) ~250 டோக்கன்களை (~10 வினாடிகள்) எடுக்கிறது
GPT-5.1 (நடுத்தரம்) ~50 டோக்கன்களை (~2 வினாடிகள்) எடுக்கிறது
reasoning_effort ஐ 'none' என்று அமைப்பதன் மூலம் உருவாக்குபவர்கள் இப்போது காரணவிளக்கமளித்தல் இல்லாமல் GPT‑5.1 ஐப் பயன்படுத்த முடியும். இது GPT‑5.1 இன் உயர் நுண்ணறிவு மற்றும் செயல்திறன் கொண்ட கருவி அழைப்பின் கூடுதல் நன்மையுடன், பதுங்குநிலை உணர்திறன் கொண்ட பயன்பாட்டு நிகழ்வுகளுக்கு காரணவிளக்கமளித்தல் இல்லாத மாதிரியாக செயல்படுகிறது. 'குறைந்தபட்ச' காரணவிளக்கமளித்தலுடன் கூடிய GPT‑5 உடன் ஒப்பிடும்போது, எந்த காரணவிளக்கமளித்தலும் இல்லாத GPT‑5.1, இணையான கருவி அழைப்பில் (இதுவே இறுதி முதல் இறுதி வரை பணி நிறைவு வேகத்தை அதிகரிக்கிறது), பணிகளைக் குறியீடு செய்தல், வழிமுறைகளைப் பின்பற்றுதல் மற்றும் தேடல் கருவிகளைப் பயன்படுத்துதல் ஆகியவற்றில் சிறந்து விளங்குகிறது - மேலும் எங்கள் API தளத்தில் வலைத் தேடலை(புதிய சாளரத்தில் திறக்கும்) ஆதரிக்கிறது. "காரணவிளக்கமளித்தல் இல்லா" பயன்முறையில் GPT‑5.1, "GPT‑5 குறைந்தபட்ச பகுத்தறிவுடன் ஒப்பிடும்போது குறைந்த தாமத கருவி அழைப்பு செயல்திறனில் 20% முன்னேற்றத்தைக்" காட்டியதாக சியரா(புதிய சாளரத்தில் திறக்கும்) நிஜ உலக மதிப்பீடுகளில் பகிர்ந்து கொண்டார்.
காரணவிளக்கமளித்தல் முயற்சியில் ஒரு மதிப்பாக 'none' என்று அறிமுகப்படுத்தப்பட்டதன் மூலம், உருவாக்குபவர்கள் இப்போது அவர்களின் பயன்பாட்டிற்கான வேகம், செலவு மற்றும் நுண்ணறிவு ஆகியவற்றுக்கு இடையிலான சமநிலையில் இன்னும் நெகிழ்வுத்தன்மையையும் கட்டுப்பாட்டையும் கொண்டுள்ளனர். GPT‑5.1 இயல்புநிலையாக 'none' என அமைக்கப்படுகிறது, இது தாமத உணர்திறன் பணிச்சுமைகளுக்கு ஏற்றது. நுண்ணறிவு மற்றும் நம்பகத்தன்மை வேகத்தை விட அதிகமாக இருக்கும்போது அதிக சிக்கலான பணிகளுக்கு 'குறைந்த' அல்லது 'நடுத்தர' என்பதைத் தேர்வுசெய்ய உருவாக்குபவர்கள் பரிந்துரைக்கிறார்கள்.
நீட்டிக்கப்பட்ட தற்காலிக சேமிப்பு, இன்று ஆதரிக்கப்படும் சில நிமிடங்களுக்குப் பதிலாக, 24 மணிநேரம் வரை தற்காலிக சேமிப்பில் செயலில் இருக்க தூண்டிகளை அனுமதிப்பதன் மூலம் காரணவிளக்கமளித்தல் செயல்திறனை மேம்படுத்துகிறது. நீண்ட தக்கவைப்பு சாளரத்துடன், அதிகமான பின்தொடர்தல் கோரிக்கைகள் தற்காலிக சேமிப்பில் உள்ள சூழலைப் பயன்படுத்திக் கொள்ளலாம் - இதன் விளைவாக குறைந்த தாமதம், குறைந்த செலவு மற்றும் பல-திருப்ப அரட்டை, குறியீட்டு அமர்வுகள் அல்லது அறிவு மீட்டெடுப்பு பணிநிலைகள் போன்ற நீண்டகால தொடர்புகளுக்கு மென்மையான செயல்திறன் கிடைக்கும்.
தூண்டி சேமிப்பு விலையிடல் நிர்ணயம் மாறாமல் உள்ளது, தற்காலிக உள்ளீட்டு டோக்கன் சேமிக்கப்படாத டோக்கன்களை விட 90% மலிவானவை, மேலும் சேமிப்பு எழுதுதல் அல்லது சேமிப்பிற்கு கூடுதல் கட்டணம் இல்லை. GPT‑5.1 உடன் நீட்டிக்கப்பட்ட தற்காலிக சேமிப்பைப் பயன்படுத்த, பதில்கள் அல்லது அரட்டை நிறைவுகள் API இல் “prompt_cache_retention='24h'” அளவுருவைச் சேர்க்கவும். மேலும் விவரங்களுக்கு தூண்டி சேமிப்பு ஆவணங்களைப்(புதிய சாளரத்தில் திறக்கும்) பார்க்கவும்.
GPT‑5.1 ஆனது GPT‑5 இன் குறியீட்டுத் திறன்களை அடிப்படையாகக் கொண்டது, இது மிகவும் கட்டுப்படுத்தக்கூடிய குறியீட்டு ஆளுமை, குறைவான அதிகப்படியான சிந்தனை, மேம்பட்ட குறியீட்டு தரம், கருவி அழைப்புகளின் வரிசைகளின் போது சிறந்த பயனர்-இலக்கு புதுப்பிப்பு செய்திகள் (முன்னுரைகள்) மற்றும் குறிப்பாக குறைந்த காரணவிளக்கமளித்தல் முயற்சியில் அதிக செயல்பாட்டு முன்பக்க வடிவமைப்புகளைக் கொண்டுள்ளது.
விரைவான குறியீட்டு்த திருத்தங்கள் போன்ற எளிமையான குறியீட்டுப் பணிகளில், GPT‑5.1 இன் கடுமையான வேகம் முன்னும் பின்னுமாக மீண்டும் மீண்டும் செய்வதை எளிதாக்குகிறது. GPT‑5.1 இன் எளிய பணிகளில் அதிக வேகம் கடினமான பணிகளில் செயல்திறனைக் குறைக்காது. SWE-bench Verified இல், GPT‑5 ஐ விட GPT‑5.1 நீண்ட நேரம் வேலை செய்து 76.3% ஐ அடைகிறது.
SWE-bench Verified இல், ஒரு மாதிரிக்கு குறியீட்டு களஞ்சியம் மற்றும் சிக்கல் விளக்கம் வழங்கப்படுகிறது, மேலும் சிக்கலைத் தீர்க்க ஒரு பேட்சை உருவாக்க வேண்டும். லேபிள்கள் காரணவிளக்கமளித்தல் முயற்சியைக் குறிக்கின்றன. துல்லியம் அனைத்து 500 சிக்கல்களிலும் சராசரியாக உள்ளது. எல்லா மாதிரிகளும் JSON அடிப்படையிலான apply_patch கருவியுடன் ஒரு சேணத்தைப் பயன்படுத்தின.
சில குறியீட்டு நிறுவனங்களிடமிருந்து GPT‑5.1 குறித்த ஆரம்ப பின்னூட்டம் எங்களுக்கு கிடைத்தது. அவர்களின் கருத்துக்கள் இங்கே உள்ளன:
- ஆக்மென்ட் குறியீடு(புதிய சாளரத்தில் திறக்கும்) GPT‑5.1 ஐ "குறைவான வீணான செயல்கள், அதிக திறமையான காரணவிளக்கமளித்தல் மற்றும் சிறந்த பணி கவனம் செலுத்துதலுடன் அதிக திட்டமிட்டது" என்று அழைத்தது, மேலும் அவர்கள் "பல கோப்பு திட்டங்களில் மிகவும் துல்லியமான மாற்றங்கள், மென்மையான இழுப்பு கோரிக்கைகள் மற்றும் வேகமான மறு செய்கை" ஆகியவற்றைக் காண்கிறார்கள்.
- க்ளைன்(புதிய சாளரத்தில் திறக்கும்) தங்கள் மதிப்பீடுகளில், “GPT‑5.1 எங்கள் வேறுபாடு திருத்த அளவுகோல்களில் SOTA-வை 7% முன்னேற்றத்துடன் அடைந்தது, இது சிக்கலான குறியீட்டு பணிகளுக்கு மிகுந்த நம்பகத்தன்மையை வெளிப்படுத்துகிறது” என்று கூறியது.
- CodeRabbit(புதிய சாளரத்தில் திறக்கும்) GPT‑5.1 ஐ அதன் “PR மதிப்புரைகளுக்கான முதன்மை மாதிரி” என்று அழைத்தது.
- "நீங்கள் என்ன கேட்கிறீர்கள் என்பதைப் புரிந்துகொள்வதிலும், அதைச் செய்து முடிக்க உங்களுடன் இணைந்து பணியாற்றுவதிலும் GPT‑5.1 குறிப்பிடத்தக்க அளவில் சிறந்தது" என்று காக்னிஷன்(புதிய சாளரத்தில் திறக்கும்) கூறியது.
- "GPT‑5.1 குறிப்பிடத்தக்க வகையில் விரைவான பதில்களை வழங்குகிறது மற்றும் அதன் காரணவிளக்கமளித்தல் ஆழத்தை பணிக்கு ஏற்ப மாற்றியமைக்கிறது, அதிகப்படியான சிந்தனையைக் குறைத்து ஒட்டுமொத்த உருவாக்குபவர் அனுபவத்தை மேம்படுத்துகிறது" என்று ஃபேக்டரி(புதிய சாளரத்தில் திறக்கும்) தெரிவித்துள்ளது.
- புதிய பயனர்களுக்கு வார்ப்(புதிய சாளரத்தில் திறக்கும்) GPT‑5.1 ஐ இயல்புநிலையாக மாற்றுகிறது, இது "GPT‑5 தொடர் அறிமுகப்படுத்திய ஈர்க்கக்கூடிய நுண்ணறிவு ஆதாயங்களை உருவாக்குகிறது, அதே நேரத்தில் மிகவும் பதிலளிக்கக்கூடிய மாதிரியாக உள்ளது" என்று கூறுகிறது.
" GPT 5.1 என்பது மற்றொரு LLM மட்டுமல்ல, இது உண்மையிலேயே முகவராக செயல்படக்கூடியது, நான் இதுவரை சோதித்த மிகவும் இயற்கையான தன்னாட்சி கொண்ட மாதிரி. இது உங்களைப் போலவே எழுதுகிறது, உங்களைப் போலவே குறியீடுகளை உருவாக்குகிறது, சிரமமின்றி சிக்கலான வழிமுறைகளைப் பின்பற்றுகிறது, மேலும் முன்னணிப் பணிகளில் சிறந்து விளங்குகிறது, உங்கள் தற்போதுள்ள கோட் பேஸில் அழகாக பொருந்துகிறது. Responses API இல் அதன் முழு திறனையும் நீங்கள் உண்மையில் திறக்க முடியும், அதை எங்கள் IDE இல் வழங்குவதில் நாங்கள் மகிழ்ச்சியடைகிறோம்.
Responses API இல் உள்ள மாதிரியிலிருந்து உருவாக்குபவர் அதிகப் பலன்களைப் பெற உதவும் வகையில் GPT‑5.1 உடன் இரண்டு புதிய கருவிகளை நாங்கள் அறிமுகப்படுத்துகிறோம்: JSON எஸ்கேப்பிங் தேவையில்லாமல் குறியீடு திருத்தங்களை இன்னும் நம்பகமானதாக மாற்றுவதற்கான தன்னிச்சையான apply_patch கருவி , மற்றும் உங்கள் உள்ளூர் கணினியில் மாதிரி எழுத கட்டளைகளை இயக்க அனுமதிக்கும் ஷெல் கருவி .
தன்னிச்சையான apply_patch கருவி கட்டமைக்கப்பட்ட மாறுபாடுகளைப் பயன்படுத்தி கோப்புகளை உருவாக்கவும், இற்றைப்படுத்தல் மற்றும் நீக்கவும் GPT‑5.1‑ஐ அனுமதிக்கிறது. திருத்தங்களை மட்டுமே பரிந்துரைப்பதற்குப் பதிலாக, மாதிரி ஒரு செயலி பயன்படுத்தும் பேட்ச் செயல்பாடுகளை வெளியிடுகிறது மற்றும் மீண்டும் அறிக்கை செய்கிறது, இது மீண்டும் மீண்டும் நிகழும், பல படி குறியீடு திருத்த பணிகளை சாத்தியமாக்குகிறது.
Responses API இல் apply_patch கருவியைப் பயன்படுத்த, "tools": [{“type”: “apply_patch”}] உடன் கருவிகள் வரிசையில் சேர்த்து உங்கள் உள்ளீட்டில் கோப்பு உள்ளடக்கத்தைச் சேர்க்கவும் அல்லது உங்கள் கோப்பு அமைப்புடன் தொடர்பு கொள்ள மாதிரி கருவிகளை வழங்கவும். உங்கள் கோப்பு முறைமையில் நீங்கள் பயன்படுத்தும் வேறுபாடுகளைக் கொண்ட கோப்புகளை உருவாக்கவும், புதுப்பிப்பதற்கும் அல்லது நீக்கவும் இந்த மாதிரி apply_patch_call உருப்படிகளை உருவாக்கும். apply_patch கருவியுடன் ஒருங்கிணைப்பது பற்றிய கூடுதல் தகவலுக்கு, எங்கள் உருவாக்குபவர் ஆவணங்களைப்(புதிய சாளரத்தில் திறக்கும்) பாருங்கள்.
ஷெல் கருவி கட்டுப்படுத்தப்பட்ட கட்டளை-வரி இடைமுகத்தின் மூலம் உள்ளூர் கணினியுடன் மாதிரியைத் தொடர்பு கொள்ள அனுமதிக்கிறது. மாதிரி ஷெல் கட்டளைகளை முன்மொழிகிறது; ஒரு உருவாக்குபவரின் ஒருங்கிணைப்பு அவற்றை செயல்படுத்தி வெளியீடுகளைத் திருப்பி வழங்குகிறது. இது ஒரு எளிய திட்டம் செயல்படுத்தும் வளையத்தை உருவாக்குகிறது, இது மாதிரிகள் அமைப்பை ஆய்வு செய்யவும், பயன்பாடுகளை இயக்கவும், பணியை முடிக்கும் வரை தரவைச் சேகரிக்கவும் அனுமதிக்கிறது.
Responses API இல் shell கருவியைப் பயன்படுத்த, உருவாக்குபவர்கள் அதை "tools": [{“type”: “shell”}] உடன் கருவிகள் வரிசையில் சேர்க்கலாம். API செயல்படுத்த ஷெல் கட்டளைகளை உள்ளடக்கிய "shell_call" உருப்படிகளை உருவாக்கும். உருவாக்குபவர்கள் உள்ளூர் சூழலில் கட்டளைகளை இயக்கி, அடுத்தது API கோரிக்கையில் "shell_call_output" உருப்படியில் செயல்படுத்தும் முடிவுகளை பின் செல்ல அனுப்புவார்கள். எங்கள் உருவாக்குபவர் ஆவணங்களில்(புதிய சாளரத்தில் திறக்கும்) மேலும் அறியவும்.
GPT‑5.1 மற்றும் gpt-5.1-chat-latest ஆகியவை API இல் உள்ள அனைத்து கட்டண அடுக்குகளிலும் உருவாக்குபவர்களுக்குக் கிடைக்கின்றன. விலையிடல் மற்றும் விகித வரம்புகள்(புதிய சாளரத்தில் திறக்கும்) GPT‑5 போன்றவையே. நாங்கள் API-யில் gpt-5.1-codex மற்றும் gpt-5.1-codex-mini ஆகியவற்றை வெளியிடுகிறோம். பெரும்பாலான குறியீட்டுப் பணிகளில் GPT‑5.1 சிறந்து விளங்கினாலும், gpt-5.1-கோடெக்ஸ் மாதிரிகள் கோடெக்ஸ் அல்லது கோடெக்ஸ் போன்ற உபகரணங்களில் நீண்டகால, முகவர் குறியீட்டு பணிகளுக்கு உகந்ததாக உள்ளன.
உருவாக்குபவர்கள் எங்கள் GPT‑5.1 உருவாக்குபவர் ஆவணங்களை(புதிய சாளரத்தில் திறக்கும்) மற்றும் மாதிரி அறிவுறுத்தல் வழிகாட்டியை(புதிய சாளரத்தில் திறக்கும்) பயன்படுத்தி உருவாக்கத் தொடங்கலாம். நாங்கள் தற்போது API இல் GPT‑5 ஐ விலக்க திட்டமிடவில்லை, மேலும் அவ்வாறு செய்ய முடிவு செய்தால், உருவாக்குபவர்களுக்கு முன்கூட்டிய அறிவிப்போம்.
உண்மையான ஏஜன்ட் மற்றும் குறியீட்டுப் பணிகளுக்கு மிகவும் திறமையான, நம்பகமான மாதிரிகளை மீண்டும் மீண்டும் பயன்படுத்த நாங்கள் உறுதிபூண்டுள்ளோம், திறமையாக சிந்திக்கும், விரைவாக மீண்டும் மீண்டும் செயல்படும் மற்றும் சிக்கலான பணிகளை கையாளும் அதே வேளையில் உருவாக்குபவர்களை தொடர்ந்து செயல்பட வைக்கும் மாதிரிகளைப் பயன்படுத்துவோம். சூழலுக்கேற்ற காரணவிளக்கமளித்தல், வலுவான குறியீட்டு செயல்திறன், தெளிவான பயனர் எதிர்கொள்ளும் புதுப்பிப்புகள் மற்றும் apply_patch மற்றும் shell போன்ற புதிய கருவிகளுடன், குறைந்த உராய்வுடன் உருவாக்க உங்களுக்கு உதவும் வகையில் GPT‑5.1 வடிவமைக்கப்பட்டுள்ளது. நாங்கள் இங்கே தொடர்ந்து பெரிதும் முதலீடு செய்கிறோம்: அடுத்த வாரங்கள் மற்றும் மாதங்களில் அதிக திறன் கொண்ட ஏஜன்ட் மற்றும் குறியீட்டு மாதிரிகளை நீங்கள் எதிர்பார்க்கலாம்.
மதிப்பீடு | GPT‑5.1 (high) | GPT‑5 (high) |
SWE-bench Verified | 76.3% | 72.8% |
GPQA Diamond | 88.1% | 85.7% |
AIME 2025 | 94.0% | 94.6% |
FrontierMath | 26.7% | 26.3% |
MMMU | 85.4% | 84.2% |
Tau2-பெஞ்ச் ஏர்லைன் | 67.0% | 62.6% |
Tau2-பெஞ்ச் டெலிகாம்* | 95.6% | 96.7% |
Tau2-பெஞ்ச் சில்லறை | 77.9% | 81.1% |
BrowseComp Long சூழல் 128k | 90.0% | 90.0% |
* Tau2-பெஞ்ச் டெலிகாமிற்கு, நாங்கள் GPT‑5.1 க்கு அதன் செயல்திறனை மேம்படுத்த ஒரு குறுகிய, பொதுவான உதவித் தூண்டியை வழங்கினோம்.


