GPT‑5 ማስተዋወቅ
እስካሁን ከነበሩን ሞዴሎች ብልህ፣ ፈጣን፣ እና በጣም ጠቃሚው ሲሆን፣ ባለሙያው ደረጃ የማሰብ ችሎታን በሁሉም ሰው እጅ ውስጥ የሚያስቀምጥ የተቀመጠ አስተሳሰብ አለው።
እስካሁን ድረስ የነበረን ምርጡን የAI ስርዓት GPT‑5ን እያስተዋወቅን ነው። GPT‑5 በኮድ፣ በሂሳብ፣ በጽሑፍ፣ በጤና፣ በእይታ ግንዛቤ እና በሌሎችም ዘርፎች ውስጥ የዘመናዊ አፈፃፀም ያለው እና በሁሉም በቀደሙ ሞዴሎች ላይ የበለጠ የእውቀት እድገት አለው። የባለሙያ ደረጃ ምላሾችን ለመስጠት መቼ በፍጥነት ምላሽ መስጠት እንዳለበት እና መቼ ረዘም ጊዜ ማስብ እንዳለበት የሚያውቅ የተማከለ ስርዓት ነው። GPT‑5 ለሁሉም ተጠቃሚዎች የሚገኝ ሲሆን፣ የPlus ተመዝጋቢዎች የበለጠ አጠቃቀም ያገኛሉ እና የPro ተመዝጋቢዎች ደግሞ GPT‑5 Proን ከተሻለ ምክንያታዊነት ጋር የተሰጠ ስሪት ማግኘት ይችላሉ፣ ይህም ተጨማሪ እና ትክክለኛ መልሶችን ለማቅረብ የተሻለ ነው።
GPT‑5 አብዛኛዎቹን ጥያቄዎች የሚመልስ ብልህ እና ውጤታማ ሞዴል፣ ለከባድ ችግሮች ጥልቅ የማስተዋል ሞዴል (GPT‑5 አሳቢ) እና በውይይት ዓይነት፣ ውስብስብነት፣ መሳሪያ ፍላጎቶች እና በግልጽ አላማዎ ላይ በመመርኮዝ የትኛውን መጠቀም እንዳለበት በፍጥነት የሚወስን (ለምሳሌ በጥያቄው ውስጥ “ስለዚህ በደንብ አስቡበት” ካሉ)የጊዜው ላይ አስተላላፊ ነው። አስተላላፊው በትክክለኛ ምልክቶች ላይ መማር የሚቀጥል ሲሆን ተጠቃሚዎች ሞዴሎችን ሲቀይሩ፣ ለምላሾች የምርጫ መጠኖችን እና ትክክለኛነትን በመለካት በጊዜ ሂደት ይሻሻላል። አንዴ የአጠቃቀም ገደቦች ከተደረሱ በኋላ የእያንዳንዱ ሞዴል አነስተኛ እትም ቀሪ ጥያቄዎችን ያከናውናል። በቅርብ ጊዜ እነዚህን ችሎታዎች በአንድ ሞዴል ውስጥ ለማካተት እቅድ አለን።
GPT‑5 በደረጃ ማወዳደርያዎች ላይ የቀድሞ ሞዴሎችን ይበልጣል እናም ጥያቄዎችን በፍጥነት ይመልሳል፣ ነገር ግን—በይበልጥም—ለእውነተኛ ዓለም ጥያቄዎች ላይ የበለጠ ጠቃሚ ነው። በChatGPT በሦስቱ በጣም በተለመዱ አጠቃቀሞች፣ በጽሑፍ፣ በኮዲንግ እና በጤንነት ውስጥ የGPT‑5ን አፈጻጸም በማሳደግ፣ ቅዠቶችን በመቀነስ፣ መከተልን በማሻሻል እና ሳይኮፋኒዝምን በመቀነስ ረገድ ጉልህ እድገቶችን አሳይተናል።
GPT‑5 እስከ አሁን ድረስ በጣም ጠንካራ የሆነው የኮዲንግ ሞዴላችን ነው። ውስብስብ የፊት-መጨረሻ መፍጠር እና ትላልቅ ማከማቻዎችን መቃኘት ላይ ልዩ ማሻሻያዎችን ያሳያል። ብዙ ጊዜ ውብና ምላሽ ሰጪ ድር ጣቢያዎችን፣ መተግበርያዎችን እና ጨዋታዎችን በአንድ እርምጃ የሚማርክ ስሜትን በመፍጠር በተመጣጣኝነት እና በጣዕም ሀሳቦች ወደ እውነታ ይቀይራል። የመጀመሪያ ፈታኞች የንድፍ ምርጫዎቹን እንደ ክፍተት፣ የታይፖግራፊ እና ነጭ ቦታ ያሉ ነገሮችን በተሻለ ግንዛቤ በማድረግ አመልክተዋል። GPT‑5 ለአበልፃጊዎች ምን እንደሚከፍት ሙሉ ዝርዝሮችን እዚህ ይመልከቱ።
እዚህ፣ GPT‑5 በአንድ እርምጃ ብቻ የፈጠራቸውን አንዳንድ ምሳሌዎች ይገኛሉ፦
እርምጃ፦ በሚከተሉት መስፈርቶች መሰረት አንድ የኤችቲኤምኤል ፋይል ውስጥ አንድ ገጽ መተግበሪያ ፍጠር፦
- ስም፦ Jumping Ball Runner
- ግብ፦ በተቻለ መጠን በሕይወት ለመትረፍ እንቅፋቶችን መዝለል።
- ያካተተው፦ ፍጥነትን መጨመር፣ ከፍተኛ ውጤት መከታተል፣ እንደገና ሞክር አዝራር እና ለድርጊቶች እና ለክንውኖች አስቂኝ ድምጾች።
- UI በቀለማት ያሸበረቀ እንዲሁም ከፓራላክስ ማሸብለያ ዳራዎች ጋር መሆን አለበት።
- ገጸ ባሕርያቶቹ ካርቶን መምስል እና ለመመልከት አስደሳች መሆን አለባቸው።
- ጨዋታው ለሁሉም ሰው አስደሳች መሆን አለበት።
GPT‑5 እስካሁን ከነበሩን የጽሑፍ ተባባሪዎች በጣም ችሎታ ያለው ነው፣ ይህም እርስዎን ለመምራት እና ረቂቅ ሀሳቦችን ወደ አስገዳጅ፣ አስተጋቢ ፅሁፍ ከሥነ-ጽሑፋዊ ጥልቀት እና ምት ጋር ለመተርጎም ሊረዳህ ይችላል። መዋቅራዊ አሻሚነትን የሚያካትት ጽሁፍን በአስተማማኝ ሁኔታ፣ ለምሳሌ ያልተስተካከለ አያምቢክ ፔንታሜትር ወይም በተፈጥሮ የሚፈስ ነፃ ጥቅስ፣ የቅርጽ አክብሮትን ከሚገልጽ ግልጽነት ጋር በማጣመር ይቆጣጠራል። እነዚህ የተሻሻሉ የመጻፍ ችሎታዎች ማለት ChatGPT እንደ ሪፖርቶች፣ ኢሜይሎች፣ ማስታወሻዎች እና ሌሎች የዕለት ተግባራት ላይ እርስዎን ለመርዳት የተሻለ ይሆናል ማለት ነው። የGPT‑5 እና GPT‑4o የጽሑፍ ቅጥያዎች በታች ባለው ሰንጠረዥ ውስጥ ሊነጻጽሩ ይችላሉ።
GPT‑5 ተጠቃሚዎች ስለጤንነታቸው እንዲያውቁ እና እንዲሟገቱ የሚያስችል ከጤና ጋር ለተያያዙ ጥያቄዎች ያለን ምርጡ ሞዴል ነው። ሞዴሉ በHealthBench ላይ ከማንኛውም የቀድሞው ሞዴል በእጅጉ ከፍተኛ ደረጃ ያለው ውጤት አለው፣ ይህም በእውነተኛ ሁኔታዎች እና በሐኪም የተገለጹ መስፈርቶች መሠረት በዚህ ዓመት የተለቀቀ ግምገማም ነው። ከቀደመው ሞዴሎች ጋር ሲነፃፀር፣ እንደ ንቁ የአስተሳሰብ አጋር ሆኖ ይሠራል፣ ሊሆኑ የሚችሉ ስጋቶችንም በንቃት ይለያል እና የበለጠ ጠቃሚ መልሶችን ለመስጠት ጥያቄዎችን ይጠይቃል። ሞዴሉ አሁን ከተጠቃሚው አውድ፣ ከእውቀት ደረጃ እና ጂኦግራፊ ጋር በመስማማት የበለጠ ትክክለኛ እና አስተማማኝ ምላሾችን ይሰጣል፣ በሰፊ የሁኔታዎች ክልል ውስጥ ደህንነቱ የተጠበቀ እና የበለጠ ጠቃሚ ምላሾችን ማቅረብ ይችላል። ልብ ይበሉ፣ ChatGPT የሕክምና ባለሙያን አይተካትም—ውጤቶችን ለመረዳት፣ ከአቅራቢዎች ጋር በሚኖርዎት ጊዜ ትክክለኛ ጥያቄዎችን ለመጠየቅ እና ውሳኔዎችን ለማመዛዘን እንደ አጋር አድርገው ያአስቡት።
GPT‑5 በተለያዩ ጎራዎች ከቀዳሚዎቻችን ሞዴሎች የተሻለ እንደሆነ በአንዳንድ መንገዶች ማየት ይችላሉ - የበለፀገ፣ የበለጠ ዝርዝር ያለው እና ጠቃሚ - በእነዚህ ምሳሌዎች፦
GPT-4o
GPT-5
የGPT‑5 ምላሽ ትልቁ የስሜታዊ ቅስትን በጠንካራ መጨረሻ፣ በግልጽ ምስሎች እና በአስደናቂ ምሳሌዎች ("አሁን የሌለ ሀገር ጥቁር ባንዲራዎች"፣ "የኪዮቶ ደወል ምሽትን ምሽትን በተራራው ይጥላል") ግልጽ የባህል እና ቦታ ስሜትን ያመጣል። የGPT‑4o ስሪት ከማሳየት ይልቅ የሚናገር የበለጠ ሊጠበቅ የሚችል መዋቅር እና የቅላጼ እቅድ ይከተላል ("ታለቅሳለች ግን አትናገርም")።
*ለተሰጠው ጥያቄ በሁለቱ በ4o እና OpenAI o3 መካከል በተሻለ የሚሠራው የትኛው ሞዴል መሆኑን በማየት ያለውን ምላሽ መርጠናል።
GPT‑5 በአካዳሚክ እና በሰው የተገመገሙ መመዘኛዎች ላይ በተለይም በሂሳብ፣ በኮዲንግ፣ በንዑስ እይታ እና በጤና ላይ ያለው አፈፃፀም እንደሚያሳየው በሁሉም ዘርፎች የበለጠ ብልህ ነው። አዲስ የሥልጠና ደረጃ በሂሳብ (94.6% በAIME 2025 ያለ መሳሪያዎች)፣ በእውነተኛ ዓለም ኮዲንግ (በSWE-bench Verified 74.9%፣ በAider Polyglot 88%)፣ በባለብዙ ሞዴል ግንዛቤ (በMMMU 84.2%) እና በጤና (በHealthBench Hard 46.2%) ያስመዘግባል— እነዚህም እድገቶች በዕለታዊ አጠቃቀም ላይ ይታያሉ። በGPT‑5 pro የተራዘመ ምክንያታዊነት፣ ሞዴሉ በGPQA ላይ አዲስ የአለም ደረጃ አስተዋጽኦ ያሳድጋል፣ ይህም ያለ መሳሪያዎች 88.4% ውጤት ያሳያል።
*የመሳሪያዎች የAIME ውጤቶች በቀጥታ መሳሪያ ከሌላቸው ሞዴሎች አፈፃፀም ጋር መወዳደር የለባቸውም፤ እነሱ እንዴት እንደ GPT‑5 ያሉትን መሳሪያዎች በውጤታማነት እንደሚጠቀሙ ምሳሌዎች ናቸው።
ሁሉም የSWE-bench ግምገማ ስራዎች በውስጣዊ መሠረተ ልማት ላይ እንደተረጋገጡ ተግባራት n=477 ተግባሮችን ቋሚ ንዑስ ስብስብ ይጠቀማሉ።
GPT‑5 በመመሪያ መከታተል እና የኤጀንቲክ መሣሪያ አጠቃቀም ላይ በሚደረጉ ሙከራዎች ከፍተኛ እድገት ያሳያል፣ ይህም በተደጋጋሚ ደረጃ ጥያቄዎችን በአስተማማኝነት ለማከናወን፣ በተለያዩ መሣሪያዎች ላይ ማስተባበርን እና በአውድ ውስጥ ያሉ ለውጦችን ለማስተካከል የሚያስችሉ የችሎታ ዓይነቶችን ይሰጣል። በተግባር ይህ ማለት ውስብስብ እና እየተሻሻሉ ተግባሮችን ለማስተናገድ የተሻለ ነው፤ GPT‑5 መመሪያዎችዎን በታማኝነት መከተል እና በእሱ ያሉትን መሳሪያዎች በመጠቀም ከመጀመሪያ እስከ መጨረሻ የሚከናወኑትን ስራዎች የበለጠ መስራት ይችላል።
ሞዴሉ በእይታ፣ በቪዲዮ ላይ የተመሠረተ፣ ቦታዊ እና ሳይንሳዊ ምክንያታዊነትን በሚያካትት አይነተ ብዙ መለኪያዎች ይበልጣል። የበለጠ ጠንካራ አይነተ ብዙ አፈፃፀም ማለት ChatGPT በምስሎች እና ሌሎች ጽሑፍ ያልሆኑ ግቤቶች ላይ የበለጠ ትክክለኛ ሊያደርግ ይችላል—ይህም ገበታን መተርጎም፣ የሚቀርብ ፎቶን ማጠቃለል ወይም ስለ ንድፍ ጥያቄዎች መልስ መስጠት ሊሆን ይችላል።
GPT‑5 በውስብስብ፣ ኢኮኖሚያዊ ጠቀሜታ ያለው የእውቀት ስራ አፈጻጸምን በሚለካ ውስጣዊ ደረጃ ማወዳደርያ ላይ የተሻለ አፈጻጸም ያለው ሞዴላችን ነው። ምክንያታዊነትን በሚጠቀሙበት ጊዜ GPT‑5 በግምት በግማሽ በሚሆኑ ጉዳዮች ውስጥ ከባለሙያዎች ጋር ተመሳሳይ ወይም የተሻለ ነው፣ ይህም ሕግ፣ ሎጂስቲክስ፣ ሽያጭ እና ኢንጂነሪንግን ጨምሮ ከ40 በላይ ሙያዎች ውስጥ ተግባሮች ላይ ከo3 እና ChatGPT ወኪል ይበልጣል፣።
ከላይ ለሚደረጉ ግምገማዎች ዘዴ፦ ለGPT‑4o ውጤቶች እ.ኤ.አ እስከ ነሐሴ 2025 ድረስ በChatGPT ውስጥ ያለው ቅርብ ጊዜ ሞዴልን ያንፀባርቃሉ። ሁሉም ሞዴሎች በከፍተኛ 'ምክንያታዊ ጥረት' ቅንብሮች ላይ ይገመገማሉ። የማመዛዘን ጥረት በChatGPT ውስጥ ሊለያይ ይችላል፣ ሞዴሉን በሚጠቀሙበት ጊዜ ተጠቃሚው ሊያጋጥመው የሚችለው የላይኛው ወሰን ከፍተኛ ነው።
GPT‑5 ከአነስተኛ አስተሳሰብ ጊዜ የበለጠ እሴትን ያገኛል። በእኛ ግምገማዎች ውስጥ GPT‑5 (ከአስተሳሰብ ጋር) የእይታ ምክንያታዊነት፣ አጀንቲክ ኮዲንግ እና የምረቃ ደረጃ ሳይንሳዊ ችግር መፍትሄን ጨምሮ በችሎታዎች ላይ ከ50-80% አነስተኛ ቶከኖችን በመፍጠር ከOpenAI o3 የተሻለ ውጤት ያስመዘግባል።
GPT‑5 በMicrosoft Azure AI ሱፐርኮምፒውቲንግ መሠረት ላይ ሰልጥኗል።
GPT‑5 ከቀደም ሞዴሎቻችን አንጻር የመቃዠት ዕድሉ በእጅጉ ዝቅተኛ ነው። የChatGPT ምርት ትራፊክ ተወካይ በማይታወቁ እርምጃዎች ላይ የድር ፍለጋ ማንቃት ከተከናወነ፣ የGPT‑5 ምላሾች ከGPT‑4o ጋር ሲነጽጸር የእውነተኛ ስህተት የመያዝ ዕድሉ ~45% ያነሰ ነው፣ ሲያስብም የGPT‑5 ምላሾች ከOpenAI o3 አንጻር የእውነተኛ ስህተት የመያዝ ዕድሉ ~ 80% ያነሰ ነው።
በተለይ ውስብስብ እና ክፍት በሆኑ ጥያቄዎች ላይ ስናሰላስል ሞዴሎቻችንን የበለጠ አስተማማኝ ለማድረግ ቁርጠኞች ነን። ስለዚህ፣ ክፍት የሆኑ እውነታዎችን የጭንቅ ፈተና ለመፈጸም አዳዲስ ግምገማዎችን አክለናል። ከሁለት የህዝብ የእውነታ መመዘኛዎች ላይ ክፍት የሆኑ የእውነታ እርምጃዎችን በማሰብ የGPT‑5 የመቃዠት መጠንን ለክተናል -LongFact(በአዲስ መስኮት ውስጥ ይክፈታል) (ጽንሰ-ሀሳቦች እና ቁሶች) እና FActScore(በአዲስ መስኮት ውስጥ ይክፈታል)። በእነዚህ ሁሉ መመዘኛዎች ላይ፣ "GPT‑5 አሳቢ" በቅዠቶች ከፍተኛ መቀነስን ያሳያል—ከo3 አንጻር ስድስት እጥፍ ያነሰ—በተከታታይ ትክክለኛ የረጅም ቅርጽ ይዘትን ለማምረት ግልጽ ዝግጅትን ያሳያል። በእነዚህ መመዘኛዎች ላይ ለግምገማዎቻችን የአፈፃፀም እና የደረጃ አሰጣጥ ዝርዝሮች በሲስተም ካርድ ውስጥ ይገኛሉ።
ከተሻሻለ እውነታዊነት ጋር፣ GPT‑5 (ከአስተሳሰብ ጋር) ድርጊቶቹን እና ችሎታዎቹን በታማኝነት ለተጠቃሚው ይወጣል—በተለይም ለማይቻሉ፣ ያልተገለጡ ወይም ቁልፍ የጎደሉ መሳሪያዎች ተግባራት ላይ። በስልጠና ወቅት ከፍተኛ ሽልማት ለማግኘት ምክንያታዊ ሞዴሎች አንድ ተግባርን በተሳካ ሁኔታ ስለማጠናቀቃቸው መዋሸት ሊማሩ ወይም እርግጠኛ ባልሆኑት መልስ ላይ ከመጠን በላይ እርግጠኛ ሊሆኑ ይችላሉ። ለምሳሌ፣ ይህንን ለመሞከር ሁሉንም ምስሎች በአይነተ ብዙ ደረጃ ማወዳደርያ CharXiv ጥያቄዎች አስወግደን ስንለካ OpenAI o3 በጊዜው 86.7% የሌሉ ምስሎች ሲሰጠን GPT‑5 ደግሞ 9% በራስ መተማመን መልሶችን ሰጥቶን ነበር።
በማመዛዘን ጊዜ GPT‑5 ተግባራት ሊጠናቀቁ የማይችሉበትን ጊዜ በትክክል ይረዳል እና ገደቦቹንም በግልጽ ይገልጻል። የማይቻሉ የኮዲንግ ስራዎችን እና የጎደሉትን የአይነተ ብዙ ንብረቶችን በሚያካትቱ ቅንብሮች ላይ የማታለል መጠኖችን ገምግመናል እናም GPT‑5 (ከአስተሳሰብ ጋር) በሁሉም መለክያዎች ከo3 ያነሰ አታላይ ሆኖ አግኝተነዋል። በእውነተኛ በሚሰራው ChatGPT ትራፊክ የትልቅ ውይይቶች ስብስብ ላይ በመወሰን፣ ከo3 እስከ GPT‑5 የምክንያታዊ ምላሾች የማታለል መጠንን ከ4.8% ወደ 2.1% ቀንሰናል። ይህ ለተጠቃሚዎች ትርጉም ያለው መሻሻል ቢወክልም ተጨማሪ ሥራ መከናወን ይኖርበታል እናም የሞዴሎቻችንን እውነታነት እና ታማኝነት ለማሻሻል ጥናት ማድረግ እንቀጥል። ተጨማሪ ዝርዝሮችን በስርዓት ካርዱ ማግኘት ይችላሉ።
ከመቀነሻ በፊት
ከመቀነስ እርምጃ በኋላ
GPT‑5 ደህንነት ድንበር ያሻሽላል። ባለፈው ጊዜ ChatGPT በዋናነት በመቃወም እቅፍ ላይ የተመሠረተ የደህንነት ስልጠና ላይ የተማመነ፦ በተጠቃሚው እርምጃ ላይ በመመስረት ሞዴሉን መከተል ወይም መቃወም አለበት። የዚህ አይነት ስልጠና በግልፅ ተንኮል አዘል ለሆኑ ጥያቄዎች ጥሩ የሚሰራ ቢሆንም፣ የተጠቃሚው አላማ ግልፅ ያልሆነበትን ወይም መረጃን በአስተማማኝ ወይም በተንኮል አዘል መንገዶች ለመጠቀም የሚታሰቡ ሁኔታዎች ላይ ሊቸገር ይችላል። የእምቢታ ስልጠና በተለይም እንደ ቫይሮሎጂ ባሉ ባለሁለት ጎራዎች ላይ አስቸጋሪ ነው፣ ምንም እንኳን በከፍተኛ ደረጃ ደህንነቱ በተጠበቀ ሁኔታ ሊከናወን ቢችልም፣ በዝርዝር ከተጠናቀቀ መጥፎ ተዋንያን ሊጠቀሙበት ይችላል።
ለGPT‑5 አዲስ የደህንነት ስልጠና ዓይነት — ደህንነት ማጠናቀቂያዎች — አስገብተናል፣ ይህም ሞዴሉ በተቻለ መጠን በጣም ጠቃሚ መልስ እንዲሰጥ እና በደህንነት ድንበሮች ውስጥ እንዲቆይ ያስተምራል። አንዳንድ ጊዜ ይህ ማለት የተጠቃሚውን ጥያቄ በከፊል መመለስ ወይም በከፍተኛ ደረጃ ብቻ መመለስ ማለት ሊሆን ይችላል። ሞዴሉ መቃወም ካለበት፣ GPT‑5 ለምን መቃዎም እንዳለበት በግልፅ እንዲነግርዎት እንዲሁም ደህንነታቸው የተጠበቁ አማራጮችን እንዲያቀርብ የተማራ ነው። በሁለቱም ቁጥጥር ውስጥ ባሉ ሙከራዎች እና እውነተኛ በሚሰራው ሞዴሎቻችን ውስጥ ይህ አቀራረብ የበለጠ የተለየ መሆኑን እናገኛለን፣ ይህም የባለሁለት አጠቃቀም ጥያቄዎችን የተሻለ አሰሳ፣ ለአስተዋይ አላማ ጠንካራ ጥንካሬ እና ያነሰ ያልተፈለገ መከላከያ እንደሚያመጣ እናገኛለን። ስለ አዲሱ የደህንነት-ስልጠና አቀራረባችንን እንዲሁም ስለ የስልጠና ዘዴ፣ መለኪያዎች እና ውጤቶች ሙሉ ዝርዝሮችን በደህንነት የተጠናቀቀ ወረቀታችን ላይ የበለጠ ያንብቡ።
በእርምጃ ዓይነቶች ላይ ደህንነት እና አጋዥነት (አስተማማኝ ምላሾች ሲሰጡ)። GPT‑5 (ከአሳቢ ጋር) በሁሉም እርምጃ ዓይነቶች ላይ ከፍተኛ ደህንነትን እና የበለጠ እርዳታን ያሳያል።
በአጠቃላይ፣ GPT‑5 በጣም በፈቃደኝነት ተስማሚ አይደለም፣ አላስፈላጊ ኢሞጂዎችን በትንሽ ይጠቀማል፣ እና ከGPT‑4o ጋር ሲነፃፀር በክትትል ውስጥ የበለጠ የላቀ እና አሳቢ የሆነ ነው። "ከኤአይ ጋር መነጋገር" ሳይሆን ከፒኤችዲ ደረጃ የማሰብ ችሎታ ካለው ከጠቃሚ ጓደኛ ጋር ውይይት የሚመስል መሆን አለበት።
በዚህ ዓመት መጀመሪያ ላይ ሞዴሉን ከልክ በላይ መታዘዝ ወይም ከልክ በላይ የሚያስደንቅ ወይም ተስማሚ የሚያደርገውን ዝማኔ ለGPT‑4o አውጥተን ነበር። ለውጡንም በፍጥነት መልሰነዋል እናም ከዚያ ጊዜ ጀምሮ ይህንን ባህሪ ለመረዳት እና ለመቀነስ ስራ ጀምረናል።
- የሳይኮፋንሲ ደረጃዎችን ለመለካት አዳዲስ ግምገማዎችን ማበልጸግ
- ሞዴሉ መስማማትን እንዲቀንስ ስልጠናችንን ማሻሻል—ለምሳሌ፣ በተለምዶ ከመጠን በላይ ስምምነትን የሚያስከትሉ ምሳሌዎችን ማከል እና ከዚያ እንደዚያ እንዳያደርግ ማስተማር።
የተለዩ የሳይኮፋንሲ ምላሾችን ለማግኘት የተነደፉ እርምጃዎችን በመጠቀም በታለሙ የሳይኮፋንሲ ግምገማዎች ውስጥ GPT‑5 የሳይኮፋንሲ ምላሾችን በትርጉም ቀንሷል (ከ14.5% ወደ 6% በታች)። አንዳንድ ጊዜ የሳይኮፋንሲን መቀነስ የተጠቃሚን እርካታ በመቀነስ ሊመጣ ይችላል፣ ነገር ግን ያደረግናቸው ማሻሻያዎች ሳይኮፋንሲን ከግማሽ በላይ የሚቀንሱ ሲሆን ሌሎች ሊለኩ የሚችሉ ጥቅሞችን ያስገኛል፣ ስበማስገኘት ተጠቃሚዎች ChatGPTን በደንብ እንዲጠቀሙ ለመርዳት ከዓላማችን ጋር በሚስማማ መልኩ ከፍተኛ ጥራት ያለው ገንቢ ውይይት ማግኘታቸውን ቀጥለዋል።
GPT‑5 በመመሪያ ተከታታይነት እጅግ የተሻለ ነው እናም ብጁ መመሪያዎችን የመከተል ችሎታው ላይ ተዛማጅ መሻሻል እናያለን።
እንዲሁም በአስተዳደር ችሎታ ላይ በተደረጉ ማሻሻያዎች የተቻለ ለሁሉም ChatGPT ተጠቃሚዎች አራት አዳዲስ ቅድመ-ዕይታ ያላቸው የጥናት ቅድመ ባህሪያትንም እንጀምራለን። እነዚህ፣ በመጀመሪያ ለጽሑፍ ውይይት የሚገኙ እና በኋላም ወደ ድምፅ የሚመጡ፣ ChatGPT እንዴት እንደሚገናኝ እንዲያዋቅሩ ያስችሉዎታል—አጭር እና ፕሮፌሽናል፣ አሳቢ እና ደጋፊ፣ ወይም ትንሽ ቀላጅ—ብጁ ጥያቄዎችን ሳይጽፉ። አራቱ የመጀመሪያ አማራጮች ሲኒክ፣ ሮቦት፣ አዳማጭ እና ነርድ እንደ ፈቃደኝነት የሚመረጡ፣ በማንኛውም ጊዜ በቅንብሮች ውስጥ የሚስተካከሉ እና ከእርስዎ የግንኙነት ዘይቤ ጋር እንዲዛመዱ የተነደፉ ናቸው።
እነዚህ ሁሉ አዳዲስ ስብዕናዎች ሳይኮፋንሲን ለመቀነስ በውስጣዊ ግምገማ ላይ ያለውን መጠን ይሞላሉ ወይም ያስበልጣሉ።
በመጀመሪያ ግብረ መልስ ላይ በመመስረት መማርና መደጋገምን እንጠብቃለን።
በባዮሎጂካል እና ኬሚካል ጎራ ውስጥ የ“GPT‑5 አሳቢ” ሞዴልን እንደ ከፍተኛ አቅም ለመያዝ ወስነናል እና ተዛማጅ አደጋዎችን በበቂ ሁኔታ ለመቀነስ ጠንካራ መከላከያዎችን ተግባራዊ አድርገናል። እንደ CAISI እና UK AISI ያሉ አጋሮች ጋር 5,000 ሰዓታት ቀይ-ቡድን በማጠናቀቅ በዝግጁነት ማእቀፍ ሞዴሉን በጥብቅ በማስረጃ የደህንነት ግምገማዎቻችንን ፈትነናል።
ለChatGPT ወኪል ከእኛ አቀራረብ ጋር ተመሳሳይ በሆነው፣ ይህ ሞዴል አዲስ ጀማሪዎች ከባድ ባዮሎጂካል ጉዳት የሚፈጥሩበትን መንገድ ትርጉም ባለው ሁኔታ ሊረዳ እንደሚችል እርግጥ የሆነ ማስረጃ ባይኖርንም - ለከፍተኛ አቅም የተገለፀ ወሰን -የእኛ የተወሰነ ገደብ(በአዲስ መስኮት ውስጥ ይክፈታል) እንደዚህ ያሉ ችሎታዎች ሲኖሩ ዝግጁነትን ለመጨመር የጥንቃቄ እርምጃ እየወሰድን ሲሆን አስፈላጊዎቹን መከላከያዎችም አሁን እየሰራን ነው። በዚህም ምክንያት "GPT‑5 አሳቢ" ለባዮሎጂ ባለብዙ ሽፋን የመከላከያ ስርዓት ያለው ጠንካራ የደህንነት መዋቅር አለው፦ አዲሱ ደህንነት በተጠበቀ ማጠናቀቂያችን በኩል ውጤት እንዳይወጣ ለሞዴሉ ስልጠና ማድረግ፣ ሁል ጊዜ የሚሰሩ መደብሮች እና ምክንያታዊ መቆጣጠሪያዎች እና ግልጽ የማስፈጸምያ መስመሮች።
በስርዓት ካርዳችን ውስጥ ለGPT‑5 ስለ ጠንካራ የደህንነት አቀራረባችን ዝርዝር ያንብቡ የስርዓት ካርድ።
በጣም ፈታኝ፣ ውስብስብ ለሆኑ ተግባራት ከፍተኛ ጥራት ያላቸውን እና በጣም አጠቃላይ መልሶችን ለማቅረብ GPT‑5 pro OpenAI o3‑proን በመተካት የተመጣጠነ ነገር ግን ቀልጣፋ ትይዩ የሙከራ ጊዜ ስሌትን በመጠቀም ረጅም ጊዜ የሚያስበውን GPT‑5 proን እንለቀቃለን። GPT‑5 pro በGPT‑5 ቤተሰብ እጅግ በጣም አስቸጋሪ የሆኑ የሳይንስ ጥያቄዎችን የያዘ በGPQA ላይ ያለውን ዘመናዊ አፈጻጸም ጨምሮ ከፍተኛውን አፈጻጸም በበርካታ ፈታኝ የእውቀት መመዘኛዎች ላይ አስመዝግቧል።
ከ1000 በላይ ኢኮኖሚያዊ ዋጋ ያላቸው እውነተኛ ዓለም እርምጃዎች ላይ በተደረጉ ግምገማዎች ውጤት፣ ውጫዊ ባለሙያዎች GPT‑5 proን ከ"GPT‑5 አሳቢ" 67.8% በላይ እንደሚመርጡ አስተውለዋል። GPT‑5 pro 22% አነስተኛ ዋና ስህተቶችን ያደረገ ሲሆን በጤና፣ በሳይንስ፣ በሂሳብ እና በኮዲንግ በልጧል። ባለሙያዎች ምላሾቹን ተገቢ፣ ጠቃሚ፣ እና ሁሉን አቀፍ ብለው ገምግመውታል።
GPT‑5 በChatGPT ውስጥ አዲሱ ነባሪ ነው፣ ይህም ለተመዘገቡ ተጠቃሚዎች GPT‑4o፣ OpenAI o3፣ OpenAI o4-mini፣ GPT‑4.1 እና GPT‑4.5ን ይተካል። ChatGPTን ብቻ ይክፈቱ እና ጥያቄዎን ያስገቡ፤ GPT‑5 የቀረውን ያከናውናል፣ ምላሹ ተጠቃሚ ሲሆን ምክንያታዊነትን በራስ-ሰር ይተገብራል። የሚከፈሉ ተጠቃሚዎች ከፈለጉ ከሞዴል መምረጫው "GPT‑5 አሳቢ"ን መምረጥ ወይም ምላሽ በሚያመነጭበት ጊዜ እርምጃ ውስጥ 'ይሄንን በደንብ አስብበት' የመሰለ ነገር መጻፍ ይችላሉ።
GPT‑5 ዛሬ ለሁሉም Plus, Pro, Team, እና Free ተጠቃሚዎች መዘጋጀት ይጀምራል፣ ለEnterprise እና Edu ደግሞ ተጠቃሚዎች ቀጣይ ሳምንት መድረስ ይጀምራል። Pro፣ Plus እና Team ተጠቃሚዎች እንዲሁም በChatGPT በመግባት በCodex CLI(በአዲስ መስኮት ውስጥ ይክፈታል) ውስጥ በGPT‑5 መጀመር ይችላሉ።
ልክ እንደ GPT‑4o፣ የGPT‑5 የነፃ እና የክፍያ መዳረሻ መካከል ያለው ልዩነት የአጠቃቀም መጠን ነው። የPro ተመዝጋቢዎች የGPT‑5 ያልተገደበ መዳረሻ እና የGPT‑5 Pro መዳረሻ ያገኛሉ። የPlus ተጠቃሚዎች ከነፃ ተጠቃሚዎች በእጅጉ ከፍ ያለ አጠቃቀም ስላለው ለዕለት ተዕለት ጥያቄዎች እንደ ነባሪ ሞዴላቸው ሊጠቀሙት ይችላሉ። የTeam፣ Enterprise እና የEdu ደንበኞች GPT‑5ን በምቾት እንደ ነባሪ ሞዴል ለዕለት ተዕለት ሥራ ሊጠቀሙበት ይችላሉ፣ እነዚህ ሰፊ ገደቦች ሙሉ ድርጅቶች በGPT‑5 ላይ እንዲተማመኑ ያስችላቸዋል። ለChatGPT Free ተጠቃሚዎች ሙሉ የማመዛዘን ችሎታዎች ሙሉ በሙሉ እስኪወጣ ጥቂት ቀናት ሊወስድ ይችላል። ነፃ ተጠቃሚዎች የGPT‑5 የአጠቃቀም ገደቦቻቸው ጋር ከደረሱ በኋላ ወደ GPT‑5 mini፣ አነስተኛ፣ ፈጣን እና ከፍተኛ ችሎታ ያለው ሞዴል ይለዋወጣሉ።
ደራሲ
የግርጌ ማስታወሻዎች
* በቀዳሚው የብሎግ ልጥፋችን ውስጥ ከተዘገቡ ቁጥሮች ጋር ትንሽ ልዩነት አለ፣ እነዚህ በቀድሞ የHLE ስሪት ላይ የተከናወነ ነው።
** በMultiChallenge (GPT-4o) ውስጥ ያለው ነባሪ ደረጃ ሰጪ በተደጋጋሚ የሞዴል ምላሾችን በተሳሳተ ሁኔታ ደረጃ እንደሚሰጥ አግኝተናል። እንደ o3-mini ያሉ ደረጃ መስጫውን ወደ አመዛዛኝ ሞዴል መቀየር በምርመራችን የተመረመሩ ናሙናዎች ላይ ትክክለኛነትን በከፍተኛ ደረጃ እንደሚያሻሽል አግኝተናል።
***ለMMMUPro፣ የመደበኛ እና የዕይታ ነጥቦችን አማካኝ አድርገናል።
አስተዋጽዖ አበርካቾች
Aaditya Singh፣ Adam Fry፣ Adam Perelman፣ Adam Tart፣ Adi Ganesh፣ Ahmed El-Kishky፣ Aidan McLaughlin፣ Aiden Low፣ AJ Ostrow፣ Akhila Ananthram፣ Akshay Nathan፣ Alan Luo፣ Alec Helyar፣ Aleksander Madry፣ Aleksandr Efremov፣ Aleksandra Spyra፣ Alex Baker-Whitcomb፣ Alex Beutel፣ Alex Karpenko፣ Alex Makelov፣ Alex Neitz፣ Alex Wei፣ Alexandra Barr፣ Alexandre Kirchmeyer፣ Alexey Ivanov፣ Alexi Christakis፣ Alistair Gillespie፣ Allison Tam፣ Ally Bennett፣ Alvin Wan፣ Alyssa Huang፣ Amy McDonald Sandjideh፣ Amy Yang፣ Ananya Kumar፣ Andre Saraiva፣ Andrea Vallone፣ Andrei Gheorghe፣ Andres Garcia Garcia፣ Andrew Braunstein፣ Andrew Liu፣ Andrew Schmidt፣ Andrey Mereskin፣ Andrey Mishchenko፣ Andy Applebaum፣ Andy Rogerson፣ Ann Rajan፣ Annie Wei፣ Anoop Kotha፣ Anubha Srivastava፣ Anushree Agrawal፣ Arun Vijayvergiya፣ Ashley Tyra፣ Ashvin Nair፣ Avi Nayak፣ Ben Eggers፣ Bessie Ji፣ Beth Hoover፣ Bill Chen፣ Blair Chen፣ Boaz Barak፣ Borys Minaiev፣ Botao Hao፣ Bowen Baker፣ Brad Lightcap፣ Brandon McKinzie፣ Brandon Wang፣ Brendan Quinn፣ Brian Fioca፣ Brian Hsu፣ Brian Yang፣ Brian Yu፣ Brian Zhang፣ Brittany Brenner፣ Callie Riggins Zetino፣ Cameron Raymond፣ Camillo Lugaresi፣ Carolina Paz፣ Cary Hudson፣ Cedric Whitney፣ Chak Li፣ Charles Chen፣ Charlotte Cole፣ Chelsea Voss፣ Chen Ding፣ Chen Shen፣ Chengdu Huang፣ Chris Colby፣ Chris Hallacy፣ Chris Koch፣ Chris Lu፣ Christina Kaplan፣ Christina Kim፣ CJ Minott-Henriques፣ Cliff Frey፣ Cody Yu፣ Coley Czarnecki፣ Colin Reid፣ Colin Wei፣ Cory Decareaux፣ Cristina Scheau፣ Cyril Zhang፣ Cyrus Forbes፣ Da Tang፣ Dakota Goldberg፣ Dan Roberts፣ Dana Palmie፣ Daniel Kappler፣ Daniel Levine፣ Daniel Wright፣ Dave Leo፣ David Lin፣ David Robinson፣ Declan Grabb፣ Derek Chen፣ Derek Lim፣ Derek Salama፣ Dibya Bhattacharjee፣ Dimitris Tsipras፣ Dinghua Li፣ Dingli Yu፣ DJ Strouse፣ Drew Williams፣ Dylan Hunn፣ Ed Bayes፣ Edwin Arbus፣ Ekin Akyurek፣ Elaine Ya Le፣ Elana Widmann፣ Eli Yani፣ Elizabeth Proehl፣ Enis Sert፣ Enoch Cheung፣ Eri Schwartz፣ Eric Han፣ Eric Jiang፣ Eric Mitchell፣ Eric Sigler፣ Eric Wallace፣ Erik Ritter፣ Erin Kavanaugh፣ Evan Mays፣ Evgenii Nikishin፣ Fangyuan Li፣ Felipe Petroski Such፣ Filipe de Avila Belbute Peres፣ Filippo Raso፣ Florent Bekerman፣ Foivos Tsimpourlas፣ Fotis Chantzis፣ Francis Song፣ Francis Zhang፣ Gaby Raila፣ Garrett McGrath፣ Gary Briggs፣ Gary Yang፣ Giambattista Parascandolo፣ Gildas Chabot፣ Grace Kim፣ Grace Zhao፣ Gregory Valiant፣ Guillaume Leclerc፣ Hadi Salman፣ Hanson Wang፣ Hao Sheng፣ Haoming Jiang፣ Haoyu Wang፣ Haozhun Jin፣ Harshit Sikchi፣ Heather Schmidt፣ Henry Aspegren፣ Honglin Chen፣ Huida Qiu፣ Hunter Lightman፣ Ian Covert፣ Ian Kivlichan፣ Ian Silber፣ Ian Sohl፣ Ibrahim Hammoud፣ Ignasi Clavera፣ Ikai Lan፣ Ilge Akkaya፣ Ilya Kostrikov፣ Irina Kofman፣ Isak Etinger፣ Ishaan Singal፣ Jackie Hehir፣ Jacob Huh፣ Jacqueline Pan፣ Jake Wilczynski፣ Jakub Pachocki፣ James Lee፣ James Quinn፣ Jamie Kiros፣ Janvi Kalra፣ Jasmyn Samaroo፣ Jason Wang፣ Jason Wolfe፣ Jay Chen፣ Jay Wang፣ Jean Harb፣ Jeffrey Han፣ Jeffrey Wang፣ Jennifer Zhao፣ Jeremy Chen፣ Jerene Yang፣ Jerry Tworek፣ Jesse Chand፣ Jessica Landon፣ Jessica Liang፣ Ji Lin፣ Jiancheng Liu፣ Jianfeng Wang፣ Jie Tang፣ Jihan Yin፣ Joanne Jang፣ Joel Morris፣ Joey Flynn፣ Johannes Ferstad፣ Johannes Heidecke፣ John Fishbein፣ John Hallman፣ Jonah Grant፣ Jonathan Chien፣ Jonathan Gordon፣ Jongsoo Park፣ Jordan Liss፣ Jos Kraaijeveld፣ Joseph Guay፣ Joseph Mo፣ Josh Lawson፣ Josh McGrath፣ Joshua Vendrow፣ Joy Jiao፣ Julian Lee፣ Julie Steele፣ Julie Wang፣ Junhua Mao፣ Kai Chen፣ Kai Hayashi፣ Kai Xiao፣ Kamyar Salahi፣ Kan Wu፣ Karan Sekhri፣ Karan Sharma፣ Karan Singhal፣ Karen Li፣ Kenny Nguyen፣ Keren Gu-Lemberg፣ Kevin King፣ Kevin Liu፣ Kevin Stone፣ Kevin Yu፣ Kristen Ying፣ Kristian Georgiev፣ Kristie Lim፣ Kushal Tirumala፣ Kyle Miller፣ Lama Ahmad፣ Larry Lv፣ Laura Clare፣ Laurance Fauconnet፣ Lauren Itow፣ Lauren Yang፣ Laurentia Romaniuk፣ Leah Anise፣ Lee Byron፣ Leher Pathak፣ Leon Maksin፣ Leyan Lo፣ Leyton Ho፣ Li Jing፣ Liang Wu፣ Liang Xiong፣ Lien Mamitsuka፣ Lin Yang፣ Lindsay McCallum፣ Lindsey Held፣ Liz Bourgeois፣ Logan Engstrom፣ Lorenz Kuhn፣ Louis Feuvrier፣ Lu Zhang፣ Lucas Switzer፣ Lukas Kondraciuk፣ Lukasz Kaiser፣ Manas Joglekar፣ Mandeep Singh፣ Mandip Shah፣ Manuka Stratta፣ Marcus Williams፣ Mark Chen፣ Mark Sun፣ Marselus Cayton፣ Martin Li፣ Marvin Zhang፣ Marwan Aljubeh፣ Matt Nichols፣ Matthew Haines፣ Max Schwarzer፣ Mayank Gupta፣ Meghan Shah፣ Melody Huang፣ Meng Dong፣ Mengqing Wang፣ Mia Glaese፣ Micah Carroll፣ Michael Lampe፣ Michael Malek፣ Michael Sharman፣ Michael Zhang፣ Michele Wang፣ Michelle Pokrass፣ Mihai Florian፣ Mikhail Pavlov፣ Miles Wang፣ Ming Chen፣ Mingxuan Wang፣ Minnia Feng፣ Mo Bavarian፣ Molly Lin፣ Moose Abdool፣ Mostafa Rohaninejad፣ Nacho Soto፣ Natalie Staudacher፣ Natan LaFontaine፣ Nathan Marwell፣ Nelson Liu፣ Nick Preston፣ Nick Turley፣ Nicklas Ansman፣ Nicole Blades፣ Nikil Pancha፣ Nikita Mikhaylin፣ Niko Felix፣ Nikunj Handa፣ Nishant Rai፣ Nitish Keskar፣ Noam Brown፣ Ofir Nachum፣ Oleg Boiko፣ Oleg Murk፣ Olivia Watkins፣ Oona Gleeson፣ Pamela Mishkin፣ Patryk Lesiewicz፣ Paul Baltescu፣ Pavel Belov፣ Peter Zhokhov፣ Philip Pronin፣ Phillip Guo፣ Phoebe Thacker፣ Qi Liu፣ Qiming Yuan፣ Qinghua Liu፣ Rachel Dias፣ Rachel Puckett፣ Rahul Arora፣ Ravi Teja Mullapudi፣ Raz Gaon፣ Reah Miyara፣ Rennie Song፣ Rishabh Aggarwal፣ RJ Marsan፣ Robel Yemiru፣ Robert Xiong፣ Rohan Kshirsagar፣ Rohan Nuttall፣ Roman Tsiupa፣ Ronen Eldan፣ Rose Wang፣ Roshan James፣ Roy Ziv፣ Rui Shu፣ Ruslan Nigmatullin፣ Saachi Jain፣ Saam Talaie፣ Sam Altman፣ Sam Arnesen፣ Sam Toizer፣ Sam Toyer፣ Samuel Miserendino፣ Sandhini Agarwal፣ Sarah Yoo፣ Savannah Heon፣ Scott Ethersmith፣ Sean Grove፣ Sean Taylor፣ Sebastien Bubeck፣ Sever Banesiu፣ Shaokyi Amdo፣ Shengjia Zhao፣ Sherwin Wu፣ Shibani Santurkar፣ Shiyu Zhao፣ Shraman Ray Chaudhuri፣ Shreyas Krishnaswamy፣ Shuaiqi (Tony) Xia፣ Shuyang Cheng፣ Shyamal Anadkat፣ Simón Posada Fishman፣ Simon Tobin፣ Siyuan Fu፣ Somay Jain፣ Song Mei፣ Sonya Egoian፣ Spencer Kim፣ Spug Golden፣ SQ Mah፣ Steph Lin፣ Stephen Imm፣ Steve Sharpe፣ Steve Yadlowsky፣ Sulman Choudhry፣ Sungwon Eum፣ Suvansh Sanjeev፣ Tabarak Khan፣ Tal Stramer፣ Tao Wang፣ Tao Xin፣ Tarun Gogineni፣ Taya Christianson፣ Ted Sanders፣ Tejal Patwardhan፣ Thomas Degry፣ Thomas Shadwell፣ Tianfu Fu፣ Tianshi Gao፣ Timur Garipov፣ Tina Sriskandarajah፣ Toki Sherbakov፣ Tomer Kaftan፣ Tomo Hiratsuka፣ Tongzhou Wang፣ Tony Song፣ Tony Zhao፣ Troy Peterson፣ Val Kharitonov፣ Victoria Chernova፣ Vineet Kosaraju፣ Vishal Kuo፣ Vitchyr Pong፣ Vivek Verma፣ Vlad Petrov፣ Wanning Jiang፣ Weixing Zhang፣ Wenda Zhou፣ Wenlei Xie፣ Wenting Zhan፣ Wes McCabe፣ Will DePue፣ Will Ellsworth፣ Wulfie Bain፣ Wyatt Thompson፣ Xiangning Chen፣ Xiangyu Qi፣ Xin Xiang፣ Xinwei Shi፣ Yann Dubois፣ Yaodong Yu፣ Yara Khakbaz፣ Yifan Wu፣ Yilei Qian፣ Yin Tat Lee፣ Yinbo Chen፣ Yizhen Zhang፣ Yizhong Xiong፣ Yonglong Tian፣ Young Cha፣ Yu Bai፣ Yu Yang፣ Yuan Yuan፣ Yuanzhi Li፣ Yufeng Zhang፣ Yuguang Yang፣ Yujia Jin፣ Yun Jiang፣ Yunyun Wang፣ Yushi Wang፣ Yutian Liu፣ Zach Stubenvoll፣ Zehao Dou፣ Zheng Wu እና Zhigang Wang


