17 มีนาคม 2569

ขอแนะนำ GPT‑5.4 mini และ nano

โมเดลที่รวดเร็วและมีประสิทธิภาพ ซึ่งเราปรับจูนมาเพื่อเน้นงานเขียนโค้ดและการทำงานของเอเจนต์ย่อยโดยเฉพาะ

กำลังโหลด…

วันนี้เราเปิดให้ใช้งาน GPT‑5.4 mini และ nano ซึ่งเป็นโมเดลขนาดเล็กที่มีประสิทธิภาพสูงสุดเท่าที่เราเคยมีมา เรานำความสามารถที่โดดเด่นของ GPT‑5.4 มาใส่ไว้ในโมเดลรุ่นใหม่ที่ทำงานได้รวดเร็วและมีประสิทธิภาพยิ่งขึ้น เพื่อตอบโจทย์การประมวลผลข้อมูลจำนวนมากได้อย่างลื่นไหล

เรายกระดับศักยภาพของ GPT‑5.4 mini ให้เหนือกว่า GPT‑5 mini ทั้งในด้านการเขียนโค้ด การให้เหตุผล การทำความเข้าใจมัลติโมดอล และการใช้เครื่องมือ โดยทำงานได้รวดเร็วกว่าเดิมมากกว่า 2 เท่า โมเดลรุ่นนี้มีประสิทธิภาพใกล้เคียงกับ GPT‑5.4 รุ่นใหญ่ในการทดสอบหลายด้าน ซึ่งรวมถึงการวัดผลบน SWE-Bench Pro และ OSWorld-Verified ด้วย

GPT‑5.4 nano คือเวอร์ชันที่เล็กและประหยัดค่าใช้จ่ายที่สุดในตระกูล GPT‑5.4 สำหรับงานที่เน้นความเร็วและต้นทุนเป็นสำคัญ มันยังถือเป็นการอัปเกรดครั้งใหญ่จาก GPT‑5 nano อีกด้วย เราแนะนำให้ใช้สำหรับงานจำแนกประเภท การสกัดข้อมูล การจัดอันดับ รวมถึงระบบเอเจนต์ย่อยที่ช่วยเคลียร์งานสนับสนุนง่ายๆ ให้เสร็จสิ้นอย่างรวดเร็ว

โมเดลเหล่านี้ได้รับการออกแบบมาสำหรับงานที่ความหน่วงมีผลโดยตรงต่อประสบการณ์ใช้งาน เช่น ผู้ช่วยเขียนโค้ดที่ต้องตอบสนองทันที อเจนต์ย่อยที่ต้องทำงานสนับสนุนอย่างรวดเร็ว ระบบที่จับภาพหน้าจอและตีความได้ทันที และแอปมัลติโหมดที่วิเคราะห์ภาพแบบเรียลไทม์ สำหรับการใช้งานในลักษณะนี้ โมเดลที่ดีที่สุดมักไม่ใช่โมเดลที่มีขนาดใหญ่ที่สุด แต่เป็นโมเดลที่สามารถตอบโต้ได้อย่างรวดเร็ว เรียกใช้เครื่องมือต่างๆ ได้อย่างแม่นยำ และยังคงทำผลงานได้ดีในงานวิชาชีพที่ซับซ้อน

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-Bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%
Toolathlon	54.6%	42.9%	35.5%	26.9%
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%

^{1 ค่าระดับ reasoning_effort สูงสุดที่มีให้เลือกสำหรับ GPT‑5 mini คือ 'สูง'}

มาฟังเสียงตอบรับจากผู้ใช้งานจริงหลังจากเราเปิดให้ทดลองใช้ GPT‑5.4 mini และ nano ในเวิร์กโฟลว์ของพวกเขา

"ในบรรดาโมเดลระดับเดียวกัน GPT-5.4 mini ทำผลงานในภาพรวมตั้งแต่ต้นจนจบกระบวนการได้อย่างยอดเยี่ยม จากการประเมินของเรา โมเดลนี้มีประสิทธิภาพทัดเทียมหรือสูงกว่าคู่แข่ง ทั้งในด้านการสร้างผลลัพธ์และการดึงข้อมูลอ้างอิง ในขณะที่ใช้ค่าใช้จ่ายน้อยกว่าอย่างเห็นได้ชัด นอกจากนี้ยังมีอัตราการผ่านแบบครบกระบวนการสูงกว่า และระบุแหล่งที่มาของข้อมูลได้แม่นยำกว่าโมเดล GPT-5.4 รุ่นใหญ่อีกด้วย"

— Aabhas Sharma ซีทีโอจาก Hebbia

การเขียนโค้ด

GPT‑5.4 mini และ nano มอบประสิทธิภาพที่โดดเด่นในกระบวนการเขียนโค้ดที่ต้องการความรวดเร็วในการปรับแก้ซ้ำ โมเดลเหล่านี้จัดการงานแก้ไขเฉพาะจุด การไล่ดูโครงสร้างโค้ด การสร้างส่วนหน้าของเว็บไซต์ และการไล่แก้บั๊กด้วยความหน่วงที่ต่ำมาก ซึ่งเหมาะอย่างยิ่งสำหรับงานเขียนโค้ดที่ต้องการความฉับไวและต้นทุนที่ต่ำลง

ผลการทดสอบเกณฑ์มาตรฐานชี้ว่า GPT‑5.4 mini ทำคะแนนได้เหนือกว่า GPT‑5 mini อย่างสม่ำเสมอในระดับความเร็วที่ใกล้เคียงกัน และมีศักยภาพขยับเข้าใกล้ระดับของ GPT‑5.4 รุ่นใหญ่ โดยทำงานได้รวดเร็วขึ้นมาก มอบจุดสมดุลระหว่างประสิทธิภาพและความไวที่แข็งแกร่งที่สุดตัวหนึ่งสำหรับกระบวนการเขียนโค้ด

เราประเมินความหน่วงโดยพิจารณาจากพฤติกรรมการใช้งานจริงของโมเดล ร่วมกับการจำลองสถานการณ์แบบออฟไลน์ การประเมินความหน่วงนี้ครอบคลุมถึงระยะเวลาการเรียกใช้เครื่องมือ (เวลาประมวลผลโค้ด) จำนวน Token ขาออก และจำนวน Token ขาเข้า ความหน่วงในการใช้งานจริงอาจแตกต่างกันอย่างมาก และขึ้นอยู่กับปัจจัยหลายประการที่การจำลองของเราไม่ได้ครอบคลุมไว้ ในทำนองเดียวกันการประมาณการต้นทุนจะอ้างอิงตามราคา API ของโมเดลเหล่านี้ ณ เวลาที่เขียนบทความ ค่าใช้จ่ายอาจมีการเปลี่ยนแปลงได้ในอนาคต ความพยายามในการให้เหตุผลถูกปรับจากระดับต่ำไปยังระดับสูงสุด (xhigh)

เอเจนต์ย่อย

GPT‑5.4 mini ยังเหมาะอย่างยิ่งสำหรับระบบที่ผสานโมเดลหลายขนาดเข้าด้วยกัน ยกตัวอย่างเช่นใน Codex เราสามารถใช้โมเดลขนาดใหญ่อย่าง GPT‑5.4 รับผิดชอบด้านการวางแผน การประสานงาน และการตัดสินใจขั้นสุดท้าย พร้อมทั้งส่งต่องานย่อยที่เฉพาะเจาะจงให้เอเจนต์ย่อยที่เป็น GPT‑5.4 mini ช่วยจัดการขนานกันไป เช่น การค้นหาในฐานข้อมูลโค้ด การรีวิวไฟล์ขนาดใหญ่ หรือการประมวลผลเอกสารสนับสนุน เรียนรู้วิธีการทำงานของเอเจนต์ย่อยใน Codex เพิ่มเติมได้ในเอกสาร⁠(เปิดในหน้าต่างใหม่)

รูปแบบการทำงานนี้จะมีประโยชน์มากยิ่งขึ้น เมื่อโมเดลขนาดเล็กทำงานได้รวดเร็วและมีความสามารถมากขึ้น เหล่านักพัฒนาสามารถออกแบบระบบที่ผสมผสานโมเดลหลายขนาดเข้าด้วยกันแทนการใช้โมเดลเดียวทำงานทุกอย่าง โดยให้โมเดลรุ่นใหญ่ทำหน้าที่ตัดสินใจ และให้โมเดลรุ่นเล็กทำหน้าที่ลงมือทำงานจำนวนมากได้อย่างรวดเร็ว GPT‑5.4 mini คือมินิโมเดลที่แข็งแกร่งที่สุดของเราจนถึงตอนนี้สำหรับเวิร์กโฟลว์สไตล์นั้น

การใช้คอมพิวเตอร์

GPT‑5.4 mini มอบประสิทธิภาพที่แข็งแกร่งในงานมัลติโมดัล โดยเฉพาะงานที่เกี่ยวข้องกับการสั่งการคอมพิวเตอร์ โมเดลนี้สามารถตีความภาพหน้าจอที่มีอินเทอร์เฟซหนาแน่นได้อย่างรวดเร็ว เพื่อจัดการงานสั่งการคอมพิวเตอร์ให้เสร็จสิ้นด้วยความว่องไว ในการทดสอบบน OSWorld-Verified พบว่า GPT‑5.4 mini ทำคะแนนขยับเข้าใกล้ระดับของ GPT‑5.4 ในขณะที่ทำผลงานได้เหนือกว่า GPT‑5 mini อย่างชัดเจน

การพร้อมใช้งานและการกำหนดราคา

GPT‑5.4 mini พร้อมให้ใช้งานแล้ววันนี้ใน API, Codex และ ChatGPT

สำหรับการใช้งานผ่าน API นั้น GPT‑5.4 mini รองรับการป้อนข้อมูลทั้งข้อความและรูปภาพ การใช้งานเครื่องมือ การเรียกใช้ฟังก์ชัน การค้นหาเว็บ การค้นหาไฟล์ การสั่งการคอมพิวเตอร์ รวมถึงทักษะเฉพาะด้านต่างๆ โมเดลนี้มาพร้อมหน้าต่างบริบทขนาด 400k โดยมีค่าบริการอยู่ที่ 0.75 ดอลลาร์ต่อ 1 ล้าน Token อินพุต และ 4.50 ดอลลาร์ต่อ 1 ล้าน Token เอาต์พุต

คุณสามารถเข้าถึง GPT‑5.4 mini ได้ผ่านทุกช่องทางของ Codex ทั้งบนแอป ตัวเสริมใน IDE หรือบนเว็บไซต์ โมเดลนี้ใช้ทรัพยากรเพียง 30% ของ GPT‑5.4 เท่านั้น โมเดลนี้ใช้โควตาเพียง 30% ของ GPT‑5.4 ซึ่งช่วยให้นักพัฒนาจัดการงานเขียนโค้ดที่ไม่ซับซ้อนใน Codex ได้อย่างรวดเร็วโดยจ่ายเพียงหนึ่งในสามของราคาเดิม คุณสามารถใช้ Codex กระจายงานไปยังเอเจนต์ย่อยของ GPT‑5.4 mini เพื่อช่วยประหยัดค่าใช้จ่ายโดยการรันงานที่ไม่ต้องใช้การคิดวิเคราะห์สูงบนโมเดลรุ่นเล็กลง

ใน ChatGPT โมเดล GPT‑5.4 mini พร้อมให้ใช้งานสำหรับผู้ใช้ Free และ Go ผ่านฟีเจอร์ “Thinking” ในเมนู + สำหรับผู้ใช้รายอื่นทั้งหมด GPT‑5.4 mini จะพร้อมให้ใช้งานเป็นทางเลือกสำรองเมื่อถึงขีดจำกัดอัตราการใช้งานสำหรับ GPT‑5.4 Thinking

GPT‑5.4 nano มีให้ใช้งานเฉพาะใน API และมีค่าใช้จ่าย 0.20 ดอลลาร์สหรัฐต่อ 1 ล้าน Token อินพุต และ 1.25 ดอลลาร์สหรัฐต่อ 1 ล้าน Token เอาต์พุต

หากต้องการข้อมูลเพิ่มเติมเกี่ยวกับมาตรการป้องกันของโมเดล โปรดดูภาคผนวกการ์ดระบบในศูนย์รวมความปลอดภัยในการใช้งาน⁠(เปิดในหน้าต่างใหม่)ของเรา

Coding

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%

Tool-calling

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
MCP Atlas	67.2%	57.7%	56.1%	47.6%
Toolathlon	54.6%	42.9%	35.5%	26.9%
τ2-bench (telecom)	98.9%	93.4%	92.5%	74.1%

Intelligence

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
HLE w/ tool	52.1%	41.5%	37.7%	31.6%
HLE w/o tools	39.8%	28.2%	24.3%	18.3%

MM / Vision / CUA

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%
MMMUPro w/ Python	81.5%	78.0%	69.5%	74.1%
MMMUPro	81.2%	76.6%	66.1%	67.5%
OmniDocBench 1.5 (no tools)² — lower is better	0.109	0.1263	0.2419	0.1791

Long context

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K	86.0%	47.7%	44.2%	35.1%
OpenAI MRCR v2 8-needle 128K–256K	79.3%	33.6%	33.1%	19.4%
Graphwalks BFS 0K–128K	93.1%	76.3%	73.4%	73.4%
Graphwalks parents 0–128K (accuracy)	89.8%	71.5%	50.8%	64.3%