ขอแนะนำ gpt-oss
gpt-oss-120b และ gpt-oss-20b ก้าวข้ามขีดจำกัดเดิมของโมเดลการให้เหตุผลแบบ Open-Weight
เรากำลังเปิดตัว gpt-oss-120b และ gpt-oss-20b โมเดลภาษาที่ทันสมัยระดับแนวหน้าแบบ Open-Weight ที่มอบประสิทธิภาพการใช้งานจริงได้อย่างได้อย่างยอดเยี่ยมด้วยราคาประหยัด โมเดลเหล่านี้ใช้งานได้ภายใต้ Apache 2.0 ที่มีความยืดหยุ่น ให้ผลลัพธ์ดีกว่าโมเดลแบบเปิดที่มีขนาดใกล้เคียงกันในด้านการคิดวิเคราะห์ มีความสามารถในการใช้เครื่องมือได้อย่างมีประสิทธิภาพ และได้รับการปรับแต่งเพื่อการใช้งานบนอุปกรณ์ของผู้ใช้ทั่วไปอย่างคุ้มค่า โมเดลเหล่านี้ได้รับการเทรนด้วยการผสมผสานระหว่างการเรียนรู้แบบเสริมแรง (reinforcement learning) และเทคนิคที่พัฒนาจากโมเดลภายในที่ก้าวหน้าที่สุดของ OpenAI รวมถึง o3 และระบบระดับแนวหน้าประเภทอื่นๆ
โมเดล gpt-oss-120b สามารถทำงานได้ใกล้เคียงกับ OpenAI o4-mini ในการทดสอบมาตรฐานด้านการใช้เหตุผลหลัก พร้อมทั้งทำงานได้อย่างมีประสิทธิภาพบน GPU ขนาด 80 กิกะไบต์เพียงตัวเดียว โมเดล gpt-oss-20b ให้ผลลัพธ์ใกล้เคียงกับ OpenAI o3‑mini ในการทดสอบมาตรฐานทั่วไป และสามารถทำงานบนอุปกรณ์ปลายทางได้ด้วยหน่วยความจำเพียง 16 กิกะไบต์ ทำให้เหมาะสำหรับการใช้งานบนอุปกรณ์โดยตรง การประมวลผลในเครื่อง และการพัฒนาอย่างรวดเร็วโดยไม่ต้องพึ่งพาโครงสร้างพื้นฐานที่มีค่าใช้จ่ายสูง โมเดลทั้งสองยังแสดงสมรรถนะที่โดดเด่นในการใช้เครื่องมือ การเรียกใช้ฟังก์ชันจากตัวอย่างจำนวนน้อย และการให้เหตุผลแบบเป็นลำดับความคิด (ตามผลลัพธ์ในชุดการประเมิน Tau-Bench) รวมถึง HealthBench โดยให้ผลลัพธ์เหนือกว่าโมเดลปิดบางรุ่น เช่น OpenAI o1 และ GPT‑4o ด้วยซ้ำ
โมเดลเหล่านี้สามารถทำงานร่วมกับ Responses API (เปิดในหน้าต่างใหม่)ได้ และถูกออกแบบมาเพื่อใช้งานภายในกระบวนการทำงานแบบเอเจนต์ โดยมีความสามารถโดดเด่นในการทำตามคำสั่ง การใช้เครื่องมือ เช่น การค้นหาข้อมูลบนเว็บหรือการรันโค้ด Python และการใช้เหตุผล รวมถึงความสามารถในการปรับระดับความพยายามในการใช้เหตุผลสำหรับงานที่ไม่ซับซ้อน และหรือการสร้างผลลัพธ์สุดท้ายที่มีความหน่วงต่ำมาก สามารถปรับแต่งได้อย่างเต็มที่ ให้การให้เหตุผลแบบใช้กระบวนการคิดเป็นลำดับ (CoT) แบบเต็มรูปแบบ และสนับสนุน เอาต์พุตที่มีโครงสร้าง(เปิดในหน้าต่างใหม่)
ความปลอดภัยถือเป็นรากฐานสำคัญของแนวทางในการปล่อยโมเดลทั้งหมดของเรา และมีความสำคัญเป็นพิเศษสำหรับโมเดลแบบเปิด นอกจากการฝึกและประเมินด้านความปลอดภัยแล้ว เราได้เพิ่มชั้นการประเมินอีกขั้น โดยการทดสอบโมเดล gpt-oss-120b ที่ได้รับการปรับจูนโดยการโจมตีเชิง (adversarial fine-tuning) ภายใต้ กรอบการเตรียมความพร้อม(เปิดในหน้าต่างใหม่) ของเรา โมเดล gpt-oss มีประสิทธิภาพเทียบเท่าโมเดลระดับแนวหน้าของเราในเกณฑ์มาตรฐานความปลอดภัยภายใน ทำให้นักพัฒนาได้รับมาตรฐานความปลอดภัยเดียวกันกับโมเดลแบบปิดรุ่นล่าสุดของเรา เรากำลังแบ่งปันผลลัพธ์ของงานนั้นและรายละเอียดเพิ่มเติม ในเอกสารวิจัย(เปิดในหน้าต่างใหม่) และใน การ์ดโมเดล(เปิดในหน้าต่างใหม่) กระบวนการของเราได้รับการประเมินโดยผู้เชี่ยวชาญภายนอก และถือเป็นก้าวสำคัญในการกำหนดมาตรฐานความปลอดภัยรุ่นใหม่สำหรับโมเดลแบบ Open-Weight
นอกจากนี้เรายังได้ร่วมมือกับพันธมิตรกลุ่มแรก เช่น AI Sweden(เปิดในหน้าต่างใหม่), Orange(เปิดในหน้าต่างใหม่) และ Snowflake(เปิดในหน้าต่างใหม่) เพื่อศึกษาแนวทางการใช้งานจริงของแบบจำลองเปิด ตั้งแต่การติดตั้งใช้งานภายในองค์กรเพื่อความปลอดภัยของข้อมูล ไปจนถึงการปรับแต่งแบบจำลองด้วยชุดข้อมูลเฉพาะทาง รามีความยินดีที่จะมอบโมเดลเปิดชั้นนำเหล่านี้ เพื่อให้ทุกคน ตั้งแต่นักพัฒนาส่วนบุคคล องค์กรขนาดใหญ่ ไปจนถึงรัฐบาล สามารถใช้และปรับแต่ง AI บนโครงสร้างพื้นฐานของตัวเอง นักพัฒนาสามารถกำหนดได้ทั้งประสิทธิภาพ ค่าใช้จ่าย และความหน่วงเวลาที่ต้องการสำหรับเวิร์กโฟลว์ AI เมื่อใช้ควบคู่กับโมเดลใน API ของเรา
โมเดล gpt-oss ถูกพัฒนาด้วยเทคนิคก่อนและหลังการเทรนที่ล้ำสมัยที่สุดของเรา โดยมุ่งเน้นการให้เหตุผล ประสิทธิภาพ และการใช้งานจริงในสภาพแวดล้อมการใช้งานที่หลากหลาย แม้ว่าเราจะเปิดให้ใช้งานโมเดลอื่นๆ เช่น Whisper และ CLIP อย่างเป็นสาธารณะแล้ว แต่โมเดล gpt-oss เป็นโมเดลภาษาแบบ Open-Weight ตัวแรกของเราตั้งแต่ GPT‑2[1]
แต่ละโมเดลใช้โครงสร้างทรานส์ฟอร์เมอร์ซึ่งใช้ประโยชน์จากเทคนิคการผสมผสานของผู้เชี่ยวชาญ (MoE[2]) เพื่อลดจำนวนพารามิเตอร์ที่ต้องใช้งานในการประมวลผลอินพุต รูปแบบจำลอง gpt-oss-120b เปิดใช้งานตัวแปร 5.1 พันล้านตัวต่อโทเค็น ในขณะที่ gpt-oss-20b เปิดใช้งาน 3.6 พันล้านตัว โมเดลทั้งสองมีจำนวนพารามิเตอร์รวม 117 พันล้าน และ 21 พันล้านตามลำดับ โมเดลเหล่านี้ใช้รูปแบบการให้ความสนใจแบบหนาแน่น สลับกับการให้ความสนใจแบบบางเฉพาะพื้นที่ซึ่งคล้ายกับ GPT‑3[3] โมเดลถูกออกแบบเพื่อประสิทธิภาพในการอนุมานและการใช้หน่วยความจำ โดยใช้การใส่ใจหลายคำถามแบบจัดกลุ่มที่มีขนาดกลุ่มเท่ากับ 8 ผสานกับการเข้ารหัสตำแหน่งเชิงหมุน (Rotary Positional Embedding หรือ RoPE[4]) รองรับบริบทได้ยาวถึง 128,000 หน่วย
โมเดล | เลเยอร์ | จำนวนพารามิเตอร์ทั้งหมด | พารามิเตอร์ที่ใช้งานต่อหนึ่งโทเค็น | ผู้เชี่ยวชาญทั้งหมด | ผู้เชี่ยวชาญที่ถูกเรียกใช้งานต่อหนึ่งโทเค็น | ความยาวของบริบท |
gpt-oss-120b | 36 | 117 พันล้าน | 5.1 พันล้าน | 128 | 4 | 128k |
gpt-oss-20b | 24 | 21 พันล้าน | 3.6 พันล้าน | 32 | 4 | 128k |
เราได้เทรนโมเดลด้วยชุดข้อมูลที่เป็นภาษาอังกฤษเป็นส่วนใหญ่และประกอบด้วยข้อความเท่านั้น โดยเน้นที่ด้าน STEM การเขียนโค้ด และความรู้ทั่วไป เราได้แบ่งข้อมูลออกเป็นโทเค็น โดยใช้ชุดเครื่องมือแบ่งโทเค็นที่มีขอบเขตใหญ่กว่าเครื่องมือที่เราใช้สำหรับโมเดล OpenAI o4-mini และ GPT‑4o ซึ่งก็คือ o200k_harmony โดยจะเปิดให้ใช้งานแบบสาธารณะในวันนี้เช่นกัน
หากต้องการรายละเอียดเกี่ยวกับกับสถาปัตยกรรมและการเทรนโมเดลของเรา โปรดอ่าน การ์ดโมเดล(เปิดในหน้าต่างใหม่)
โมเดลได้รับการเทรนอบรมเพิ่มเติมโดยใช้กระบวนการที่คล้ายกับที่ใช้สำหรับ o4-mini รวมถึงขั้นตอนการปรับแต่งภายใต้การดูแลและขั้นตอน RL ที่ต้องใช้การประมวลผลสูง เป้าหมายของเราคือการปรับโมเดลให้สอดคล้องกับ OpenAI Model Spec(เปิดในหน้าต่างใหม่) และสอนให้มันใช้ การให้เหตุผลแบบใช้กระบวนการคิดเป็นลำดับ และการใช้เครื่องมือก่อนที่จะสร้างคำตอบ ด้วยการใช้เทคนิคเดียวกันกับโมเดลการใช้เหตุผลที่เป็นกรรมสิทธิ์ของ SoTA ของเรา โมเดลเหล่านี้แสดงให้เห็นถึงความสามารถที่ยอดเยี่ยมหลังผ่านการเทรน
แบบจำลองเปิดสองรุ่นนี้รองรับระดับการใช้เหตุผลสามระดับ ได้แก่ ต่ำ ปานกลาง และสูง ซึ่งเป็นการแลกเปลี่ยนระหว่างความหน่วงกับสมรรถนะ คล้ายกับโมเดลการใช้เหตุผลแบบ o-series ของ OpenAI ใน API นักพัฒนาสามารถตั้งค่าความพยายามในการใช้เหตุผลได้อย่างง่ายดายด้วยประโยคเดียวในข้อความระบบ
เราได้ประเมินรูปแบบจำลอง gpt-oss-120b และ gpt-oss-20b โดยใช้เกณฑ์มาตรฐานเชิงวิชาการที่เป็นที่ยอมรับ เพื่อวัดขีดความสามารถของโมเดลด้านการเขียนโค้ด คณิตศาสตร์เชิงแข่งขัน สุขภาพ และการใช้เครื่องมือเชิงตัวแทน เมื่อเปรียบเทียบกับรูปแบบจำลองการให้เหตุผลอื่นๆ ของ OpenAI ซึ่งรวมถึง o3, o3‑mini และ o4-mini
gpt-oss-120b มีประสิทธิภาพเหนือกว่า OpenAI o3‑mini และเทียบเท่าหรือดีกว่า OpenAI o4-mini ในการเขียนโค้ดแข่งขัน (Codeforces) การแก้ปัญหาทั่วไป (MMLU และ HLE) และการเรียกใช้เครื่องมือ (TauBench) นอกจากนี้ยังทำผลงานได้ดีกว่า o4-mini ในแบบสอบถามที่เกี่ยวข้องกับสุขภาพ (HealthBench) และคณิตศาสตร์การแข่งขัน (AIME 2024 & 2025) gpt-oss-20b สามารถเทียบเท่าหรือเหนือกว่า OpenAI o3‑mini ในการประเมินเดียวกันนี้ แม้จะมีขนาดเล็ก แต่ก็ยังมีประสิทธิภาพเหนือกว่าในด้านคณิตศาสตร์การแข่งขันและด้านสุขภาพ
โมเดล GPT‑oss ไม่สามารถทดแทนผู้เชี่ยวชาญทางการแพทย์ได้ และไม่ได้มีไว้สำหรับการวินิจฉัยหรือการรักษาโรค
ตัวอย่างการเปิดตัว
gpt-oss-120b สามารถรวบรวมข้อมูลที่เป็นปัจจุบันได้อย่างรวดเร็ว โดยใช้เครื่องมือค้นหาข้อมูล รวมถึงการเชื่อมต่อการเรียกใช้ตามมาหลายสิบครั้งเข้าด้วยกัน
งานวิจัย ล่าสุดของเรา พบว่าการตรวจสอบกระบวนการคิดเป็นลำดับของโมเดลการใช้เหตุผลอาจมีประโยชน์ในการตรวจจับพฤติกรรมที่ไม่เหมาะสม ตราบที่โมเดลไม่ได้ถูกเทรนให้ปรับกระบวนการคิดเป็นลำดับด้วยการควบคุมโดยตรง มุมมองนี้ เป็นที่ยอมรับร่วมกัน(เปิดในหน้าต่างใหม่) จากผู้เชี่ยวชาญในอุตสาหกรรมด้วยเช่นกัน เพื่อความสอดคล้องกับหลักการของเราตั้งแต่เปิดตัว OpenAI o1‑preview เราไม่ได้ใช้การควบคุมกระบวนการคิดเป็นลำดับโดยตรงใดๆ ของโมเดล gpt-oss ทั้งสองรุ่น เราเชื่อว่าการทำเช่นนี้เป็นสิ่งสำคัญเพื่อเฝ้าติดตามพฤติกรรมผิดปกติ การหลอกลวง และการใช้งานโมเดลในทางที่ผิด เราหวังว่าการเปิดตัวโมเดลแบบเปิดที่ไม่มีการควบคุมดูแลจะทำให้นักพัฒนาและนักวิจัยมีโอกาสในการวิจัยและพัฒนาระบบตรวจสอบ กระบวนการคิดเป็นลำดับของตนเอง
นักพัฒนาไม่ควรแสดงกระบวนการคิดเป็นลำดับให้ผู้ใช้เห็นในแอปพลิเคชันของตนโดยตรง เนื้อหาเหล่านี้อาจประกอบด้วยข้อมูลที่ถูกสร้างขึ้นโดยไม่มีข้อเท็จจริงหรือมีความเป็นอันตราย รวมถึงภาษาที่ไม่สอดคล้องกับนโยบายความปลอดภัยมาตรฐานของ OpenAI และอาจมีข้อมูลที่ถูกกำหนดไว้อย่างชัดเจนว่าไม่ควรรวมอยู่ในผลลัพธ์สุดท้าย
GPT‑oss‑120b ปฏิบัติตามคำสั่งของระบบอย่างเคร่งรัดในเอาต์พุต แต่มักจะไม่เชื่อฟังคำสั่งในกระบวนการคิดเป็นลำดับอย่างเห็นได้ชัด
โมเดล GPT‑oss gpt-oss ใช้ประโยชน์จากแนวทางที่ล้ำยุคที่สุดของเราสำหรับการเทรนด้านความปลอดภัย ในระหว่างการเทรนล่วงหน้า เราได้กรองข้อมูลที่เป็นอันตรายบางส่วนที่เกี่ยวข้องกับสารเคมี ชีวภาพ รังสี และนิวเคลียร์ (CBRN) ออกไป ในระหว่างการเทรนเพิ่มเติมเราใช้ การปรับเชิงไตร่ตรอง และ ลำดับชั้นของคำสั่ง(เปิดในหน้าต่างใหม่) เพื่อสอนโมเดลให้ปฏิเสธคำสั่งที่ไม่ปลอดภัยและป้องกันการโจมตีด้วยคำสั่ง
เมื่อโมเดล Open-Weight ถูกปล่อยออกมา ผู้ไม่หวังดีอาจปรับแต่งโมเดลเพื่อใช้ในทางไม่เหมาะสมได้ เราได้ประเมินความเสี่ยงเหล่านี้โดยตรงด้วยการปรับจูนโมเดลบนข้อมูลเฉพาะด้านชีววิทยาและความปลอดภัยทางไซเบอร์ สร้างเวอร์ชันเฉพาะด้านที่ไม่ปฏิเสธคำสั่งสำหรับแต่ละสาขา ในลักษณะเดียวกับที่ผู้โจมตีอาจนำไปใช้ จากนั้นพวกเราจึงประเมินระดับความสามารถของโมเดลเหล่านี้ผ่านการทดสอบทั้งภายในและภายนอก ผลจากการทดสอบที่ระบุไว้ใน เอกสารความปลอดภัยพบว่า แม้จะมีการปรับจูนอย่างละเอียดด้วยชุดการเทรนที่ล้ำหน้าของ OpenAI แบบจำลองที่ถูกปรับแต่งในทางที่เป็นอันตรายก็ไม่สามารถบรรลุสมรรถนะสูงได้ตาม กรอบการเตรียมพร้อม ของเรา วิธีการปรับแต่งที่เป็นอันตรายนี้ผ่านการตรวจสอบจากผู้เชี่ยวชาญอิสระสามกลุ่ม ซึ่งได้เสนอแนวทางเพื่อยกระดับกระบวนการฝึกและการประเมินผล โดยเราได้นำข้อเสนอแนะจำนวนมากมาปรับใช้ เราได้ระบุรายละเอียดคำแนะนำเหล่านี้ไว้ในการ์ดโมเดล กระบวนการเหล่านี้ถือเป็นความก้าวหน้าที่มีความหมายสำหรับความปลอดภัยของโมเดลแบบเปิด ผลการค้นพบเหล่านี้ทำให้เราตัดสินใจเปิดตัวโมเดล GPT‑oss เราหวังว่าโมเดลเหล่านี้จะช่วยเร่งกระบวนการฝึกด้านความปลอดภัยและการวิจัยด้านการปรับความสอดคล้องของโมเดลในอุตสาหกรรม
เพื่อส่งเสริมให้การสร้างระบบนิเวศโอเพนซอร์สมีความปลอดภัยยิ่งขึ้น เราได้จัดกิจกรรม Red Teaming Challenge(เปิดในหน้าต่างใหม่) เพื่อเชิญชวนนักวิจัย นักพัฒนา และผู้สนใจจากทั่วโลกให้ช่วยระบุปัญหาด้านความปลอดภัยที่ไม่เคยพบมาก่อน กิจกรรมนี้มีเงินรางวัลมูลค่า 500,000 ดอลลาร์ ซึ่งจะมอบให้ตามการพิจารณาของคณะกรรมการผู้เชี่ยวชาญจาก OpenAI และห้องปฏิบัติการชั้นนำอื่นๆ หลังจบการแข่งขันเราจะปล่อยรายงานและชุดข้อมูลประเมินผลแบบโอเพ่นซอร์สจากผลลัพธ์ที่ตรวจสอบแล้ว เพื่อให้ชุมชนทั้งหมดสามารถนำไปใช้ประโยชน์ได้ทันที เรียนรู้เพิ่มเติมและเข้าร่วม ที่นี่(เปิดในหน้าต่างใหม่)
เวทสำหรับทั้ง GPT‑oss‑120b และ GPT‑oss‑20b สามารถดาวน์โหลดได้ฟรีบน Hugging Face และมาในรูปแบบควอนไทซ์ดั้งเดิมใน MXFP4 สิ่งนี้ทำให้โมเดล GPT‑oss‑120B สามารถทำงานได้ภายในหน่วยความจำ 80GB ในขณะที่ GPT‑oss‑20b ใช้หน่วยความจำเพียง 16GB เท่านั้น
โมเดลได้รับการเทรนเพิ่มเติมใน รูปแบบคำสั่งฮาร์โมนี(เปิดในหน้าต่างใหม่) ของเรา และเราได้เปิดโอเพ่นซอร์สของ ฮาร์โมนีเรนเดอร์(เปิดในหน้าต่างใหม่) ทั้งในภาษา Python และ Rust เพื่อให้ง่ายต่อการนำไปใช้งาน เรายังได้เผยแพร่การใช้งานอ้างอิงสำหรับการรันการอนุมานด้วย PyTorch และบนแพลตฟอร์ม Metal ของ Apple พร้อมทั้งชุดเครื่องมือตัวอย่างสำหรับโมเดล
เราได้ออกแบบแบบจำลองเหล่านี้ให้มีความยืดหยุ่นและสามารถใช้งานได้ง่ายในทุกที่ ทั้งการทำงานภายในเครื่อง อุปกรณ์ หรือผ่านผู้ให้บริการอนุมานจากภายนอก เพื่อสนับสนุนเป้าหมายนี้ ก่อนการเปิดตัวเราได้ร่วมมือกับแพลตฟอร์มการปรับใช้ชั้นนำ เช่น Azure, Hugging Face, vLLM, Ollama, llama.cpp LM Studio, AWS, Fireworks, Together AI, Baseten, Databricks, Vercel, Cloudflare และ OpenRouter เพื่อทำให้โมเดลต่างๆ เข้าถึงได้อย่างกว้างขวางสำหรับนักพัฒนา ในด้านฮาร์ดแวร์เราได้ร่วมงานกับผู้นำในอุตสาหกรรม ได้แก่ NVIDIA, AMD, Cerebras และ Groq เพื่อให้มั่นใจถึงประสิทธิภาพที่ปรับแต่งอย่างเหมาะสมในหลากหลายระบบ
ในการเปิดตัววันนี้ Microsoft ยังนำเวอร์ชัน gpt-oss-20b ที่ปรับแต่งให้เหมาะกับ GPU สำหรับเพื่อใช้งานบนอุปกรณ์ Windows อีกด้วย โมเดลเหล่านี้สนับสนุนการอนุมานในพื้นที่จากการขับเคลื่อนด้วย ONNX Runtime และพร้อมใช้งานผ่าน Foundry Local และ AI Toolkit สำหรับ VS Code ทำให้นักพัฒนา Windows สามารถสร้างด้วยโมเดลแบบเิดได้ง่ายขึ้น
สำหรับนักพัฒนาที่ต้องการโมเดลที่สามารถปรับแต่งได้อย่างเต็มที่และนำไปใช้ในสภาพแวดล้อมของตนเองได้ GPT‑oss เป็นตัวเลือกที่ยอดเยี่ยม สำหรับผู้ที่ต้องการการสนับสนุนแบบมัลติโมดัล พร้อมเครื่องมือในตัว และการผสานรวมกับแพลตฟอร์มของเราอย่างราบรื่น โมเดลที่มีอยู่ผ่านแพลตฟอร์ม API ของเรายังคงเป็นตัวเลือกที่ดีที่สุด เรายังคงมุ่งมั่นรับฟังข้อเสนอแนะจากนักพัฒนาอย่างใกล้ชิด และอาจพิจารณาการสนับสนุน API สำหรับ GPT‑oss ในอนาคต
หากคุณต้องการทดลองใช้โมเดลต่างๆ ให้ไปที่ พื้นที่ทดลองโมเดลแบบเปิด(เปิดในหน้าต่างใหม่) ของเรา หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับวิธีการใช้โมเดลกับผู้ให้บริการระบบนิเวศที่แตกต่างกัน หรือวิธีการปรับแต่งโมเดล โปรดดูคู่มือของเรา(เปิดในหน้าต่างใหม่)
การเปิดตัว GPT‑oss‑120b และ GPT‑oss‑20b ถือเป็นก้าวสำคัญสำหรับโมเดลแบบ Open-Weight โมเดลเหล่านี้นำมาซึ่งความก้าวหน้าที่สำคัญ ทั้งในด้านการใช้เหตุผลและความปลอดภัยด้วยขนาดของโมเดลที่เหมาะสม โมเดลแบบเปิดช่วยส่งเสริมโมเดลที่เราเปิดให้ให้บริการ ทำให้ผู้พัฒนามีเครื่องมือที่หลากหลายยิ่งขึ้น เพื่อเร่งงานวิจัยระดับแนวหน้า ส่งเสริมการคิดค้นสิ่งใหม่ และทำให้การพัฒนาระบบ AI มีความปลอดภัยและโปร่งใสยิ่งขึ้นในการใช้งานที่หลากหลาย
โมเดลแบบเปิดเหล่านี้ยังช่วยลดอุปสรรคสำหรับตลาดเกิดใหม่ ภาคส่วนที่มีทรัพยากรจำกัด และองค์กรขนาดเล็กที่อาจขาดงบประมาณหรือความยืดหยุ่นในการใช้งานโมเดลแบบลิขสิทธิ์ เมื่อมีเครื่องมือที่ทรงพลังและเข้าถึงได้ง่ายอยู่ในมือ ผู้คนทั่วโลกก็สามารถสร้างสรรค์ คิดค้นสิ่งใหม่ และสร้างโอกาสใหม่ให้แก่ตนเองและผู้อื่นได้ การเข้าถึงอย่างกว้างขวางของโมเดลแบบ Open-Weights ที่มีประสิทธิภาพสูงและสร้างขึ้นในสหรัฐอเมริกา ช่วยขยายรากฐานของ AI แบบประชาธิปไตย
การมีระบบนิเวศโมเดลเปิดที่แข็งแรงเป็นหนึ่งด้านสำคัญในการทำให้ AI เข้าถึงได้ง่ายและสร้างประโยชน์ให้กับทุกคน เราขอเชิญนักพัฒนาและนักวิจัยใช้โมเดลเหล่านี้ในการทดลอง ร่วมมือกัน และก้าวข้ามขีดจำกัดของสิ่งที่เป็นไปได้ เราตั้งตารอที่จะชื่นชมสิ่งที่คุณสร้างสรรค์
ผู้เขียน
การอ้างอิง
ผู้มีส่วนร่วม
Zoran Martinovic Zhuohan Li Zhiqing Sun Zach Johnson Yu Yang Yu Bai Yang Song Xin Wang Wenting Zhan Volodymyr Kyrylov Vlad Fomenko Tyler Bertao Tong Mu Timur Garipov Tarun Gogineni Suvansh Sanjeev Steve Mostovoy Song Mei Shengjia Zhao Sebastien Bubeck Scott McKinney Scott Lessans Sandhini Agarwal Sam Toizer Sam Altman Saachi Jain Romain Huet Rahul K. Arora Philippe Tillet Olivia Watkins Nivedita Brett Nikhil Vyas Miles Wang Michihiro Yasunaga Michelle Pokrass Mia Glaese Max Schwarzer Mark Chen Mario Lezcano-Casado Marat Dukhan Lukas Gross Ludovic Peran Ludovic Peran Lindsay McCallum Lin Yang Lily (Xiaoxuan) Liu Leher Pathak Lama Ahmad Kristian Georgiev Kristen Ying Kimmy Richardson Kevin Whinnery Kevin Weil Kevin Lu Kevin Fives Kendal Simon Katia Gil Guzman Karan Singhal Karan Singhal Kai Chen Josh McGrath Jordan Liss Jongsoo Park John Hallman Johannes Heidecke Jiancheng Liu Ji Lin Jason Kwon Jason Ai James Park Lennon Jakub Pachocki Jacob Huh Jackie Hehir Irina Kofman Huida Qiu Hongyu Ren Harshit Sikchi Hannah Wong Haitang Hu Haitang Hu Haiming Bao Hadi Salman Guillaume Leclerc Greg Brockman Gideon Myles Giambattista Parascandolo Gaby Raila Foivos Tsimpourlas Filippo Raso Eugene Brevdo Eric Wallace Enoch Cheung Elizabeth Proehl Elaine Ya Le Edwin Arbus Eddie Zhang Dominik Kundel Dmitry Pimenov David Robinson Dane Stuckey Dana Palmie Dan Cook Cyril Zhang Chris Lu Chris Koch Che Chang Cedric Whitney Casey Dvorak Carolina Paz Brian Zhang Bowen Baker Bob Rotsted Boaz Barak Ashley Pantuliano Andy Applebaum Amy Wendling Ally Bennett Alexander Neitz Alex Paino Alex Nichol Alec Helyar Aidan McLaughlin Aidan Clark และAdam Goucher


