OpenAI เปิดตัว GPT-5.4 พร้อมความสามารถใช้งานคอมพิวเตอร์แบบ native ที่ทำให้ AI สามารถควบคุมคอมพิวเตอร์ได้อย่างมีประสิทธิภาพ
Kawin Suangkaew

OpenAI ได้ประกาศเปิดตัว GPT-5.4 ซึ่งถือเป็นการก้าวกระโดดครั้งสำคัญของวงการ AI โดยเป็นโมเดลทั่วไป (general-purpose model) เครื่องแรกที่มาพร้อมกับความสามารถในการใช้งานคอมพิวเตอร์ (computer-use capabilities) อย่างเป็น native ทำให้ AI agents สามารถควบคุมคอมพิวเตอร์และดำเนินงานที่ซับซ้อนได้อย่างมีประสิทธิภาพ
GPT-5.4 ได้รวมเอาความก้าวหน้าล่าสุดของ OpenAI ในหลายด้านเข้าไว้ด้วยกัน ไม่ว่าจะเป็น reasoning, coding และ agentic workflows โดยโมเดลนี้ได้ผสานความสามารถด้านการเขียนโค้ดที่เป็นเลิศของ GPT-5.3-Codex เข้ากับการปรับปรุงการทำงานกับเครื่องมือต่างๆ สภาพแวดล้อมซอฟต์แวร์ และงานมืออาชีพที่เกี่ยวข้องกับ spreadsheet, presentation และเอกสาร
สิ่งที่น่าตื่นเต้นที่สุดใน GPT-5.4 คือการเป็นโมเดลทั่วไปเครื่องแรกที่มาพร้อมกับความสามารถใช้งานคอมพิวเตอร์แบบ native และทันสมัยที่สุด ทำให้ agents สามารถควบคุมคอมพิวเตอร์และดำเนิน workflows ที่ซับซ้อนข้ามแอปพลิเคชันได้
โมเดลรองรับ context สูงสุดถึง 1 ล้าน tokens ทำให้ agents สามารถวางแผน ดำเนินการ และตรวจสอบงานในระยะยาวได้ นอกจากนี้ GPT-5.4 ยังปรับปรุงวิธีการทำงานของโมเดลกับระบบนิเวศของเครื่องมือและ connectors ขนาดใหญ่ด้วย tool search ช่วยให้ agents ค้นหาและใช้เครื่องมือที่เหมาะสมได้อย่างมีประสิทธิภาพมากขึ้น
GPT-5.4 ได้สร้างสถิติใหม่ในหลายด้าน โดยเฉพาะบน GDPval ซึ่งทดสอบความสามารถของ agents ในการทำงานที่ต้องใช้ความรู้เฉพาะทางใน 44 อาชีพ GPT-5.4 สามารถเทียบเท่าหรือเหนือกว่ามืออาชีพในอุตสาหกรรมได้ถึง 83.0% ของการเปรียบเทียบ เทียบกับ 70.9% ของ GPT-5.2
บน OSWorld-Verified ซึ่งวัดความสามารถของโมเดลในการนำทางสภาพแวดล้อมเดสก์ท็อปผ่าน screenshots และคำสั่ง keyboard/mouse GPT-5.4 บรรลุอัตราความสำเร็จ 75.0% ซึ่งสูงกว่า GPT-5.2 ที่ 47.3% อย่างมาก และยังเหนือกว่าประสิทธิภาพของมนุษย์ที่ 72.4%
สำหรับการใช้งาน browser บน WebArena-Verified GPT-5.4 บรรลุอัตราความสำเร็จ 67.3% เทียบกับ 65.4% ของ GPT-5.2
ความสามารถใช้งานคอมพิวเตอร์ที่ดีขึ้นของ GPT-5.4 สร้างขึ้นจากการปรับปรุงความสามารถด้าน visual perception บน MMMU-Pro GPT-5.4 บรรลุอัตราความสำเร็จ 81.2% เทียบกับ 79.5% ของ GPT-5.2
สำหรับนักพัฒนาที่ต้องการใช้ความสามารถเหล่านี้ผ่าน API สามารถเข้าถึงได้โดยใช้ computer tool ที่อัปเดตแล้ว นอกจากนี้ใน ChatGPT ผู้ใช้สามารถลองใช้ความสามารถเหล่านี้ได้กับ GPT-5.4 Thinking หรือ Pro
GPT-5.4 ถือเป็นก้าวสำคัญของ OpenAI ในการพัฒนา AI ให้สามารถทำงานที่ซับซ้อนได้อย่างมีประสิทธิภาพ ด้วยความสามารถใช้งานคอมพิวเตอร์แบบ native ทำให้ AI agents สามารถทำงานได้อย่างแท้จริง