OpenAI เปิดตัว o3 โมเดล AI ใหม่ล่าสุดที่ฉลาดจนอาจใกล้เข้าสู่ยุค AGI

OpenAI เปิดตัว o3 และ o3-mini โมเดล AI ตัวใหม่ที่พัฒนาต่อยอดมาจาก o1 ที่เพิ่งเปิดตัวให้เห็นเมื่อเดือนกันยายน ปี 2024 โดยมาพร้อมกับความสามารถเด่นในเรื่องของ Reasoning หรือการให้เหตุผล ซึ่งนี่อาจเป็นก้าวต่อไปที่ทำให้เข้าใกล้ยุค AGI หรือขั้นต่อไปของปัญญาประดิษฐ์ที่จะมีความสามารถที่เหนือกว่ามนุษย์ในหลายๆ ด้าน


o3 มีอะไรดี ?

ความพิเศษของ o3 อยู่ที่ "ความสามารถในการให้เหตุผล" ซึ่งหมายความว่ามันสามารถ "คิด" และ "ตรวจสอบ" คำตอบของตัวเองได้ ก่อนที่จะตอบเรา โดยปกติแล้วหากเราถามคำถามยากๆ กับ AI มันอาจจะตอบผิดหรือให้ข้อมูลที่ไม่ถูกต้อง แต่ o3 ต่างออกไป เพราะมันถูกฝึกมาให้คิดอย่างรอบคอบก่อนตอบ

โดยเมื่อเราถามคำถามกับ o3 แทนที่มันจะตอบทันที o3 จะหยุดคิดสักครู่ราวกับว่ามันกำลังคิดอยู่ในใจ โดยพิจารณาคำถามที่คล้ายกันหลายๆ คำถาม และอธิบายขั้นตอนการคิดให้ทราบ จากนั้น o3 จะตรวจสอบคำตอบของตัวเองอย่างละเอียดเพื่อให้แน่ใจว่าถูกต้องที่สุด ซึ่งหลังจากคิด และตรวจสอบแล้ว o3 จะทำการสรุปคำตอบที่ดีที่สุดให้กับผู้ใช้

ทั้งนี้ o3 และ o3-mini จะเปิดให้นักวิจัยบางส่วนได้ใช้งานเวอร์ชันพรีวิวก่อนเป็นกลุ่มแรก ก่อนที่จะเปิดให้ผู้ใช้ทั่วไปใช้งานช่วงเดือนมกราคม 2025


o3 เก่งแค่ไหน เข้าใกล้ AGI หรือยัง ?

ในการทดสอบ SWE-Bench Verified ซึ่งเป็นการทดสอบความสามารถด้านการเขียนโปรแกรม o3 ทำคะแนนได้ดีกว่า o1 ราว 22.8% ส่วนการทดสอบ Codeforce หรือการแข่งขันเขียนโปรแกรม o3 ได้คะแนนสูงถึง 2,727 ซึ่งนับว่าเป็นคะแนนที่สูงมาก เพราะหากได้คะแนนราว 2,400 ก็ถือว่าเก่งกว่าโปรแกรมเมอร์ราว 99.2% บนโลกแล้ว

ส่วนการทดสอบ American Invitational Mathematics Exam หรือการทดสอบเลขระดับยากของอเมริกา o3 ทำคะแนนได้เกือบเต็มที่ 96.7% ตอบผิดเพียงแค่ข้อเดียว ส่วนการทดสอบ Frontier Math หรือการทดสอบคณิตศาสตร์ขั้นสูง o3 ก็สามารถทำลายสถิติ แก้โจทย์ได้ 25.2% ในขณะที่ AI ตัวอื่นๆ ทำได้ไม่เกิน 2%

แม้ Sam Altman ซีอีโอของ OpenAI จะเคยกล่าวว่า ปี 2025 อาจเป็นปีที่มนุษย์ได้เห็น AGI แต่ดูเหมือนว่า โมเดล o3 ตัวใหม่อาจจะยังไม่ไปถึงจุดนั้น โดยจากการทดสอบ ARC-AGI ซึ่งเป็นการทดสอบที่ออกแบบมาเพื่อประเมินว่าระบบ AI สามารถได้รับทักษะใหม่ๆ นอกจากข้อมูลที่ได้ระบการฝึกฝนหรือไม่ 

ARC-AGI ค้นพบว่า o3 เป็นโมเดลที่ถือว่ามีความก้าวหน้าในเรื่องของความสามารถเป็นอย่างมาก แต่ค่าใช้จ่ายในการแก้โจทย์ ARC-AGI ยังถือว่าสูงอยู่ที่ราว 17-20 ดอลลาร์สหรัฐฯ ต่อข้อ แม้จะประมวลผลในโหมด low-compute (หากจ้างมนุษย์แก้โจทย์เดียวกันจะอยู่ที่ราว 5 ดอลลาร์สหรัฐฯ)

โดยทาง ARC-AGI มองว่า o3 ยังไม่ใช่ AGI ที่แท้จริงเพราะยังทำโจทย์ง่ายๆ บางข้อผิดพลาด รวมทั้งแบบทดสอบ ARC-AGI 2 ที่กำลังจะออกมาใหม่น่าจะเป็นโจทย์ที่ท้าทายสำหรับ o3 มากกว่าตอนนี้มาก และอาจทำให้คะแนนลดลงเหลือต่ำกว่า 30% 

ทาง ARC-AGI สรุปทิ้งท้ายไว้อย่างน่าสนใจว่า ถ้าวันไหนที่เราพยายามคิดโจทย์ง่ายๆ ให้มนุษย์ทำ แต่กลับพบว่า AI ก็ทำได้หมดทุกข้อ ไม่ว่าจะพยายามแค่ไหน นั่นแหละคือสัญญาณว่า AGI ได้เกิดขึ้นจริงแล้ว ซึ่งในตอนนี้ o3 ยังไปไม่ถึงจุดนั้น


อ้างอิง : techcrunch, arcprize



ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

ศูนย์วิจัยกสิกรชี้ ส่งออกไทยอาจเสียหาย 4 แสนล้านบาท จากภาษีตอบโต้ 37%

ศูนย์วิจัยกสิกรไทย ออกบทวิเคราะห์ประเมินถึงสถานการณ์ที่สหรัฐญ ขึ้นภาษีตอบโต้ (Reciprocal Tariffs) กับไทยในอัตรา 37% ซึ่งถือว่าสูงกว่าที่เคยประเมินไว้ที่ 25% ถือเป็นความเสี่ยงต่อเศร...

Responsive image

ไทย–อินเดีย จับมือสู่การเป็น “หุ้นส่วนทางยุทธศาสตร์”

ไทย-อินเดียยกระดับสัมพันธ์สู่ “หุ้นส่วนทางยุทธศาสตร์” ประกาศความร่วมมือ 6 ฉบับ ครอบคลุมเศรษฐกิจ ดิจิทัล วัฒนธรรม รับมือแรงสั่นสะเทือนจากนโยบายภาษีสหรัฐฯ และเสริมบทบาทภูมิรัฐศาสตร์ใ...

Responsive image

[ข่าวลือ] Microsoft ชะลอการลงทุน Data Center ในหลายประเทศทั่วโลก

Microsoft ถูกเปิดเผยว่าชะลอหรือหยุดการลงทุนใน Data Center หลายประเทศ ทั้งลอนดอน ชิคาโก อินโดนีเซีย และวิสคอนซิน สะท้อนการทบทวนยุทธศาสตร์ AI และคลาวด์ ข้อมูลจาก Bloomberg...