วงการ AI คึกคักขึ้นอีกครั้งเมื่อ Deep Cogito เปิดตัว Cogito 1 โมเดล AI รุ่นใหม่ที่มีคุณสมบัติพิเศษในการสลับโหมดระหว่างการ "คิดวิเคราะห์" และการตอบคำถาม ซึ่งทำให้มันเป็นโมเดล AI แบบ "ไฮบริด" ที่สามารถเลือกได้ว่าจะให้ตอบคำถามหรือวิเคราะห์ข้อมูล
หลายคนคงคุ้นเคยกับ AI อย่าง o1 ของ OpenAI ที่เก่งในเรื่องการแก้ปัญหาซับซ้อน ไม่ว่าจะเป็นโจทย์คณิตศาสตร์หรือฟิสิกส์ ด้วยการทำงานทีละขั้นตอนและตรวจสอบตัวเอง แต่ข้อเสียของโมเดลเหล่านี้คือ การใช้พลังงานสูงและตอบช้า
หลายคนคงรู้จัก AI อย่าง o1 ของ OpenAI ที่เชี่ยวชาญในการแก้ปัญหาที่ซับซ้อน อย่างเช่น คณิตศาสตร์หรือฟิสิกส์ ด้วยการทำงานทีละขั้นตอนและตรวจสอบคำตอบตัวเอง แต่ข้อเสียของโมเดลเหล่านี้คือ การใช้พลังงานสูงและตอบช้ากว่าโมเดลอื่นๆ
โมเดล AI ไฮบริดจึงเป็นตัวเลือกใหม่ที่สามารถตอบคำถามง่ายๆ ได้ทันที แต่เมื่อเจอปัญหาที่ยากขึ้น โมเดลนี้จะหยุดคิดและวิเคราะห์ให้ละเอียดก่อนตอบ ซึ่ง Deep Cogito ได้นำแนวคิดนี้มาพัฒนาให้ Cogito 1 ที่มีทั้งความเร็วในการตอบและความสามารถในการคิดวิเคราะห์ได้ในตัว"
ทุกรุ่นของ Cogito 1 เป็นโมเดลไฮบริด ที่สามารถสลับโหมดการคิดได้ตามความเหมาะสม โดยมีรุ่นให้เลือกตั้งแต่ 3 พันล้านพารามิเตอร์ ไปจนถึง 70 พันล้านพารามิเตอร์ ซึ่งหมายความว่าโมเดลที่มีพารามิเตอร์มากขึ้น จะสามารถแก้ปัญหาที่ซับซ้อนได้ดีกว่า และยังมีแผนจะเปิดตัวโมเดลที่มีพารามิเตอร์สูงถึง 671 พันล้านพารามิเตอร์ ในอนาคต
ต้องบอกว่า Cogito 1 ไม่ได้พัฒนาจากศูนย์ แต่ได้ใช้โมเดลที่เปิดให้ใช้ฟรีจาก Meta และ Alibaba มาเป็นฐาน แล้วใช้วิธีการฝึกสอนใหม่เพื่อเพิ่มประสิทธิภาพและทำให้สามารถสลับโหมดคิดวิเคราะห์ได้
ซึ่งจากการทดสอบภายใน Cogito 1 ได้รับการยืนยันว่า Cogito 70B ในโหมดคิดวิเคราะห์สามารถเอาชนะ R1 จาก DeepSeek ในการทดสอบด้านคณิตศาสตร์และภาษา ในขณะที่เมื่อปิดโหมดคิดวิเคราะห์ Cogito 70B ยังทำคะแนนได้ดีกว่า Llama 4 Scout จาก Meta ในการทดสอบ AI ทั่วไป
สหรับผู้ที่สนใจสามารถทดลองใช้งาน Cogito 1 ได้โดยดาวน์โหลดหรือใช้ผ่าน API บนแพลตฟอร์มคลาวด์ Fireworks AI และ Together AI ซึ่งเปิดให้ใช้งานได้แล้ว
Deep Cogito กล่าวว่าขณะนี้ยังอยู่ในช่วงเริ่มต้นของการพัฒนา และกำลังมองหาวิธีการฝึกสอนหลังการฝึกอบรมเพื่อให้ AI มีความสามารถในการพัฒนาตัวเองได้มากขึ้น
Deep Cogito ก่อตั้งขึ้นใน มิถุนายน 2024 โดยมีสำนักงานตั้งอยู่ที่ ซานฟรานซิสโก ผู้ก่อตั้งคือ Drishan Arora และ Dhruv Malhotra ซึ่งทั้งคู่เคยทำงานที่ Google และ DeepMind มาก่อน
เป้าหมายใหญ่ ของ Deep Cogito คือการพัฒนา "ปัญญาประดิษฐ์ทั่วไปที่มีความสามารถเหนือมนุษย์" ซึ่งจะสามารถทำงานได้ดีกว่ามนุษย์ในหลายๆ ด้าน และอาจจะสร้างสรรค์สิ่งใหม่ๆ ที่มนุษย์ยังไม่เคยจินตนาการถึงได้
อ้างอิง: techcrunch
ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด