เมื่อ AI สร้างรูปภาพสมจริงได้จาก คำพูดและตัวหนังสือ ทำความรู้จักกับ “Dall-E”

เมื่อ A.I. สร้างภาพจำลองได้เหมือนจริง โดยที่เราไม่ต้องเขียนโค้ดที่ยุ่งยากแต่อย่างใด เพียงใส่ข้อความ โปรแกรม text-to-image แปลงข้อความเป็นรูปภาพที่เรียกว่า DALL-E ก็จะใช้แบบจำลองปัญญาประดิษฐ์ หาข้อมูลที่เกี่ยวข้องจาก search engine ที่มีอยู่มาวิเคราะห์เป็นภาพ เป็นอีกขั้นของการให้ AI ทำงานให้เราอย่างง่ายดาย

เมื่อ AI สร้างรูปภาพสมจริงได้จาก คำพูดและตัวหนังสือ ทำความรู้จักกับ “Dall-E”

โมเดล AI “DALL-E” มาจากซอฟต์แวร์ Imagen ของ Google และ OpenAI ซึ่งเป็นสตาร์ทอัพที่ได้รับการสนับสนุนจาก Microsoft เป็นผู้พัฒนา 

ในการใช้งาน เพียงกรอกข้อความลงไป ตัวอย่างเช่น เมื่อพิมพ์ข้อความ “Cat on the UFO” จากนั้น AI ก็จะคาดเดาในการแสดงคำศัพท์เหล่านั้น ซึ่งวิศวกรได้ฝึกฝนโมเดล Imagen ด้วยชิป AI ในตัวหลายร้อยตัวบนคู่ของข้อความรูปภาพที่มีอยู่ภายในระบบ 460 ล้านคู่ที่เกี่ยวกับคอลเลกชั่นคำและรูปภาพมากมายจากเว็บ รวมถึงรูปภาพที่ผู้คนโพสต์บน Flickr จากนั้นภาพก็จะแสดงผลออกมา

การใช้งานส่วนใหญ่ในตอนนี้ ยังใช้งานกันในกลุ่มเล็กๆ ที่แชร์รูปภาพให้กันเพื่อความบันเทิง นั่นเป็นเพราะ Google และ OpenAI ยังไม่ได้เผยแพร่เทคโนโลยีอย่างจริงจังต่อสาธารณชนในวงกว้าง โดย Joanne Jang แห่ง OpenAI เขียนไว้ในหน้าเว็บไซต์ของบริษัทว่า “เรากำลังทำงานอย่างหนักเพื่อเร่งการเข้าถึง แต่อาจต้องใช้เวลาสักระยะจนกว่าที่จะมีการใช้งานกันในวงกว้าง”

เริ่มทดลองให้ใช้ด้วย DALL-E Mini

ส่วนหนึ่งของระบบที่เปิดเผยให้ทดลองใช้ในตอนนี้ คือ DALL-E Mini ซึ่งใช้รหัสโอเพนซอร์ซจากทีมนักพัฒนาที่จัดระเบียบอย่างคร่าวๆ ซึ่งผู้คนก็ให้ความสนใจในจำนวนมาก 

ขณะเดียวกันทาง OpenAI ได้มีมาตรการในเรื่องภาพที่อาจไม่เหมาะสมด้วย โดยจะมี Moderator ควบคุมและลบเนื้อหาที่มีความรุนแรงออกจากข้อมูลการเทรนของ Machine และมีตัวกรองที่หยุด DALL-E 2 จากการสร้างภาพหากผู้ใช้ส่งการแจ้งเตือนที่อาจละเมิดนโยบายของบริษัทเกี่ยวกับภาพอนาจาร ความรุนแรง การก่อการร้าย หรือเนื้อหาทางการเมือง

ทั้งนี้ โมเดลสร้างภาพยังไม่ได้สมบูรณ์แบบและไม่ได้ให้ผลลัพธ์ที่สื่อถึงความหมายได้อย่างแม่นยำเสมอไป นอกจากนี้ทาง OpenAI ยังมีแพลนที่จะให้บริการ DALL-E 2 ซึ่งจะสร้างภาพให้มีความสมจริงมากกว่านี้ในอนาคต

ทดลองสร้างภาพด้วย AI ได้ที่ huggingface 

อ้างอิงจาก CNBC






ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

คอมตัมคอมพิวติ้ง ตอนนี้ไปถึงไหนแล้ว ? สรุปความก้าวหน้าควอนตัมจากงาน NVIDIA GTC 2025

งาน NVIDIA GTC 2025 เป็นปีแรกที่มีการจัดเวทีพูดคุยเกี่ยวกับควอนตัมคอมพิวติ้งโดยเฉพาะ (Quantum Day) ซึ่ง NVIDIA ในฐานะเจ้าภาพ และผู้ขับเคลื่อนการประมวลผลแบบ Accelerated Computing จึ...

Responsive image

ญี่ปุ่น ใช้ AI และเทคโนโลยีอะไร ในการรับมือแผ่นดินไหว ?

เหตุแผ่นดินไหวในเมียนมาที่ส่งผลกระทบมาถึงประเทศไทย สร้างความตระหนักถึงความเสี่ยงด้านแผ่นดินไหวที่อาจเกิดขึ้นในประเทศ แม้ประเทศไทยจะไม่ใช่พื้นที่ที่มีความเสี่ยงสูง แต่เหตุการณ์ดังกล...

Responsive image

AI วาดสไตล์ Ghibli : OpenAI แอบดึงข้อมูลมาเทรนด์หรือเปล่า ประเด็นที่โลกไม่ควรมองข้าม

ฟีเจอร์ใหม่จาก ChatGPT ที่สร้างภาพสไตล์ Ghibli ทำเอาโลกอินเทอร์เน็ตสะเทือน แต่คำถามใหญ่คือ...นี่คือวิวัฒนาการของเทคโนโลยี หรือการทำลายจิตวิญญาณของศิลปะที่ Ghibli ยึดถือมาทั้งชีวิต ...