สรุป 7 สิ่งมหัศจรรย์จากงาน Google I/O 2024

Techsauce สรุปให้ Google I/O 2024 มีอะไรน่าสนใจบ้าง หลังเมื่อช่วงเที่ยงคืน (เวลาไทย) ที่ผ่านมา Google ได้จัดงานประชุมนักพัฒนาซอฟต์แวร์ Google I/O ประจำปี 2024 ซึ่งเป็นงานที่บริษัทจะประกาศผลิตภัณฑ์ตัวใหม่หรือโปรเจกต์ที่กำลังพัฒนา

แน่นอนทุกเวทีสายเทคต้องพูดถึง AI เช่นเดียวกับ Google Sundar Pichai CEO ประกาศว่านี่เป็น Gemini Era หรือ “ยุคของ Gemeni” (AI เรือธงของบริษัท) ที่ Google ตั้งเป้าจะใช้ความสามารถของมันกับทุกผลิตภัณฑ์ โดยในงานปีนี้มีการพูดคำว่า AI มากถึง 120 ครั้ง และมีการประกาศอัปเดตผลิตภัณฑ์บริการมากมายพร้อมความสามารถของ AI 

1. Gemini 1.5 Pro 

  • โมเดลเรือธงตัวล่าสุดของ Google
  • ประมวลผล Token ได้มากถึง 2 ล้าน Tokens
  • คิดเป็นประมาณ 1.4 ล้านคำ วิดีโอ 2 ชั่วโมง หรือเสียง 22 ชั่วโมง
  • สามารถประมวลผลข้อมูลได้มากกว่าเดิม
  • นับเป็นรุ่นที่รองรับ Input ได้ใหญ่ที่สุดในบรรดาโมเดลที่มีอยู่ในตลาด
  • จดจำบริบทการสนทนาที่ซับซ้อนได้ดีขึ้น
  • ลดโอกาสที่จะเบี่ยงเบนจากหัวข้อสนทนาไปสู่หัวข้ออื่น
  • เข้าใจทั้งเสียงและภาพได้ดีขึ้น
  • เข้าใจโค้ด การใช้เหตุผลเชิงตรรกะ และวางแผนได้ดีกว่าเดิม
  • Gemini 1.5 Pro รุ่น 2 ล้าน Tokens ยังไม่เปิดให้คนทั่วไปใช้งาน
  • Gemini 1.5 Pro รุ่น 1ล้าน  Tokens เปิดให้ใช้งานสำหรับลูกค้า Google Cloud

2. Veo โมเดลสร้างวิดีโอแบบมืออาชีพ 

  • โมเดลวิดีโอ AI รุ่นล่าสุด สร้างวิดีโอคุณภาพสูงจาก Prompt ข้อความ รูปภาพ และวิดีโอ
  • สร้างวิดีโอที่มีความซับซ้อน แต่ละซีนมีความต่อเนื่องกัน 
  • การเคลื่อนไหวในวิดีโอจึงสมจริงทั้งในคน สัตว์ และวัตถุตลอดทั้ง shot
  • สามารถสร้างวิดีโอความละเอียดสูงถึง 1080p และได้ความยาวกว่า 1 นาที
  • สามารถเข้าใจภาษาและคำศัพท์ที่ใช้กันในวงการภาพยนตร์
  • สามารถทำเอฟเฟ็กต์ด้านภาพยนตร์ได้
  • ครีเอเตอร์บน YouTube ที่ได้รับการคัดเลือกจะได้ทดลองใช้ฟีเจอร์ VideoFX ในเร็วๆ นี้

3. Project Astra ผู้ช่วย AI อัจฉริยะ 

  • ผู้ช่วย AI อัจฉริยะแบบเรียลไทม์ (คล้ายกับ Jarvis ของ Tony Stark ในภาพยนตร์ Iron Man)
  • สามารถมองเห็นและเข้าใจสภาพแวดล้อมรอบตัวคุณได้
  • จาก VDO สาธิตจะเห็นว่ามันสามารถช่วยทำงาน ตอบคำถาม จดจำสภาพแวดล้อม ใช้ความคิดสร้างสรรค์ รวมถึงค้นหาสิ่งที่คุณวางผิดที่ เรียกว่าความสามารถรอบด้านมากๆ โดยทั้งหมดนี้เกิดขึ้นแบบเรียลไทม์ ถามปุ๊ป ตอบปั๊ป
  • ตอนนี้ Project Astra ยังเป็นเพียงแค่ตัวต้นแบบและอยู่ในช่วงเริ่มต้นเท่านั้น
  • ปัจจุบันทีม DeepMind ปรับปรุงและรวบรวมโมเดล AI ต่างๆ เพื่อสร้างผู้ช่วยที่ดีที่สุดเท่าที่จะเป็นไปได้

4. Circle to search 

  • ฟีเจอร์ช่วยทำการบ้านคณิตศาสตร์บน Android
  • แค่วงกลมโจทย์เลขก็จะมี AI ช่วยแก้โจทย์ให้ โดยแจกแจงปัญหาและอธิบายขั้นตอนที่จำเป็นในการแก้โจทย์
  • ขับเคลื่อนโดยโมเดล LearnLM AI ของ Google ซึ่งออกแบบมาเพื่อช่วยในการเรียนรู้โดยเฉพาะ
  • การอัปเดตล่าสุดได้มีการเพิ่มฟีเจอร์แก้โจทย์คณิต ฟิสิกส์ 
  • ภายในปีนี้ Circle to Search จะสามารถช่วยในเรื่องสมการทางคณิตศาสตร์ที่ซับซ้อนยิ่งขึ้น เช่น สูตรทางคณิตศาสตร์ แผนภาพ และกราฟได้

5. TalkBack เปิดโลกให้ผู้พิการทางสายตาหรือผู้มีปัญหาการมองเห็น

  • ฟีเจอร์การช่วยเหลือพิเศษที่ช่วยให้ผู้ที่ตาบอดหรือมีสายตาเลือนรางให้โต้ตอบกับอุปกรณ์ Android ได้
  • ใช้การสัมผัสหน้าจอและการอธิบาย และอ่านออกเสียงโดยไม่ต้องใช้อินเทอร์เน็ต 
  • ล่าสุดอัปเดตใหม่ด้วยการนำ Gemini nano ซึ่งเป็นโมเดลขนาดเล็กที่สุดของ Google เข้ามาใช้งาน การอัปเดตจะช่วยเติมเต็มรายละเอียดที่ขาดหายไป  เช่น รายละเอียดเพิ่มเติมเกี่ยวกับสิ่งที่อยู่ในรูปถ่ายที่ครอบครัวหรือเพื่อนส่งมา หรือสไตล์เสื้อผ้าเมื่อต้องช้อปปิ้งออนไลน์
  • จะเปิดใช้บน Android ในปลายปีนี้ 

6. Google ‘Gems’ สร้าง Chatbot ของตัวเอง

  • ฟีเจอร์ที่ช่วยให้ผู้ใช้สามารถสร้าง Gemini Assistant 
  • Gemini Assistant จะเป็นเวอร์ชันที่ผู้ใช้งานออกแบบเอง ซึ่งจะช่วยในการทำงานที่เฉพาะเจาะจงและเหมาะสมกับความต้องการในการใช้งาน
  • ตัวอย่างเช่น สามารถเปลี่ยน Gemini เป็นเพื่อนร่วมออกกำลังกาย ผู้ช่วยเชฟ คู่หูเขียนโค้ด คู่มือการเขียนเชิงสร้างสรรค์หรืออะไรก็ได้ที่ต้องการใช้งาน
  • Gems จะให้ความรู้สึกคล้ายกับ GPT Store ของ OpenAI ที่ให้คุณสร้างแชทบอท ChatGPT แบบกำหนดเองได้
  • ฟีเจอร์ Gems พร้อมให้ใช้งานเร็วๆ นี้ สำหรับสมาชิก Gemini Advanced

7. Gemini in Workspace อัปเดต AI มาช่วยงานแบบฉ่ำ 

  • ผู้ช่วยในการทำงานให้ง่ายขึ้น ด้วยโมเดล Gemini 1.5 Pro ตั้งแต่ Doc Sheet Slide Drive ไปจนถึง Gmail 
  • สามารถสรุปอีเมลจากยาวๆ ให้เป็น treads อ่านง่าย
  • สามารถเขียนอีเมลตอบกลับได้เหมาะสมตามบริบท
  • สามารถเตือนให้ตอบอีเมลในภายหลัง
  • สามารถขอให้ Gemini ช่วยในสิ่งที่ต้องการบน Workspace  เช่น จัดระเบียบใบเสร็จจากอีเมลและใส่ไว้ในโฟลเดอร์ Drive หรือแยกข้อมูลจากใบเสร็จและใส่ลงใน Sheet
  • Gemini in Workspace  จะเปิดตัวอย่างเป็นทางการสำหรับสมาชิกในเดือนหน้า 

อ้างอิง: techcrunch[1] techcrunch[2] techcrunch [3] theverge[1] theverge [2] theverge[3] theverge[4] theverge[5]

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

วิจัยพบ AI ไม่ได้คิดอย่างที่พูด แม้จะโชว์วิธีคิดยาวเหยียด แต่ซ่อนความคิดที่แท้จริงไว้ไม่บอกใคร

ตอนนี้มี AI ประเภทใหม่ที่เรียกว่าโมเดลจำลองการให้เหตุผล (SR Model) ซึ่งถูกสร้างมาให้โชว์วิธีคิดทีละขั้นตอน เวลาเราถามคำถามยากๆ AI จะอธิบายออกมาเป็นขั้นเป็นตอนว่าคิดด้วยวิธีไหน ถึงไ...

Responsive image

เปิดตัว Llama 4 โมเดล AI ที่ฉลาดที่สุดของ Meta ทำอะไรได้บ้าง แต่ละโมเดลต่างกันอย่างไร ?

Meta ได้เปิด Llama 4 ซึ่งเป็น AI เวอร์ชันอัปเดตล่าสุดอย่างเป็นทางการ โดยครั้งนี้มีโมเดลใหม่ทั้งหมด 3 ตัว ได้แก่ Llama 4 Scout, Llama 4 Maverick และ Llama 4 Behemoth โดยทาง Meta เป...

Responsive image

KBTG ร่วมมือ MIT Media Lab สนับสนุน AHA พัฒนา AI มุ่งสร้างสังคมที่ยั่งยืน

KBTG ประกาศความร่วมมือกับโครงการ Advancing Humans with AI (AHA) โดย MIT Media Lab ในฐานะผู้ร่วมสนับสนุนการจัดตั้งโครงการ ตอกย้ำความตั้งใจในการผลักดันความก้าวหน้าด้าน AI และ Human-C...