Wikipedia แจกชุดข้อมูลฟรี ใช้เทรน AI แบบถูกลิขสิทธิ์

ตอนนี้ Wikipedia กำลังเจอศึกหนักจากบอท AI ที่แห่กันเข้ามาขูดเนื้อหาไปใช้เทรนโมเดล ทำเซิร์ฟเวอร์หน่วง ต้นทุนพุ่ง แถมคนใช้งานจริงก็ต้องรอโหลดหน้าเว็บนานขึ้น

ล่าสุด Wikimedia Foundation เจ้าของโครงการ Wikipedia เลยงัดไม้เด็ด แจกชุดข้อมูลให้เหล่านักพัฒนา AI แบบฟรี ๆ หวังลดการแห่เข้าเว็บโดยไม่จำเป็น

Wikipedia คืออะไร ?

Wikipedia คือสารานุกรมออนไลน์แบบเปิด (open encyclopedia) ที่ใคร ๆ ก็สามารถเข้าไปอ่าน แก้ไข หรือเพิ่มเติมเนื้อหาได้ฟรี โดยไม่ต้องสมัครสมาชิกหรือเสียเงินก็ตาม ก่อตั้งในปี 2001 โดย Jimmy Wales และ Larry Sanger โดยมีแนวคิดหลักคือ “ความรู้ควรเป็นของทุกคน” ปัจจุบันบริหารโดยองค์กรไม่แสวงหากำไรชื่อว่า Wikimedia Foundation

Wikipedia แจกชุดข้อมูลให้ฝึก AI ลดการแห่เข้าเว็บ

Wikimedia Foundation เจ้าของ Wikipedia ตัดสินใจปล่อยชุดข้อมูลอย่างเป็นทางการสำหรับนักพัฒนา AI ใช้ได้ฟรี ความร่วมมือครั้งนี้จับมือกับ Kaggle แพลตฟอร์มด้านดาต้าไซน์ของ Google ปล่อยเวอร์ชันเบต้าของชุดข้อมูลโครงสร้างภาษาอังกฤษและฝรั่งเศส ซึ่งถูกจัดรูปแบบมาให้เหมาะกับงานด้าน machine learning โดยเฉพาะ

ข้อมูลที่ปล่อยออกมาจะประกอบด้วยคำอธิบายสั้น ๆ สไตล์ infobox ลิงก์ภาพ และการแบ่งส่วนบทความอย่างชัดเจน แต่จะไม่มีการอ้างอิงหรือสื่ออื่น ๆ เช่นวิดีโอ ซึ่งอาจทำให้เกิดคำถามเรื่องเครดิตแหล่งข้อมูล อย่างไรก็ตาม ทาง Wikimedia Enterprise ยืนยันว่าทั้งหมดอยู่ภายใต้สัญญาอนุญาตแบบเปิด เช่น Creative Commons และ public domain

สิ่งที่น่าสนใจคือ Wikipedia คือคลังความรู้ขนาดมหึมาครอบจักรวาล ที่มีข้อมูลตั้งแต่เรื่องประวัติศาสตร์, วิทยาศาสตร์, ศิลปะ, เกม, ดารา, เมือง, ปรัชญา ไปจนถึงมุกใน The Simpsons ซึ่งยิ่งข้อมูลครอบคลุมมากเท่าไหร่ AI ยิ่งเรียนรู้โลกได้ใกล้เคียงมนุษย์มากเท่านั้น

อ้างอิง: engadget

ลงทะเบียนเข้าสู่ระบบ เพื่ออ่านบทความฟรีไม่จำกัด

No comment

RELATED ARTICLE

Responsive image

ไปรษณีย์ไทย จับมือ Techsauce พัฒนา Data-as-a-service เปิดหา Partner นำข้อมูลต่อยอดธุรกิจ

บริษัท ไปรษณีย์ไทย จำกัด ผนึกกำลัง บริษัท เทคซอส มีเดีย จำกัด ลงนามบันทึกข้อตกลงความร่วมมือ (MOU) อย่างเป็นทางการ เพื่อร่วมกันพัฒนาและประยุกต์ใช้เทคโนโลยีและข้อมูล สร้างสรรค์บริการ...

Responsive image

แจก 5 AI Prompts ที่เวิร์กทุกแชตบอท ChatGPT, Gemini, Claude

รวม 5 AI Prompts ที่ใช้ได้กับทุกแชตบอท ทั้ง ChatGPT, Gemini, Claude และอื่น ๆ ใช้ได้ทั้งสรุปบทความ วางแผนงาน สร้างไอเดีย...

Responsive image

ครั้งแรกของโลก! ไต้หวันปลูกถ่ายหัวใจที่ ‘ยังเต้นอยู่’ ได้สำเร็จ

ครั้งแรกของโลกที่ศัลยแพทย์ประสบความสำเร็จในการปลูกถ่ายหัวใจด้วยเทคนิคใหม่สุดล้ำ โดยหัวใจของผู้บริจาค ไม่หยุดเต้นเลยแม้แต่วินาทีเดียว ตลอดทั้งการปลูกถ่าย ซึ่งช่วยลดความเสียหายต่ออวั...