OpenAI และ Microsoft กำลังสืบสวนกรณีที่ DeepSeek บริษัทปัญญาประดิษฐ์จากจีน อาจนำข้อมูลจากโมเดลของ OpenAI ไปใช้ในการพัฒนาโมเดล AI โดยไม่ได้รับอนุญาต ซึ่งอาจเป็นการละเมิดข้อตกลงการใช้บริการ
รายงานจากบลูมเบิร์กเปิดเผยว่า ทีมรักษาความปลอดภัยของไมโครซอฟท์ตรวจพบว่ามีการดึงข้อมูลปริมาณมหาศาลผ่านบัญชีนักพัฒนาของโอเพนเอไอในช่วงปลายปี 2024 ซึ่งโอเพนเอไอ เชื่อว่าอาจมีความเชื่อมโยงกับ DeepSeek
พร้อมกันนี้ โอเพนเอไอได้ให้ข้อมูลกับไฟแนนเชียล ไทมส์ว่าพบหลักฐานเกี่ยวกับการใช้เทคนิค "Distillation" ซึ่งเป็นวิธีที่นักพัฒนาใช้ในการฝึกโมเดลเอไอ โดยดึงข้อมูลจากโมเดลที่มีความสามารถสูงกว่าเพื่อลดต้นทุนการพัฒนา
ทั้งนี้ โมเดลขนาดใหญ่อย่าง GPT-4 ของโอเพนเอไอใช้งบประมาณกว่า 100 ล้านดอลลาร์สหรัฐในการฝึก แต่การใช้ Distillation สามารถลดค่าใช้จ่ายนี้ลงได้อย่างมาก แม้ว่านักพัฒนาจะสามารถใช้ API ของโอเพนเอไอในการรวมเอไอเข้ากับแอปพลิเคชันของตัวเองได้ แต่การนำผลลัพธ์ไปฝึกโมเดลคู่แข่งถือเป็นการละเมิดข้อตกลงการให้บริการ อย่างไรก็ตาม OpenAI ยังไม่ได้เปิดเผยรายละเอียดของหลักฐานที่ค้นพบ
อ่านเพิ่มเติม:
ประเด็นนี้เต็มไปด้วยความย้อนแย้ง เนื่องจากโอเพนเอไอก็เคยใช้ข้อมูลจากอินเทอร์เน็ตจำนวนมากโดยไม่ได้รับอนุญาตในการพัฒนาโมเดล GPT ในช่วงแรกเช่นกัน
โอเพนเอไอออกแถลงการณ์ในประเด็นนี้ว่า เราทราบดีว่าบริษัทที่ตั้งอยู่ในสาธารณรัฐประชาชนจีน รวมถึงประเทศอื่นๆ กำลังพยายามใช้กระบวนการ Distillation กับโมเดลเอไอชั้นนำของสหรัฐฯ อย่างต่อเนื่อง ในฐานะผู้นำด้านเอไอ เราได้ดำเนินมาตรการป้องกันเพื่อปกป้องทรัพย์สินทางปัญญาของเรา ซึ่งรวมถึงการควบคุมความสามารถของโมเดลที่ปล่อยออกสู่สาธารณะ และเรามองว่าการทำงานร่วมกับรัฐบาลสหรัฐฯ อย่างใกล้ชิดเป็นสิ่งสำคัญยิ่งเพื่อป้องกันไม่ให้เทคโนโลยีอันทรงพลังถูกดึงไปใช้โดยคู่แข่งและฝ่ายตรงข้าม
...
ขณะนี้ โอเพนเอไอและพาร์ทเนอร์อย่างไมโครซอฟท์กำลังเดินหน้าสืบสวนเพิ่มเติมเพื่อระบุว่าข้อมูลที่ DeepSeek ใช้อาจละเมิดข้อตกลงด้านทรัพย์สินทางปัญญาหรือไม่ ซึ่งอาจส่งผลกระทบต่อการแข่งขันในอุตสาหกรรมเอไอระดับโลก
ที่มา: Bloomberg