แม็กซิม ล็อต (Maxim Lott) ผู้ก่อตั้ง Trancking.AI เว็บไซต์นำเสนอแบบทดสอบอคติของโมเดล AI ทำการทดสอบ IQ โมเดล AI ตัวดังในตอนนี้ โดยมีแรงบันดาลใจจากไอเดียที่ว่า ปัจจุบันการทดสอบเกณฑ์มาตรฐาน AI ที่สำคัญเป็นเพียง “การทดสอบการท่องจำที่ดี ไม่ใช่ความฉลาด”
กล่าวคือ AI ได้รับการฝึกฝนให้จดจำ และเลียนแบบจากข้อมูลที่เป็นข้อเท็จจริง หรือข้อมูลเชิงประจักษ์ ซึ่งผลลัพธ์ที่ได้จากการสร้างเนื้อหาก็มาจากการสุ่มข้อมูลเหล่านั้นขึ้นมาตอบ
พูดง่ายๆ ก็คือ พลัง AI ที่เราเห็นทุกวันนี้ส่วนใหญ่มาจากฐานข้อมูลขนาดใหญ่ และการจับคู่ของชุดข้อมูลที่ผ่านการป้อนคำสั่งนั่นเอง ดังนั้นจึงเกิดความสงสัยว่าแท้จริงแล้ว AI มีความฉลาดแค่ไหนกันแน่ ซึ่งการจะวัดระดับสติปัญญาก็ควรใช้มาตรวัดความฉลาดเชิงตรรกะอื่นๆ ที่นอกเหนือจากการทดสอบเขียนโค้ด ข้อสอบคณิตศาสตร์
ล็อต ทำการทดสอบโมเดล AI ด้วยการใช้แบบทดสอบ IQ ของ Mensa Norwegian ซึ่งเป็นหนึ่งในแบบทดสอบเชาวน์ปัญญาที่ได้รับการยอมรับในระดับสากล และได้รับความนิยมมากที่สุดสำหรับการวัดประเมินระดับความฉลาดของสติปัญญา
โดยหลักๆ จะเป็นการวัดจากรูปแบบการใช้เหตุผลผ่านวิธีการวิเคราะห์ภาพ (Visual reasoning) ที่ประกอบด้วยคำถาม 35 ข้อ ซึ่งจะต้องตอบภายใน 25 นาที โดยโมเดล AI ทุกตัวจะได้รับการทดสอบสองถึงสามครั้ง เพื่อลดความแปรปรวน อย่างไรก็ตามเขาได้ทำการทดสอบเพื่อประเมินการตีความภาพ การอธิบายตรรกะในการเลือกคำตอบนั้นๆ อ่านวิธีการทดสอบเพิ่มเติม AIs ranked by IQ
ซึ่งผลลัพธ์ที่ได้นั้น AI บางตัวฉลาดกว่าตัวอื่นมาก โดย Claude เป็นโมเดล AI ที่ฉลาดที่สุด ณ ตอนนี้ หลังจากเปิดตัวได้ไม่นาน แต่ก่อนหน้านั้น ChatGPT เป็นผู้นำที่ชัดเจน เขาพบว่า ChatGPT-4 บางครั้งใช้ตรรกะถูกต้อง แต่ก็ยังตอบผิดเพราะอ่านรูปภาพผิด ซึ่งสะท้อนให้เห็นว่า การวิเคราะห์ภาพ อาจจะยังไม่มีประสิทธิภาพเพียงพอ โดย Microsoft Bing มาเป็นอันดับ 3 และ Google ตามหลังสุดในหมู่ผู้เล่นรายใหญ่
ติดตามเพจ Facebook : Thairath Money ได้ที่ลิงก์นี้ - https://www.facebook.com/ThairathMoney