Google เปิดตัว โมเดลประมวลภาษาขนาดใหญ่ (LLMs) ที่ขับเคลื่อนด้วย Generative AI ตัวใหม่ ที่ชื่อว่า เจมินาย ‘Gemini’ ที่ระบุว่ามีประสิทธิภาพเหนือกว่า GPT-4 โดยได้ผลคะแนนการทดสอบต่างๆ ที่มากกว่าโมเดล GenAI ที่เคยมีมา
Gemini จะเป็นโมเดล Multimodal รองรับข้อมูลและคำสั่งหลายประเภท เพื่อการใช้งานที่หลากหลายในเวลาเดียวกัน เช่น ข้อความอักษร ภาพวิดีโอ เสียง และโค้ด ถูกเทรนด์ด้วยข้อมูลจากอินเทอร์เน็ตแบบ Real-time data ที่จะมีการอัปเดตอย่างสม่ำเสมอ บนโครงสร้างพื้นฐาน Tensor Processing Units (TPU) v4 และ v5e ที่ออกแบบภายในองค์กรของ Google
Gemini จะมี 3 เวอร์ชัน ได้แก่ Gemini Ultra รองรับข้อมูล 1T-2M พารามิเตอร์ คาดว่ามีประสิทธิภาพมากที่สุด ขนาดใหญ่ที่สุดสำหรับงานที่มีความซับซ้อนสูง, Gemini Pro ขนาดรองลงมาสำหรับการปรับขนาดในงานที่หลากหลาย และโมเดลบนอุปกรณ์ Nano-1 1.8B และ Nano-2 3.25B ที่คาดว่าไว้ใช้กับแพลตฟอร์มสมาร์ทโฟน
โดยมีแผนเปิดให้ใช้งานจริงในปีหน้า ซึ่งคาดว่าจะปรากฏใน Pixel 8 Pro สมาร์ทโฟนเครื่องแรกที่ออกแบบมาเพื่อใช้งาน Gemini Nano ซึ่งจะมีฟีเจอร์ใหม่ๆ เช่น สรุปเนื้อจากคลิปเสียงจาก Recorder, Smart Reply ใน Gboard โดยเริ่มจาก WhatsApp และเตรียมเปิดตัวแอปฯ ส่งข้อความเพิ่มมากขึ้นในปีหน้า
ตามการรายงานของ Google ระบุว่า Gemini Ultra พิสูจน์ให้เห็นว่ามีประสิทธิภาพเหนือกว่า GPT-4 รวมถึงโมเดลทั้งหลายในปัจจุบัน จากการทดสอบมาตรฐานวิชาการต่างๆ ด้วยผลคะแนนที่มากกว่า ทั้งการทดสอบ MMLU ที่ได้คะแนน 90.04% โดย GPT-4 ได้คะแนน 87.29% ชุดข้อสอบคณิตศาสตร์ GSM8K ที่ได้คะแนน 94.4% โดย GPT-4 ได้ 92.0% รวมถึงมาตรฐานการเขียนโค้ดขั้นสูง HumanEval และ Natural2Code
ปัจจุบัน Gemini Pro ถูกนำไปใช้งานแล้วใน Bard ในสหรัฐอเมริกา และอีก 170 ประเทศที่ใช้ภาษาอังกฤษ นับเป็นการอัปเกรดที่ใหญ่ที่สุดของ Bard นับตั้งแต่เปิดตัว จากเดิมที่ขับเคลื่อนด้วยโมเดล PaLM2 โดยคาดว่าจะโมเดล Gemini จะถูกนำไปใช้ประยุกต์และเสริมประสิทธิภาพโปรดักต์ต่างๆ ของ Google หลังจากนี้ เริ่มต้นจาก Google Search, Chrome และ Duet AI
อ้างอิง Google