เทคโนโลยีปัญญาประดิษฐ์ (AI) กำลังพัฒนาไปอย่างรวดเร็ว แทบจะวันต่อวัน มีศักยภาพที่จะเติบโตในอนาคตไปได้อีกไกล และกำลังเข้ามามีบทบาทสำคัญของมนุษย์เราในหลายๆด้าน

โดยเฉพาะ Generative AI หรือ Gen AI กับความฉลาดที่สามารถสร้างคอนเทนต์หรือเนื้อหาใหม่ๆอัตโนมัติได้หลากหลายแบบไม่จำกัดผ่านอุปกรณ์คอมพิวเตอร์และอุปกรณ์พกพาต่างๆสะดวกรวดเร็ว การใช้คำสั่งตัวหนังสือหรือข้อความให้เป็นรูปภาพที่สร้างความฮือฮาสามารถสร้างได้ภายในพริบตาเดียว กลายเป็นเรื่องปกติ ธรรมดาไปแล้ว

เมื่อ OpenAI หนึ่งในผู้บุกเบิกแล็บการวิจัย AI ที่ได้พัฒนาโมเดลและเครื่องมือหลายๆ ตัวที่นิยมใช้กันแพร่หลายในขณะนี้ เช่น GPT เพื่อสร้างข้อความ รวมถึงคอนเทนต์ต่างๆ และ DALL-3 ที่สร้างภาพจากข้อความ กลายเป็นเรื่องธรรมดาไปแล้ว

สัปดาห์ที่ผ่านมา OpenAI เปิดตัวโมเดลตัวล่าสุด Sora AI สามารถสร้างวิดีโอเหมือนจริงคุณภาพสูงด้วยคำสั่งจากข้อความจากจินตนาการของผู้ป้อน เริ่มแรกสามารถสร้างได้กับความยาว 1 นาที ซึ่งสามารถสร้างตัวละครหลายๆตัว มีการ เคลื่อนไหวเฉพาะเจาะจง สามารถรวบรวมรายละเอียดของวัตถุและฉากหลังได้อย่างแม่นยำ ขณะนี้อยู่ระหว่างการทดสอบภายใน แต่เมื่อดูตัวอย่างการสร้างนับว่าน่าประทับใจไม่น้อย

AI ล้ำยุคเร็วกว่าที่คาด เตรียมตัวให้พร้อมรับการเปลี่ยนแปลง

...

AI ล้ำยุคเร็วกว่าที่คาด เตรียมตัวให้พร้อมรับการเปลี่ยนแปลง

สร้างวิดีโอไม่พอ ล้ำไปอีกด้วยความสามารถสร้างเสียงประกอบแบบซาวด์เอฟเฟกต์สมจริงได้อีกจาก ElevenLabs สตาร์ตอัพการโคลนเสียง ช่วยเสริมให้วิดีโอที่ Sora สร้างขึ้นเช่น คลื่นกระแทก, เสียงดังกึกก้อง, เสียงนกร้อง และ เครื่องยนต์รถแข่ง เพื่อสร้างเสียงที่เราซ้อนทับบนคลิปที่เราชื่นชอบ ซึ่งคงต้องรอดูการทำงานเต็มๆต่อไป

ทางด้านกูเกิล (Google) หลังจากเปิดตัว Gemini (เจมิไน) โมเดล AI คู่แข่งสำคัญ GPT ล่าสุดได้ออกมาหยุดให้บริการสร้างภาพบุคคล เนื่องจากพบข้อบกพร่องว่าการสร้างภาพประวัติศาสตร์ยังไม่ถูกต้อง เช่น ภาพบุคคลของผู้ก่อตั้งประเทศสหรัฐอเมริกากลายเป็นรูปชาวอเมริกันอินเดียน, คนผิวดำหรือคนเอเชีย ซึ่งทำให้เกิดการวิพากษ์วิจารณ์ หรือการสร้างภาพทหารเยอรมันในยุคนาซี เป็นภาพสาวหน้าหมวย คนผิวดำ เป็นต้น ต้องรอการปรับปรุงก่อน

AI ล้ำยุคเร็วกว่าที่คาด เตรียมตัวให้พร้อมรับการเปลี่ยนแปลง

ขณะเดียวกันกูเกิลยังได้เปิดตัว Gemma (เจมม่า) เป็นโมเดลใหม่สำหรับนักพัฒนาที่นำไปต่อยอดใช้บนแอปพลิเคชันของตนเอง เป็นโมเดลภาษาขนาดใหญ่สองตัวคือ Gemma 2B และ 7B มีประสิทธิภาพที่ดีที่สุดในระดับเดียวกัน และโมเดล Gemma สามารถทำงานได้โดยตรงบนแล็ปท็อปสำหรับนักพัฒนาหรือคอมพิวเตอร์เดสก์ท็อป โดยเฉพาะอย่างยิ่ง Gemma เหนือกว่าโมเดลที่ใหญ่กว่าอย่างเห็นได้ชัดในการวัดประสิทธิภาพที่สำคัญ

กูเกิลยังได้โชว์ผลการทดสอบ Gemma 7B มีคะแนนเหนือกว่า Llama-2 7B และ 13B ของ Meta ในทุกๆด้าน ปัจจุบันอยู่ระหว่างการพัฒนาอยู่ โดยกูเกิลคาดหวังว่า Gemma จะเป็นเครื่องมือที่มีประโยชน์สำหรับผู้ใช้ทั่วไป นักเรียน นักเขียน นักพัฒนาซอฟต์แวร์ และอื่นๆอีกมากมาย

AI ล้ำยุคเร็วกว่าที่คาด เตรียมตัวให้พร้อมรับการเปลี่ยนแปลง
AI ล้ำยุคเร็วกว่าที่คาด เตรียมตัวให้พร้อมรับการเปลี่ยนแปลง

...

AI ล้ำยุคเร็วกว่าที่คาด เตรียมตัวให้พร้อมรับการเปลี่ยนแปลง

สำหรับความแตกต่างระหว่าง Gemini และ Gemma ซึ่ง Gemini มีขนาดใหญ่กว่า เหมาะสำหรับงานที่ต้องการความซับซ้อนสูง Gemma เป็นโอเพ่นซอร์สเหมาะสำหรับงานทั่วไป จุดดีของโมเดลหลายๆตัวสามารถเปรียบเทียบและเลือกโมเดลที่เหมาะสมกับงาน

ขณะเดียวกันหลังจากกูเกิลปล่อย Gemini Ultra 1.0 โมเดลรุ่นใหญ่สุด ในรูปแบบพรีเมียมมีค่าใช้จ่ายได้ไม่กี่วัน ล่าสุดได้เปิดตัว Gemini 1.5 Pro เป็นโมเดลขนาดกลางที่ถูกปรับให้เหมาะกับการขยายขนาดในหลากหลายงานรองรับอินพุชขนาดใหญ่ถึง 1 ล้านโทเคนมีคุณสมบัติใหม่ๆ เช่นสามารถอัปโหลดไฟล์ PDF ขนาดใหญ่ 7 แสนคำ, คลังโค้ด 3 หมื่นบรรทัด, วิดีโอยาว 1 ชั่วโมง เป็นคำสั่งได้โดยตรงจาก Google AI Studio

เทคโนโลยี AI กำลังพัฒนาอย่างรวดเร็ว มีการค้นพบและพัฒนาโมเดล AI ใหม่ๆอยู่เสมอแทบทุกวัน ซึ่งทำให้ความสามารถพัฒนาไปอย่างก้าวกระโดด สิ่งที่เกิดขึ้นจะส่งผลต่อการเปลี่ยนแปลงการทำงานจะมีบทบาทสำคัญในการใช้ชีวิตประจำวันที่เราต้องเตรียมพร้อมรับการเปลี่ยนแปลงที่จะเกิดขึ้น.

คลิกอ่านคอลัมน์ “บทความไซเบอร์เน็ต” เพิ่มเติม

...