SeaLLMs (Southeast Asian Large Language Models) โมเดลประมวลภาษาขนาดใหญ่ที่พัฒนาเพื่อรองรับการใช้งานในภูมิภาคเอเชียตะวันออกเฉียงใต้ (SEA) โดยเฉพาะ โมเดลนี้รองรับภาษาในภูมิภาคถึง 9 ภาษา ได้แก่ ภาษาไทย เวียดนาม อินโดนีเซีย มาเลย์ ตากาล็อก พม่า เขมร ลาว ทมิฬ ชวา รวมถึงภาษาอังกฤษและจีน
SeaLLMs ได้รับการพัฒนาโดย Alibaba DAMO Academy ซึ่งเป็นสถาบันวิจัยของบริษัท Alibaba Group จากประเทศจีน โดยร่วมมือจากพันธมิตรในภูมิภาคเอเชียตะวันออกเฉียงใต้ รวมถึงนักวิจัยจากมหาวิทยาลัยเทคโนโลยีหนานหยาง (Nanyang Technological University) ประเทศสิงคโปร์
แม้ว่าโมเดลภาษาขนาดใหญ่ในปัจจุบันจะมีความก้าวหน้าอย่างมากในหลากหลายงาน แต่ยังคงมีอคติทางภาษา เป้าหมายหลักของ SeaLLMs จึงนับเป็นก้าวสำคัญในการส่งเสริมการพัฒนา AI ที่ครอบคลุมและเป็นธรรมแก่ผู้ใช้ในเอเชียตะวันออกเฉียงใต้ให้เข้าถึงและใช้ประโยชน์จากโมเดลขั้นสูงที่ปลอดภัยและน่าเชื่อถือ ลดข้อจำกัดทางภาษาที่เคยเป็นอุปสรรคมาก่อน
โมเดลนี้จะช่วยให้ธุรกิจและชุมชนในภูมิภาคสามารถเข้าถึงเทคโนโลยีที่ทันสมัยและถือเป็นรากฐานสำคัญสำหรับงานวิจัยในอนาคตที่เน้นการพัฒนา AI ที่เคารพและรักษาความหลากหลายทางภาษาและวัฒนธรรม
คุณสมบัติเด่นของ SeaLLMs
- การรองรับหลายภาษา (Multilingual Support) SeaLLM-base ได้รับการฝึกอบรมด้วยชุดข้อมูลที่หลากหลายและมีคุณภาพสูง ผ่านการตรวจสอบโดยนักภาษาศาสตร์ที่เป็นเจ้าของภาษา ทำให้โมเดลนี้เข้าใจบริบทท้องถิ่นและการสื่อสารแบบเจ้าของภาษาได้อย่างลึกซึ้ง แชตบ็อตที่ใช้โมเดลนี้จึงสามารถเข้าใจและสะท้อนบริบททางวัฒนธรรมของแต่ละภาษาได้อย่างแม่นยำ ไม่ว่าจะเป็นบรรทัดฐานทางสังคม ขนบธรรมเนียม สไตล์การสื่อสาร โดยปัจจุบันมี SeaLLM-chat ซึ่งเป็นโมเดลที่ออกแบบมาเพื่อเป็นผู้ช่วยแชตบอทถาม-ตอบ ที่ปรับให้เข้ากับบริบททางวัฒนธรรมของแต่ละตลาดในภูมิภาค ทั้งในแง่ของขนบธรรมเนียม สไตล์การสื่อสาร และกรอบกฎหมาย
- โมเดลโอเพ่นซอร์ส ประสิทธิภาพสูง (Open-Source) SeaLLMs มีให้เลือกทั้งเวอร์ชัน 13 พันล้านพารามิเตอร์ และ 7 พันล้านพารามิเตอร์ โดยเปิดโอเพนซอร์สบน Hugging Face พร้อมให้ใช้งานสำหรับการวิจัยและเชิงพาณิชย์ โดยโมเดลรุ่นล่าสุด SeaLLM-7B-v2.5 มีความสามารถโดดเด่นหลายด้าน ความรู้ทั่วไป การคำนวณเชิงตรรกะ และความสามารถในการปฏิบัติตามคำสั่ง นอกจากนี้ยังมีผลลัพธ์ที่ดีกว่า GPT-3.5 ในหลายแบบทดสอบความรู้และการใช้เหตุผลที่เกี่ยวข้องกับภาษาในภูมิภาคเอเชียตะวันออกเฉียงใต้
- รองรับข้อมูลหลายรูปแบบ (Multimodal Capabilities)
SeaLLMs ยังได้พัฒนา SeaLLMs-Audio ที่รองรับข้อมูลเสียง (Multimodal) และสามารถจดจำ วิเคราะห์ ประมวลผล เสียงจากหลายภาษาในเอเชียตะวันออกเฉียงใต้ ควบคู่ไปกับภาษาอังกฤษและจีน
ติดตามเพจ Facebook : Thairath Money ได้ที่ลิงก์นี้ -