Thairath OnlineThairath PlusThairath SportThairath TVMIRROR

รู้จักโมเดล “SeaLLMs” รองรับ 9 ภาษาอาเซียน รวมอังกฤษ-จีน เข้าใจบริบทท้องถิ่นกว่า GPT

Date Time: 20 มี.ค. 2568 13:03 น.

Summary

  • SeaLLMs (Southeast Asian Large Language Models) โมเดลโอเพ่นซอร์สประสิทธิภาพสูงรองรับ 9 ภาษาอาเซียน ลดข้อจำกัดด้านภาษาให้ผู้ใช้ในภูมิภาคเข้าถึงเทคโนโลยีขั้นสูง แปลภาษา วิเคราะห์ประมวลผลเสียงจากหลายภาษา ควบคู่ไปกับภาษาอังกฤษและจีน ได้อย่างเข้าใจบริบททางวัฒนธรรม สไตล์การสื่อสารท้องถิ่น กรอบกฎหมาย

SeaLLMs (Southeast Asian Large Language Models) โมเดลประมวลภาษาขนาดใหญ่ที่พัฒนาเพื่อรองรับการใช้งานในภูมิภาคเอเชียตะวันออกเฉียงใต้ (SEA) โดยเฉพาะ โมเดลนี้รองรับภาษาในภูมิภาคถึง 9 ภาษา ได้แก่ ภาษาไทย เวียดนาม อินโดนีเซีย มาเลย์ ตากาล็อก พม่า เขมร ลาว ทมิฬ ชวา รวมถึงภาษาอังกฤษและจีน

SeaLLMs ได้รับการพัฒนาโดย Alibaba DAMO Academy ซึ่งเป็นสถาบันวิจัยของบริษัท Alibaba Group จากประเทศจีน โดยร่วมมือจากพันธมิตรในภูมิภาคเอเชียตะวันออกเฉียงใต้ รวมถึงนักวิจัยจากมหาวิทยาลัยเทคโนโลยีหนานหยาง (Nanyang Technological University) ประเทศสิงคโปร์

แม้ว่าโมเดลภาษาขนาดใหญ่ในปัจจุบันจะมีความก้าวหน้าอย่างมากในหลากหลายงาน แต่ยังคงมีอคติทางภาษา เป้าหมายหลักของ SeaLLMs จึงนับเป็นก้าวสำคัญในการส่งเสริมการพัฒนา AI ที่ครอบคลุมและเป็นธรรมแก่ผู้ใช้ในเอเชียตะวันออกเฉียงใต้ให้เข้าถึงและใช้ประโยชน์จากโมเดลขั้นสูงที่ปลอดภัยและน่าเชื่อถือ ลดข้อจำกัดทางภาษาที่เคยเป็นอุปสรรคมาก่อน

โมเดลนี้จะช่วยให้ธุรกิจและชุมชนในภูมิภาคสามารถเข้าถึงเทคโนโลยีที่ทันสมัยและถือเป็นรากฐานสำคัญสำหรับงานวิจัยในอนาคตที่เน้นการพัฒนา AI ที่เคารพและรักษาความหลากหลายทางภาษาและวัฒนธรรม

คุณสมบัติเด่นของ SeaLLMs

  • การรองรับหลายภาษา (Multilingual Support) SeaLLM-base ได้รับการฝึกอบรมด้วยชุดข้อมูลที่หลากหลายและมีคุณภาพสูง ผ่านการตรวจสอบโดยนักภาษาศาสตร์ที่เป็นเจ้าของภาษา ทำให้โมเดลนี้เข้าใจบริบทท้องถิ่นและการสื่อสารแบบเจ้าของภาษาได้อย่างลึกซึ้ง แชตบ็อตที่ใช้โมเดลนี้จึงสามารถเข้าใจและสะท้อนบริบททางวัฒนธรรมของแต่ละภาษาได้อย่างแม่นยำ ไม่ว่าจะเป็นบรรทัดฐานทางสังคม ขนบธรรมเนียม สไตล์การสื่อสาร โดยปัจจุบันมี SeaLLM-chat ซึ่งเป็นโมเดลที่ออกแบบมาเพื่อเป็นผู้ช่วยแชตบอทถาม-ตอบ ที่ปรับให้เข้ากับบริบททางวัฒนธรรมของแต่ละตลาดในภูมิภาค ทั้งในแง่ของขนบธรรมเนียม สไตล์การสื่อสาร และกรอบกฎหมาย
  • โมเดลโอเพ่นซอร์ส ประสิทธิภาพสูง (Open-Source) SeaLLMs มีให้เลือกทั้งเวอร์ชัน 13 พันล้านพารามิเตอร์ และ 7 พันล้านพารามิเตอร์ โดยเปิดโอเพนซอร์สบน Hugging Face พร้อมให้ใช้งานสำหรับการวิจัยและเชิงพาณิชย์ โดยโมเดลรุ่นล่าสุด SeaLLM-7B-v2.5 มีความสามารถโดดเด่นหลายด้าน ความรู้ทั่วไป การคำนวณเชิงตรรกะ และความสามารถในการปฏิบัติตามคำสั่ง นอกจากนี้ยังมีผลลัพธ์ที่ดีกว่า GPT-3.5 ในหลายแบบทดสอบความรู้และการใช้เหตุผลที่เกี่ยวข้องกับภาษาในภูมิภาคเอเชียตะวันออกเฉียงใต้
  • รองรับข้อมูลหลายรูปแบบ (Multimodal Capabilities)
    SeaLLMs ยังได้พัฒนา SeaLLMs-Audio ที่รองรับข้อมูลเสียง (Multimodal) และสามารถจดจำ วิเคราะห์ ประมวลผล เสียงจากหลายภาษาในเอเชียตะวันออกเฉียงใต้ ควบคู่ไปกับภาษาอังกฤษและจีน 

อ้างอิงข้อมูลจาก GitHub IpiSingapore 

ติดตามเพจ Facebook : Thairath Money ได้ที่ลิงก์นี้ -   


เราใช้คุ้กกี้

เพื่อให้ทุกคนได้ประสบการณ์การใช้งานที่ดียิ่งขึ้น

อ่านเพิ่มเติมคลิก(Privacy Policy) และ (Cookie Policy)