ทีมงาน Tongyi Qianwen ประกาศว่าสามเดือนหลังจากการเปิดตัว Qwen2 ซึ่งเป็นสมาชิกล่าสุดของตระกูล Qwen ซึ่งเป็นโมเดลภาษาซีรีส์ Qwen2.5 ก็ได้เป็นโอเพ่นซอร์สอย่างเป็นทางการแล้ว นี่ถือเป็นการเปิดตัวโอเพ่นซอร์สครั้งใหญ่ที่สุดครั้งหนึ่งในประวัติศาสตร์ ซึ่งรวมถึงโมเดลภาษาทั่วไป Qwen2.5 รวมถึงโมเดล Qwen2.5-Coder และ Qwen2.5-Math ที่มุ่งเป้าไปที่สาขาการเขียนโปรแกรมและคณิตศาสตร์โดยเฉพาะ
โมเดลซีรีส์ Qwen2.5 ได้รับการฝึกอบรมล่วงหน้าเกี่ยวกับชุดข้อมูลขนาดใหญ่ล่าสุด ซึ่งมีโทเค็นมากถึง 18T เมื่อเปรียบเทียบกับ Qwen2 โมเดลใหม่ได้รับการปรับปรุงอย่างมากในด้านการเรียนรู้ ความสามารถในการเขียนโปรแกรม และความสามารถทางคณิตศาสตร์ โมเดลนี้รองรับการประมวลผลข้อความแบบยาว สามารถสร้างเนื้อหาได้สูงสุดโทเค็น 8K และรองรับภาษามากกว่า 29 ภาษา
รุ่นโอเพ่นซอร์สซีรีส์ Qwen2.5 ไม่เพียงแต่ใช้สิทธิ์การใช้งาน Apache2.0 เท่านั้น แต่ยังมีเวอร์ชันหลากหลายขนาดที่แตกต่างกันเพื่อปรับให้เข้ากับความต้องการของแอปพลิเคชันที่แตกต่างกัน นอกจากนี้ ทีมงาน Tongyi Qianwen ยังเปิดแหล่งที่มาของรุ่น Qwen2-VL-72B ซึ่งมีประสิทธิภาพเทียบเท่ากับ GPT-4
โมเดลใหม่ได้รับการปรับปรุงที่สำคัญในการดำเนินการตามคำสั่ง การสร้างข้อความแบบยาว การทำความเข้าใจข้อมูลที่มีโครงสร้าง และการสร้างเอาต์พุตที่มีโครงสร้าง โดยเฉพาะอย่างยิ่งในด้านการเขียนโปรแกรมและคณิตศาสตร์ โมเดล Qwen2.5-Coder และ Qwen2.5-Math ได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลระดับมืออาชีพ ซึ่งแสดงให้เห็นถึงความสามารถที่แข็งแกร่งยิ่งขึ้นในสาขาวิชาชีพ
ประสบการณ์โมเดลซีรีส์ Qwen2.5:
คอลเลกชัน Qwen2.5: https://modelscope.cn/studios/qwen/Qwen2.5