Tongyi Qianwen 팀은 Qwen 제품군의 최신 멤버인 Qwen2.5 언어 모델 시리즈인 Qwen2가 출시된 지 3개월 후 공식적으로 오픈 소스라고 발표했습니다. 이는 일반 언어 모델 Qwen2.5는 물론 프로그래밍 및 수학 분야를 특별히 겨냥한 Qwen2.5-Coder 및 Qwen2.5-Math 모델을 포함하여 역사상 가장 큰 오픈 소스 릴리스 중 하나가 될 수 있습니다.
Qwen2.5 시리즈 모델은 최대 18T 토큰을 포함하는 최신 대규모 데이터 세트로 사전 훈련되었습니다. Qwen2에 비해 새 모델은 지식 습득, 프로그래밍 능력 및 수학적 능력이 크게 향상되었습니다. 이 모델은 긴 텍스트 처리를 지원하고 최대 8K 토큰까지 콘텐츠를 생성할 수 있으며 29개 이상의 언어에 대한 지원을 유지합니다.
오픈 소스 Qwen2.5 시리즈 모델은 Apache2.0 라이센스를 채택할 뿐만 아니라 다양한 애플리케이션 요구 사항에 맞게 다양한 크기의 다양한 버전을 제공합니다. 또한 Tongyi Qianwen 팀은 GPT-4에 필적하는 성능을 갖춘 Qwen2-VL-72B 모델도 오픈 소스로 제공했습니다.
새로운 모델은 명령 실행, 긴 텍스트 생성, 구조화된 데이터 이해 및 구조화된 출력 생성 분야에서 상당한 개선을 달성했습니다. 특히 프로그래밍 및 수학 분야에서 Qwen2.5-Coder 및 Qwen2.5-Math 모델은 전문 데이터 세트로 훈련되어 전문 분야에서 더욱 강력한 역량을 입증했습니다.
Qwen2.5 시리즈 모델 경험:
Qwen2.5 컬렉션: https://modelscope.cn/studios/qwen/Qwen2.5