Модели серии Qwen2.5 с открытым исходным кодом Alibaba Tongyi Qianwen: Qwen2-VL-72B сопоставим с GPT-4.

Команда Tongyi Qianwen объявила, что через три месяца после выпуска Qwen2 последний член семейства Qwen, серия языковых моделей Qwen2.5, официально имеет открытый исходный код. Это знаменует собой, возможно, один из крупнейших выпусков с открытым исходным кодом в истории, включая общую языковую модель Qwen2.5, а также модели Qwen2.5-Coder и Qwen2.5-Math, специально предназначенные для областей программирования и математики.

Модели серии Qwen2.5 предварительно обучены на новейшем крупномасштабном наборе данных, который содержит до 18T токенов. По сравнению с Qwen2, новая модель значительно улучшилась в плане приобретения знаний, навыков программирования и математических способностей. Модель поддерживает обработку длинного текста, может генерировать контент размером до 8 000 токенов и поддерживает поддержку более чем 29 языков.

Модели серии Qwen2.5 с открытым исходным кодом не только используют лицензию Apache2.0, но также предоставляют множество версий разных размеров для адаптации к различным потребностям приложений. Кроме того, команда Tongyi Qianwen также открыла исходный код модели Qwen2-VL-72B с производительностью, сравнимой с GPT-4.

Новая модель обеспечивает значительные улучшения в выполнении инструкций, генерации длинного текста, понимании структурированных данных и генерации структурированного вывода. Модели Qwen2.5-Coder и Qwen2.5-Math, особенно в области программирования и математики, были обучены на профессиональных наборах данных, продемонстрировав более сильные возможности в профессиональных областях.

Опыт модели серии Qwen2.5:

  • Коллекция Qwen2.5: https://modelscope.cn/studios/qwen/Qwen2.5