Mistral은 가장 강력한 오픈 소스 다중 모드 모델인 Pixtral Large를 출시합니다. Le Chat을 업그레이드하면 Flux Pro를 직접 호출할 수 있습니다.

프랑스 인공지능 스타트업 Mistral AI는 통합 웹 검색, 이미지 생성, 새로 출시된 Pixtral Large 모델을 포함하여 Le Chat AI 도우미의 일련의 새로운 기능을 발표했습니다.

르챗 기능 업그레이드

이제 사용자는 Le Chat을 통해 실시간 웹 콘텐츠에 직접 액세스하고 필요한 정보를 쉽게 얻을 수 있습니다. 동시에 Black Forest Labs의 Flux Pro 모델을 통해 사용자는 다양한 창의적 요구 사항을 충족하는 고품질 이미지를 생성할 수도 있습니다.

웹 검색 및 이미지 생성 외에도 Le Chat은 생성된 콘텐츠를 사용자가 채팅 창 내에서 직접 편집할 수 있는 캔버스 인터페이스도 도입했습니다. 이 기능을 통해 사용자는 응답을 다시 생성할 필요 없이 문서를 작성하고, 프레젠테이션을 만들고, 코드를 편집할 수 있어 작업 효율성이 크게 향상됩니다.

Pixtral Large 모델 소개

Mistral AI가 출시한 Pixtral Large 모델은 시각적 작업에서 매우 뛰어난 성능을 발휘합니다. 이 모델은 Mistral Large2를 기반으로 구축되었으며 여러 업계 벤치마크에서 탁월한 결과를 얻었습니다.

예를 들어, MathVista 수학적 추론 테스트에서 Pixtral Large는 69.4%를 기록하여 GPT-4o 및 Gemini1.5Pro와 같은 다른 경쟁사를 능가했습니다.

동시에 그래프, 표, 수식 등 다양한 정보를 처리할 수 있는 차트와 복잡한 문서 분석 능력도 인정받았다.

Pixtral Large 모델은 1,230억 매개변수 다중 모드 디코더와 10억 매개변수 시각적 인코더를 결합하고 최대 30K의 컨텍스트 창으로 최대 128개의 고해상도 이미지를 동시에 처리할 수 있습니다.

이로 인해 문서 분석 및 복잡한 이미지 처리에 탁월합니다. Mistral AI는 Pixtral Large가 다양한 사용자의 연구 및 적용을 용이하게 하기 위해 Hugging Face 플랫폼에 학술 및 상업용 라이선스를 모두 제공할 것이라고 밝혔습니다.

또한 Mistral AI는 긴 컨텍스트 이해 및 함수 호출의 정확성을 향상시키기 위해 Mistral Large 언어 모델을 업데이트했습니다.

업데이트된 모델은 Mistral의 API를 통해 제공될 예정이며 곧 Google Cloud 및 Microsoft Azure에서도 제공될 예정입니다.

Pixtral 대형 종이 입구: https://arxiv.org/abs/2410.07073

모델 페이지: https://huggingface.co/mistralai/Pixtral-Large-Instruct-2411

르챗 입구: https://auth.mistral.ai/ui/login?flow=b3e9d399-afc8-497b-8f8d-99900b447c08

API 입구: https://docs.mistral.ai/api/