La startup française d'intelligence artificielle Mistral AI a annoncé une série de nouvelles fonctionnalités pour son assistant Le Chat AI, notamment la recherche Web intégrée, la génération d'images et le nouveau modèle Pixtral Large.
Mise à jour de la fonction Le Chat
Les utilisateurs peuvent désormais accéder directement aux contenus Web en temps réel via Le Chat et obtenir facilement les informations dont ils ont besoin. Dans le même temps, avec l'aide du modèle Flux Pro de Black Forest Labs, les utilisateurs peuvent également générer des images de haute qualité pour répondre à une variété de besoins créatifs.
En plus de la recherche sur le Web et de la génération d'images, Le Chat introduit également une interface canevas qui permet aux utilisateurs de modifier le contenu généré directement dans la fenêtre de discussion. Cette fonctionnalité permet aux utilisateurs d'écrire des documents, de créer des présentations et de modifier du code sans avoir à régénérer les réponses, améliorant ainsi considérablement l'efficacité du travail.
Présentation du grand modèle Pixtral
Le modèle Pixtral Large lancé par Mistral AI se comporte très bien dans les tâches visuelles. Ce modèle est construit sur Mistral Large2 et a obtenu d'excellents résultats dans plusieurs benchmarks industriels.
Par exemple, dans le test de raisonnement mathématique MathVista, Pixtral Large a obtenu un score de 69,4 %, surpassant d'autres concurrents tels que GPT-4o et Gemini1.5Pro.
Dans le même temps, le modèle a également été reconnu pour sa capacité à analyser des graphiques et des documents complexes, capable de traiter une variété d'informations, notamment des graphiques, des tableaux et des formules.
Le modèle Pixtral Large combine un décodeur multimodal de 123 milliards de paramètres avec un encodeur visuel de 1 milliard de paramètres et peut traiter jusqu'à 128 images haute résolution simultanément, avec une fenêtre contextuelle maximale de 30K.
Cela le rend excellent pour l’analyse de documents et le traitement d’images complexes. Mistral AI a déclaré que Pixtral Large fournirait également des licences académiques et commerciales sur la plateforme Hugging Face afin de faciliter la recherche et l'application par différents utilisateurs.
De plus, Mistral AI a mis à jour son modèle de langage Mistral Large pour améliorer la précision de la compréhension du contexte long et des appels de fonction.
Le modèle mis à jour sera disponible via l'API de Mistral et sera bientôt disponible sur Google Cloud et Microsoft Azure.
Entrée papier Pixtral Large : https://arxiv.org/abs/2410.07073
Page modèle : https://huggingface.co/mistralai/Pixtral-Large-Instruct-2411
Entrée Le Chat : https://auth.mistral.ai/ui/login?flow=b3e9d399-afc8-497b-8f8d-99900b447c08
Entrée API : https://docs.mistral.ai/api/