Das französische Startup für künstliche Intelligenz Mistral AI hat eine Reihe neuer Funktionen für seinen Le Chat AI-Assistenten angekündigt, darunter integrierte Websuche, Bildgenerierung und das neu eingeführte Modell Pixtral Large.
Upgrade der Le Chat-Funktion
Benutzer können jetzt über Le Chat direkt auf Webinhalte in Echtzeit zugreifen und problemlos die Informationen erhalten, die sie benötigen. Gleichzeitig können Benutzer mit Hilfe des Flux Pro-Modells von Black Forest Labs auch hochwertige Bilder generieren, um eine Vielzahl kreativer Anforderungen zu erfüllen.
Zusätzlich zur Websuche und Bildgenerierung führt Le Chat auch eine Canvas-Oberfläche ein, die es Benutzern ermöglicht, generierte Inhalte direkt im Chat-Fenster zu bearbeiten. Mit dieser Funktion können Benutzer Dokumente schreiben, Präsentationen erstellen und Code bearbeiten, ohne Antworten neu generieren zu müssen, was die Arbeitseffizienz erheblich verbessert.
Wir stellen vor: Pixtral Large-Modell
Das von Mistral AI eingeführte Pixtral Large-Modell schneidet bei visuellen Aufgaben sehr gut ab. Dieses Modell basiert auf Mistral Large2 und hat in mehreren Branchen-Benchmarks hervorragende Ergebnisse erzielt.
Beispielsweise erzielte Pixtral Large im MathVista-Test zum mathematischen Denken eine Punktzahl von 69,4 % und übertraf damit andere Konkurrenten wie GPT-4o und Gemini1.5Pro.
Gleichzeitig wurde das Modell auch für seine Fähigkeit zur Analyse von Diagrammen und komplexen Dokumenten gewürdigt und ist in der Lage, eine Vielzahl von Informationen, einschließlich Grafiken, Tabellen und Formeln, zu verarbeiten.
Das Pixtral Large-Modell kombiniert einen multimodalen Decoder mit 123 Milliarden Parametern mit einem visuellen Encoder mit 1 Milliarde Parametern und kann bis zu 128 hochauflösende Bilder gleichzeitig verarbeiten, mit einem maximalen Kontextfenster von 30 KB.
Dadurch eignet es sich hervorragend für die Dokumentenanalyse und die komplexe Bildverarbeitung. Mistral AI gab an, dass Pixtral Large auch sowohl akademische als auch kommerzielle Lizenzen für die Hugging Face-Plattform bereitstellen wird, um die Forschung und Anwendung durch verschiedene Benutzer zu erleichtern.
Darüber hinaus hat Mistral AI sein Sprachmodell Mistral Large aktualisiert, um die Genauigkeit des Verständnisses langer Kontexte und von Funktionsaufrufen zu verbessern.
Das aktualisierte Modell wird über die API von Mistral verfügbar sein und bald auf Google Cloud und Microsoft Azure verfügbar sein.
Pixtral Großer Papiereingang: https://arxiv.org/abs/2410.07073
Modellseite: https://huggingface.co/mistralai/Pixtral-Large-Instruct-2411
Le Chat-Eingang: https://auth.mistral.ai/ui/login?flow=b3e9d399-afc8-497b-8f8d-99900b447c08
API-Eingang: https://docs.mistral.ai/api/