Mistral は、最も強力なオープンソース マルチモーダル モデル Pixtral Large を発表、Le Chat をアップグレードすると、Flux Pro を直接呼び出すことができます。

フランスの人工知能スタートアップ Mistral AI は、統合 Web 検索、画像生成、新しく発売された Pixtral Large モデルなど、Le Chat AI アシスタントの一連の新機能を発表しました。

Le Chat機能アップグレード

ユーザーは Le Chat を通じてリアルタイム Web コンテンツに直接アクセスし、必要な情報を簡単に取得できるようになりました。同時に、Black Forest Labs の Flux Pro モデルの助けを借りて、ユーザーはさまざまなクリエイティブなニーズを満たす高品質の画像を生成することもできます。

Web 検索と画像生成に加えて、Le Chat にはキャンバス インターフェイスも導入されており、ユーザーは生成されたコンテンツをチャット ウィンドウ内で直接編集できます。この機能により、ユーザーは応答を再生成することなくドキュメントの作成、プレゼンテーションの作成、コードの編集ができるようになり、作業効率が大幅に向上します。

Pixtral Largeモデルの紹介

Mistral AI によって発売された Pixtral Large モデルは、視覚的なタスクで非常に優れたパフォーマンスを発揮します。このモデルは Mistral Large2 に基づいて構築されており、複数の業界ベンチマークで優れた結果を達成しています。

たとえば、MathVista の数学的推論テストでは、Pixtral Large は 69.4% のスコアを獲得し、GPT-4o や Gemini1.5Pro などの他の競合製品を上回りました。

同時に、このモデルは、グラフ、表、数式などのさまざまな情報を処理できる、チャートや複雑な文書を分析する能力も評価されています。

Pixtral Large モデルは、1,230 億パラメータのマルチモーダル デコーダと 10 億パラメータのビジュアル エンコーダを組み合わせており、最大 30K のコンテキスト ウィンドウで最大 128 枚の高解像度画像を同時に処理できます。

そのため、文書分析や複雑な画像処理に優れています。 Mistral AIは、Pixtral Largeは、さまざまなユーザーによる研究とアプリケーションを促進するために、Hugging Faceプラットフォームで学術ライセンスと商用ライセンスの両方を提供すると述べた。

さらに、Mistral AI は、長いコンテキストの理解と関数呼び出しの精度を向上させるために、Mistral Large 言語モデルを更新しました。

更新されたモデルは、Mistral の API を通じて利用可能になり、間もなく Google Cloud と Microsoft Azure でも利用できるようになる予定です。

Pixtral大型紙入口:https://arxiv.org/abs/2410.07073

モデルページ:https://huggingface.co/mistralai/Pixtral-Large-Instruct-2411

Le Chat 入り口: https://auth.mistral.ai/ui/login?flow=b3e9d399-afc8-497b-8f8d-99900b447c08

API入口:https://docs.mistral.ai/api/