世界的なデータラベル会社 SnorkelAI が高度なデータセンター AI 機能を開始

最近、SnorkelAI は、企業による AI および機械学習モデルの専門化の加速を支援することを目的として、AI データ開発プラットフォーム Snorkel Flow に一連の新機能をリリースしました。これらの新機能により、予測および生成 AI 開発ライフサイクルにおけるデータ準備の時間、コスト、複雑さを大幅に削減できます。

画像出典注:画像はAIによって生成され、画像はサービスプロバイダーMidjourneyによって許可されています

今日の企業においては、「AI対応データ」(AIに適したデータ)を保有することが重要です。 Gartner によると、AI 対応データとは、データが特定のユースケースを表す必要があるというだけでなく、AI モデルを効果的にトレーニングまたは実行するために、あらゆるパターン、エラー、異常、予期せぬ状況もカバーする必要があるとのことです。さらに、データの準備は一夜にして完了するものではなく、継続的に行う必要があります。

Snorkel Flow の新バージョンは、AI データ開発プラクティスを実装および拡張するための強力なプラットフォームを企業に提供し、高精度で特殊な AI モデルの運用配信を加速します。

具体的には、新機能には LLM 評価ツールが含まれます。これにより、ユーザーは特定の業界のユースケースに合わせてカスタマイズされた評価を実施し、モデルのエラー タイプについての洞察を得て、それらを修正するためにデータ開発に迅速に介入できます。さらに、高度なドキュメント ブロック処理、埋め込みモデルの微調整、ドキュメント メタデータ抽出を通じて検索精度を向上させる RAG チューニング ワークフローがあります。これらの機能により、AI アシスタントの応答品質を向上させるために必要な開発時間を大幅に短縮できます。

PDF ファイル用の新しい固有表現認識 (NER) 機能を使用すると、ユーザーはテキストをクリックし、境界ボックスを描画し、パターンを指定し、基礎となるモデルをプロンプトするだけで、より簡単かつ迅速に情報を抽出できます。この柔軟性により情報の取得が容易になり、NER モデルの精度が向上します。

さらに、シュノーケル フローは注釈とフィードバックのプロセスを簡素化し、専門家がより効率的な方法でデータに注釈を付けることができるようにします。さらに、新しく追加されたシーケンス マーカー分析ツールは、より詳細なパフォーマンス分析を提供しながら、ユーザーがモデル予測のエラーをより直観的に発見するのに役立ちます。

ユーザー エクスペリエンスの観点から、Snorkel Flow はデータ サイエンティストと専門家のコラボレーションをよりスムーズにするために一連の最適化を行いました。 Databricks や Amazon SageMaker などの主要な AI 開発プラットフォームとのシームレスな統合をサポートしており、特殊なモデルの微調整とデプロイメントを迅速に行うことができます。

Snorkel AI の CEO、Alex Ratner 氏は次のように述べています。「AI はすべてのビジネス リーダーにとって優先事項となっていますが、継続的かつ一貫した AI 開発は依然として非常に面倒で、コストがかかり、労働集約的です。したがって、企業の成長を加速するためには、これらのプラットフォームのアップデートが重要です。」 AI ソリューションの提供を最適化することが重要です。」

ハイライト:

新機能: Snorkel Flow は、LLM 評価ツールと RAG チューニング ワークフローを起動して、データ準備の効率を向上させます。

便利な抽出: 新しい固有表現認識により、PDF からの情報の抽出がより簡単かつ迅速になります。

? 最適化されたエクスペリエンス: データ サイエンティストと専門家間の効率的なコラボレーションを促進するために、ユーザー エクスペリエンスが向上しました。