La société mondiale d'étiquetage de données SnorkelAI lance des capacités avancées d'IA pour les centres de données

Récemment, SnorkelAI a lancé une série de nouvelles fonctionnalités sur sa plateforme de développement de données d'IA Snorkel Flow, visant à aider les entreprises à accélérer la spécialisation des modèles d'IA et d'apprentissage automatique. Ces nouvelles fonctionnalités peuvent réduire considérablement le temps, le coût et la complexité de la préparation des données dans le cycle de vie du développement de l’IA prédictive et générative.

Remarque sur la source de l'image : l'image est générée par l'IA et l'image est autorisée par le fournisseur de services Midjourney

Dans les entreprises d’aujourd’hui, il est crucial de disposer de « données prêtes pour l’IA » (données adaptées à l’IA). Selon Gartner, les données prêtes pour l'IA ne signifient pas seulement que vos données doivent représenter un cas d'utilisation spécifique, elles doivent également couvrir chaque modèle, erreur, anomalie et situation inattendue afin de former ou d'exécuter efficacement un modèle d'IA. De plus, la préparation des données ne se fait pas du jour au lendemain, mais doit être effectuée en continu.

La nouvelle version de Snorkel Flow offre aux entreprises une plate-forme puissante pour mettre en œuvre et faire évoluer les pratiques de développement de données d'IA afin d'accélérer la mise en production de modèles d'IA spécialisés et hautement précis.

Plus précisément, les nouvelles fonctionnalités incluent des outils d'évaluation LLM, qui permettent aux utilisateurs d'effectuer des évaluations personnalisées pour des cas d'utilisation spécifiques du secteur, d'obtenir des informations sur les types d'erreurs de modèle et d'intervenir rapidement dans le développement des données pour les corriger. De plus, il existe un flux de travail de réglage RAG qui améliore la précision de la récupération grâce au traitement avancé des blocs de documents, au réglage fin des modèles d'intégration et à l'extraction des métadonnées des documents. Ces fonctionnalités peuvent réduire considérablement le temps de développement nécessaire pour améliorer la qualité des réponses de l’assistant IA.

Grâce à la nouvelle fonction NER (Named Entity Recognition) pour les fichiers PDF, les utilisateurs peuvent extraire des informations plus facilement et plus rapidement en cliquant simplement sur le texte, en dessinant des cadres de délimitation, en spécifiant des motifs et en invitant le modèle sous-jacent. Cette flexibilité facilite la capture des informations, améliorant ainsi la précision du modèle NER.

De plus, Snorkel Flow simplifie le processus d'annotation et de retour d'information, permettant aux experts d'annoter les données de manière plus efficace. De plus, le nouvel outil d'analyse des marqueurs de séquence peut aider les utilisateurs à découvrir de manière plus intuitive les erreurs dans les prédictions du modèle tout en fournissant une analyse des performances plus détaillée.

En termes d'expérience utilisateur, Snorkel Flow a procédé à une série d'optimisations pour rendre la collaboration entre data scientists et experts plus fluide. Il prend en charge une intégration transparente avec les principales plates-formes de développement d'IA, notamment Databricks et Amazon SageMaker, pour un réglage précis et un déploiement plus rapides de modèles spécialisés.

Alex Ratner, PDG de Snorkel AI, a déclaré : « L'IA est devenue une priorité pour chaque chef d'entreprise, mais le développement continu et cohérent de l'IA reste très fastidieux, coûteux et demande beaucoup de main-d'œuvre. Par conséquent, les mises à jour de ces plates-formes sont importantes pour aider les entreprises à accélérer. et l’optimisation de la fourniture de solutions d’IA est essentielle.

Souligner:

Nouvelles fonctionnalités : Snorkel Flow lance l'outil d'évaluation LLM et le flux de travail de réglage RAG pour améliorer l'efficacité de la préparation des données.

Extraction pratique : la nouvelle reconnaissance d'entités nommées facilite et accélère l'extraction d'informations à partir de fichiers PDF.

? Expérience optimisée : L'expérience utilisateur est améliorée pour favoriser une collaboration efficace entre les data scientists et les experts.