Глобальная компания по маркировке данных SnorkelAI запускает расширенные возможности искусственного интеллекта для центров обработки данных

Недавно компания SnorkelAI запустила ряд новых функций на своей платформе разработки данных искусственного интеллекта Snorkel Flow, призванных помочь предприятиям ускорить специализацию моделей искусственного интеллекта и машинного обучения. Эти новые возможности могут значительно сократить время, стоимость и сложность подготовки данных в жизненном цикле разработки прогнозного и генеративного ИИ.

Примечание к источнику изображения: изображение генерируется искусственным интеллектом и разрешено поставщиком услуг Midjourney.

На современных предприятиях наличие «данных, готовых к использованию ИИ» (данных, подходящих для ИИ) имеет решающее значение. По мнению Gartner, данные, готовые к использованию ИИ, не только означают, что ваши данные должны представлять конкретный вариант использования, они также должны охватывать каждую закономерность, ошибку, аномалию и непредвиденную ситуацию, чтобы эффективно обучать или запускать модель ИИ. Более того, подготовка данных не происходит в одночасье, а должна осуществляться постоянно.

Новая версия Snorkel Flow предоставляет предприятиям мощную платформу для внедрения и масштабирования методов разработки данных искусственного интеллекта для ускорения производства высокоточных специализированных моделей искусственного интеллекта.

В частности, новые функции включают инструменты оценки LLM, которые позволяют пользователям проводить индивидуальные оценки для конкретных сценариев использования в отрасли, получать представление о типах ошибок модели и быстро вмешиваться в разработку данных для их исправления. Кроме того, существует рабочий процесс настройки RAG, который повышает точность поиска за счет расширенной обработки блоков документов, точной настройки моделей внедрения и извлечения метаданных документа. Эти функции могут значительно сократить время разработки, необходимое для повышения качества ответов ИИ-помощника.

Благодаря новой функции распознавания именованных объектов (NER) для PDF-файлов пользователи могут легче и быстрее извлекать информацию, просто щелкая текст, рисуя ограничивающие рамки, указывая шаблоны и запрашивая базовую модель. Такая гибкость упрощает сбор информации, тем самым повышая точность модели NER.

Кроме того, Snorkel Flow упрощает процесс аннотирования и обратной связи, позволяя экспертам более эффективно аннотировать данные. Кроме того, недавно добавленный инструмент анализа маркеров последовательности может помочь пользователям более интуитивно обнаруживать ошибки в прогнозах модели, обеспечивая при этом более подробный анализ производительности.

Что касается пользовательского опыта, Snorkel Flow провел ряд оптимизаций, чтобы сделать сотрудничество между учеными и экспертами более плавным. Он поддерживает бесшовную интеграцию с основными платформами разработки искусственного интеллекта, включая Databricks и Amazon SageMaker, для более быстрой настройки и развертывания специализированных моделей.

Алекс Ратнер, генеральный директор Snorkel AI, сказал: «ИИ стал приоритетом для каждого бизнес-лидера, но постоянная и последовательная разработка ИИ по-прежнему является очень утомительной, дорогостоящей и трудоемкой задачей, поэтому обновления этих платформ важны для помощи предприятиям в ускорении процесса. и оптимизация предоставления решений искусственного интеллекта имеет решающее значение».

Основные моменты:

Новые функции: Snorkel Flow запускает инструмент оценки LLM и рабочий процесс настройки RAG для повышения эффективности подготовки данных.

Удобное извлечение. Новое распознавание именованных объектов упрощает и ускоряет извлечение информации из PDF-файлов.

Оптимизированный опыт: улучшен пользовательский интерфейс, способствующий эффективному сотрудничеству между учеными, работающими с данными, и экспертами.