Недавно компания SnorkelAI запустила ряд новых функций на своей платформе разработки данных искусственного интеллекта Snorkel Flow, призванных помочь предприятиям ускорить специализацию моделей искусственного интеллекта и машинного обучения. Эти новые возможности могут значительно сократить время, стоимость и сложность подготовки данных в жизненном цикле разработки прогнозного и генеративного ИИ.
Примечание к источнику изображения: изображение генерируется искусственным интеллектом и разрешено поставщиком услуг Midjourney.
На современных предприятиях наличие «данных, готовых к использованию ИИ» (данных, подходящих для ИИ) имеет решающее значение. По мнению Gartner, данные, готовые к использованию ИИ, не только означают, что ваши данные должны представлять конкретный вариант использования, они также должны охватывать каждую закономерность, ошибку, аномалию и непредвиденную ситуацию, чтобы эффективно обучать или запускать модель ИИ. Более того, подготовка данных не происходит в одночасье, а должна осуществляться постоянно.
Новая версия Snorkel Flow предоставляет предприятиям мощную платформу для внедрения и масштабирования методов разработки данных искусственного интеллекта для ускорения производства высокоточных специализированных моделей искусственного интеллекта.
В частности, новые функции включают инструменты оценки LLM, которые позволяют пользователям проводить индивидуальные оценки для конкретных сценариев использования в отрасли, получать представление о типах ошибок модели и быстро вмешиваться в разработку данных для их исправления. Кроме того, существует рабочий процесс настройки RAG, который повышает точность поиска за счет расширенной обработки блоков документов, точной настройки моделей внедрения и извлечения метаданных документа. Эти функции могут значительно сократить время разработки, необходимое для повышения качества ответов ИИ-помощника.
Благодаря новой функции распознавания именованных объектов (NER) для PDF-файлов пользователи могут легче и быстрее извлекать информацию, просто щелкая текст, рисуя ограничивающие рамки, указывая шаблоны и запрашивая базовую модель. Такая гибкость упрощает сбор информации, тем самым повышая точность модели NER.
Кроме того, Snorkel Flow упрощает процесс аннотирования и обратной связи, позволяя экспертам более эффективно аннотировать данные. Кроме того, недавно добавленный инструмент анализа маркеров последовательности может помочь пользователям более интуитивно обнаруживать ошибки в прогнозах модели, обеспечивая при этом более подробный анализ производительности.
Что касается пользовательского опыта, Snorkel Flow провел ряд оптимизаций, чтобы сделать сотрудничество между учеными и экспертами более плавным. Он поддерживает бесшовную интеграцию с основными платформами разработки искусственного интеллекта, включая Databricks и Amazon SageMaker, для более быстрой настройки и развертывания специализированных моделей.
Алекс Ратнер, генеральный директор Snorkel AI, сказал: «ИИ стал приоритетом для каждого бизнес-лидера, но постоянная и последовательная разработка ИИ по-прежнему является очень утомительной, дорогостоящей и трудоемкой задачей, поэтому обновления этих платформ важны для помощи предприятиям в ускорении процесса. и оптимизация предоставления решений искусственного интеллекта имеет решающее значение».
Основные моменты:
Новые функции: Snorkel Flow запускает инструмент оценки LLM и рабочий процесс настройки RAG для повышения эффективности подготовки данных.
Удобное извлечение. Новое распознавание именованных объектов упрощает и ускоряет извлечение информации из PDF-файлов.
Оптимизированный опыт: улучшен пользовательский интерфейс, способствующий эффективному сотрудничеству между учеными, работающими с данными, и экспертами.