Recentemente, a SnorkelAI lançou uma série de novos recursos em sua plataforma de desenvolvimento de dados de IA, Snorkel Flow, com o objetivo de ajudar as empresas a acelerar a especialização de modelos de IA e de aprendizado de máquina. Estas novas capacidades podem reduzir significativamente o tempo, o custo e a complexidade da preparação de dados no ciclo de vida de desenvolvimento de IA preditiva e generativa.
Nota sobre a fonte da imagem: a imagem é gerada por IA e autorizada pelo provedor de serviços Midjourney
Nas empresas de hoje, ter “dados prontos para IA” (dados adequados para IA) é crucial. De acordo com o Gartner, os dados prontos para IA não significam apenas que seus dados precisam representar um caso de uso específico, eles também devem cobrir todos os padrões, erros, anomalias e situações inesperadas para treinar ou executar efetivamente um modelo de IA. Além disso, a preparação dos dados não acontece da noite para o dia, mas precisa ser feita continuamente.
A nova versão do Snorkel Flow fornece às empresas uma plataforma poderosa para implementar e dimensionar práticas de desenvolvimento de dados de IA para acelerar a entrega de produção de modelos de IA especializados e altamente precisos.
Especificamente, os novos recursos incluem ferramentas de avaliação LLM, que permitem aos usuários realizar avaliações personalizadas para casos de uso específicos do setor, obter insights sobre os tipos de erros do modelo e intervir rapidamente no desenvolvimento de dados para corrigi-los. Além disso, há um fluxo de trabalho de ajuste RAG que melhora a precisão da recuperação por meio de processamento avançado de blocos de documentos, ajuste fino de modelos de incorporação e extração de metadados de documentos. Esses recursos podem reduzir significativamente o tempo de desenvolvimento necessário para melhorar a qualidade das respostas do assistente de IA.
Com a nova função Named Entity Recognition (NER) para arquivos PDF, os usuários podem extrair informações com mais facilidade e rapidez simplesmente clicando no texto, desenhando caixas delimitadoras, especificando padrões e solicitando o modelo subjacente. Esta flexibilidade facilita a captura de informações, melhorando assim a precisão do modelo NER.
Além disso, o Snorkel Flow simplifica o processo de anotação e feedback, permitindo que os especialistas anotem os dados de maneira mais eficiente. Além disso, a ferramenta de análise de marcador de sequência recém-adicionada pode ajudar os usuários a descobrir erros nas previsões do modelo de forma mais intuitiva, ao mesmo tempo que fornece uma análise de desempenho mais detalhada.
Em termos de experiência do usuário, o Snorkel Flow fez uma série de otimizações para tornar a colaboração entre cientistas de dados e especialistas mais fácil. Ele oferece suporte à integração perfeita com as principais plataformas de desenvolvimento de IA, incluindo Databricks e Amazon SageMaker, para ajuste fino e implantação mais rápidos de modelos especializados.
Alex Ratner, CEO da Snorkel AI, disse: “A IA se tornou uma prioridade para todos os líderes empresariais, mas o desenvolvimento contínuo e consistente da IA ainda é muito tedioso, caro e trabalhoso. Portanto, as atualizações dessas plataformas são importantes para ajudar as empresas a acelerar. e otimizar a entrega de soluções de IA é fundamental.”
Destaque:
Novos recursos: Snorkel Flow lança ferramenta de avaliação LLM e fluxo de trabalho de ajuste RAG para melhorar a eficiência da preparação de dados.
Extração conveniente: o novo reconhecimento de entidade nomeada torna a extração de informações de PDFs mais fácil e rápida.
? Experiência otimizada: A experiência do usuário é aprimorada para promover a colaboração eficiente entre cientistas de dados e especialistas.