Doubao Big Model, uma subsidiária da Bytedance, divulgou hoje seu relatório anual de progresso tecnológico de 2024, revelando que sua versão mais recente, Doubao-pro-1215, alcançou alinhamento total com GPT-4 em termos de desempenho geral e mostrou capacidades mais fortes em algumas áreas profissionais. Este progresso marca que a tecnologia de grandes modelos da China entrou oficialmente no primeiro escalão do mundo.
Desde a sua estreia em maio deste ano, o modelo de saco de feijão grande alcançou uma melhoria de capacidade de 32% em apenas 7 meses. De acordo com a introdução oficial, Doubao fez progressos significativos na compreensão da precisão e da qualidade da geração, otimizando o processamento massivo de dados e inovando a arquitetura do modelo, incluindo a melhoria da dispersão do modelo e a introdução de aprendizagem por reforço e outros meios técnicos. Principalmente em cenários complexos como matemática e conhecimento profissional, seu desempenho supera até o GPT-4, enquanto o preço do serviço é apenas um oitavo deste último.
Vale destacar que Doubao divulgou pela primeira vez sua capacidade de processamento de texto ultralongo de 3 milhões de palavras, o que significa que pode processar simultaneamente conteúdo equivalente a “centenas” de relatórios acadêmicos. Usando algoritmos de dados contextuais como STRING, bem como soluções otimizadas de esparsificação e distribuição, Doubao controla o atraso de processamento de milhões de tokens em 15 segundos, melhorando significativamente a eficiência de processamento do modelo para conhecimento externo massivo.
Este avanço tecnológico não só demonstra o rápido desenvolvimento da tecnologia de IA da China, mas também indica que a popularização de aplicações de grandes modelos pode ser acelerada devido ao melhor desempenho de custos.