Doubao Big Model, une filiale de Bytedance, a publié aujourd'hui son rapport annuel d'avancement technologique 2024, révélant que sa dernière version, Doubao-pro-1215, a atteint un alignement complet avec GPT-4 en termes de performances globales et a montré des capacités plus fortes dans certains domaines professionnels. Ces progrès marquent que la technologie chinoise des grands modèles est officiellement entrée au premier échelon mondial.
Depuis son lancement en mai de cette année, le grand modèle de pouf a amélioré sa capacité de 32 % en seulement 7 mois. Selon l'introduction officielle, Doubao a réalisé des progrès significatifs dans la compréhension de la précision et de la qualité de la génération en optimisant le traitement massif des données et en innovant dans l'architecture des modèles, notamment en améliorant la rareté des modèles et en introduisant l'apprentissage par renforcement et d'autres moyens techniques. Surtout dans des scénarios complexes tels que les mathématiques et les connaissances professionnelles, ses performances dépassent même le GPT-4, alors que le prix du service ne représente qu'un huitième de ce dernier.
Il convient de noter que Doubao a dévoilé pour la première fois sa capacité de traitement de texte ultra-long de 3 millions de mots, ce qui signifie qu'il peut traiter simultanément un contenu équivalent à « des centaines » de rapports académiques. En utilisant des algorithmes de données contextuelles tels que STRING, ainsi que des solutions optimisées de fragmentation et de distribution, Doubao contrôle le délai de traitement de millions de jetons en 15 secondes, améliorant considérablement l'efficacité de traitement du modèle pour des connaissances externes massives.
Cette percée technologique démontre non seulement le développement rapide de la technologie chinoise de l'IA, mais indique également que la vulgarisation des applications de grands modèles pourrait être accélérée grâce à de meilleurs rapports coûts-performances.