lundi, mai 18, 2026
25.1 C
Tunisie

Sakana AI publie TreeQuest : l’IA devient collaborative et plus performante

TreeQuest, nouvel algorithme open source développé par Sakana AI, permet à plusieurs modèles d’intelligence artificielle de collaborer efficacement. Il ouvre la voie à une intelligence collective, dépassant les performances individuelles avec jusqu’à 30 % de gains sur des tâches complexes.

Le laboratoire japonais Sakana AI marque un tournant dans l’évolution de l’intelligence artificielle avec le lancement de TreeQuest, un algorithme open source qui permet à plusieurs modèles d’IA de coopérer pour résoudre des tâches complexes. Mis à disposition sous licence Apache 2.0 depuis fin juin 2025, TreeQuest ambitionne de dépasser les limites des approches traditionnelles basées sur des modèles isolés de plus en plus volumineux.

Contrairement à l’approche dominante du « bigger is better », Sakana AI introduit ici une philosophie d’orchestration intelligente entre modèles existants, visant une intelligence collective distribuée et complémentaire.

Une avancée technique majeure : AB-MCTS et « scaling à l’inférence »

TreeQuest repose sur l’algorithme de Recherche d’Arbre Monte Carlo à Ramification Adaptative (AB-MCTS), une méthode d’exploration qui permet à un système de sélectionner dynamiquement le modèle IA le plus adapté à chaque étape d’une tâche complexe.

Testé sur le benchmark ARC-AGI-2, reconnu pour son exigence, TreeQuest a permis à une combinaison des modèles o4-mini (OpenAI), Gemini 2.5 Pro (Google) et R1 (DeepSeek) de résoudre plus de 30 % des problèmes, contre seulement 23 % pour o4-mini utilisé seul.

Ce résultat souligne la puissance du raisonnement collaboratif entre IA, même lorsqu’un premier modèle échoue. Par exemple, une réponse erronée générée par o4-mini a permis à DeepSeek-R1 et Gemini 2.5 Pro de rebondir pour trouver la bonne solution finale.

Une réponse stratégique aux enjeux industriels

Cette percée intervient dans un contexte où les acteurs de l’intelligence artificielle doivent justifier des coûts d’entraînement massifs et se différencier sur un marché saturé. Sakana AI démontre ici qu’une approche hybride et modulaire, exploitant la diversité des modèles (comme ChatGPT, Gemini, Grok, DeepSeek), peut offrir de meilleures performances à moindre coût.

« Les biais et limites propres à chaque IA peuvent devenir des atouts collectifs si bien orchestrés », précise l’équipe de Sakana AI, soulignant une vision anti-monolithique de l’IA.

Une architecture ouverte, souple et accessible

TreeQuest est fourni avec une API flexible qui permet aux développeurs d’intégrer des logiques personnalisées de scoring, génération, et coordination, avec des points de reprise pour les tâches longues. Le système prend en charge à la fois les déploiements mono-modèle et multi-modèles, rendant l’outil compatible avec des infrastructures techniques variées.

L’open source est ici stratégique : il facilite l’adoption, encourage l’interopérabilité et soutient les ambitions d’un écosystème IA ouvert.

Vers une réduction des hallucinations IA ?

Le chercheur Takuya Akiba, à l’origine du projet, souligne un autre avantage clé de cette approche : la réduction des hallucinations — ces réponses erronées générées par les LLM. En combinant plusieurs modèles ayant des tendances différentes, TreeQuest équilibre les biais et renforce la fiabilité des résultats.

Cette innovation propose ainsi une alternative crédible au développement incessant de modèles toujours plus volumineux, tout en posant les bases d’un futur coopératif pour l’IA.

Articles Recents

Cine LUT Galaxy S26 : comment Samsung démocratise l’étalonnage cinématographique professionnel

La fonction Cine LUT du Galaxy S26 démocratise l'étalonnage colorimétrique pro. Samsung et U5K Imageworks dévoilent les dessous d'une technologie qui transforme chaque vidéo en plan de film.

XPENG arrive en Tunisie : une nouvelle étape pour la mobilité électrique intelligente

XPENG lance officiellement ses activités en Tunisie avec un showroom à La Marsa et trois modèles électriques premium : G6, G9 et P7+. La marque mise sur l’intelligence artificielle, la connectivité et la mobilité intelligente pour séduire une nouvelle génération d’automobilistes tunisiens.

Faille critique cPanel (CVE-2026-41940) : 1,5 million de serveurs exposés, des États d’Asie du Sud-Est sous attaque

CVE-2026-41940, une injection CRLF critique dans cPanel, permet un accès root sans authentification. Exploitée depuis février 2026, elle expose 1,5 million de serveurs. Des gouvernements d'Asie du Sud-Est sont ciblés dans une vague d'attaques coordonnées.

Samsung Internet pour Windows : architecture cross-device et IA agentique

Samsung Internet pour Windows synchronise signets, historique et sessions entre smartphone et PC Galaxy Book, tout en intégrant un assistant IA agentique basé sur Perplexity pour automatiser la navigation et les recherches en langage naturel.

Epson ColorWorks C4000 : architecture technique et cas d’usage agroalimentaire

L'Epson ColorWorks C4000 est une imprimante d'étiquettes couleur à jet d'encre pigmentée offrant jusqu'à 1200 × 1200 dpi et 103 mm/s. Elle imprime à l'unité sur substrats alimentaires (papier, PP, PET, vinyle) sans minimum de tirage ni setup, avec des encres UltraChrome DL résistantes à l'eau et aux UV.

Topics

Cine LUT Galaxy S26 : comment Samsung démocratise l’étalonnage cinématographique professionnel

La fonction Cine LUT du Galaxy S26 démocratise l'étalonnage colorimétrique pro. Samsung et U5K Imageworks dévoilent les dessous d'une technologie qui transforme chaque vidéo en plan de film.

XPENG arrive en Tunisie : une nouvelle étape pour la mobilité électrique intelligente

XPENG lance officiellement ses activités en Tunisie avec un showroom à La Marsa et trois modèles électriques premium : G6, G9 et P7+. La marque mise sur l’intelligence artificielle, la connectivité et la mobilité intelligente pour séduire une nouvelle génération d’automobilistes tunisiens.

Faille critique cPanel (CVE-2026-41940) : 1,5 million de serveurs exposés, des États d’Asie du Sud-Est sous attaque

CVE-2026-41940, une injection CRLF critique dans cPanel, permet un accès root sans authentification. Exploitée depuis février 2026, elle expose 1,5 million de serveurs. Des gouvernements d'Asie du Sud-Est sont ciblés dans une vague d'attaques coordonnées.

Samsung Internet pour Windows : architecture cross-device et IA agentique

Samsung Internet pour Windows synchronise signets, historique et sessions entre smartphone et PC Galaxy Book, tout en intégrant un assistant IA agentique basé sur Perplexity pour automatiser la navigation et les recherches en langage naturel.

Epson ColorWorks C4000 : architecture technique et cas d’usage agroalimentaire

L'Epson ColorWorks C4000 est une imprimante d'étiquettes couleur à jet d'encre pigmentée offrant jusqu'à 1200 × 1200 dpi et 103 mm/s. Elle imprime à l'unité sur substrats alimentaires (papier, PP, PET, vinyle) sans minimum de tirage ni setup, avec des encres UltraChrome DL résistantes à l'eau et aux UV.

Samsung obtient 34 certifications TÜV Rheinland pour ses TV et barres de son 2026

Samsung a reçu les certifications TÜV Rheinland Product Carbon Reduction et Product Carbon Footprint pour 34 modèles 2026, incluant ses TV OLED, Micro RGB, Mini LED, The Frame Pro et la barre de son HW-Q990H, validant la réduction mesurable de leurs émissions carbone sur tout leur cycle de vie.

Galaxy S26 Ultra : L’architecture « Horizontal Lock » ou la fin de l’instabilité physique

Grâce à une analyse en temps réel des gyroscopes, le Galaxy S26 Ultra corrige l'inclinaison physique du châssis pour maintenir un horizon parfait. Une intégration native qui supprime le besoin de stabilisateurs externes encombrants.

XPENG P7 2025 : Quand la Réalité Augmentée Devient Interface Émotionnelle

Le Road Rage Reliever utilise un système AR embarqué synchronisant eye-tracking et reconnaissance comportementale pour offrir un exutoire ludique au conducteur stressé. XPENG positionne cette innovation comme laboratoire d'une nouvelle catégorie : l'automobile sentient, capable de décoder et moduler l'état émotionnel de ses utilisateurs.

Articles connexes

Catégories populaires