jeudi, juillet 2, 2026
35.5 C
Tunisie

Sakana AI publie TreeQuest : l’IA devient collaborative et plus performante

TreeQuest, nouvel algorithme open source développé par Sakana AI, permet à plusieurs modèles d’intelligence artificielle de collaborer efficacement. Il ouvre la voie à une intelligence collective, dépassant les performances individuelles avec jusqu’à 30 % de gains sur des tâches complexes.

Le laboratoire japonais Sakana AI marque un tournant dans l’évolution de l’intelligence artificielle avec le lancement de TreeQuest, un algorithme open source qui permet à plusieurs modèles d’IA de coopérer pour résoudre des tâches complexes. Mis à disposition sous licence Apache 2.0 depuis fin juin 2025, TreeQuest ambitionne de dépasser les limites des approches traditionnelles basées sur des modèles isolés de plus en plus volumineux.

Contrairement à l’approche dominante du « bigger is better », Sakana AI introduit ici une philosophie d’orchestration intelligente entre modèles existants, visant une intelligence collective distribuée et complémentaire.

Une avancée technique majeure : AB-MCTS et « scaling à l’inférence »

TreeQuest repose sur l’algorithme de Recherche d’Arbre Monte Carlo à Ramification Adaptative (AB-MCTS), une méthode d’exploration qui permet à un système de sélectionner dynamiquement le modèle IA le plus adapté à chaque étape d’une tâche complexe.

Testé sur le benchmark ARC-AGI-2, reconnu pour son exigence, TreeQuest a permis à une combinaison des modèles o4-mini (OpenAI), Gemini 2.5 Pro (Google) et R1 (DeepSeek) de résoudre plus de 30 % des problèmes, contre seulement 23 % pour o4-mini utilisé seul.

Ce résultat souligne la puissance du raisonnement collaboratif entre IA, même lorsqu’un premier modèle échoue. Par exemple, une réponse erronée générée par o4-mini a permis à DeepSeek-R1 et Gemini 2.5 Pro de rebondir pour trouver la bonne solution finale.

Une réponse stratégique aux enjeux industriels

Cette percée intervient dans un contexte où les acteurs de l’intelligence artificielle doivent justifier des coûts d’entraînement massifs et se différencier sur un marché saturé. Sakana AI démontre ici qu’une approche hybride et modulaire, exploitant la diversité des modèles (comme ChatGPT, Gemini, Grok, DeepSeek), peut offrir de meilleures performances à moindre coût.

« Les biais et limites propres à chaque IA peuvent devenir des atouts collectifs si bien orchestrés », précise l’équipe de Sakana AI, soulignant une vision anti-monolithique de l’IA.

Une architecture ouverte, souple et accessible

TreeQuest est fourni avec une API flexible qui permet aux développeurs d’intégrer des logiques personnalisées de scoring, génération, et coordination, avec des points de reprise pour les tâches longues. Le système prend en charge à la fois les déploiements mono-modèle et multi-modèles, rendant l’outil compatible avec des infrastructures techniques variées.

L’open source est ici stratégique : il facilite l’adoption, encourage l’interopérabilité et soutient les ambitions d’un écosystème IA ouvert.

Vers une réduction des hallucinations IA ?

Le chercheur Takuya Akiba, à l’origine du projet, souligne un autre avantage clé de cette approche : la réduction des hallucinations — ces réponses erronées générées par les LLM. En combinant plusieurs modèles ayant des tendances différentes, TreeQuest équilibre les biais et renforce la fiabilité des résultats.

Cette innovation propose ainsi une alternative crédible au développement incessant de modèles toujours plus volumineux, tout en posant les bases d’un futur coopératif pour l’IA.

Articles Recents

ESET Research met à nu SprySOCKS for Windows : pilote noyau, détournement TCP et soupçon de bootkit UEFI

WIN_DRV intègre un pilote noyau capable de masquer ses connexions réseau et de détourner le trafic TCP vers un port caché, rendant sa détection quasi impossible depuis l'espace utilisateur.

Galaxy Ring 2 : Samsung mise sur le logiciel, la batterie silicium-carbone et une possible ouverture à iOS

Entre fusion des données biométriques, batterie silicium-carbone et litige de brevets avec Oura, le Galaxy Ring 2 se dessine comme une mise à jour avant tout logicielle, lancement attendu début 2027.

Pénurie de mémoire IA : Xiaomi, Oppo et Vivo réduisent leurs objectifs smartphones 2026 jusqu’à 30 %

Xiaomi ramène son objectif à 95 millions d'unités (−30 %). IDC anticipe −14 % sur l'ensemble des expéditions mondiales 2026. Samsung, SK Hynix et Micron ont réorienté leurs capacités vers l'IA, comprimant l'offre DRAM grand public jusqu'en 2027 au moins.

ESET Research : rôle technique dans la neutralisation des botnets Amadey et Stealc (MaaS)

Trois ans de suivi continu, des systèmes automatisés d'extraction d'artefacts et un partage structuré d'IoC : la contribution d'ESET au démantèlement d'Amadey et Stealc illustre le rôle pivot du renseignement sur les menaces dans les opérations de takedown coordonnées.

Galaxy Watch 9 et Ultra 2 : ce que les fuites techniques révèlent avant l’Unpacked de juillet

Snapdragon Wear Elite 3 nm, batterie 800 mAh sur l'Ultra 2, design anguleux : voici ce que les fuites révèlent sur les prochaines Galaxy Watch de Samsung.

Topics

ESET Research met à nu SprySOCKS for Windows : pilote noyau, détournement TCP et soupçon de bootkit UEFI

WIN_DRV intègre un pilote noyau capable de masquer ses connexions réseau et de détourner le trafic TCP vers un port caché, rendant sa détection quasi impossible depuis l'espace utilisateur.

Galaxy Ring 2 : Samsung mise sur le logiciel, la batterie silicium-carbone et une possible ouverture à iOS

Entre fusion des données biométriques, batterie silicium-carbone et litige de brevets avec Oura, le Galaxy Ring 2 se dessine comme une mise à jour avant tout logicielle, lancement attendu début 2027.

Pénurie de mémoire IA : Xiaomi, Oppo et Vivo réduisent leurs objectifs smartphones 2026 jusqu’à 30 %

Xiaomi ramène son objectif à 95 millions d'unités (−30 %). IDC anticipe −14 % sur l'ensemble des expéditions mondiales 2026. Samsung, SK Hynix et Micron ont réorienté leurs capacités vers l'IA, comprimant l'offre DRAM grand public jusqu'en 2027 au moins.

ESET Research : rôle technique dans la neutralisation des botnets Amadey et Stealc (MaaS)

Trois ans de suivi continu, des systèmes automatisés d'extraction d'artefacts et un partage structuré d'IoC : la contribution d'ESET au démantèlement d'Amadey et Stealc illustre le rôle pivot du renseignement sur les menaces dans les opérations de takedown coordonnées.

Galaxy Watch 9 et Ultra 2 : ce que les fuites techniques révèlent avant l’Unpacked de juillet

Snapdragon Wear Elite 3 nm, batterie 800 mAh sur l'Ultra 2, design anguleux : voici ce que les fuites révèlent sur les prochaines Galaxy Watch de Samsung.

Design computationnel chez Samsung : IA, jumeaux numériques et robots au service des wearables

Plus de 10 000 simulations IA, des centaines de millions de données anatomiques mondiales : voici comment Samsung a repensé le design des Galaxy Buds4 Series grâce au computational design.

ESET, seul Challenger du Magic Quadrant 2026 de Gartner

ESET est désigné seul Challenger du Magic Quadrant 2026 de Gartner pour la protection des terminaux. Une reconnaissance qui s’appuie sur 16 années de présence dans le rapport et sur la plateforme ESET PROTECT, axée prévention

ESET Research : la Chine espionne le Golfe et l’IA sud-coréenne

ESET Research documente l'expansion des campagnes d'espionnage chinoises vers le Venezuela, la Syrie et le Golfe, avec un ciblage marquant d'une entreprise sud-coréenne spécialisée en IA et robotique, liée à Made in China 2025.

Articles connexes

Catégories populaires