mardi, décembre 16, 2025
17.4 C
Tunisie

Sakana AI publie TreeQuest : l’IA devient collaborative et plus performante

TreeQuest, nouvel algorithme open source développé par Sakana AI, permet à plusieurs modèles d’intelligence artificielle de collaborer efficacement. Il ouvre la voie à une intelligence collective, dépassant les performances individuelles avec jusqu’à 30 % de gains sur des tâches complexes.

Le laboratoire japonais Sakana AI marque un tournant dans l’évolution de l’intelligence artificielle avec le lancement de TreeQuest, un algorithme open source qui permet à plusieurs modèles d’IA de coopérer pour résoudre des tâches complexes. Mis à disposition sous licence Apache 2.0 depuis fin juin 2025, TreeQuest ambitionne de dépasser les limites des approches traditionnelles basées sur des modèles isolés de plus en plus volumineux.

Contrairement à l’approche dominante du « bigger is better », Sakana AI introduit ici une philosophie d’orchestration intelligente entre modèles existants, visant une intelligence collective distribuée et complémentaire.

Une avancée technique majeure : AB-MCTS et « scaling à l’inférence »

TreeQuest repose sur l’algorithme de Recherche d’Arbre Monte Carlo à Ramification Adaptative (AB-MCTS), une méthode d’exploration qui permet à un système de sélectionner dynamiquement le modèle IA le plus adapté à chaque étape d’une tâche complexe.

Testé sur le benchmark ARC-AGI-2, reconnu pour son exigence, TreeQuest a permis à une combinaison des modèles o4-mini (OpenAI), Gemini 2.5 Pro (Google) et R1 (DeepSeek) de résoudre plus de 30 % des problèmes, contre seulement 23 % pour o4-mini utilisé seul.

Ce résultat souligne la puissance du raisonnement collaboratif entre IA, même lorsqu’un premier modèle échoue. Par exemple, une réponse erronée générée par o4-mini a permis à DeepSeek-R1 et Gemini 2.5 Pro de rebondir pour trouver la bonne solution finale.

Une réponse stratégique aux enjeux industriels

Cette percée intervient dans un contexte où les acteurs de l’intelligence artificielle doivent justifier des coûts d’entraînement massifs et se différencier sur un marché saturé. Sakana AI démontre ici qu’une approche hybride et modulaire, exploitant la diversité des modèles (comme ChatGPT, Gemini, Grok, DeepSeek), peut offrir de meilleures performances à moindre coût.

« Les biais et limites propres à chaque IA peuvent devenir des atouts collectifs si bien orchestrés », précise l’équipe de Sakana AI, soulignant une vision anti-monolithique de l’IA.

Une architecture ouverte, souple et accessible

TreeQuest est fourni avec une API flexible qui permet aux développeurs d’intégrer des logiques personnalisées de scoring, génération, et coordination, avec des points de reprise pour les tâches longues. Le système prend en charge à la fois les déploiements mono-modèle et multi-modèles, rendant l’outil compatible avec des infrastructures techniques variées.

L’open source est ici stratégique : il facilite l’adoption, encourage l’interopérabilité et soutient les ambitions d’un écosystème IA ouvert.

Vers une réduction des hallucinations IA ?

Le chercheur Takuya Akiba, à l’origine du projet, souligne un autre avantage clé de cette approche : la réduction des hallucinations — ces réponses erronées générées par les LLM. En combinant plusieurs modèles ayant des tendances différentes, TreeQuest équilibre les biais et renforce la fiabilité des résultats.

Cette innovation propose ainsi une alternative crédible au développement incessant de modèles toujours plus volumineux, tout en posant les bases d’un futur coopératif pour l’IA.

Articles Recents

Rapport ESET Research S2 2025 : l’IA opérationnelle redéfinit les vecteurs d’attaque et les modèles de menace

ESET Research analyse l’évolution technique des cybermenaces au second semestre 2025. L’essor de l’IA offensive, la montée des ransomwares industrialisés et l’explosion des attaques NFC confirment une mutation profonde des tactiques, techniques et procédures (TTP).

HONOR lance le X9d : le smartphone ultra-résistant à batterie 8 300 mAh

Le HONOR X9d illustre la stratégie d’innovation de HONOR : autonomie record, durabilité certifiée IP69K, écran OLED 1,5K à 120 Hz et photo 108 Mpx assistée par IA. Un smartphone qui démocratise des technologies jusqu’ici réservées au haut de gamme.

OpenAI Révolutionne ChatGPT : Adobe Photoshop, Express et Acrobat Intégrés pour 800 Millions d’Utilisateurs

L'intégration Adobe-OpenAI permet d'éditer des images avec Photoshop, de créer des designs avec Adobe Express et de manipuler des PDF via Acrobat, directement dans l'interface ChatGPT. Les utilisateurs activent les outils par commande vocale simple, comme : « Adobe Photoshop, floute l'arrière-plan de cette image ». Le service est gratuit.

Jolla Phone : le smartphone Linux qui veut concurrencer Android sur le terrain de la vie privée

Jolla dévoile un smartphone Linux sécurisé sous Sailfish OS 5, doté d’un matériel haut de gamme et d’un interrupteur de confidentialité physique. Les précommandes dépassent déjà 1 200 unités sur les 2 000 nécessaires pour lancer la production.

Xiaomi 17 Ultra Leica Leitzphone Edition repéré dans une base de données

Le Xiaomi 17 Ultra Leica Leitzphone Edition apparaît dans la base GSMA. Ce modèle spécial, doté d’un système photo triple capteur, confirme l’expansion du partenariat Xiaomi–Leica avant un lancement mondial prévu en mars 2026.

Topics

Rapport ESET Research S2 2025 : l’IA opérationnelle redéfinit les vecteurs d’attaque et les modèles de menace

ESET Research analyse l’évolution technique des cybermenaces au second semestre 2025. L’essor de l’IA offensive, la montée des ransomwares industrialisés et l’explosion des attaques NFC confirment une mutation profonde des tactiques, techniques et procédures (TTP).

HONOR lance le X9d : le smartphone ultra-résistant à batterie 8 300 mAh

Le HONOR X9d illustre la stratégie d’innovation de HONOR : autonomie record, durabilité certifiée IP69K, écran OLED 1,5K à 120 Hz et photo 108 Mpx assistée par IA. Un smartphone qui démocratise des technologies jusqu’ici réservées au haut de gamme.

OpenAI Révolutionne ChatGPT : Adobe Photoshop, Express et Acrobat Intégrés pour 800 Millions d’Utilisateurs

L'intégration Adobe-OpenAI permet d'éditer des images avec Photoshop, de créer des designs avec Adobe Express et de manipuler des PDF via Acrobat, directement dans l'interface ChatGPT. Les utilisateurs activent les outils par commande vocale simple, comme : « Adobe Photoshop, floute l'arrière-plan de cette image ». Le service est gratuit.

Jolla Phone : le smartphone Linux qui veut concurrencer Android sur le terrain de la vie privée

Jolla dévoile un smartphone Linux sécurisé sous Sailfish OS 5, doté d’un matériel haut de gamme et d’un interrupteur de confidentialité physique. Les précommandes dépassent déjà 1 200 unités sur les 2 000 nécessaires pour lancer la production.

Xiaomi 17 Ultra Leica Leitzphone Edition repéré dans une base de données

Le Xiaomi 17 Ultra Leica Leitzphone Edition apparaît dans la base GSMA. Ce modèle spécial, doté d’un système photo triple capteur, confirme l’expansion du partenariat Xiaomi–Leica avant un lancement mondial prévu en mars 2026.

La croissance de ChatGPT ralentit tandis que Google Gemini accélère

ChatGPT voit sa croissance ralentir à +6 % entre août et novembre 2025, alors que Google Gemini bondit de 30 %. OpenAI réagit avec un « code rouge » interne et accélère le lancement de GPT-5.2.

ESET RESEARCH : MuddyWater Déploie MuddyViper et Fooder dans une Campagne Sophistiquée Contre Israël et l’Égypte

Le groupe de cyberespionnage iranien MuddyWater (TA450) a lancé une nouvelle campagne ciblant des organisations clés en Israël (technologie, ingénierie, industrie, administrations, éducation) et une victime en Égypte. Le cœur de l'attaque est la backdoor MuddyViper, déployée directement en mémoire via le loader Fooder , un outil déguisé en jeu Snake. MuddyViper permet l'exfiltration d'identifiants Windows et de données de navigateur.

Galaxy Z TriFold : le premier smartphone triple-pli qui change les règles du mobile

Le Galaxy Z TriFold marque une avancée majeure dans les formats pliables grâce à son architecture triple-pli, son écran 10’’, sa charnière Armor FlexHinge et sa plateforme Snapdragon optimisée. Un concentré d’ingénierie pensé pour la productivité et l’IA embarquée.

Articles connexes

Catégories populaires