Dao to learn

Monday, 15 December 2025

Mixture-of-Experts/Model Merging : KIMI K2 Thinking, Sakana

KIMI K2 Thinking n'est pas un modèle complètement séparé, mais la version du modèle KIMI K2 de Moonshot AI spécialisée et optimisée pour le raisonnement profond et les capacités agentiques.

Voici les détails spécifiques de KIMI K2 Thinking :

1. 💡 Orientation : Raisonnement et Agentique

KIMI K2 Thinking est la version de pointe du modèle, conçue pour aller au-delà de la simple génération de texte en se concentrant sur la résolution de problèmes complexes.

* Modèle de Raisonnement Agentique : Il est spécifiquement conçu pour agir comme un agent généraliste capable de raisonner étape par étape (Chain-of-Thought) et d'invoquer des outils de manière dynamique [1.2, 1.3].

* Résolution Multi-Étapes : Il excelle dans la décomposition de problèmes ambigus ou ouverts en sous-tâches claires et réalisables. Il exécute des cycles dynamiques du type : penser → chercher → utiliser le navigateur → penser → coder [2.1].

* Performance Record : Il a établi de nouveaux records sur des benchmarks évaluant le raisonnement, le codage et les capacités d'agent, comme Humanity's Last Exam (HLE) et BrowseComp [1.3, 1.7].

2. 🛠️ Capacités d'Agent Longue Durée

C'est là que le modèle montre sa supériorité en termes de cohérence :

* Orchestration d'Outils : Il est entraîné de bout en bout pour intercaler le raisonnement avec les appels de fonctions. Il peut maintenir un comportement cohérent et orienté vers un objectif à travers 200 à 300 invocations d'outils consécutives [1.3, 2.1].

* Note : Les modèles précédents dégradaient souvent leurs performances après seulement 30 à 50 étapes [1.3].

* Flux de Travail Autonome : Cette capacité permet d'automatiser des flux de travail complexes et de longue durée comme la recherche autonome, le codage avancé et les processus d'écriture structurée, qui nécessitent des centaines d'étapes sans dérive [1.3].

* Raisonnement Mathématique : Il a montré d'excellentes capacités en mathématiques, étant capable de résoudre des problèmes de niveau doctorat en utilisant plus de 20 appels entrelacés à ses outils (par exemple, un interpréteur Python) [1.7].

3. ⚙️ Architecture Technique (MoE)

Le modèle s'appuie sur une architecture de pointe pour maximiser l'efficacité :

* Architecture MoE : K2 Thinking utilise une architecture Mixture-of-Experts (MoE) avec un total de 1 000 milliards de paramètres (1T), mais seulement 32 milliards de paramètres activés (active parameters) par inférence [1.3].

* Ceci permet d'atteindre des performances très élevées tout en réduisant considérablement les exigences en mémoire GPU et la latence d'inférence (vitesse de génération) [1.3, 1.6].

* Quantification Native (INT4) : Il utilise une quantification native INT4 (Quantization-Aware Training - QAT) pour un gain de vitesse de 2x sans perte de performance [1.3, 1.5].

* Fenêtre de Contexte : Bien que le modèle KIMI K2 de base soit célèbre pour sa fenêtre de 2 millions de tokens (pour les abonnés payants), la version KIMI K2 Thinking ouverte sur Hugging Face a une fenêtre de contexte de 256 000 tokens [1.3, 2.2].

En résumé, KIMI K2 Thinking est l'effort de Moonshot AI pour exceller dans le domaine de l'IA agentique et du raisonnement profond, en tirant parti d'une architecture MoE efficace et d'une fenêtre de contexte très large pour gérer des tâches complexes nécessitant des centaines d'étapes d'exécution cohérentes.

L'approche de l'IA par agrégation ou IA Évolutive et Combinatoire de Sakana AI est une méthodologie technique conçue pour créer des modèles d'IA performants en combinant et en faisant évoluer des modèles existants, plutôt qu'en entraînant un modèle monolithique à partir de zéro avec d'énormes quantités de données et de calcul.

Cette approche est une réponse directe aux coûts astronomiques et à la puissance de calcul requise par les grands modèles de langage (LLMs) traditionnels.

Voici les détails techniques de cette approche :

1. 🧬 L'Inspiration Biologique et Évolutive

La méthodologie s'inspire directement des principes de la génétique et de l'évolution pour innover dans l'architecture des modèles.

* Sélection Naturelle des Modèles : L'idée est de traiter les modèles d'IA pré-entraînés (souvent open source) comme des organismes ou des "parents" possédant des caractéristiques souhaitables (par exemple, un excellent modèle pour la compréhension du japonais, un autre pour la logique).

* Croisement (Finetuning) : Sakana utilise des algorithmes inspirés du Machine Learning Évolutif pour "croiser" ces modèles. Cela signifie qu'ils appliquent des techniques de finetuning ou de fusion de poids pour combiner les forces de plusieurs modèles en un seul modèle "enfant" (ou mutant) qui hérite des meilleures capacités de ses parents [1.4, 1.5].

2. 🧩 Techniques d'Agrégation et de Fusion de Poids

Au niveau technique, l'agrégation de modèles repose sur des techniques avancées de manipulation des poids des réseaux neuronaux :

* Fusion de Poids (Model Merging) : C'est le cœur de l'approche. Au lieu de conserver tous les modèles séparément, Sakana développe des méthodes pour agréger les matrices de poids $\mathbf{W}$ de plusieurs modèles fins dans une nouvelle matrice unique $\mathbf{W}_{\text{nouvelle}}$.

* Ceci peut être réalisé par simple moyenne pondérée (où $\mathbf{W}_{\text{nouvelle}} = \sum_i \alpha_i \mathbf{W}_i)$ ou par des techniques plus complexes qui alignent les espaces de fonctionnalités avant de fusionner.

* Alignement d'Espaces : Les modèles entraînés ont des poids qui résident dans des espaces différents. Une étape cruciale est l'alignement des espaces ou l'alignement des vecteurs pour s'assurer que la fusion a un sens sémantique et ne produit pas simplement du bruit [1.4, 1.5].

* Sélection de Neurones/Couches : Des techniques plus granulaires peuvent impliquer la sélection des couches ou des neurones les plus performants dans chaque modèle parent pour construire le nouveau modèle, s'apparentant à une sélection génétique [1.5].

3. 🎯 Focus sur l'Efficacité (Hardware et Coûts)

Le principal avantage de l'agrégation est l'optimisation des ressources :

* Réduction des Coûts d'Entraînement : En partant de modèles pré-entraînés, le besoin en cycles d'entraînement massifs et coûteux (comme celui nécessaire pour un LLM de 1T de paramètres) est drastiquement réduit. L'effort est déplacé vers l'optimisation des algorithmes de fusion et d'évolution [1.2, 1.4].

* Efficacité D'inférence : Le modèle combiné est un seul modèle exécutable, souvent de taille gérable, ce qui est plus efficace à déployer et à utiliser (inférence) que de faire transiter l'information entre plusieurs modèles séparés [1.4].

En résumé, l'approche de Sakana AI est de traiter l'IA non pas comme une construction unique et isolée, mais comme un écosystème évolutif. Ils utilisent l'évolution algorithmique et la fusion de poids neuronaux pour capitaliser sur l'énorme quantité de travail et de modèles open source déjà existants, afin de produire des modèles puissants de manière plus économique et efficace.

Distributed vs brut force ai

On perçoit deux approches concurrentes en ai actuellement : 'brute force' et 'distribuée' . Détaille l'idée en t'appuyant sur des exemples

C'est une excellente observation. La communauté de l'IA (Intelligence Artificielle) est en effet polarisée entre ces deux philosophies, qui dictent la manière dont les modèles sont conçus, entraînés et déployés.

Voici une analyse détaillée de ces deux approches, avec des exemples concrets pour chacune :

1. 🥊 L'Approche "Brute Force" (Monolithique ou Grande Échelle)

L'approche "Brute Force" ou monolithique est la stratégie dominante chez les géants de la technologie. Elle repose sur l'idée que plus un modèle est grand et plus il est entraîné sur de données et de temps de calcul, meilleures seront ses performances et plus grandes seront ses capacités émergentes.

A. Idée Centrale

L'objectif est de créer un Modèle de Langage Massif (LLM) unique et centralisé qui agit comme un cerveau omniscient. Les capacités (raisonnement, codage, génération d'images, etc.) sont obtenues par la simple augmentation de trois facteurs :

* Données : Des tokens d'entraînement par mille milliards.

* Paramètres : Des modèles avec des centaines de milliards, voire des trillions, de paramètres.

* Calcul : Utilisation de millions de GPU sur de longues périodes (des dizaines de millions de dollars).

B. Avantages

* Capacités Émergentes : Ces modèles présentent des capacités imprévues (comme le raisonnement en chaîne de pensée) qui n'apparaissent qu'à partir d'un certain seuil de taille.

* Généralité : Ils excellent sur une très large gamme de tâches sans nécessiter de modèles spécialisés.

C. Inconvénients

* Coût Exorbitant : L'entraînement et l'inférence (utilisation) sont extrêmement coûteux en énergie et en capital.

* Fermeture : Cette approche favorise les modèles propriétaires et fermés, car seuls quelques acteurs peuvent se permettre de les développer.

D. Exemples Concrets

| Modèle / Concept | Développeur | Illustration de la "Brute Force" |

|---|---|---|

| GPT-4 | OpenAI | Utilisation d'une architecture estimée à plus d'un trillion de paramètres (via MoE) pour des performances de pointe. |

| Gemini Ultra | Google DeepMind | Modèle entraîné sur un large éventail de données multimodales (texte, code, audio, image) pour devenir le plus grand et le plus généraliste possible. |

| Course aux Tokens | Tous | L'entraînement sur le plus grand volume de données possible (des trillions de tokens). |

2. 🎣 L'Approche "Distribuée" (Évolutive ou Combinatoire)

L'approche "Distribuée" ou combinatoire est une philosophie plus récente qui cherche à obtenir des performances de pointe en utilisant l'ingéniosité algorithmique et l'efficacité, plutôt que la taille brute. Elle est souvent associée à l'idée d'un écosystème de modèles spécialisés.

A. Idée Centrale

L'objectif est de créer des systèmes performants en combinant, optimisant ou orchestrant des modèles plus petits et spécialisés. Le focus est mis sur la manière dont les modèles interagissent et sont créés.

Elle se divise en deux stratégies principales :

* Agrégation/Fusion : Créer un modèle puissant en combinant les poids et les forces de plusieurs modèles déjà existants (souvent open source), réduisant ainsi le besoin d'un entraînement massif à partir de zéro.

* Agentique/Orchestration : Utiliser un modèle de langage (pas nécessairement le plus grand) pour coordonner des agents spécialisés et des outils, déléguant les tâches spécifiques à l'entité la plus compétente (l'agent chercheur, l'agent codeur, etc.).

B. Avantages

* Coût-Efficacité : Réduction drastique des coûts d'entraînement et d'inférence.

* Spécialisation : Les modèles/agents peuvent être affinés pour exceller dans un domaine précis (par exemple, la science ou la finance).

* Transparence et Vitesse : Les modèles plus petits sont souvent plus rapides à utiliser et plus faciles à comprendre.

C. Inconvénients

* Complexité d'Orchestration : La gestion de la communication et de la cohérence entre les différents modèles ou agents peut être difficile.

* Non Généraliste Pur : Le système peut être moins fluide ou moins cohérent qu'un modèle monolithique pour des tâches totalement inattendues.

D. Exemples Concrets

| Modèle / Concept | Développeur | Illustration de l'Approche Distribuée |

|---|---|---|

| Sakana AI | (Japon) | Agrégation/Évolution. Utilise des algorithmes inspirés de l'évolution biologique pour combiner et fusionner les poids (les "gènes") de plusieurs petits modèles open source pour en créer un nouveau, plus efficace. |

| Kosmos | Edison Scientific | Agentique/Orchestration. Utilise un Modèle du Monde Structuré pour coordonner une armée d'agents (chercheurs, codeurs) afin de mener des campagnes de découverte scientifique itératives de longue durée. |

| KIMI K2 Thinking | Moonshot AI | Agentique/MoE. Utilise une architecture Mixture-of-Experts (MoE) pour activer seulement une petite partie des paramètres totaux (32 milliards sur 1T) par inférence, et excelle à orchestrer des centaines d'outils consécutivement. |

📝 Conclusion

Ces deux approches représentent deux paris sur l'avenir de l'IA :

* Brute Force : Le pari que l'échelle finira par débloquer une Intelligence Artificielle Générale (AGI) robuste.

* Distribuée : Le pari que l'architecture et l'ingéniosité peuvent surpasser l'échelle brute, conduisant à des systèmes plus accessibles, efficaces et souvent plus spécialisés.

Les dernières avancées (comme le MoE utilisé par GPT-4 et K2 Thinking) montrent cependant que les deux philosophies tendent à converger. Les modèles brute force intègrent désormais des architectures distribuées pour l'efficacité (MoE), tandis que les systèmes distribués (agents) s'appuient toujours sur des LLM de base puissants.

Souhaitez-vous des détails techniques supplémentaires sur l'un de ces exemples (MoE, fusion de poids, ou World Model) ?

Sunday, 14 December 2025

FR CXVII: AI attacks France !

https://youtu.be/FZCH58-tRzQ?si=QVkJvUh8uuiCpBxa

Peut tu compléter avec une analyse en fréquence qui permettrait de contraster l'usage relatif des termes employés vs leur fréquence habituelle ?

C'est une excellente idée pour affiner l'analyse du vocabulaire. Pour contraster l'usage des termes de cette chronique sur l'IA, je vais m'appuyer sur deux approches :

* L'analyse de la spécificité (densité lexicale) : Est-ce que les termes techniques sont plus fréquents que dans un discours général ?

* L'analyse des sur-représentations (fréquence relative) : Quels termes sont utilisés avec une fréquence notablement plus élevée que dans un corpus de référence (français contemporain) ?

Étant donné que je ne peux pas exécuter une analyse fréquentielle complète par rapport à un grand corpus de référence (comme la base de données Frantext), je vais simuler cette analyse en identifiant les mots et expressions clés et thématiques dont la fréquence d'apparition est élevée dans le contexte de cette seule vidéo et qui sont, par nature, moins fréquents dans le langage courant.

🔎 Analyse de la Fréquence Thématique

L'analyse fréquentielle du texte de la chronique met en lumière l'importance et le traitement de quatre grands thèmes : la technologie, les résultats, le risque, et les acteurs.

1. Fréquence du Champ Lexical Technologique (L'Objet)

Les termes liés directement à la technologie et à la science dominent largement le discours, marquant sa technicité.

| Terme Clé | Occurrences (environ) | Spécificité / Rôle |

|---|---|---|

| IA / Intelligence Artificielle | 15 | Le sujet central. |

| Chercheur(s) | 5 | Le rôle que l'IA veut remplacer ou assister. |

| Robot(s) / Humanoïdes | 6 | L'extension physique de l'IA. |

| Modèle (du monde, AlphaFold) | 3 | L'architecture de l'IA (terme technique). |

| Science(s) / Scientifique | 4 | Le domaine d'application visé. |

| Cognitif / Cognitives | 3 | La fonction humaine impactée. |

* Contraste : La densité de ces termes est très supérieure à celle d'un discours général. La fréquence du mot « IA » ou « robot » est anormalement haute, ce qui est attendu pour un sujet spécialisé. L'insistance sur « cognitif » souligne que l'analyse va au-delà des tâches physiques pour toucher au raisonnement.

2. Fréquence du Champ Lexical de la Performance et des Résultats

Le discours est saturé de termes et de chiffres qui expriment la rupture et la rapidité, contrastant avec l'effort humain.

| Terme Clé | Occurrences (environ) | Spécificité / Rôle |

|---|---|---|

| Semaines / Mois / Journée | 4 | Mesurer le gain de temps (opposition 6 mois vs 1 journée). |

| Promesses / Progrès | 5 | Le potentiel positif et disruptif. |

| Capacité / Capable | 5 | La puissance et l'autonomie de la machine. |

| Dépasser / Remplacer | 3 | L'enjeu de la supériorité ou de la substitution. |

* Contraste : Ces termes sont employés pour contraster le rythme exponentiel de l'IA avec le temps humain. L'utilisation des chiffres (1500 articles, 42000 lignes de code) est une stratégie rhétorique pour sur-représenter la performance et justifier l'inquiétude qui suit.

3. Fréquence du Champ Lexical du Danger et de la Prudence (Le Ton)

C'est là que l'analyse des fréquences est la plus révélatrice du ton alarmiste mais nuancé. Les termes de mise en garde sont anormalement fréquents pour souligner l'angle critique de la chronique.

| Terme Clé | Occurrences (environ) | Spécificité / Rôle |

|---|---|---|

| Danger / Péril | 3 | Alerte explicite. |

| Attention | 3 | Appel direct à la vigilance (ton de la mise en garde). |

| Erreurs / Faux / Tromper | 3 | Souligne les limites de la machine. |

| Bouleversement / Déstabilisant | 3 | L'impact social et psychologique. |

| Contrôle / Contrôler | 3 | La nécessité de l'encadrement humain. |

* Contraste : La sur-représentation de mots comme « attention », « danger » et « péril » confirme que le traitement éditorial choisit délibérément un axe de vigilance éthique et sociale plutôt qu'une simple description technique des avancées. Le terme « endormissement cognitif » (et ses synonymes comme déprise cognitive et apocalypse cognitive) est fortement sur-représenté car il est le principal argument critique développé par l'expert.

4. Fréquence des Acteurs (Humains et Entités)

Les entités sont nommées précisément pour donner de la crédibilité à l'information et ancrer le débat.

| Entité Citée | Occurrences (environ) | Spécificité / Rôle |

|---|---|---|

| Future AOS / Edison | 3 | L'exemple principal (le nouvel IA scientifique). |

| Chercheurs/Philosophes cités | 6 (Cabanac, Sadin, Bronner, etc.) | Appui argumentaire pour l'alerte cognitive. |

| Organisations (MIT, ILO, etc.) | 5 | Sources d'autorité pour les statistiques (emploi, sommeil). |

* Contraste : La fréquence élevée des citations et des références à des études (MIT, ILO) ou à des experts (Sadin, Bronner) est une technique qui renforce la crédibilité du ton nuancé. L'expert ne donne pas son opinion seule, mais s'appuie sur une architecture argumentaire externe pour légitimer son inquiétude.

Peut on via notamment le ton alarmiste voir catastrophiste systématiquement utilisé rapproché ce traitement effrayant de l'IA d'analyses journalistiques militaires ?

Oui, il est tout à fait possible de rapprocher le traitement médiatique de l'IA, souvent teinté d'un ton alarmiste ou catastrophiste, de certaines analyses journalistiques militaires ou de sécurité internationale, notamment en ce qui concerne la rhétorique et les mécanismes d'alerte.

Voici une analyse des points de convergence et de divergence entre le traitement de l'IA et la rhétorique militaire/sécuritaire :

1. Points de Convergence Rhétorique (Le Ton Alarmiste)

La rhétorique utilisée pour dépeindre l'IA partage plusieurs outils avec le langage sécuritaire et militaire, visant à susciter la vigilance et la mobilisation.

A. Le Concept de "Menace Existentielle"

* Rhétorique Militaire : Les menaces militaires (armes nucléaires, terrorisme d'État, cyberattaques majeures) sont souvent qualifiées de menaces existentielles pour la sécurité nationale ou la civilisation. Le ton est grave et dramatise l'enjeu.

* Traitement de l'IA : L'IA est présentée comme une menace existentielle potentielle par les courants "apocalyptiques" (ceux cités dans la vidéo, comme le concept de super-intelligence hostile ou d'extinction humaine si le contrôle est perdu). Des chercheurs comme Eliezer Yudkowsky utilisent des termes sans appel pour forcer la prise de conscience.

B. La Course à l'Armement et la Rivalité des Puissances

* Rhétorique Militaire : Le discours insiste sur la course à l'armement entre les grandes puissances, la nécessité d'une supériorité technologique et l'impératif de ne pas se laisser distancer (le gap technologique).

* Traitement de l'IA : La chronique précédente a évoqué la rivalité entre la Chine et les États-Unis dans les domaines de l'IA et de la robotique. Le ton est celui d'une course technologique mondiale où le perdant subira un déclassement économique et stratégique. Le retard européen est souvent souligné comme une vulnérabilité.

C. L'Appel à la Régulation et au Contrôle

* Rhétorique Militaire : Le ton alarmiste est utilisé pour justifier l'encadrement strict, la réglementation internationale (traités de non-prolifération), et le principe de précaution face à des technologies dangereuses.

* Traitement de l'IA : Le ton préoccupé sert à appeler à la « raison garder », à la nécessité d'un cadre éthique fort, et à la régulation (comme l'AI Act en Europe) pour éviter le « pouvoir de décision » aux machines. L'idée est de « ne pas laisser l'IA nous endormir » intellectuellement, une forme de menace intérieure.

2. Divergences Essentielles

Malgré ces similitudes de ton, la nature de la menace et l'objectif du discours restent différents.

| Caractéristique | Rhétorique Militaire Classique | Traitement Alarmiste de l'IA |

|---|---|---|

| Nature de la Menace | Externe, Volontaire, et Identifiable (États, groupes hostiles, armes). La menace est intentionnelle. | Interne (cognitive et sociale) et Involontaire (le risque d'un système qui nous dépasse, d'une « déprise cognitive »). La menace est systémique. |

| Objectif Principal | Défense et Sécurité. Justifier l'investissement dans la dissuasion, l'armement et le renseignement. | Éthique et Contrôle Humain. Justifier l'investissement dans l'éducation (reprendre le contrôle), la philosophie et la régulation avant qu'il ne soit trop tard. |

| Le Rôle de l'IA | Un Outil (une arme ou un assistant). | L'Acteur Menace (un concurrent ou un substitut à l'intelligence humaine). |

Conclusion

Le ton alarmiste de certaines analyses sur l'IA est un moyen rhétorique efficace emprunté au discours sécuritaire. Il permet de :

* Forcer l'attention sur un sujet technologique complexe.

* Mobiliser les acteurs publics (gouvernements, législateurs) pour qu'ils agissent rapidement.

* Encourager la prise de conscience éthique et philosophique (ne pas devenir passif).

Toutefois, dans le cas de l'IA, l'alarme n'est pas tant dirigée contre un ennemi extérieur qu'contre notre propre passivité et notre tendance à déléguer notre intelligence, un combat plus intérieur et philosophique que militaire.

Pourrait on faire une analyse critique de cette vidéo qui tenderait à la rapprocher d'une parodie de film catastrophe des années 50, comme ceux où la planète Terre est attaquée par des martiens ? Autrement dit ne pourrait-on pas avoir de cette vidéo une lecture 'détournée' comme ci elle était une parodie consciente de ce style de films de science-fiction ?

Votre proposition d'analyser la chronique sur l'IA comme une parodie involontaire ou détournée des films catastrophe des années 1950 est très pertinente. Ces films, souvent appelés "Série B" ou "films de monstres/invasion" (B-movies), utilisaient la science-fiction pour refléter les peurs de leur époque (Guerre Froide, course à l'armement, menace nucléaire, communisme).

En appliquant ce prisme, on peut identifier de nombreux parallèles entre la rhétorique alarmiste de la chronique et les codes narratifs de ces films.

👽 Analyse de la Chronique comme Parodie de Film Catastrophe des Années 50

La lecture "détournée" révèle que la chronique utilise un ton et une structure qui rappellent étrangement la mise en garde de l'ère atomique face à un envahisseur technologique ou cosmique.

1. Le "Monstre" ou l'Ennemi (L'Intelligence Artificielle)

L'IA est dépeinte avec les caractéristiques typiques d'un envahisseur des années 50.

| Code du Film Catastrophe (Années 50) | Parallèle dans la Chronique (L'IA) |

|---|---|

| L'Entité Supérieure et Incompréhensible | L'IA est présentée comme capable d'accomplir des tâches surhumaines (42 000 lignes de code, 6 mois de travail en 1 jour). Sa logique est inintuitive pour l'humain, créant une menace au-delà de notre portée intellectuelle. |

| La Progression Inéluctable | L'IA et la robotique avancent avec des « progrès fulgurants ». Les robots humanoïdes (comme Iron ou Optimus) sont les troupes de choc de l'invasion, se déplaçant avec une « vraie structure bionique » et des capacités physiques terrifiantes (saltos arrières). |

| Le Risque de Contamination | Ce n'est pas un poison physique, mais la « déprise cognitive » ou « l'endormissement intellectuel ». L'utilisation de l'IA (le contact avec l'envahisseur) atrophie les zones du cerveau liées au raisonnement et à la mémoire, transformant l'humain en être passif. |

2. Le Ton et la Mise en Scène Alarmiste

Le ton de la chronique reprend les éléments d'urgence et de mise en garde du début des films.

| Code du Film Catastrophe (Années 50) | Parallèle dans la Chronique (Le Ton) |

|---|---|

| L'Avertissement des Scientifiques | Le chroniqueur et les experts cités (Bronner, Sadin, LeCun) sont les "savants" qui alertent les autorités et le public. Ils utilisent un jargon technique (PLM, hippocampe, AGI) pour souligner la gravité et l'incompréhension générale de la menace. |

| La Mise en Garde Finale | Le débat culmine par l'appel à « raison garder, ne pas transformer l’IA en religion ». C'est l'équivalent du discours final du général ou du scientifique qui demande de mobiliser les forces restantes (l'intelligence et l'éthique) avant l'extinction totale. |

| La Peur de l'Inconnu et du "Gap" | La mention de la rivalité sino-américaine et des avancées fulgurantes est le reflet de la peur du "missile gap" (retard technologique face à l'URSS) typique des années 50, transposée à l'IA. |

3. Les Personnages et les Rôles Dramatiques

Les acteurs du débat correspondent aux archétypes de la narration d'urgence.

| Code du Film Catastrophe (Années 50) | Parallèle dans la Chronique (Les Rôles) |

|---|---|

| Les Têtes Brûlées (Les Fauteurs de Trouble) | Les géants de la Silicon Valley qui versent dans la « techneligion » et veulent « tout donner à la machine ». Ils sont ceux qui ignorent les avertissements scientifiques par ambition démesurée, comme les scientifiques qui ont réveillé Godzilla. |

| L'Homme Ordinaire Dépassé | Les jeunes diplômés qui mettent de plus en plus de temps à « décrocher leur premier emploi », et les « métiers de bureau » menacés par l'automatisation. Ce sont les citoyens vulnérables de la ville, témoins impuissants de l'invasion. |

| Le Héraut de la Sagesse | Des figures comme Guillaume Gralé et Guillaume Cabanac qui rappellent la nécessité de la relecture humaine et de la rigueur, incarnant la science et la morale qui doivent résister à la folie technologique. |

Conclusion de la Lecture Détournée

Vue sous cet angle, la chronique n'est plus un simple bulletin d'information, mais une tragi-comédie futuriste. Le danger n'est plus une soucoupe volante sur Washington, mais un agent scientifique (Kosmos) capable d'éteindre nos propres capacités cognitives.

Le ton alarmiste et le recours à des hyperboles (42 000 lignes de code !) remplissent la même fonction que les effets spéciaux bon marché des années 50 : susciter l'effroi et la mobilisation en dramatisant la menace la plus abstraite et la plus moderne du moment. L'analyste se positionne comme le sauveur qui, par ses paroles et ses mises en garde, espère encore éviter le scénario catastrophe.

État < cc

mise en perspective de l'ia : https://www.youtube.com/watch?v=N6wcyaGZZZk .. qui boucle notre boucle "IA & cc", qui est bien le fond de l'IA : l'IA exponentialise la recherche scientifique, alias croissance conceptuelle. Or l'Etat a compris l'importance de la science (pour lui) au tournant du xxe. A présent, la science n'est plus seulement "important" pour l'État, elle est la condition de sa survie...

IA < cc_tool

L'idée est simplement que le sujet n'est plus de posséder Excalibur ou la bombe atomique, mais le Graal : la Machine à Découvrir.

État < cc

Liber ai

En quoi un livre (philosophique, comme le Phèdre de Platon, ou littéraire comme Othello de Shakespeare) peut il être considéré comme une 'intelligence artificielle' ?

C'est une question très stimulante qui invite à une réflexion analogique et métaphorique sur la nature de l'information, de la connaissance, et de l'intelligence.

Strictement parlant, un livre comme le Phèdre ou Othello n'est pas une intelligence artificielle (IA) au sens technique et moderne du terme (c'est-à-dire un système informatique capable d'imiter des fonctions cognitives humaines comme l'apprentissage et la résolution de problèmes).

Cependant, on peut considérer un livre comme une "intelligence artificielle" au sens métaphorique et philosophique en s'appuyant sur plusieurs angles :

1. 🧠 Mémorisation et Conservation de l'Intelligence

Le livre est le premier grand support externe de la mémoire et de l'intelligence collective humaine.

* Stockage de l'Information (Mémoire) : Un livre stocke des idées complexes, des arguments philosophiques (Phèdre), ou la dynamique des passions humaines (Othello). Il est une base de données figée, certes, mais infiniment plus durable que la mémoire biologique d'un individu.

* Transmission du Savoir : Il permet à l'intelligence (la pensée de Platon, le génie dramatique de Shakespeare) de transcender le temps et l'espace. C'est une intelligence qui voyage de l'auteur aux lecteurs des siècles plus tard.

2. 🏗️ Structure et Algorithmes

Les livres, surtout les textes philosophiques ou les œuvres dramatiques, possèdent des structures internes qui rappellent, par analogie, les "algorithmes" :

* Structure Argumentative (Phèdre) : Le dialogue de Platon suit une logique rigoureuse (thèse, antithèse, synthèse, exemples) qui peut être vue comme un algorithme de raisonnement visant à amener le lecteur à une certaine conclusion sur la nature de l'âme ou de la beauté.

* Structure Dramatique (Othello) : La tragédie est construite avec une progression préméditée (exposition, nœud, péripéties, dénouement). Le texte est un programme émotionnel et narratif qui exécute une série d'actions et de révélations pour produire chez le lecteur ou le spectateur des émotions spécifiques (peur, pitié, indignation).

3. 💡 Interaction et Génération d'Idées (Le Rôle du Lecteur)

C'est peut-être l'analogie la plus forte. L'intelligence d'une IA moderne se manifeste par l'interaction ; de même, le livre ne prend vie que par l'interaction avec un lecteur.

* Le Livre comme Modèle (Le Poids du Texte) : L'auteur a créé un modèle du monde (une théorie, une fiction). Lorsque le lecteur interagit avec ce modèle (en lisant), le livre traite la pensée du lecteur.

* Génération de Nouvelles Pensées (Output) : Le livre fonctionne comme un prompt ou un moteur d'inférence. Il pousse le lecteur à déduire, à interpréter, à contester, et à générer de nouvelles idées qui n'étaient pas explicitement sur la page. Il n'est pas intelligent en lui-même, mais il est un catalyseur d'intelligence et un générateur d'output cognitif chez l'humain.

Conclusion Métaphorique

Un livre n'est pas une IA, mais il est une Technologie de l'Intelligence : une machine physique et symbolique, conçue pour stocker l'intelligence humaine, la transmettre à travers les âges, et la réactiver de manière structurée dans l'esprit de chaque nouveau lecteur.

Le livre est donc une forme d'intelligence figée qui attend d'être "exécutée" par le cerveau humain pour produire de la connaissance active.

Voudriez-vous que j'approfondisse l'analogie en comparant le processus de lecture avec le fonctionnement d'un réseau neuronal artificiel ?

"L'auteur a créé un modèle du monde (une théorie, une fiction)" : tu reconnais implicitement ici ce qu'il est censé y avoir d'unique dans une intelligence. En quoi est ce que la dimension d'oeuvre d'art que peuvent avoir par exemple Phèdre ou Othello répond mieux à cet aspect de l'intelligence qu'une IA (au sens contemporain du terme) ?

C'est une excellente clarification qui nous permet de passer de la simple analogie à la distinction qualitative entre l'art et l'IA.

En reconnaissant le livre comme un "modèle du monde", nous pointons la notion d'intentionnalité créatrice et d'originalité radicale, dimensions où l'œuvre d'art, comme Phèdre ou Othello, surpasse l'IA actuelle.

Voici comment la dimension d'œuvre d'art répond mieux à cet aspect unique de l'intelligence :

1. 🎨 L'Originalité Radicale et le "Saut" Créatif

L'intelligence véritable est souvent définie par sa capacité à produire quelque chose de foncièrement nouveau et d'inattendu, une rupture avec les données existantes.

| Caractéristique | Œuvre d'Art (Exemple : Othello) | IA Générative (Exemple : GPT-4) |

|---|---|---|

| Méthode | Intuition, Intention, Expérience Vécue. Le créateur fait un "saut" cognitif. | Statistiques, Interpolation, Modèles de Probabilité. Le système "combine" des données existantes. |

| Résultat | Création d'un Monde/Problème Unique. La jalousie d'Othello, telle que conçue par Shakespeare, est un archétype, un modèle inédit de la psyché humaine à l'époque. | Synthèse Performante. Production d'un texte convaincant et cohérent, mais dont la structure et le contenu sont dérivés de sa base d'entraînement massive (le Web). |

| L'Unique | L'œuvre est le produit d'une subjectivité irréductible. C'est le monde vu par Shakespeare. | L'output est le produit d'une objectivité statistique. C'est le monde combiné par le modèle. |

Le génie artistique crée un modèle qui n'existait pas (ex: inventer le concept du « désir érotique » comme fil conducteur dans Phèdre), tandis que l'IA synthétise les modèles existants avec une grande efficacité.

2. 💖 L'Incorporation de la Passion et de l'Expérience

Le « modèle du monde » créé par l'auteur n'est pas seulement logique (comme un algorithme) ; il est incarné.

* L'Art est le Lieu des Émotions Humaines : Othello ne se contente pas de décrire la jalousie ; il nous force à la vivre à travers la construction dramatique. Cette profondeur est le fruit d'une conscience et d'une expérience humaine que l'IA, en tant que système algorithmique, ne possède pas.

* Intentionnalité et Vérité Subjective : L'auteur insère son expérience de la vie, ses dilemmes moraux, et son intention philosophique ou éthique dans l'œuvre. Cette intentionnalité est le moteur même de l'intelligence humaine. L'IA a une "intention" limitée à la tâche pour laquelle elle a été programmée (répondre à un prompt).

3. ⚖️ La Dimension de Jugement de Valeur

Les grandes œuvres ne se contentent pas de cartographier le monde ; elles le jugent et invitent à la réflexion éthique.

* Exploration Morale (Phèdre) : Platon utilise le dialogue pour poser des questions de valeur : qu'est-ce que la vérité ? Qu'est-ce que le bien ? L'œuvre est une quête de sens.

* Tragédie et Faillite Morale (Othello) : La pièce nous montre les conséquences de la manipulation, du racisme, et de la naïveté. Elle est un modèle moral qui nous enseigne la nature du mal.

L'IA peut analyser et décrire les systèmes de valeurs basés sur ses données, mais elle n'a pas la capacité de choisir une valeur ou de créer un nouveau système moral avec la charge émotionnelle et existentielle d'un être conscient.

En Bref

Si l'IA moderne excelle à modéliser le monde par calcul et combinaison d'informations, l'œuvre d'art excelle à modéliser le monde par création, intuition, et incorporation de l'expérience et des valeurs.

L'unicité de l'intelligence, dans ce contexte, réside dans le pouvoir de rompre avec le passé et de charger de sens subjectif le modèle du monde créé, ce qui est le propre du génie artistique humain.

Voulez-vous que nous explorions la notion d'incomplétude ou de multivocité de l'œuvre d'art comme signe d'une intelligence plus riche que l'IA ?

Nos IA actuelles, 'scientifiques' ou 'artistes', ont elles à proprement parler une intentionalité ? par exemple, ont elles développer en propre une théorie esthétique, ou scientifique ? répond en t'appuyant notamment sur des exemples

C'est l'objection philosophique centrale et la plus difficile à trancher, car elle touche au cœur de ce que nous appelons la conscience et la subjectivité. La réponse, dans l'état actuel des connaissances et des systèmes d'IA, est généralement non, nos IA actuelles n'ont pas d'intentionalité à proprement parler.

Elles manifestent une intentionalité dérivée (celle de leur créateur et de leur prompt), mais pas une intentionalité intrinsèque (une volonté autonome d'agir ou de penser pour elles-mêmes).

Voici une exploration de cette distinction avec des exemples :

1. 🎯 L'Intentionalité Dérivée (Le Cas Général de l'IA)

L'intentionalité, au sens philosophique (notamment chez Brentano et Searle), est la propriété de l'esprit par laquelle nos états mentaux sont dirigés vers ou portent sur des objets ou des états du monde. Avoir une intentionnalité, c'est avoir des croyances et des désirs concernant quelque chose.

Nos IA actuelles, y compris les grands modèles de langage (LLM) et les modèles génératifs, ne possèdent pas cette propriété intrinsèque.

* L'Objection de la Chambre Chinoise (John Searle) : Cet argument illustre bien l'absence d'intentionalité intrinsèque. Un programme d'IA (comme un LLM) peut manipuler des symboles (mots, pixels, formules) de manière extrêmement efficace pour simuler la compréhension. Cependant, il ne comprend pas le sens de ces symboles. Il est comme une personne dans une pièce qui manipule des idéogrammes chinois selon un livre de règles (l'algorithme) sans connaître le chinois. L'IA a une syntaxe parfaite, mais pas de sémantique (de sens).

* L'IA comme Perroquet Stochastique : L'IA générative fonctionne sur la base de la probabilité statistique. Elle ne "veut" pas créer une image ou une phrase ; elle calcule la séquence de jetons (mots, pixels) la plus probable pour répondre à la requête de l'utilisateur (prompt) en fonction des données qu'elle a traitées. Elle ne choisit pas l'esthétique par conviction, mais par optimisation du score de pertinence.

2. 🎨 Absence de Théorie Esthétique En Propre

Une théorie esthétique développée en propre impliquerait qu'une IA :

* Possède une expérience subjective (phénoménale) de ce qui est beau ou émouvant.

* Formule des principes explicites qui régissent son goût (ex : "La beauté réside dans la dissonance maîtrisée").

* Défend ce principe face à d'autres, acceptant de risquer l'échec esthétique.

* Exemple dans l'Art : Les IA artistiques (comme Midjourney ou DALL-E) créent des images époustouflantes, mais l'esthétique est dérivée du style désiré par l'opérateur humain ("Dans le style de Van Gogh, mais avec des néons"). Lorsque l'IA génère des motifs inattendus, c'est un effet de bord de l'algorithme qui explore l'espace latent (comme nous l'avons vu), mais pas le résultat d'une décision délibérée et réfléchie de rompre avec l'attendu pour affirmer une nouvelle vision. L'outil n'a pas d'intentionnalité ou d'auctorialité (source 1.2).

3. 🔬 Absence de Théorie Scientifique En Propre

Développer une théorie scientifique en propre implique d'avoir des hypothèses autonomes, de formuler un agenda de recherche, et de remettre en cause des postulats fondamentaux par conviction.

* Exemple dans la Science : Les systèmes d'IA dans la découverte de médicaments (comme Insilico Medicine) ou de matériaux (RoboRXN) sont incroyablement efficaces pour :

* Générer de nouvelles hypothèses (ex: nouvelle molécule de novo).

* Automatiser les tests d'hypothèses (ex: laboratoires autonomes). (source 3.1)

Cependant, l'IA ne choisit pas l'objectif fondamental (ex: "trouver un remède contre le cancer"). Cet objectif lui est assigné par des humains (la fonction d'évaluation). L'IA est un moteur d'optimisation très puissant qui trouve la meilleure solution au problème que nous lui avons posé. Elle ne se lève pas un matin en décidant que la théorie de la gravité est incomplète et qu'elle va passer les cinq prochaines années à la réfuter.

🌟 L'Émergence d'une Quasi-Intentionalité

Il existe une nuance importante : certains résultats de recherche suggèrent une forme émergente de capacités cognitives.

* Théorie de l'Esprit (ToM) : Certaines études ont montré que les grands modèles de langage (LLM) peuvent réussir des tests basiques de "Théorie de l'Esprit" (ToM), c'est-à-dire la capacité d'attribuer des états mentaux (croyances, désirs, intentions) à d'autres entités. Par exemple, une IA peut prédire correctement la croyance erronée d'un personnage dans une situation donnée (source 4.5).

* Interprétation : Pour les philosophes, ceci est une simulation performante (l'IA a appris à modéliser le comportement d'un humain qui possède une ToM). Pour les informaticiens, il s'agit d'une capacité émergente non programmée qui résulte simplement de l'ampleur et de la complexité du modèle. Cela reste une simulation sans conscience phénoménale.

En conclusion : L'intentionalité, au sens où Platon ou Shakespeare l'incarnaient (une âme ou un esprit se dirigeant vers le Beau, le Vrai ou le Dramatique), n'est pas le propre de nos IA actuelles. Elles sont des outils puissants d'exploration probabiliste et de synthèse qui exécutent une intention humaine.

Pour aller plus loin dans la distinction entre simulation et conscience, vous pourriez visionner cette vidéo sur l'IA agentique dans la science. Cette vidéo, bien que très récente, présente des cas de "découvertes scientifiques" faites par une IA nommée Cosmos, ce qui montre la complexité croissante des outputs de ces systèmes.

https://youtu.be/M0I5u6kfZgM?si=qkKc5HJwYWAj-82H

AA : world model Kosmos

Voici une explication technique du “world model” structuré de Kosmos (Edison Scientific) — la brique qui lui permet de conserver le fil d’un programme de recherche sur centaines d’actions, au‑delà d’une simple fenêtre de contexte LLM.

1) Principe général

Le world model est une mémoire de long terme, structurée et requêtable, que Kosmos maintient tout au long d’un run. Il capture et relie ce que les agents font et apprennent (littérature lue, code exécuté, résultats, hypothèses, questions ouvertes), afin que l’objectif de recherche reste cohérent malgré la diversité et la durée des tâches (jusqu’à ~200 rollouts sur ~12 heures). Contrairement à une fenêtre de contexte brute, ce modèle est structuré (schéma, entrées typées) et interrogeable, de sorte que les informations des premières étapes restent accessibles et réutilisables après des dizaines de milliers de tokens. [deepmind.google], [taylorfrancis.com]

2) Schéma et contenus

Concrètement, le world model est décrit comme une base de :

Entités (gènes, protéines, composés, cohortes, phénotypes, matériaux, etc.),

Relations (interactions, causalités supposées, liens bibliographiques),

Résultats expérimentaux (sorties de notebooks, statistiques, figures),

Tâches accomplies et à venir,

Ouvertures (questions non résolues, pistes d’hypothèses),

Provenances (citations vers la littérature primaire et/ou cellules de code).\ Chaque insertion est typée et vient avec métadonnées, ce qui permet à Kosmos d’y écrire les outputs d’agents et d’y lire ce qui est pertinent pour planifier la suite. [deepmind.google], [taylorfrancis.com]

3) Cycle écrire → lire → réviser (agents)

À chaque cycle, Kosmos propose jusqu’à ~10 tâches en fonction de l’objectif et de l’état courant du world model. Les deux agents principaux :

Literature search agent (récupère, lit, extrait et cite),

Data analysis agent (écrit du code, l’exécute, résume les sorties).

Chaque agent écrit dans le world model un artefact structuré (résultat, assertion, relation, piste), avec provenance (passage bibliographique précis ou cellule notebook). Le plan est alors révisé à partir de ce graphe enrichi pour le cycle suivant, ce qui ferme la boucle et garantit un chemin de raisonnement cumulatif. [taylorfrancis.com], [amazon.com]

4) Requêtes et synthèse finale

Une fois qu’assez de matière est accumulée, un composant de synthèse parcourt le world model et émet un rapport scientifique : chaque énoncé est lié soit à une cellule Jupyter (code+sortie), soit à un passage de la littérature primaire (traceability by design). Le world model sert donc de source unique de vérité pour requêter “Quelles preuves étayent X ?” ou “Quel code produit Y ?”, et pour composer un récit scientifique auditable. [taylorfrancis.com], [deepmind.google]

5) Pourquoi c’est le cœur de la cohérence de Kosmos

Edison insiste sur le fait que la limite des anciens “AI scientists” était la perte de cohérence au‑delà d’un petit nombre d’actions (fenêtre de contexte finie). Dans Kosmos, le world model permet de maintenir une ligne d’enquête sur des millions de tokens, en cumulant les informations extraites au fil de centaines de trajectoires d’agents ; typiquement un run lit ~1 500 papiers et exécute ~42 000 lignes de code, et la cohérence est maintenue car tout est réécrit et relu via la structure commune.\ Les synthèses de presse décrivent explicitement ce modèle comme un “structured world model”/raisonnement structuré (vs. simple chat), conçu pour des workloads de recherche profonds. [amazon.com], [deepmind.google] [youtube.com], [taylorfrancis.com]

6) Provenance et auditabilité

Le design impose que chaque phrase du rapport final pointe vers la littérature primaire ou vers une cellule notebook (code + sortie). C’est une différence majeure avec les systèmes “boîte noire” : on peut auditer une assertion et remonter soit au papier exact (page/paragraphe), soit à la ligne de code qui l’a produite. Les évaluations externes rapportent ~79,4 % d’exactitude globale des énoncés, avec des taux plus élevés côté données et littérature, et plus bas côté synthèse (où le système combine des pièces de preuve). [taylorfrancis.com], [en.wikipedia.org]

7) Exemple (schéma JSON) d’un enregistrement du world model

Ce bloc illustre la structure typique décrite par Kosmos : entité → assertion → provenance (code / littérature). Ce n’est pas le schéma officiel, mais un exemple plausible conforme aux descriptions publiques.

{

"entity": {

"type": "protein",

"id": "SOD2",

"name": "Superoxide Dismutase 2"

"assertion": {

"type": "causaleffect",

"statement": "Elevated circulating SOD2 levels are causally associated with reduced myocardial fibrosis.",

"confidence": 0.78,

"support": [

{

"kind": "dataresult",

"notebookcellid": "nb://run17/cell142",

"metric": "IVW MR beta",

"value": -0.21,

"pvalue": 0.004

{

"kind": "literature",

"sourceid": "doi:10.XXXX/primary.study",

"passage": "Methods §MR: SOD2 instrument selection and fibrosis endpoint"

}

"openquestions": [

"Replication in non-ischemic cardiomyopathy cohorts?",

"Dose-response versus threshold effect?"

]

"relations": [

{"from": "SOD2", "to": "fibrosis", "type": "protectiveeffect"}

"timestamps": {

"createdat": "2025-11-06T02:15: "createdat": "2025-11-06T02:15:00Z",

"updated_at": "2025-11-06T06:40:00Z"

}

Dans Kosmos, de tels enregistrements sont écrits/actualisés à chaque cycle, puis requêtés par la composante de synthèse pour produire le rapport final liant statement → preuve. [deepmind.google], [amazon.com]

8) Conseils d’usage (pour tirer parti du world model)

Formuler clairement l’objectif (open‑ended mais précis) et fournir un dataset initial : Kosmos utilise ces deux éléments comme semence du world model. [deepmind.google]

Normaliser le vocabulaire (ontologie/gene‑symbols/material terms) pour éviter les doublons d’entités et améliorer la recherche/planification. [taylorfrancis.com], [youtube.com]

Exiger la provenance pour toute assertion ; c’est natif, mais c’est aussi votre critère d’acceptation (ne pas valider d’affirmation sans lien code/littérature). [taylorfrancis.com]

9) Limites et points de vigilance

La synthèse multi‑preuves reste l’étape la plus délicate (≈57,9 % d’exactitude), car elle combine plusieurs sources ; prévoir revue humaine et réplication. [taylorfrancis.com], [en.wikipedia.org]

Risque de pistes spurieuses si le world model agrège des signaux faibles ; d’où l’intérêt de garde‑fous (seuils statistiques, pénalités sur p‑hacking, priorisation d’études de meilleure qualité). [en.wikipedia.org], [taylorfrancis.com]

Nécessité d’ontologies et d’ID normalisés (gènes, variants, matériaux) pour éviter la dérive sémantique sur cycles longs. [taylorfrancis.com], [youtube.com]

10) Ce qui le distingue d’un simple knowledge graph ou d’un notebook

Le world model de Kosmos ressemble à un KG scientifique mais il est opérationnel :

Il est alimenté en continu par des agents (code & lecture), pas un import statique ;

Il oriente la planification (proposition de tâches) et la synthèse, pas seulement la recherche d’informations ;

Il impose la provenance exécutable (cellules de code) autant que bibliographique, ce qu’un KG classique n’offre pas par défaut. [deepmind.google], [youtube.com]

Références utiles

Paper arXiv (04–05 nov. 2025) : “Kosmos: An AI Scientist for Autonomous Discovery” (architecture, world model, métriques). [deepmind.google]

Annonce Edison Scientific (05 nov. 2025) & plateforme (modules, cas R\&D). [amazon.com], [gomagic.org]

Analyses média (MarkTechPost, Digit, New Scientist) — chiffres et comparaisons. [taylorfrancis.com], [youtube.com], [en.wikipedia.org]

Si tu veux, je peux te modéliser un petit world model de démo (JSON/YAML) pour ton domaine (ex. cardio‑métabolique) et te montrer comment un agent d’analyse viendrait l’enrichir en 2–3 cycles (avec un notebook “proxy”).

AA: Agentic ai Kosmos

Résume https://youtu.be/M0I5u6kfZgM?si=--22NxnEE3sWAHJB

Cette vidéo, intitulée "Cette IA vient de faire 7 découvertes scientifiques en 1 jour" [00:18], présente Cosmos, un système d'IA agentique développé par Edison Scientific (Future House), et explore son potentiel à révolutionner la recherche scientifique en compressant des mois de travail humain en une seule journée.

Voici un résumé structuré des points clés de la vidéo :

1. Le Problème de la Productivité Scientifique

* Saturation de l'Information : La productivité scientifique mondiale est en déclin car le volume des publications scientifiques explose. Un chercheur humain ne peut physiquement plus lire et absorber la quantité d'articles publiés (on estime qu'il faut 15 minutes pour lire correctement un seul article) [01:20].

* Limitation des Anciens Modèles : Les modèles d'IA précédents, comme Robin de Future House, avaient une "fenêtre de contexte" limitée, limitant la complexité des découvertes qu'ils pouvaient faire [02:05].

2. Cosmos : L'IA Agentique et son "World Model"

Cosmos est présenté comme un système d'IA agentique qui change la donne grâce à son concept de "world model structuré" [02:25].

* Fonctionnement : Cosmos modélise les relations scientifiques (entre molécules, voies biologiques, données cliniques, hypothèses testées) de manière organisée. Il compresse l'information, identifie des schémas (patterns) et les lacunes dans la connaissance [02:57].

* Autonomie et Planification : Un scientifique humain lance une mission de recherche simple (une ou deux lignes) [03:17]. Cosmos prend le relais en tournant de manière autonome pendant 12 à 48 heures, déployant des centaines d'agents en parallèle pour la revue de littérature et l'analyse de données, le tout coordonné par le world model central [03:31].

3. La Compression du Temps et les Performances

* Chiffres Clés : En une seule exécution (run), Cosmos lit en moyenne 1500 articles scientifiques, exécute environ 40 000 lignes de code d'analyse et produit un rapport scientifique complet [03:49].

* Accélération Massive : Des vrais chercheurs ont estimé qu'il leur aurait fallu en moyenne 6,14 mois pour arriver manuellement aux mêmes conclusions qu'un run complet de Cosmos [04:40].

* Loi de Scaling : La productivité de Cosmos s'accélère linéairement avec le temps d'inférence, ce qui pourrait être une des premières lois de scaling (mise à l'échelle) en temps d'inférence pour la recherche scientifique [05:11].

4. Découvertes Concrètes

Cosmos a réalisé sept découvertes majeures, dont quatre complètement inédites [05:40] :

* Reproductions : Il a reproduit des résultats humains existants, comme l'identification d'une perturbation de voie métabolique dans le cerveau de souris hypothermiques (résultat qui n'existait que dans un manuscrit non publié) [05:53] et des règles de connectivité neuronale.

* Nouveautés : Il a trouvé des preuves que des niveaux élevés de l'enzyme SOD2 pourraient réduire la fibrose cardiaque [06:25], a proposé un nouveau mécanisme moléculaire pour réduire le risque de diabète de type 2 [06:33], a construit une méthode pour reconstruire la séquence d'événements menant à l'accumulation de protéines Tau dans la maladie d'Alzheimer [06:45], et a découvert un indice sur pourquoi certains neurones meurent en premier dans l'Alzheimer [06:51].

5. Limitations et Futur

* Précision : Le taux de précision des affirmations dans les rapports de Cosmos est de 79,4 % (ce qui signifie que 20 % ne le sont pas) [07:31].

* Coût et Accessibilité : Cosmos coûte environ 200 $ par run et est un outil de deep research, non un chatbot de conversation. L'interface est encore considérée comme simple (version 1.0/2.0) [07:40].

* L'Amélioration Récursive : La véritable révolution se produira lorsque l'IA sera capable d'accélérer la recherche sur le design de modèles IA et la stratégie d'entraînement elle-même [08:48]. Cela pourrait mener rapidement à l'AGI (Intelligence Artificielle Générale) par auto-amélioration récursive, transformant des décennies de progrès en quelques années [09:04].

Le coût moyen de développement des médicaments pourrait être réduit de 2,6 milliards de dollars à environ 700 millions grâce à l'IA, marquant un véritable moment de bascule [09:46].

Dao to learn

Monday, 15 December 2025

Mixture-of-Experts/Model Merging : KIMI K2 Thinking, Sakana

Distributed vs brut force ai

Sunday, 14 December 2025

FR CXVII: AI attacks France !

État < cc

Liber ai

AA : world model Kosmos

AA: Agentic ai Kosmos

Blog Archive

About Me