Ok

En poursuivant votre navigation sur ce site, vous acceptez l'utilisation de cookies. Ces derniers assurent le bon fonctionnement de nos services. En savoir plus.

20/01/2012

Le cerveau Bayésien, c'est Jack Bauer.

"- Alors, Jack, cette réponse ?

- Je vous demande une minute, M. le Président

- Il me faut une solution maintenant Jack : dois-je décider d'annuler la frappe nucléaire en cours ?

- Juste une minute M. le Président, et je vous donne la solution définitive."

 

Le paradigme Bayésien (dont je vous ai parlé il y a peu) s'infiltre dans les sciences cognitives comme l'eau d'Evian dans les couches granitiques : il aura fallu quelques milliers d'années, mais un jour ou l'autre, ça vient à la surface. Le problème avec les (nouveaux) paradigmes, c'est qu'ils méritent un peu d'explication. Dont acte.

multicolor.jpgImaginez qu'on vous présente un sac de billes. Vous avez (entre autres) la notion de contenant/contenu, et votre outil personnel de reconnaissance de forme vous permet de deviner qu'il y a dans ce sac souple des objets arrondis : dès la première fraction de seconde, votre cerveau s'est emparé de cette vision pour la remâcher à sa guise ; mais oublions un instant ce travail réalisé en tâche de fond pour nous concentrer sur les événements et votre réaction intellectuelle.

La personne qui gère le test plonge alors une main dans le sac et en ressort une bille rouge, qu'elle pose à côté du sac. Vous êtes brièvement absorbé par la vision de cette bille rouge, que vous dépiautez rapidement en taille, couleur, brillance, texture, poids apparent et quelques autres facteurs. La personne plonge à nouveau la main dans le sac, et en sort une deuxième bille rouge, apparemment semblable en tous points à la première, qu'elle pose également. Vous notez également cette bille rouge. La personne recommence, et sort une troisième bille rouge.

A ce moment du test, on est tenté de comparer le fonctionnement des probabilités classique d'une part et  bayésienne de l'autre. La probabilité classique indique que la probabilité de tirer à nouveau un bille rouge est de 3/3=100%, donc une certitude totale. L'inférence bayésienne, elle, va plutôt dire que cette probabilité est "très élevée", nous y reviendrons. 

multicolor2.jpgLa personne pousse alors sur le côté le sac et les billes rouges, et vous présente un deuxième sac, très semblable au premier. Instantanément, vous envisagez qu'il s'agit d'un deuxième sac de billes rouges. La personne plonge sa main dans le sac, et tire une bille bleue. A ce moment du test, la logique bayésienne est perdue : ce résultat infirme la supposition qui vient d'être faite, et induit un véritable trouble. La logique classique, elle, n'est en rien gênée, et considère que la probabilité de tirer à nouveau une bille rouge est de 3/4=75%. Disons momentanément qu'il y a avantage à la logique classique, car toute solution proposée, même erronée, est considérée comme meilleure que pas de solution du tout.

La personne tire alors une deuxième bille : bleue également. Votre cerveau bayésien fonctionne alors furieusement, et génère ou accède un certain nombre de modèles : le modèle "sac de billes", le modèle "sac de billes de la même couleur", le modèle "ensemble de sacs de billes d'une même couleur mais de couleurs différentes" : ces modèles vous permettent de calculer que la probabilité bayésienne que la prochaine bille soit bleue est très élevée ; en revanche, le modèle classique dit toujours que la prochaine bille sera rouge, avec une probilité de 3/5=60%. Notez bien que ces deux calculs contradictoires cohabitent en vous, et que ça ne vous pose aucun problème. L'aide au test plonge une troisième fois la main, et la troisième bille est bleue : la partie bayésienne en vous exulte, mais elle ne se borne pas à cela : non seulement elle accorde un satisfecit supplémentaire à l'étagement de modèles décrit ci-dessus (on aurait dit "+1" chez FaceBook :)), car il a correctement permis de prédire un événement, mais en plus les divers mécanismes qui ont conduit à la création desdits modèles, eux aussi, reçoivent un +1. L'aspect exultation est géré par un minuscule mais notable afflux d'endorphines : la notion de plaisir est indispensable au cerveau bayésien.

multicolor3.jpgArrive un troisième sac. Votre cerveau classique prévoit que l'on va tirer une bille rouge, ou une bille bleue, avec des probabilités égales de 50%. Votre cerveau bayésien ne prévoit rien du tout, et signale qu'il est urgent d'attendre, car il va proposer une solution à haute probabilité ; à cet instant précis, si votre cerveau était contraint de choisir une solution, il ne disposerait que de la solution classique.

La main plonge dans le sac, et en tire une bille jaune. Instantanément, votre cerveau bayésien annonce : "C'est un sac de billes jaunes !" en précisant que cette prédiction est affectée d'une haute probabilité. L'aide plonge à nouveau la main dans le sac et ressort une bille... jaune. Votre cerveau bayésien exulte à nouveau, et accorde tout un tas de "+1" aux mécanismes ci-dessus, ainsi qu'au mécanisme qui préconise de ne pas faire de prédictions dans certaines circonstances. Votre cerveau classique, lui, s'est pris une tannée ; mais il s'en fout complètement, car lui n'a pas de mécanisme de "+1" ou "-1", pas de libération d'endorphine, rien : le cerveau classique, c'est froid, c'est simple, c'est rapide, mais c'est pas prêt de changer, c'est un week-end au Havre.

Le cerveau bayésien est bien plus aléatoire : on a vu qu'en deux moments, il est incapable de fournir une solution. En revanche, quand il frappe, il frappe juste. C'est que lui, à la différence du cerveau classique, est capable d'apprendre : dans cette expérience, il a appris (ou invoqué s'il la connaissait déjà) la notion de sac de billes, qu'il a ensuite correctement appliquée pour prédire l'avenir. Prédire l'avenir est l'essence de la compréhension, terme qui convient mal à la pensée classique. Le cortex bayésien est exigeant en moyen de traitement de l'information : on a vu que pour sortir une prédiction valable, il a fallu découvrir et stocker la notion de sac, la notion de sac de billes de même couleur, et sans doute bien d'autres éléments qui n'apparaissent pas ici ; tout cela est exécuté en "tâche de fond" comme disent les informaticiens, ce qui n'obère donc pas la pensée consciente, mais exige des moyens de calcul et de stockage de l'information démesurés par rapport à la logique non bayésienne ; on peut donc suspecter toute créature équipée d'un cerveau anormalement développé pour sa taille d'en avoir les capacités.

Cette exigeance en matière de moyens de calcul n'est pas la seule faiblesse du cerveau bayésien, loin de là. Comme il a une énorme capacité à employer l'inférence "sachant que", il va, dans le doute, chercher furieusement tous les événements passés qui pourraient avoir une relation avec la question posée ; notons qu'à chaque fois qu'il infère sur un événement passé, il va augmenter ou diminuer la valeur de la probabilité annoncée ; il va également retarder le moment de rendre son verdict. C'est pour cette raison qu'un cerveau bayésien annonce des probabilités de survenance "molles", car résultat d'un nombre éventuellement élevé de calculs d'inférence. Le cerveau bayésien propose donc rarement des solutions absolument sûres, il se contente fréquemment de "raisonnablement sûr". On peut même imaginer que, au bout d'un certain nombre d'inférences, si le résultat atteint une valeur supérieure à un seuil donné (caractéristique de l'individu), il arrête ses calculs et offre sa réponse.

S'il ne trouve rien de déterminant, il va empiler les échecs de ses recherches pour aboutir à une plausibilité très faible de sa réponse : il fait de l'auto-censure, situation extrêmement grave pour un décisionnaire. Mais ce n'est pas tout : s'il manque de clairvoyance (entendez : capacité à reconnaître si telle ou telle bribe de connaissance a vraiment un rapport avec le sujet), il ne saura jamais trouver la bonne solution, alors même que le cerveau voisin, doté des mêmes souvenirs, mais ayant mieux géré les attributs, saura rapidement élaguer l'information inutile, et saura donc aboutir à une réponse plus plausible, et plus vite. Bayésien c'est puissant, mais c'est difficile à régler : c'est une après-midi en Ferrari. Enfin il y a d'autres soucis attachés à cette méthode, dont nous parlerons... plus tard :).

bauer-phone.jpgAinsi le cortex bayésien montre à la fois sa performance, et ses faiblesses : alors que le cerveau classique fournit des réponses en toute circonstance, avec une adéquation à la réalité de qualité très variable, le cerveau bayésien est parfois incapable de fournir une réponse, ce qui est grave ; ce point à lui seul explique pourquoi le cerveau au cours des âges a conservé la logique classique, sur laquelle il peut se rabattre en cas de défaillance du bayésien. En revanche, l'adéquation des réponses du bayésien à la réalité, quand il en fournit, est meilleure ; mieux encore, il est fréquemment capable de se noter lui-même, c'est-à-dire d'attribuer une plausibilité à sa propre prédiction. Enfin il est capable de conseiller, et même de proposer une action en vue d'augmenter la plausibilité de ses déductions. Le cerveau bayésien, c'est Jack Bauer, y compris le téléphone portable.

Plus d'info sur Wikipedia :

Inférence bayésiennethéorème de Bayes.

NB : Marble bags courtesy of Flowerpress.

11/01/2012

Le paradigme bayésien, c'est Bob Morane

Chaque époque propose son nouveau paradigme : le monothéisme d'Akhenaton, les républiques en Europe au 19e siècle, le vote des femmes au 20e, le planning familial après 68, les paradigmes, grands ou petits, cristallisent une tendance autour d'une idée nouvelle. Cette notion de paradigme s'est tellement banalisée à une époque où ce qui était vrai hier ne le sera plus demain, que tout devient paradigme : les pantalons patte d'eph', le mariage des medias et du pouvoir, les lunettes de soleil à grands carreaux et l'endettement des états.

Il en est un qui fait son chemin tranquillement, venu du domaine scientifique, il semble avoir plus d'avenir immédiat que la théorie du Chaos ou celle des super-cordes, c'est le paradigme bayésien. Comme aurait dit Sophie Daumier, pourtant, il en a mis du temps à percer notre Thomas Bayes. Né vers 1701, il s'est surtout rendu célèbre pour son théorème concernant les probabilités. Nous avons l'habitude de penser en termes de probabilités quand nous tirons les dès : chacun sait que l'on a une chance sur six de tirer un six. Plus généralement, quand on connaît le système qui génère un nombre aléatoire, on saura évaluer sa probabilité.

Mais dans la vie de tous les jours, on ne connaît jamais les règles qui génèrent les observations, et les informations que nous détenons sur tel ou tel processus sont généralement parcellaires : nous constatons les résultats, et encore, quelques-uns seulement, et nous n'avons pas accès à la théorie. Le paradigme bayésien consiste donc à faire le contraire des probabilités classiques : à partir des résultats, tentons de reconstituer un modèle de ce que doit être la réalité, qui soit compatible avec les résultats observés, et qui nous permettra ainsi des prédictions.

Le principe semble simple, presque évident : pourquoi ne l'avons-nous jamais appliqué jusqu'à maintenant ? Tout simplement parce que, si le système auquel on s'intéresse est suffisamment vaste et/ou complexe, il faut un "grand" nombre d'observations pour générer un modèle digne de ce nom. Grand peut signifier de mille à un million ; il faut donc des moyens de mesure considérables, et donc coûteux. Mais ce n'est pas tout : à partir d'un million de mesures, on peut générer des milliers de modèles, qui, chacun, devront être testés pour identifier le meilleur d'entre eux : il faut donc des capacités de calcul monstrueuses.

C'est là qu'entre en scène l'informatique moderne : nos moyens de calcul massivement parallèles désormais accessibles à tous les chercheurs sérieux offrent un moyen implacable de création desdits modèles, et nous allons donc en retrouver partout.

Et pourquoi une méthode aussi alambiquée ? N'est-il pas plus simple d'accoucher d'une belle équation bien limpide genre E=mc², à l'ancienne ? C'est quand même plus efficace, non ?

Certes. Mais rappelons d'abord que celle-ci a nécessité l'intervention d'un authentique génie, d'un calibre que nous n'avons pas reproduit depuis. La résolution de nombreux problèmes modernes se heurte à des équations trop nombreuses, à l'irrésolution d'équations différentielles, au manque d'avancement des mathématiques ou pire, à notre faiblesse intellectuelle.

Face à toutes ces difficultés, il est bien plus facile et efficace d'enregistrer une palanquée de données, de les transformer en modèle mathématique, et d'exploiter celui-ci. Facile, pas cher, ça peut rapporter gros. Les modèles s'appliquent à tout, au point qu'un chercheur a défini l'Univers comme le plus petit modèle capable de simuler le comportement de... l'Univers.

Les systèmes complexes autour de nous sont légion : rien qu'en SVT il n'y a que ça, dans le comportement d'un groupe humain aussi, dans le codage des pixels je n'en parle même pas... Partout.

Ces modèles ont juste un petit problème : constitués d'un ensemble énorme d'équations que l'utilisateur n'a guère envie de regarder en détail, ils interdisent l'accès à une unique équation simple, exacte et descriptive du phénomène telle que mentionné plus haut, si tant est qu'elle existât : si les Babyloniens avaient eu des ordinateurs, ils auraient découvert la gravitation universelle, mais sans jamais connaître l'équation de Newton. Or c'est bien la maîtrise de ces équations qui a généré l'essentiel de nos avancées scientifiques depuis 400 ans. Nous continuons d'avancer, mais dans un flou croissant.

Et voilà que cette mode attaque l'homme : on ne compte déjà plus les papiers scientifiques qui cherchent à mettre en évidence les capacités bayésiennes du cortex humain, fournissant ainsi une explication à certaines capacités étonnantes de celui-ci, particulièrement dans le domaine des probabilités. O tempora, o mores, ce sont maintenant des matheux graves qui s'occupent de psychologie.

Comme on dit traditionnellement, il est un peu tôt pour dire ce qu'il en sortira, mais je suis assez confiant. Attendez-vous à retrouver des "optimisations bayésiennes" avec chaînes de Markov et recuit simulé dans votre appreil photo, votre réseau de distribution ErdF, votre sondage ifop et votre bombe de rasage. Le paradigme bayésien, le nouveau Bob Morane.

Bob Morane, contre tout chacal, l'aventurier contre tout guerrier.

12:51 Publié dans Futur, Science, Société | Lien permanent | Commentaires (0) | |  del.icio.us | | Digg! Digg |  Facebook |

13/12/2011

Le plafond de verre de l'humanité

Le boson de Higgs : comme on nous rebat les oreilles de cette particule, qui n'existe peut-être que dans les imaginations inquiètes de quelques chercheurs. D'où sort-elle en effet ? Le dix-neuvième siècle fut un havre de paix et d'ordre pour les physiciens, qui en appliquant toujours les mêmes recettes simples (un champ dérive d'un potentiel), firent une collection impressionnante de découvertes fondamentales sur le dos desquelles nous vivons aujourd'hui.

Puis vint hélas l'année 1900, qui voit Max Planck asséner un coup de marteau dans toute cette facilité scientifique avec sa théorie des quanta, aux termes de laquelle, entre autres, à la fois l'énergie et la matière deviennent discontinues, théorie plus que confirmée par la relativité en 1905.

Depuis cette date, nous sommes contraints de réconcilier cette discontinuité de la matière avec l'apparente continuité que nos sens - et les simples théories de champ - lui confèrent ; et cette réconciliation nous échappe depuis un siècle, alors que nous en connaissons tous les termes, un peu comme la résolution du conflit israélo-palestinien. 

Nous cherchons depuis un siècle ? Et alors me direz-vous, la belle affaire, la découverte de la roue a bien dû prendre quelques millénaires à nos ancêtres ! Certes, mais dans ses premières années, homo sapiens était bien plus occupé à exterminer ses prédateurs qu'à creuser la physique fondamentale, et les chiffres nous indiquent que 99% des chercheurs que l'espèce humaine a connus dans toute son histoire étaient au travail dans le cours du 20e siècle. Et on n'a rien trouvé ?

Rien, c'est beaucoup dire. On a identifié une douzaine de particules (pourquoi douze ?), émis quelques notions fondamentales (la symétrie, c'est une découverte, eh oui), proposé une collection impressionnante de théories possibles (les cordes, les super-cordes, les membranes, de quoi se tordre) dont nous n'avons confirmé aucune. Au passage, les applications pratiques de tout ce travail se comptent sur les doigts de la main. Et l'électronique, c'est pas du pur vingtième ça ? Hélas, trois fois hélas, l'électron fut théorisé en 1874, puis mis en évidence en 1897. Et les nombres complexes, bien pratiques pour théoriser l'électronique ? Les Italiens de la belle époque -16e siècle.

Quand Homo Sapiens fut conçu, on lui donna un avantage compétitif monstrueux par rapport à ses voisins : un cerveau surdimensionné, presque surabondant, qui l'a conduit essentiellement à détruire son environnement, dont il dépend en totalité, à grande vitesse. Il n'a jamais été écrit que ce cerveau serait suffisant pour se mesurer à l'univers lui-même. Et pourquoi pas casser l'univers pendant qu'on y est ?

Toute ressource naturelle a ses limites, il n'est pas exclu que nous ayons mis en évidence celles de l'esprit humain. Einstein avait déjà condamné l'espèce humaine au génie de la découverte : en ordonnant que rien ne pouvait dépasser la vitesse de la lumière, il nous interdisait à jamais les voyages interstellaires, dont la longueur excède désormais non seulement une vie humaine, mais carrément la durée de vie de l'espèce. Nous n'avions qu'un moyen de quitter notre petite planète : la force de l'esprit.

Et voilà que celui-ci nous trahit, et le communiqué de presse du CERN, nous disant qu'on est "très confiant en l'avenir" ressemble à des millions de mails, envoyés par des commerciaux à leurs patrons, déguisant un échec cuisant, ou pire encore, l'énième échec d'une liste sans fin. Nous ne trouvons pas. Soulignons que le LHC est un effort mondial qui a concentré les énergies de la quasi-totalité des chercheurs mondiaux (les américains ont abandonné leur propre projet), sans parler des ressources financières. Ca vous rappelle ITER ?

Alors où est le problème ? Notre capacité d'abstraction est peut-être en cause. Déjà, la discontinuité de la matière, les quatre dimensions, l'univers fini-infini, le surgissement absurde d'une énergie infinie qui précède les lois pour la régir, tout cela est choquant pour nos esprits. Mais découvrir des conceptions plus abstraites encore, c'est-à-dire plus éloignées de notre façon de penser et d'imaginer, est-ce trop nous demander ?

La fin du 19e siècle avait généré une tripotée de génies, qui semblent être le seul moyen de tirer la science vers le haut. Nous ignorons pourquoi. Nous ignorons comment fabriquer un génie. En fait, nous ignorons tout de notre propre façon de penser. Nous ne résoudrons pas notre problème sans améliorer notre capacité à l'abstraction de façon massive. Sinon, ce sera le plafond de verre de l'humanité.

Cauda : à la fois Max Planck et Albert Einstein furent horrifiés des conclusions de leurs découvertes, qui contredisaient brutalement leur conception du monde - disons leurs croyances. Quand Einstein disait "Dieu ne joue pas aux dés avec l'univers", c'était par dépit.