cerveau_inter_1.indd - page 27

61
Le c3rv34u statisticien
accompagnées d’images d’espèces animales pour-
tant dépourvues de toute familiarité, suffisent à
inférer quels animaux sont des « tufa » et lesquels
ne le sont pas
Figure 10
. Tenenbaummontre que cette
observation peut être modélisée dans le cadre
bayésien en supposant que le cerveau de l’enfant
organise le monde perceptif sous la forme d’un
arbre d’hypothèses, chacune attribuant au mot
une catégorie sémantique plus ou moins vaste. Les
statistiques bayésiennes attribuent automatique-
ment une vraisemblance plus faible aux catégories
sémantiques les plus vastes. Le modèle converge
alors en deux ou trois exemples : il attribue la
plausibilité la plus forte au sens correct du mot et
la généralisation s’applique alors sans faute à des
images nouvelles.
L’APPRENTISSAGE
DE RÉGULARITÉS
ABSTRAITES
Les modèles bayésiens hiérarchiques pos-
sèdent une propriété intéressante que Tenenbaum
appelle « bénédiction de l’abstraction » (
blessing
of abstraction
) : l’apprentissage est souvent très
rapide au niveau le plus élevé, celui qui concerne
les principes mêmes d’organisation d’un domaine,
car chaque observation nouvelle contribue à
sélectionner le modèle le plus pertinent des don-
nées, et celui-ci se généralise à toutes les observa-
tions nouvelles. Cette propriété s’apparente à ce
que l’on appelle « le transfert d’apprentissage » ou
« apprendre à apprendre » – propriété absolument
essentielle du cerveau humain.
Pour reprendre un exemple dû au cogniti-
cien Nelson Goodman, supposons que l’on tire d’un
sac une unique balle bleue. Que peut-on en conclure
sur les tirages suivants ? La réponse semble évi-
dente : rien ! Et pourtant… imaginez que dans le
passé, vous ayez systématiquement découvert que
chaque sac contient des billes d’une seule couleur.
En généralisant cette connaissance au nouveau
sac, vous pouvez avoir la quasi-certitude que toutes
les balles suivantes seront bleues.
Et pourtant, avant même de savoir parler, dès qu’il
entend un mot une fois ou deux, l’enfant parvient à
s’en approprier le sens.
L’hypothèse que le cerveau du bébé agit
comme un statisticien explique de nombreux
aspects de cet apprentissage. Tout d’abord, l’enfant
segmente les mots du flux continu de parole en
accumulant des statistiques sur la fréquence des
syllabes et de leurs transitions. Une expérience
classique présente aux enfants un flux continu et
régulier de syllabes sans signification /tokibugiko-
bagopilatipolutokibu…/ Après quelques minutes, le
cerveau de l’enfant détecte que ce flux est composé
de quatre mots de trois syllabes : tokibu, gikoba,
gopila et tipolu. Cet apprentissage s’appuie sur
la mesure des statistiques de passage d’une syl-
labe à la suivante. Au sein d’un mot, les syllabes
s’enchaînent de façon reproductible (dans notre
exemple,
to
est toujours suivi de
ki
et de
bu
). En
revanche, d’un mot à l’autre, la probabilité qu’une
syllabe suive une autre est beaucoup plus faible, car
les mots ne se suivent pas toujours dans le même
ordre. Le cerveau de l’enfant fait donc l’hypothèse
que les syllabes qui se suivent avec une probabilité
très élevée forment des mots.
L’enfant repère également les mots gram-
maticaux parce que leur fréquence est plus élevée
que les autres. En les extrayant, le cerveau génère
automatiquement de nouvelles hypothèses sur les
mots restants. Par exemple, après avoir découvert
que la syllabe « le » est souvent un mot grammati-
cal, le cerveau fait l’hypothèse que /lebato/ doit être
segmenté en /le/ + / bato/, et que ce dernier est un
mot, sans doute un nom.
L’informaticien et cogniticien américain
Josh Tenenbaum propose un modèle explicite des
statistiques qui permettent d’apprendre le sens
d’un nom. Comment un enfant infère-t-il s’il fait
référence à une instance particulière (ce chien-ci,
Médor) ou à une catégorie sémantique plus ou
moins étendue (« basset », « chien », « mammifère »,
« animal ») ? L’expérience montre que l’induction
est très rapide : trois instances du mot « tufa »,
1...,17,18,19,20,21,22,23,24,25,26 28,29,30,31,32,33,34,35,36,37,...43
Powered by FlippingBook