Thore Graepel - Analyse des données Facebook et prédictions psychométriques

Thore Graepel

Analyse des données Facebook et prédictions psychométriques

6 janvier 2015

Apprentissage Automatique

Introduction et définition de l'apprentissage automatique

Thore Graepel

Merci beaucoup d'être venus, et bienvenue une fois de plus à notre événement Think Computer Science.

Thore Graepel

Je m'appelle Thore Graepel. Je travaille comme chercheur pour Microsoft Research dans le domaine de l'apprentissage automatique.

Thore Graepel

L'apprentissage automatique est un domaine de l'informatique où nous essayons de permettre aux machines d'apprendre de nouvelles choses à partir de données.

Thore Graepel

C'est par opposition à la simple programmation où nous leur disons exactement ce que nous voulons qu'elles fassent. Dans l'apprentissage automatique, nous essayons de les exposer à des données et de faire en sorte que la machine reconnaisse les régularités dans les données et lui permette de faire des prédictions sur ces données.

Thore Graepel

Et aujourd'hui, je vais parler d'une application de cela, à savoir l'analyse des données Facebook.

Thore Graepel

C'est un travail conjoint avec mes collègues Pushmeet Kohli, Yoram, Michal et David ici.

Aperçu de la présentation et traces numériques

Thore Graepel

Malheureusement, ils ne peuvent pas être là, alors je vais parler en leur nom.

Thore Graepel

Voici ce que nous allons couvrir. Je vais discuter des traces cachées que nous laissons tous dans le monde numérique en faisant des choses en ligne, sur le Web, sur nos téléphones, etc.

Thore Graepel

Je vais parler de la notion de corrélation et de la manière dont la corrélation nous permet de faire des prédictions. Et les choses que nous allons prédire seront des choses comme l'intelligence des gens, leurs traits de personnalité ou leur degré de bonheur.

Thore Graepel

Parce que toutes ces choses peuvent en fait être prédites à votre sujet si vous laissez suffisamment de données sur le Web.

Thore Graepel

J'expliquerai comment nous procédons pour prédire les choses, comment nous construisons un tel algorithme, une méthode qui prend ces données et nous permet ensuite de faire ces prédictions sur les gens.

Thore Graepel

Je vous montrerai ensuite dans quelle mesure nous pouvons prédire les choses. Nous pouvons évaluer la qualité de nos prédictions d'un point de vue statistique.

Thore Graepel

Ensuite, et c'est la partie la plus amusante en fait, nous verrons ce qui est réellement corrélé avec quoi. Si vous êtes très intelligent, qu'est-ce que vous êtes susceptible d'aimer ?

Thore Graepel

Si vous êtes très extraverti, quelles sont les choses que vous n'allez pas aimer, et ainsi de suite.

Thore Graepel

Enfin, nous discuterons des implications pour la vie privée, à savoir : si les gens peuvent faire ces prédictions sur vous, en êtes-vous satisfait ? Est-ce comme sortir nu ? Ou qu'est-ce que c'est ?

Thore Graepel

D'accord.

Thore Graepel

Vos traces cachées dans le monde numérique.

Corrélation et espace de données

Thore Graepel

Il y a deux grandes sources. L'une est les médias sociaux, comme Facebook et Twitter et d'autres services de médias sociaux.

Thore Graepel

Puis-je juste demander qui ici est sur Facebook ? Pouvons-nous lever la main ? Oui, c'est assez populaire. Et Twitter ? Quelqu'un tweete ? Oui, un peu moins populaire, mais quand même pas mal de monde.

Thore Graepel

Évidemment, chaque fois que vous publiez une mise à jour sur Facebook, ou que vous écrivez un tweet, ou que vous aimez quelque chose sur Facebook, ou que vous devenez ami avec quelqu'un, chaque fois une information est recueillie sur vous et plus vous le faites, plus d'informations sont recueillies.

Thore Graepel

Mais il y a d'autres choses. Si vous écoutez de la musique, si vous achetez des livres, si vous achetez d'autres choses, si vous regardez des films en ligne, si vous faites des recherches, toutes ces choses sont enregistrées et s'ajoutent aux pièces du puzzle disponibles comme informations en ligne.

Thore Graepel

Cette conférence porte principalement sur ce qui peut être conclu de ces données.

Thore Graepel

Voici une image qui sera importante pour cette conférence, retenez-la. Vous voyez ce nuage de points ici. Imaginez que chaque personne est un point ici.

Thore Graepel

Dans ce monde, il y a probablement sept ou maintenant huit milliards de ces petits points.

Thore Graepel

L'un de ces points, c'est vous. Et l'idée que nous voulons développer ici est que la position de ce point le long de ces axes, disons cet axe et cet axe et peut-être une troisième dimension, est déterminée par toutes ces petites choses que vous faites en ligne.

Thore Graepel

Les recherches que vous faites, les choses sur lesquelles vous cliquez, les achats que vous effectuez, les morceaux de musique que vous écoutez, les films que vous regardez, etc.

Thore Graepel

Donc pour chacune de ces choses, nous ajoutons une dimension, cela devient un espace de très grande dimension, assez difficile à imaginer, et nous avons cet énorme nuage de points dedans.

Thore Graepel

Et vraiment l'un de ces points est vous et ce sont toutes les connexions que vous pouvez avoir dans ce monde virtuel à travers votre comportement en ligne.

Thore Graepel

Et maintenant, la chose importante à propos de cet énorme nuage de points est que ces points ne sont pas dispersés au hasard dans le monde.

Thore Graepel

Vous pourriez imaginer que tous les différents comportements des gens pourraient être simplement dispersés au hasard, qu'ils pourraient n'avoir aucune corrélation. Mais ils sont en fait fortement corrélés et nous verrons ce que cela signifie dans un instant.

Thore Graepel

Ils ne remplissent pas tout cet espace, mais seulement un sous-espace de dimension inférieure. Et c'est un plan dans ce cas, un peu difficile à voir sur l'écran ici.

Thore Graepel

C'est donc comme une chose de dimension inférieure où les points sont contraints de se trouver sur certaines positions. Et la raison en est que si vous me dites que vous aimez certaines choses, alors je peux vous dire que vous allez probablement aussi aimer d'autres choses.

Thore Graepel

Par exemple, si vous me dites que vous aimez Terminator 1, le film, alors je peux vous dire que vous aimez probablement aussi Terminator 2 ou 3. C'est un exemple simple. Mais c'est le genre de corrélation que nous trouvons.

Potentiel scientifique et commercial

Thore Graepel

Pourquoi voudrions-nous faire cela ? Il y a le potentiel scientifique. Pour la première fois maintenant, nous avons accès au comportement de milliards de personnes.

Thore Graepel

Dans le passé, il y avait des gens qui vaquaient à leurs occupations, achetaient un livre ici ou écoutaient de la musique là-bas, mais personne ne le savait de manière centralisée, il n'y avait pas une seule instance qui connaissait toutes ces choses.

Thore Graepel

Mais maintenant, parce que tout est connecté et que la plupart des choses se passent dans le monde numérique sur le Web, toutes ces informations sont maintenant enregistrées. On peut donc rassembler ces données et connaître toutes ces différentes choses sur les gens, et nous en verrons un exemple.

Thore Graepel

Et ce que cela nous permet de faire, c'est de comprendre comment les choses fonctionnent. Est-ce que les gens qui aiment cette chose particulière aiment aussi cette autre chose ? Cela peut nous donner une compréhension scientifique : comment les gens se ressemblent-ils, comment diffèrent-ils ?

Thore Graepel

Des questions de ce type issues de la psychologie et de la sociologie. Mais il y a aussi un potentiel commercial. Si vous y réfléchissez, un bon système de recommandation, par exemple si vous achetez un livre en ligne et que le système suggère un autre livre lié que d'autres personnes comme vous ont aimé.

Thore Graepel

Alors vous êtes plus susceptible de l'acheter, n'est-ce pas ? Idem pour les jeux vidéo, les vidéos, etc. Il y a donc un grand potentiel commercial à comprendre ce que les utilisateurs veulent, car si nous pouvons le prédire, nous pouvons leur faire de meilleures offres et cela génère des affaires.

Thore Graepel

Ce n'est pas unilatéral, c'est une bonne chose, n'est-ce pas ? Si vous voulez trouver des choses plus intéressantes et que le service en ligne peut vous tell ce que c'est. Nous devons juste trouver le bon équilibre.

Mesures psychométriques : Personnalité et Intelligence

Thore Graepel

Maintenant, afin de développer la compréhension nécessaire, nous devons trouver des explications que nous pouvons comprendre. Et s'il est très difficile de comprendre un espace à 10 000 dimensions de tous les comportements humains, ce que nous pouvons comprendre, ce sont des choses comme la personnalité des gens.

Thore Graepel

Est-ce une personne extravertie ou introvertie, des choses comme ça. L'intelligence des gens, à quel point les gens sont brillants, ou même à quel point ils sont heureux. Ce sont des mesures psychométriques et la science de la psychométrie a développé des méthodes pour mesurer ces choses.

Thore Graepel

Et si nous pouvons relier our données à ce genre d'interprétation, alors il nous sera beaucoup plus facile de comprendre ce qui se passe.

Thore Graepel

D'accord. Alors discutons-en un peu plus. La personnalité. Il existe de nombreuses façons de mesurer la personnalité. Une façon très populaire est ce qu'on appelle les cinq grands traits de personnalité.

Thore Graepel

Ce sont l'ouverture, la conscience professionnelle, l'extraversion, l'amabilité et le névrosisme.

Thore Graepel

Par exemple, l'ouverture est une ouverture intellectuelle. Si vous êtes curieux de tout, si vous voulez découvrir de nouvelles choses et vivre des aventures, alors vous avez un score élevé d'ouverture. Si vous préférez rester à la maison et faire toujours les mêmes choses, alors vous n'êtes pas très ouvert.

Thore Graepel

La conscience professionnelle est liée à l'autodiscipline, au fait d'agir avec application, de s'efforcer d'atteindre certains résultats. Ce que les écoles aimeraient que nous soyons. Pas toutes.

Thore Graepel

Je suis allemand, donc la conscience professionnelle nous est souvent attribuée parce que nous sommes ponctuels. Je peux vous assurer que rien n'est plus faux.

Thore Graepel

Il y a l'extraversion, qui est une chose bien connue, on en parle, n'est-ce pas ? C'est une personne extravertie, il est introverti. Il y a l'amabilité, qui est ce genre de compassion, le fait de penser au bien-être des autres. On peut avoir un score élevé ou bas là-dessus.

Thore Graepel

Et enfin, il y a cette dimension du névrosisme, dont l'opposé est une sorte de stabilité émotionnelle. Je suis sûr que vous avez tous croisé des gens névrosés, n'est-ce pas ? Quelqu'un qui n'a pas croisé de gens névrosés dans sa vie ?

Thore Graepel

Hmm, non, non. C'est ce que je pensais. Parce que ces rencontres sont souvent les plus mémorables. Très peu de gens les oublient.

Thore Graepel

D'accord. Ce sont donc les cinq grands traits de personnalité. Comment sont-ils mesurés ? Puis-je demander qui ici a déjà passé un test de personnalité ?

Thore Graepel

Oui, on lève la main. Oui, donc il y en a quelques-uns. Je vais vous montrer quelques exemples de questions. Par exemple, une question pourrait être : est-il plus difficile pour vous d'utiliser les autres ou de vous identifier aux autres ?

Thore Graepel

Si nous pouvons peut-être avoir un lever de main, est-il plus difficile pour vous d'utiliser les autres ? Quelqu'un ? Se servir des autres, difficile ? Ou de s'identifier aux autres ? Est-ce difficile ?

Thore Graepel

D'accord. Donc différentes personnes répondent différemment parce qu'elles ont des personnalités différentes. Qu'est-ce qui vous gouverne le plus, votre tête ou votre cœur ? La tête ?

Thore Graepel

Le cœur ? Vous voyez, les gens répondent différemment car ils ont des personnalités différentes. Lors de fêtes, restez-vous tard avec une énergie croissante ?

Thore Graepel

Oui, quelqu'un ? Ou partez-vous tôt avec une énergie décroissante ? Ah, oui. Vous voyez, les gens diffèrent.

Thore Graepel

Et donc ici, pour chacune, il y avait deux réponses, il y avait donc huit façons de répondre et cela pourrait déjà pointer vers différents types de personnalité découverts par un tel test.

Thore Graepel

Bien sûr, tout repose sur le fait que les gens répondent honnêtement, n'est-ce pas ? Si quelqu'un voulait projeter l'idée qu'il est extraverti alors qu'il ne l'est pas, il pourrait mentir à ces questions.

Thore Graepel

D'accord, en voici un autre. L'intelligence générale. C'est un point intéressant. Si je vous dis que vous êtes introverti, vous pourriez dire d'accord, il a peut-être tort, mais ce n'est pas offensant.

Thore Graepel

Mais si je vous disais que vous êtes très intelligent, alors vous pourriez être content. L'intelligence a une certaine valeur, c'est donc un sujet un peu plus délicat.

Thore Graepel

Les gens ont développé ce score de QI qui est centré sur 100 et normalisé de telle sorte que la population suit ce genre de courbe en cloche.

Thore Graepel

Cela dit en gros que la plupart des gens ont un QI entre 90 et 110 et qu'il y a moins de personnes avec un score plus élevé ou plus bas.

Thore Graepel

Je ne sais pas si cela correspond à votre expérience quand vous rencontrez des gens : ont-ils tendance à être intelligents ou stupides ?

Thore Graepel

Comment cela est-il mesuré ? Quelqu'un a déjà passé un test d'intelligence ici ? Oui, on lève la main. Voici un exemple.

Thore Graepel

J'espère vraiment que vous ferez mieux que le groupe précédent. Donnez tout ce que vous avez. Voici un élément d'intelligence. C'est un petit élément de test avec neuf formes : de 1 à 8 ; la neuvième manque.

Thore Graepel

Votre tâche est d'identifier la bonne réponse parmi huit. Essayez de voir laquelle de ces choses ici s'insère ici pour que tout cela ait du sens.

Thore Graepel

Déplacez mentalement ce carré ici et demandez-vous si l'image a du sens. Ou déplacez cette chose ici. Laquelle de ces formes devrait être dans le coin inférieur droit ? Des idées ?

Est-ce le numéro cinq ?

Thore Graepel

Vous pensez le numéro cinq ? Voulez-vous expliquer pourquoi ?

Eh bien, chaque forme a une pointe qui va vers le bas, le haut, la gauche et la droite.

Thore Graepel

Droite, gauche, bas, haut. Oui.

Oui. Alors que nous n'en avons aucun qui sort sur les côtés gauche et droit également, et le numéro cinq comblerait ce vide.

Thore Graepel

C'est un argument intéressant. Quelqu'un n'est pas d'accord ? Oui ?

Numéro un.

Thore Graepel

Vous pensez le numéro un ? Pourquoi ?

Je ne sais pas.

Thore Graepel

Juste une intuition ? Vous pensez que c'est celui qui convient le mieux d'une certaine manière, oui ?

Je pense que c'est le un parce que si vous regardez les autres formes, elles ont des carrés noirs là où il y a un autre carré blanc, et dans la forme du bas il n'y a pas d'autres carrés blancs, donc il n'y a qu'un carré blanc et pas de carrés noirs.

Thore Graepel

D'accord, levons la main. Qui pense que le numéro un est la bonne solution ? D'accord, c'est populaire. Qui pense le numéro deux ? Personne.

Thore Graepel

Qui pense le numéro trois ? Personne. Quelqu'un pour le quatre ? Le cinq ? Vous pensez le cinq, oui. Le six ? Un pour le six. Le sept ? Le huit ?

Thore Graepel

D'accord, nous avons des gens pour le 8, le 5 et le 6, la plupart pensaient que c'était le numéro un. Les créateurs du test aussi. Ils auraient pu être stupides, cela ne veut rien dire.

Thore Graepel

Mais cela repose sur une explication particulière. J'ai trouvé votre explication intéressante. La raison, j'imagine, est que ces éléments noirs vont toujours par paires.

Thore Graepel

Et comme il n'y a pas de blocs noirs extérieurs ici, la seule façon de respecter la règle des paires est de mettre celui qui est vide, car la règle tient toujours, alors qu'avec n'importe quel autre, elle serait violée.

Thore Graepel

D'accord. Très bien. Merci à tous pour vos explications. En voici un autre que j'ai toujours trouvé un peu effrayant. Il existe aussi un test de bonheur.

Thore Graepel

C'est un autre test psychométrique. On vous demande à quel point vous êtes d'accord avec ceci : À bien des égards, ma vie est proche de l'idéal. Quelqu'un ?

Thore Graepel

Oui, c'est bien. Je pense que ça l'est probablement si on compare à d'autres conditions de vie. Les conditions de ma vie sont excellentes.

Thore Graepel

Je suis satisfait de ma vie. Bien, j'aime ça. Généralement, vous avez une échelle de sept points pour indiquer votre degré d'accord dans ces tests.

Thore Graepel

Mais le point intéressant est que ces tests sont corrélés à des comportements réels et se sont donc avérés significatifs ; dans un sens, on peut mesurer le bonheur.

Comprendre la corrélation

Thore Graepel

D'accord. Passons à un sujet important : la corrélation. Je l'ai mentionné quand j'ai dit que ces points ne sont pas dispersés au hasard, mais suivent un motif.

Thore Graepel

Je pensais faire une expérience avec vous, mais c'est difficile, j'ai donc créé des données. Ce que nous voyons ici est un diagramme de dispersion.

Thore Graepel

C'est très utile pour visualiser des données, faisable dans Excel. Cet axe représente l'âge en années : 12, 13, 14, 15, 16, 17, 18, etc.

Thore Graepel

L'axe vertical représente la taille en centimètres. Le centimètre est une unité de longueur utilisée en Europe. La connaissez-vous ?

Thore Graepel

Un pouce fait deux centimètres et demi. Que signifie ce graphique ? Chaque point représente une personne.

Thore Graepel

Par exemple, cette personne avait 13 ans et mesurait 145 cm. Celle-ci avait 14 ans et mesurait 155 cm.

Thore Graepel

Que signifie une corrélation ? Une corrélation positive ici signifie qu'il y a une ligne de tendance. Les données ne sont pas aléatoires : quand les gens vieillissent, ils ont tendance à être plus grands.

Thore Graepel

Ils tendent à être plus grands. Ce n'est pas une loi déterministe, il y a des variations individuelles, mais la tendance se vérifie à cause de la croissance.

Thore Graepel

Bien sûr, plus tard, on rapetisse un peu, mais c'est bien après. C'est cela la corrélation, l'âge et la taille.

Thore Graepel

Appliquez cette idée au monde des comportements en ligne. Acheter ce livre ou non, regarder ce film ou non.

Thore Graepel

Tout comme la taille et l'âge, certains de ces comportements sont corrélés ou anti-corrélés (si l'un est haut, l'autre est bas). Voilà ce qu'est la corrélation.

Méthodologie de prédiction et Apprentissage Automatique

Thore Graepel

Si nous revenons à la prédiction, comment procédons-nous ? La clé, ce sont les données.

Thore Graepel

Nous avons besoin de données pour apprendre les dépendances. Nous avons eu la chance d'avoir les données de centaines de milliers de bénévoles (données Facebook + tests psychométriques).

Thore Graepel

Pour chaque volontaire, nous avions la liste de ce qu'il aimait sur Facebook.

Thore Graepel

Vous connaissez le bouton j'aime, pour les films, les équipes de sport ou les commentaires. Tout est enregistré.

Thore Graepel

En sortie, nous avions les résultats aux tests psychométriques. Par exemple, les Big Five (un score de 0 à 10 pour chaque trait).

Thore Graepel

L'intelligence (le QI entre 50 et 150). Le bonheur (une échelle similaire).

Thore Graepel

Avec ces entrées et sorties, on peut apprendre à prédire les unes par les autres. On peut ensuite l'appliquer à n'importe qui nous donne ses j'aime Facebook, qui sont souvent publics.

Thore Graepel

Vérifiez sur votre page si c'est visible pour vos amis ou d'autres. Nous pouvons alors prédire ces choses.

Thore Graepel

La partie de l'ingénierie qui construit ces classificateurs s'appelle l'apprentissage automatique. C'est lié aux statistiques et utilise des méthodes puissantes pour apprendre ces prédicteurs.

Thore Graepel

Entrons un peu dans les détails. Quelqu'un s'intéresse aux maths ici ? D'accord, je vais faire simple.

Thore Graepel

Une matrice est une grille de nombres. Notre point de départ est un tel tableau énorme : 60 000 lignes et 55 000 colonnes.

Thore Graepel

Chaque ligne est un utilisateur, chaque colonne est quelque chose que vous pourriez aimer sur Facebook.

Thore Graepel

Par exemple la philosophie, CNN, BMW, etc. C'est rempli de zéros et de uns. Si l'utilisateur 2 n'aime pas la philosophie, il y aura un zéro.

Thore Graepel

S'il aime CNN, il y aura un un. C'est une matrice de 50 000 par 60 000 remplie de 0 et 1. C'est difficile à gérer.

Thore Graepel

On imagine les utilisateurs comme des points dans un espace à 60 000 dimensions, comme sur cette image.

Thore Graepel

On utilise la décomposition en valeurs singulières pour trouver une structure de dimension inférieure. On voit ici que tout est sur un plan.

Thore Graepel

On peut trouver un nouveau système de coordonnées pour décrire les données de façon plus significative et construire des modèles.

Thore Graepel

Dans cette nouvelle représentation, on a 58 000 utilisateurs, mais seulement 100 nombres par personne. C'est comme une compression, un ADN numérique de ses goûts.

Thore Graepel

Prédire l'intelligence signifie trouver une direction dans cet espace (cette flèche) telle que les points orientés ainsi ont un haut QI.

Thore Graepel

Les points opposés ont un QI bas. Trouver cette flèche est la tâche d'apprentissage à partir des données.

Résultats de l'étude et précision des prédictions

Thore Graepel

Question : dans quelle mesure peut-on prédire ? Une étude a fait l'objet d'une couverture médiatique, je laisse le journaliste vous en parler.

Scarlet Fu

Un point de plus pour le big data. Une étude de Cambridge a analysé les j'aime de 58 000 utilisateurs Facebook et les a comparés à leurs tests de personnalité. Le résultat : des estimations étonnamment précises de la race, de l'âge, des opinions politiques et même de la sexualité.

Scarlet Fu

La précision était la plus basse (60 %) pour prédire si les parents étaient toujours ensemble aux 21 ans de l'utilisateur. Ceux dont les parents avaient divorcé aimaient les statuts sur les relations.

Scarlet Fu

Drogue (65 %), fumeurs (73 %), buveurs (70 %). L'orientation sexuelle était plus facile à distinguer chez les hommes (88 %). Pour les femmes, environ 75 %.

Scarlet Fu

Le sexe, la race, la religion et les opinions politiques ont été prédits avec une grande précision. Par exemple, blanc contre noir : 95 %. Plus vous aimez de choses, plus vous êtes facile à analyser.

Scarlet Fu

La corrélation avec l'âge augmente avec le nombre de j'aime analysés. Idem pour le sexe. Même sans détails personnels sur Facebook, vous informez le monde et les marketeurs.

Scarlet Fu

C'était Off the Charts.

Thore Graepel

D'accord, c'était un bon résumé. Jetons-y un coup d'œil. Ce sont les choses que nous avons tenté de prédire.

Thore Graepel

Plus la barre est longue, plus la prédiction est précise (mesurée par l'aire sous la courbe). Si on a un homme et une femme, quelle est la probabilité que l'algorithme les identifie correctement.

Thore Graepel

Pour le sexe, c'est assez facile. Apparemment, les goûts sur Facebook diffèrent beaucoup selon le sexe. Vous pouvez sans doute le confirmer.

Thore Graepel

On peut identifier les homosexuels. Ce n'est pas une surprise. Si vous aimez un site gay, cela rend plus probable que vous le soyez. Ce sont des corrélations statistiques.

Thore Graepel

On peut identifier les opinions politiques (Démocrates vs Républicains aux États-Unis) avec 85 % de précision.

Thore Graepel

Idem pour la religion, et des effets plus faibles pour la drogue ou le divorce des parents.

Thore Graepel

L'âge peut être assez bien prédit. Les goûts changent avec l'âge, c'est logique.

Thore Graepel

Puis il y a les traits de personnalité : ouverture, conscience professionnelle, extraversion, etc. J'ai dessiné ce cadre rouge.

Thore Graepel

C'est essentiellement la qualité de la prédiction via Facebook comparée à un test en ligne. Pour l'ouverture, c'est presque aussi bon.

Thore Graepel

Pour les autres traits et l'intelligence, on a environ la moitié de la précision d'un test réel.

Thore Graepel

Plus on a de données, plus les prédictions sont précises. Avec deux ou trois j'aime, on ne sait pas qui vous êtes.

Thore Graepel

Mais avec des centaines ou milliers de j'aime, vous êtes ciblé précisément dans cet espace, permettant de prédire beaucoup de choses.

Corrélations spécifiques : Intelligence, Bonheur et Personnalité

Thore Graepel

Voici ma partie préférée. Qu'est-ce qui prédit ces choses ? Que faut-il aimer pour être prédit comme intelligent ?

Thore Graepel

Voici une vidéo d'une émission américaine où l'animateur, Stephen Colbert, discute des résultats. L'émission s'appelle The Colbert Report.

Stephen Colbert

L'étude révèle aussi que les gens avec beaucoup d'amis aiment Jennifer Lopez. Les volontaires avec peu d'amis aiment marcher avec un ami et le pousser au hasard dans quelqu'un ou quelque chose.

Stephen Colbert

Hé, ce n'est pas de leur faute s'ils n'ont pas d'amis. Leurs connaissances se font bousculer au hasard dans le trafic.

Stephen Colbert

Plus important, l'étude révèle ce que vos j'aime disent de votre intelligence. Un QI élevé correspond à aimer Mozart, la science et The Colbert Report.

Thore Graepel

C'est son émission.

Stephen Colbert

Je ne vous en veux pas. Je suis intelligent.

Thore Graepel

Il était fier que l'étude lie son émission à une haute intelligence, même si l'émission de son concurrent y était aussi.

Thore Graepel

Regardons les j'aime. Corrélation avec l'intelligence : haute vs basse. Voici ce qui est associé à une haute intelligence et à une basse intelligence.

Thore Graepel

Voilà pourquoi il était fier. Quelqu'un aime le Seigneur des Anneaux ? C'est génial. La science ? Les orages ? J'adore ça. Ces corrélations ont du sens. Par contre, je ne connais pas les j'aime de l'autre côté.

Thore Graepel

Vous les connaissez ?

Thore Graepel

Oui, c'est une moto. Une chaîne TV est allée voir un concessionnaire Harley Davidson pour lui dire que ses clients étaient associés à un QI bas.

Thore Graepel

C'était étrange, car le concessionnaire près de Cambridge a dit que beaucoup de ses clients étaient professeurs à l'université. Tirez vos conclusions.

Thore Graepel

Plus tard, Stephen Colbert mange des frites bouclées en disant que ça le rendrait plus intelligent. Quel est le problème ?

Il confond corrélation et causalité.

Thore Graepel

Exactement. Ce sont des corrélations. La causalité est quand l'un cause l'autre.

Thore Graepel

Manger des frites ne rend pas plus intelligent, il n'y a aucun mécanisme pour cela.

Thore Graepel

Exemples sur le bonheur : j'aime associés au bonheur vs insatisfaction.

Thore Graepel

Orgueil et Préjugés, religion, figures conservatrices sont liés au bonheur.

Thore Graepel

Pour les insatisfaits : la science (pessimisme ?), l'iPod (solitude ?), le heavy metal (protestation ?).

Thore Graepel

Extraversion vs timidité.

Thore Graepel

Côté actif : danse, mannequinat, théâtre. Côté geek : programmation, JdR, Minecraft. C'est plausible.

Thore Graepel

L'amabilité est liée au christianisme (gentillesse) contre la haine, Nietzsche, l'athéisme, le satanisme et les couteaux.

Thore Graepel

La base du christianisme est l'amabilité dans un sens psychométrique.

Thore Graepel

De l'autre côté : je déteste tout le monde, la police, Nietzsche...

Intéressant : Prada est là. Le film Le Diable s'habille en Prada pointe dans cette direction.

L'analyse montre la précision des prédictions et permet de comprendre cet espace via la psychométrie.

Implications pour la vie privée et conclusion

Dernier point : la vie privée. Voulez-vous qu'on sache ?

Les médias ont titré : vous êtes ce que vous aimez ; Facebook révèle vos secrets en un clic. Le big data apporte une grande responsabilité. Facebook peut être une menace pour la vie privée.

Quelles informations laissé-je sur Facebook ?

Saviez-vous que c'était possible ? Est-ce surprenant ? On s'y habitue, mais la précision reste étonnante.

Changeriez-vous votre comportement ? Vous exposez-vous trop ?

C'est une question ouverte. Utilisez les paramètres de confidentialité. Qui peut voir vos infos ?

Chez Microsoft, on se demande comment utiliser ces infos pour améliorer les services sans être intrusifs.

Réfléchissez à ces questions de vie privée.

Conclusion : nous laissons des tonnes de traces sur le Web. Pensez-y : ces informations sont enregistrées pour toujours.

À cause des corrélations, on peut prédire votre personnalité via vos j'aime, musiques ou livres.

Soyez prudent avec ce que vous révélez. L'apprentissage automatique tire beaucoup de conclusions de vos données.

Merci beaucoup.

Retour aux entretiens de Thore Graepel