Analyse des données Facebook et prédictions psychométriques
6 janvier 2015
Apprentissage Automatique
Introduction et définition de l'apprentissage automatique
Merci beaucoup d'être venus, et bienvenue une fois de plus à notre événement Think Computer Science.
Je m'appelle Thore Graepel. Je travaille comme chercheur pour Microsoft Research dans le domaine de l'apprentissage automatique.
L'apprentissage automatique est un domaine de l'informatique où nous essayons de permettre aux machines d'apprendre de nouvelles choses à partir de données.
C'est par opposition à la simple programmation où nous leur disons exactement ce que nous voulons qu'elles fassent. Dans l'apprentissage automatique, nous essayons de les exposer à des données et de faire en sorte que la machine reconnaisse les régularités dans les données et lui permette de faire des prédictions sur ces données.
Et aujourd'hui, je vais parler d'une application de cela, à savoir l'analyse des données Facebook.
C'est un travail conjoint avec mes collègues Pushmeet Kohli, Yoram, Michal et David ici.
Aperçu de la présentation et traces numériques
Malheureusement, ils ne peuvent pas être là, alors je vais parler en leur nom.
Voici ce que nous allons couvrir. Je vais discuter des traces cachées que nous laissons tous dans le monde numérique en faisant des choses en ligne, sur le Web, sur nos téléphones, etc.
Je vais parler de la notion de corrélation et de la manière dont la corrélation nous permet de faire des prédictions. Et les choses que nous allons prédire seront des choses comme l'intelligence des gens, leurs traits de personnalité ou leur degré de bonheur.
Parce que toutes ces choses peuvent en fait être prédites à votre sujet si vous laissez suffisamment de données sur le Web.
J'expliquerai comment nous procédons pour prédire les choses, comment nous construisons un tel algorithme, une méthode qui prend ces données et nous permet ensuite de faire ces prédictions sur les gens.
Je vous montrerai ensuite dans quelle mesure nous pouvons prédire les choses. Nous pouvons évaluer la qualité de nos prédictions d'un point de vue statistique.
Ensuite, et c'est la partie la plus amusante en fait, nous verrons ce qui est réellement corrélé avec quoi. Si vous êtes très intelligent, qu'est-ce que vous êtes susceptible d'aimer ?
Si vous êtes très extraverti, quelles sont les choses que vous n'allez pas aimer, et ainsi de suite.
Enfin, nous discuterons des implications pour la vie privée, à savoir : si les gens peuvent faire ces prédictions sur vous, en êtes-vous satisfait ? Est-ce comme sortir nu ? Ou qu'est-ce que c'est ?
D'accord.
Vos traces cachées dans le monde numérique.
Corrélation et espace de données
Il y a deux grandes sources. L'une est les médias sociaux, comme Facebook et Twitter et d'autres services de médias sociaux.
Puis-je juste demander qui ici est sur Facebook ? Pouvons-nous lever la main ? Oui, c'est assez populaire. Et Twitter ? Quelqu'un tweete ? Oui, un peu moins populaire, mais quand même pas mal de monde.
Évidemment, chaque fois que vous publiez une mise à jour sur Facebook, ou que vous écrivez un tweet, ou que vous aimez quelque chose sur Facebook, ou que vous devenez ami avec quelqu'un, chaque fois une information est recueillie sur vous et plus vous le faites, plus d'informations sont recueillies.
Mais il y a d'autres choses. Si vous écoutez de la musique, si vous achetez des livres, si vous achetez d'autres choses, si vous regardez des films en ligne, si vous faites des recherches, toutes ces choses sont enregistrées et s'ajoutent aux pièces du puzzle disponibles comme informations en ligne.
Cette conférence porte principalement sur ce qui peut être conclu de ces données.
Voici une image qui sera importante pour cette conférence, retenez-la. Vous voyez ce nuage de points ici. Imaginez que chaque personne est un point ici.
Dans ce monde, il y a probablement sept ou maintenant huit milliards de ces petits points.
L'un de ces points, c'est vous. Et l'idée que nous voulons développer ici est que la position de ce point le long de ces axes, disons cet axe et cet axe et peut-être une troisième dimension, est déterminée par toutes ces petites choses que vous faites en ligne.
Les recherches que vous faites, les choses sur lesquelles vous cliquez, les achats que vous effectuez, les morceaux de musique que vous écoutez, les films que vous regardez, etc.
Donc pour chacune de ces choses, nous ajoutons une dimension, cela devient un espace de très grande dimension, assez difficile à imaginer, et nous avons cet énorme nuage de points dedans.
Et vraiment l'un de ces points est vous et ce sont toutes les connexions que vous pouvez avoir dans ce monde virtuel à travers votre comportement en ligne.
Et maintenant, la chose importante à propos de cet énorme nuage de points est que ces points ne sont pas dispersés au hasard dans le monde.
Vous pourriez imaginer que tous les différents comportements des gens pourraient être simplement dispersés au hasard, qu'ils pourraient n'avoir aucune corrélation. Mais ils sont en fait fortement corrélés et nous verrons ce que cela signifie dans un instant.
Ils ne remplissent pas tout cet espace, mais seulement un sous-espace de dimension inférieure. Et c'est un plan dans ce cas, un peu difficile à voir sur l'écran ici.
C'est donc comme une chose de dimension inférieure où les points sont contraints de se trouver sur certaines positions. Et la raison en est que si vous me dites que vous aimez certaines choses, alors je peux vous dire que vous allez probablement aussi aimer d'autres choses.
Par exemple, si vous me dites que vous aimez Terminator 1, le film, alors je peux vous dire que vous aimez probablement aussi Terminator 2 ou 3. C'est un exemple simple. Mais c'est le genre de corrélation que nous trouvons.
Potentiel scientifique et commercial
Pourquoi voudrions-nous faire cela ? Il y a le potentiel scientifique. Pour la première fois maintenant, nous avons accès au comportement de milliards de personnes.
Dans le passé, il y avait des gens qui vaquaient à leurs occupations, achetaient un livre ici ou écoutaient de la musique là-bas, mais personne ne le savait de manière centralisée, il n'y avait pas une seule instance qui connaissait toutes ces choses.
Mais maintenant, parce que tout est connecté et que la plupart des choses se passent dans le monde numérique sur le Web, toutes ces informations sont maintenant enregistrées. On peut donc rassembler ces données et connaître toutes ces différentes choses sur les gens, et nous en verrons un exemple.
Et ce que cela nous permet de faire, c'est de comprendre comment les choses fonctionnent. Est-ce que les gens qui aiment cette chose particulière aiment aussi cette autre chose ? Cela peut nous donner une compréhension scientifique : comment les gens se ressemblent-ils, comment diffèrent-ils ?
Des questions de ce type issues de la psychologie et de la sociologie. Mais il y a aussi un potentiel commercial. Si vous y réfléchissez, un bon système de recommandation, par exemple si vous achetez un livre en ligne et que le système suggère un autre livre lié que d'autres personnes comme vous ont aimé.
Alors vous êtes plus susceptible de l'acheter, n'est-ce pas ? Idem pour les jeux vidéo, les vidéos, etc. Il y a donc un grand potentiel commercial à comprendre ce que les utilisateurs veulent, car si nous pouvons le prédire, nous pouvons leur faire de meilleures offres et cela génère des affaires.
Ce n'est pas unilatéral, c'est une bonne chose, n'est-ce pas ? Si vous voulez trouver des choses plus intéressantes et que le service en ligne peut vous tell ce que c'est. Nous devons juste trouver le bon équilibre.
Mesures psychométriques : Personnalité et Intelligence
Maintenant, afin de développer la compréhension nécessaire, nous devons trouver des explications que nous pouvons comprendre. Et s'il est très difficile de comprendre un espace à 10 000 dimensions de tous les comportements humains, ce que nous pouvons comprendre, ce sont des choses comme la personnalité des gens.
Est-ce une personne extravertie ou introvertie, des choses comme ça. L'intelligence des gens, à quel point les gens sont brillants, ou même à quel point ils sont heureux. Ce sont des mesures psychométriques et la science de la psychométrie a développé des méthodes pour mesurer ces choses.
Et si nous pouvons relier our données à ce genre d'interprétation, alors il nous sera beaucoup plus facile de comprendre ce qui se passe.
D'accord. Alors discutons-en un peu plus. La personnalité. Il existe de nombreuses façons de mesurer la personnalité. Une façon très populaire est ce qu'on appelle les cinq grands traits de personnalité.
Ce sont l'ouverture, la conscience professionnelle, l'extraversion, l'amabilité et le névrosisme.
Par exemple, l'ouverture est une ouverture intellectuelle. Si vous êtes curieux de tout, si vous voulez découvrir de nouvelles choses et vivre des aventures, alors vous avez un score élevé d'ouverture. Si vous préférez rester à la maison et faire toujours les mêmes choses, alors vous n'êtes pas très ouvert.
La conscience professionnelle est liée à l'autodiscipline, au fait d'agir avec application, de s'efforcer d'atteindre certains résultats. Ce que les écoles aimeraient que nous soyons. Pas toutes.
Je suis allemand, donc la conscience professionnelle nous est souvent attribuée parce que nous sommes ponctuels. Je peux vous assurer que rien n'est plus faux.
Il y a l'extraversion, qui est une chose bien connue, on en parle, n'est-ce pas ? C'est une personne extravertie, il est introverti. Il y a l'amabilité, qui est ce genre de compassion, le fait de penser au bien-être des autres. On peut avoir un score élevé ou bas là-dessus.
Et enfin, il y a cette dimension du névrosisme, dont l'opposé est une sorte de stabilité émotionnelle. Je suis sûr que vous avez tous croisé des gens névrosés, n'est-ce pas ? Quelqu'un qui n'a pas croisé de gens névrosés dans sa vie ?
Hmm, non, non. C'est ce que je pensais. Parce que ces rencontres sont souvent les plus mémorables. Très peu de gens les oublient.
D'accord. Ce sont donc les cinq grands traits de personnalité. Comment sont-ils mesurés ? Puis-je demander qui ici a déjà passé un test de personnalité ?
Oui, on lève la main. Oui, donc il y en a quelques-uns. Je vais vous montrer quelques exemples de questions. Par exemple, une question pourrait être : est-il plus difficile pour vous d'utiliser les autres ou de vous identifier aux autres ?
Si nous pouvons peut-être avoir un lever de main, est-il plus difficile pour vous d'utiliser les autres ? Quelqu'un ? Se servir des autres, difficile ? Ou de s'identifier aux autres ? Est-ce difficile ?
D'accord. Donc différentes personnes répondent différemment parce qu'elles ont des personnalités différentes. Qu'est-ce qui vous gouverne le plus, votre tête ou votre cœur ? La tête ?
Le cœur ? Vous voyez, les gens répondent différemment car ils ont des personnalités différentes. Lors de fêtes, restez-vous tard avec une énergie croissante ?
Oui, quelqu'un ? Ou partez-vous tôt avec une énergie décroissante ? Ah, oui. Vous voyez, les gens diffèrent.
Et donc ici, pour chacune, il y avait deux réponses, il y avait donc huit façons de répondre et cela pourrait déjà pointer vers différents types de personnalité découverts par un tel test.
Bien sûr, tout repose sur le fait que les gens répondent honnêtement, n'est-ce pas ? Si quelqu'un voulait projeter l'idée qu'il est extraverti alors qu'il ne l'est pas, il pourrait mentir à ces questions.
D'accord, en voici un autre. L'intelligence générale. C'est un point intéressant. Si je vous dis que vous êtes introverti, vous pourriez dire d'accord, il a peut-être tort, mais ce n'est pas offensant.
Mais si je vous disais que vous êtes très intelligent, alors vous pourriez être content. L'intelligence a une certaine valeur, c'est donc un sujet un peu plus délicat.
Les gens ont développé ce score de QI qui est centré sur 100 et normalisé de telle sorte que la population suit ce genre de courbe en cloche.
Cela dit en gros que la plupart des gens ont un QI entre 90 et 110 et qu'il y a moins de personnes avec un score plus élevé ou plus bas.
Je ne sais pas si cela correspond à votre expérience quand vous rencontrez des gens : ont-ils tendance à être intelligents ou stupides ?
Comment cela est-il mesuré ? Quelqu'un a déjà passé un test d'intelligence ici ? Oui, on lève la main. Voici un exemple.
J'espère vraiment que vous ferez mieux que le groupe précédent. Donnez tout ce que vous avez. Voici un élément d'intelligence. C'est un petit élément de test avec neuf formes : de 1 à 8 ; la neuvième manque.
Votre tâche est d'identifier la bonne réponse parmi huit. Essayez de voir laquelle de ces choses ici s'insère ici pour que tout cela ait du sens.
Déplacez mentalement ce carré ici et demandez-vous si l'image a du sens. Ou déplacez cette chose ici. Laquelle de ces formes devrait être dans le coin inférieur droit ? Des idées ?
Est-ce le numéro cinq ?
Vous pensez le numéro cinq ? Voulez-vous expliquer pourquoi ?
Eh bien, chaque forme a une pointe qui va vers le bas, le haut, la gauche et la droite.
Droite, gauche, bas, haut. Oui.
Oui. Alors que nous n'en avons aucun qui sort sur les côtés gauche et droit également, et le numéro cinq comblerait ce vide.
C'est un argument intéressant. Quelqu'un n'est pas d'accord ? Oui ?
Numéro un.
Vous pensez le numéro un ? Pourquoi ?
Je ne sais pas.
Juste une intuition ? Vous pensez que c'est celui qui convient le mieux d'une certaine manière, oui ?
Je pense que c'est le un parce que si vous regardez les autres formes, elles ont des carrés noirs là où il y a un autre carré blanc, et dans la forme du bas il n'y a pas d'autres carrés blancs, donc il n'y a qu'un carré blanc et pas de carrés noirs.
D'accord, levons la main. Qui pense que le numéro un est la bonne solution ? D'accord, c'est populaire. Qui pense le numéro deux ? Personne.
Qui pense le numéro trois ? Personne. Quelqu'un pour le quatre ? Le cinq ? Vous pensez le cinq, oui. Le six ? Un pour le six. Le sept ? Le huit ?
D'accord, nous avons des gens pour le 8, le 5 et le 6, la plupart pensaient que c'était le numéro un. Les créateurs du test aussi. Ils auraient pu être stupides, cela ne veut rien dire.
Mais cela repose sur une explication particulière. J'ai trouvé votre explication intéressante. La raison, j'imagine, est que ces éléments noirs vont toujours par paires.
Et comme il n'y a pas de blocs noirs extérieurs ici, la seule façon de respecter la règle des paires est de mettre celui qui est vide, car la règle tient toujours, alors qu'avec n'importe quel autre, elle serait violée.
D'accord. Très bien. Merci à tous pour vos explications. En voici un autre que j'ai toujours trouvé un peu effrayant. Il existe aussi un test de bonheur.
C'est un autre test psychométrique. On vous demande à quel point vous êtes d'accord avec ceci : À bien des égards, ma vie est proche de l'idéal. Quelqu'un ?
Oui, c'est bien. Je pense que ça l'est probablement si on compare à d'autres conditions de vie. Les conditions de ma vie sont excellentes.
Je suis satisfait de ma vie. Bien, j'aime ça. Généralement, vous avez une échelle de sept points pour indiquer votre degré d'accord dans ces tests.
Mais le point intéressant est que ces tests sont corrélés à des comportements réels et se sont donc avérés significatifs ; dans un sens, on peut mesurer le bonheur.
Comprendre la corrélation
D'accord. Passons à un sujet important : la corrélation. Je l'ai mentionné quand j'ai dit que ces points ne sont pas dispersés au hasard, mais suivent un motif.
Je pensais faire une expérience avec vous, mais c'est difficile, j'ai donc créé des données. Ce que nous voyons ici est un diagramme de dispersion.
C'est très utile pour visualiser des données, faisable dans Excel. Cet axe représente l'âge en années : 12, 13, 14, 15, 16, 17, 18, etc.
L'axe vertical représente la taille en centimètres. Le centimètre est une unité de longueur utilisée en Europe. La connaissez-vous ?
Un pouce fait deux centimètres et demi. Que signifie ce graphique ? Chaque point représente une personne.
Par exemple, cette personne avait 13 ans et mesurait 145 cm. Celle-ci avait 14 ans et mesurait 155 cm.
Que signifie une corrélation ? Une corrélation positive ici signifie qu'il y a une ligne de tendance. Les données ne sont pas aléatoires : quand les gens vieillissent, ils ont tendance à être plus grands.
Ils tendent à être plus grands. Ce n'est pas une loi déterministe, il y a des variations individuelles, mais la tendance se vérifie à cause de la croissance.
Bien sûr, plus tard, on rapetisse un peu, mais c'est bien après. C'est cela la corrélation, l'âge et la taille.
Appliquez cette idée au monde des comportements en ligne. Acheter ce livre ou non, regarder ce film ou non.
Tout comme la taille et l'âge, certains de ces comportements sont corrélés ou anti-corrélés (si l'un est haut, l'autre est bas). Voilà ce qu'est la corrélation.
Méthodologie de prédiction et Apprentissage Automatique
Si nous revenons à la prédiction, comment procédons-nous ? La clé, ce sont les données.
Nous avons besoin de données pour apprendre les dépendances. Nous avons eu la chance d'avoir les données de centaines de milliers de bénévoles (données Facebook + tests psychométriques).
Pour chaque volontaire, nous avions la liste de ce qu'il aimait sur Facebook.
Vous connaissez le bouton j'aime, pour les films, les équipes de sport ou les commentaires. Tout est enregistré.
En sortie, nous avions les résultats aux tests psychométriques. Par exemple, les Big Five (un score de 0 à 10 pour chaque trait).
L'intelligence (le QI entre 50 et 150). Le bonheur (une échelle similaire).
Avec ces entrées et sorties, on peut apprendre à prédire les unes par les autres. On peut ensuite l'appliquer à n'importe qui nous donne ses j'aime Facebook, qui sont souvent publics.
Vérifiez sur votre page si c'est visible pour vos amis ou d'autres. Nous pouvons alors prédire ces choses.
La partie de l'ingénierie qui construit ces classificateurs s'appelle l'apprentissage automatique. C'est lié aux statistiques et utilise des méthodes puissantes pour apprendre ces prédicteurs.
Entrons un peu dans les détails. Quelqu'un s'intéresse aux maths ici ? D'accord, je vais faire simple.
Une matrice est une grille de nombres. Notre point de départ est un tel tableau énorme : 60 000 lignes et 55 000 colonnes.
Chaque ligne est un utilisateur, chaque colonne est quelque chose que vous pourriez aimer sur Facebook.
Par exemple la philosophie, CNN, BMW, etc. C'est rempli de zéros et de uns. Si l'utilisateur 2 n'aime pas la philosophie, il y aura un zéro.
S'il aime CNN, il y aura un un. C'est une matrice de 50 000 par 60 000 remplie de 0 et 1. C'est difficile à gérer.
On imagine les utilisateurs comme des points dans un espace à 60 000 dimensions, comme sur cette image.
On utilise la décomposition en valeurs singulières pour trouver une structure de dimension inférieure. On voit ici que tout est sur un plan.
On peut trouver un nouveau système de coordonnées pour décrire les données de façon plus significative et construire des modèles.
Dans cette nouvelle représentation, on a 58 000 utilisateurs, mais seulement 100 nombres par personne. C'est comme une compression, un ADN numérique de ses goûts.
Prédire l'intelligence signifie trouver une direction dans cet espace (cette flèche) telle que les points orientés ainsi ont un haut QI.
Les points opposés ont un QI bas. Trouver cette flèche est la tâche d'apprentissage à partir des données.
Résultats de l'étude et précision des prédictions
Question : dans quelle mesure peut-on prédire ? Une étude a fait l'objet d'une couverture médiatique, je laisse le journaliste vous en parler.
Un point de plus pour le big data. Une étude de Cambridge a analysé les j'aime de 58 000 utilisateurs Facebook et les a comparés à leurs tests de personnalité. Le résultat : des estimations étonnamment précises de la race, de l'âge, des opinions politiques et même de la sexualité.
La précision était la plus basse (60 %) pour prédire si les parents étaient toujours ensemble aux 21 ans de l'utilisateur. Ceux dont les parents avaient divorcé aimaient les statuts sur les relations.
Drogue (65 %), fumeurs (73 %), buveurs (70 %). L'orientation sexuelle était plus facile à distinguer chez les hommes (88 %). Pour les femmes, environ 75 %.
Le sexe, la race, la religion et les opinions politiques ont été prédits avec une grande précision. Par exemple, blanc contre noir : 95 %. Plus vous aimez de choses, plus vous êtes facile à analyser.
La corrélation avec l'âge augmente avec le nombre de j'aime analysés. Idem pour le sexe. Même sans détails personnels sur Facebook, vous informez le monde et les marketeurs.
C'était Off the Charts.
D'accord, c'était un bon résumé. Jetons-y un coup d'œil. Ce sont les choses que nous avons tenté de prédire.
Plus la barre est longue, plus la prédiction est précise (mesurée par l'aire sous la courbe). Si on a un homme et une femme, quelle est la probabilité que l'algorithme les identifie correctement.
Pour le sexe, c'est assez facile. Apparemment, les goûts sur Facebook diffèrent beaucoup selon le sexe. Vous pouvez sans doute le confirmer.
On peut identifier les homosexuels. Ce n'est pas une surprise. Si vous aimez un site gay, cela rend plus probable que vous le soyez. Ce sont des corrélations statistiques.
On peut identifier les opinions politiques (Démocrates vs Républicains aux États-Unis) avec 85 % de précision.
Idem pour la religion, et des effets plus faibles pour la drogue ou le divorce des parents.
L'âge peut être assez bien prédit. Les goûts changent avec l'âge, c'est logique.
Puis il y a les traits de personnalité : ouverture, conscience professionnelle, extraversion, etc. J'ai dessiné ce cadre rouge.
C'est essentiellement la qualité de la prédiction via Facebook comparée à un test en ligne. Pour l'ouverture, c'est presque aussi bon.
Pour les autres traits et l'intelligence, on a environ la moitié de la précision d'un test réel.
Plus on a de données, plus les prédictions sont précises. Avec deux ou trois j'aime, on ne sait pas qui vous êtes.
Mais avec des centaines ou milliers de j'aime, vous êtes ciblé précisément dans cet espace, permettant de prédire beaucoup de choses.
Corrélations spécifiques : Intelligence, Bonheur et Personnalité
Voici ma partie préférée. Qu'est-ce qui prédit ces choses ? Que faut-il aimer pour être prédit comme intelligent ?
Voici une vidéo d'une émission américaine où l'animateur, Stephen Colbert, discute des résultats. L'émission s'appelle The Colbert Report.
L'étude révèle aussi que les gens avec beaucoup d'amis aiment Jennifer Lopez. Les volontaires avec peu d'amis aiment marcher avec un ami et le pousser au hasard dans quelqu'un ou quelque chose.
Hé, ce n'est pas de leur faute s'ils n'ont pas d'amis. Leurs connaissances se font bousculer au hasard dans le trafic.
Plus important, l'étude révèle ce que vos j'aime disent de votre intelligence. Un QI élevé correspond à aimer Mozart, la science et The Colbert Report.
C'est son émission.
Je ne vous en veux pas. Je suis intelligent.
Il était fier que l'étude lie son émission à une haute intelligence, même si l'émission de son concurrent y était aussi.
Regardons les j'aime. Corrélation avec l'intelligence : haute vs basse. Voici ce qui est associé à une haute intelligence et à une basse intelligence.
Voilà pourquoi il était fier. Quelqu'un aime le Seigneur des Anneaux ? C'est génial. La science ? Les orages ? J'adore ça. Ces corrélations ont du sens. Par contre, je ne connais pas les j'aime de l'autre côté.
Vous les connaissez ?
Oui, c'est une moto. Une chaîne TV est allée voir un concessionnaire Harley Davidson pour lui dire que ses clients étaient associés à un QI bas.
C'était étrange, car le concessionnaire près de Cambridge a dit que beaucoup de ses clients étaient professeurs à l'université. Tirez vos conclusions.
Plus tard, Stephen Colbert mange des frites bouclées en disant que ça le rendrait plus intelligent. Quel est le problème ?
Il confond corrélation et causalité.
Exactement. Ce sont des corrélations. La causalité est quand l'un cause l'autre.
Manger des frites ne rend pas plus intelligent, il n'y a aucun mécanisme pour cela.
Exemples sur le bonheur : j'aime associés au bonheur vs insatisfaction.
Orgueil et Préjugés, religion, figures conservatrices sont liés au bonheur.
Pour les insatisfaits : la science (pessimisme ?), l'iPod (solitude ?), le heavy metal (protestation ?).
Extraversion vs timidité.
Côté actif : danse, mannequinat, théâtre. Côté geek : programmation, JdR, Minecraft. C'est plausible.
L'amabilité est liée au christianisme (gentillesse) contre la haine, Nietzsche, l'athéisme, le satanisme et les couteaux.
La base du christianisme est l'amabilité dans un sens psychométrique.
De l'autre côté : je déteste tout le monde, la police, Nietzsche...
Intéressant : Prada est là. Le film Le Diable s'habille en Prada pointe dans cette direction.
L'analyse montre la précision des prédictions et permet de comprendre cet espace via la psychométrie.
Implications pour la vie privée et conclusion
Dernier point : la vie privée. Voulez-vous qu'on sache ?
Les médias ont titré : vous êtes ce que vous aimez ; Facebook révèle vos secrets en un clic. Le big data apporte une grande responsabilité. Facebook peut être une menace pour la vie privée.
Quelles informations laissé-je sur Facebook ?
Saviez-vous que c'était possible ? Est-ce surprenant ? On s'y habitue, mais la précision reste étonnante.
Changeriez-vous votre comportement ? Vous exposez-vous trop ?
C'est une question ouverte. Utilisez les paramètres de confidentialité. Qui peut voir vos infos ?
Chez Microsoft, on se demande comment utiliser ces infos pour améliorer les services sans être intrusifs.
Réfléchissez à ces questions de vie privée.
Conclusion : nous laissons des tonnes de traces sur le Web. Pensez-y : ces informations sont enregistrées pour toujours.
À cause des corrélations, on peut prédire votre personnalité via vos j'aime, musiques ou livres.
Soyez prudent avec ce que vous révélez. L'apprentissage automatique tire beaucoup de conclusions de vos données.
Merci beaucoup.