Sundar Pichai

Google I/O 2017 : Passer du Mobile-First à l'IA-First

17 mai 2017

Technologie
Illustration de Sundar Pichai

Introduction et Bienvenue

Sundar Pichai

Bonjour. Bienvenue à Google I/O.

Sundar Pichai

Je vous aime aussi. Je n'arrive pas à croire que cela fait déjà un an. C'est une belle journée. Nous sommes rejoints par plus de 7 000 personnes et nous diffusons cela en direct comme toujours à plus de 400 événements dans 85 pays.

Sundar Pichai

L'année dernière était la 10ème année depuis le début de Google I/O et nous l'avons donc rapprochée de chez nous à Shoreline, là où tout a commencé. Ça semble s'être bien passé. J'ai vérifié l'article Wikipédia de l'année dernière. Il y avait quelques mentions de coups de soleil, nous avons donc beaucoup de crème solaire tout autour. C'est pour nous. Utilisez-la généreusement.

L'Échelle des Produits Google

Sundar Pichai

L'année a été très chargée depuis l'an dernier, pas différente de mes 13 années chez Google. C'est parce que nous nous sommes concentrés de plus en plus sur notre mission principale d'organiser l'information mondiale et nous le faisons pour tout le monde, et nous l'abordons en appliquant l'informatique de pointe et des connaissances techniques pour résoudre des problèmes à grande échelle.

Sundar Pichai

Cette approche nous a très, très bien servis. C'est ce qui nous a permis de porter sept de nos produits et plateformes les plus importants à plus d'un milliard d'utilisateurs actifs mensuels chacun. Et ce n'est pas seulement l'échelle à laquelle ces produits fonctionnent, les utilisateurs s'y engagent très fortement.

Sundar Pichai

YouTube ne compte pas seulement plus d'un milliard d'utilisateurs, mais chaque jour, les utilisateurs regardent plus d'un milliard d'heures de vidéos sur YouTube. Google Maps, chaque jour, les utilisateurs parcourent plus d'un milliard de kilomètres avec Google Maps. L'échelle est donc inspirante à voir et il y a d'autres produits qui s'approchent de cette échelle.

Sundar Pichai

Nous avons lancé Google Drive il y a cinq ans et aujourd'hui il compte plus de 800 millions d'utilisateurs actifs mensuels et chaque semaine, plus de trois milliards d'objets sont téléchargés sur Google Drive. Il y a deux ans à Google I/O, nous avons lancé Photos comme moyen d'organiser les photos des utilisateurs grâce à l'apprentissage automatique et aujourd'hui nous avons plus de 500 millions d'utilisateurs actifs et chaque jour, les utilisateurs téléchargent 1,2 milliard de photos sur Google.

Sundar Pichai

L'échelle de ces produits est donc incroyable, mais ils progressent encore tous vers Android, dont je suis ravi d'annoncer que dès cette semaine, nous avons dépassé les deux milliards d'appareils actifs sous Android. Comme vous pouvez le voir, le robot est assez content lui aussi derrière moi, c'est donc un privilège de servir les utilisateurs à cette échelle et tout cela est dû à la croissance du mobile et des smartphones.

Le Passage à l'IA-First

Sundar Pichai

Mais l'informatique évolue à nouveau. Nous avons parlé l'année dernière de ce changement important dans l'informatique, passant d'une approche privilégiant le mobile à une approche privilégiant l'IA. Le mobile nous a obligés à réimaginer chaque produit sur lequel nous travaillions. Nous devions tenir compte du fait que le modèle d'interaction de l'utilisateur avait fondamentalement changé avec le multi-touch, la localisation, l'identité, les paiements, et ainsi de suite.

Sundar Pichai

De même, dans un monde privilégiant l'IA, nous repensons tous nos produits et appliquons l'apprentissage automatique et l'IA pour résoudre les problèmes des utilisateurs. Et nous le faisons pour chacun de nos produits. Ainsi, aujourd'hui, si vous utilisez la recherche Google, nous classons différemment grâce à l'apprentissage automatique. Ou si vous utilisez Google Maps, Street View reconnaît automatiquement les enseignes de restaurants, les panneaux de signalisation grâce à l'apprentissage automatique.

Sundar Pichai

Duo avec les appels vidéo utilise l'apprentissage automatique pour les situations de faible bande passante et Smart Reply dans Allo l'année dernière a eu un excellent accueil et donc aujourd'hui nous sommes ravis de déployer Smart Reply pour plus d'un milliard d'utilisateurs de Gmail. Cela fonctionne vraiment bien. Voici un exemple d'e-mail. Si vous recevez un e-mail comme celui-ci, les systèmes d'apprentissage automatique apprennent à être conversationnels et peuvent répondre : "Je suis d'accord pour samedi" ou autre. C'est donc vraiment agréable à voir.

Nouvelles Modalités : Voix et Vision

Sundar Pichai

Tout comme à chaque changement de plateforme, la façon dont les utilisateurs interagissent avec l'informatique change. Le mobile a apporté le multi-touch. Nous avons évolué au-delà du clavier et de la souris. De même, nous avons maintenant la voix et la vision comme deux nouvelles modalités importantes pour l'informatique. Les humains interagissent avec l'informatique de manière plus naturelle et immersive.

Sundar Pichai

Commençons par la voix. Nous avons utilisé la voix comme entrée dans plusieurs de nos produits. C'est parce que les ordinateurs deviennent bien meilleurs pour comprendre la parole. Nous avons eu des percées significatives, mais le rythme, même depuis l'année dernière, est assez incroyable à voir. Notre taux d'erreur de mots continue de s'améliorer, même dans des environnements très bruyants.

Sundar Pichai

C'est pourquoi si vous parlez à Google sur votre téléphone ou à Google Home, nous pouvons capter votre voix avec précision, même dans des environnements bruyants. Lorsque nous expédiions Google Home, nous avions initialement prévu d'inclure huit microphones afin de pouvoir localiser avec précision la source d'où l'utilisateur parlait. Mais grâce au deep learning, nous avons utilisé une technique appelée formation de faisceau neuronale, nous avons pu l'expédier avec seulement deux microphones et obtenir la même qualité.

Sundar Pichai

Le deep learning est ce qui nous a permis il y a environ deux semaines d'annoncer la prise en charge de plusieurs utilisateurs dans Google Home afin que nous puissions reconnaître jusqu'à six personnes dans votre maison et personnaliser l'expérience pour chacune d'entre elles. La voix devient donc une modalité importante dans nos produits. La même chose se produit avec la vision.

Sundar Pichai

Comme pour la parole, nous voyons de grandes améliorations dans la vision par ordinateur. Ainsi, quand nous regardons une photo comme celle-ci, nous sommes capables de comprendre les attributs derrière l'image. Nous réalisons que c'est votre fils lors d'une fête d'anniversaire, qu'il y avait du gâteau et de la famille, et que votre fils était heureux. Nous pouvons donc mieux comprendre tout cela maintenant.

Sundar Pichai

Et nos systèmes de vision par ordinateur pour la tâche de reconnaissance d'images sont maintenant encore meilleurs que les humains. C'est un progrès stupéfiant et nous l'utilisons dans tous nos produits. Ainsi, si vous utilisez le Google Pixel, il possède le meilleur appareil photo de sa catégorie et nous faisons beaucoup de travail avec la vision par ordinateur. Vous pouvez prendre une photo en basse lumière comme celle-ci, qui est bruitée, et nous la rendons automatiquement beaucoup plus claire pour vous.

Sundar Pichai

Ou très bientôt, si vous prenez une photo de votre fille à un match de baseball et qu'il y a quelque chose qui l'obstrue, nous pouvons faire le travail difficile, supprimer l'obstruction et avoir l'image de ce qui compte pour vous devant vous.

Annonce de Google Lens

Sundar Pichai

Nous sommes clairement à un point d'inflexion avec la vision et aujourd'hui nous annonçons une nouvelle initiative appelée Google Lens.

Sundar Pichai

Google Lens est un ensemble de capacités informatiques basées sur la vision qui peuvent comprendre ce que vous regardez et vous aider à agir en fonction de ces informations. Nous le lancerons d'abord dans Google Assistant et Photos et il arrivera dans d'autres produits. Alors comment ça marche ? Par exemple, si vous tombez sur quelque chose et que vous voulez savoir ce que c'est, disons une fleur, vous pouvez invoquer Google Lens depuis votre Assistant, pointer votre téléphone vers elle et nous pourrons vous dire de quelle fleur il s'agit. C'est génial pour quelqu'un comme moi qui a des allergies.

Sundar Pichai

Ou si vous avez déjà été chez un ami et que vous avez rampé sous un bureau juste pour obtenir l'identifiant et le mot de passe d'un routeur Wi-Fi, vous pouvez pointer votre téléphone vers celui-ci et nous pourrons automatiquement faire le travail difficile pour vous. Ou si vous marchez dans une rue du centre-ville et que vous voyez un ensemble de restaurants en face de vous, vous pouvez pointer votre téléphone, car nous savons où vous êtes, nous avons notre graphe de connaissances et nous savons ce que vous regardez, nous pouvons vous donner les bonnes informations de manière significative.

Sundar Pichai

Comme vous pouvez le voir, nous commençons à comprendre les images et les vidéos. Tout Google a été construit parce que nous avons commencé à comprendre le texte et les pages web. Ainsi, le fait que les ordinateurs puissent comprendre les images et les vidéos a des implications profondes pour notre mission principale.

Infrastructure IA et Cloud TPUs

Sundar Pichai

Quand nous avons commencé à travailler sur la Recherche, nous voulions le faire à grande échelle. C'est pourquoi nous avons repensé notre architecture informatique. Nous avons conçu nos centres de données de A à Z et nous y avons consacré beaucoup d'efforts. Maintenant que nous évoluons pour ce monde d'apprentissage automatique et d'IA, nous repensons à nouveau notre architecture informatique. Nous construisons ce que nous considérons comme des centres de données privilégiant l'IA.

Sundar Pichai

C'est pourquoi l'année dernière nous avons lancé les Tensor Processing Units. Il s'agit d'un matériel personnalisé pour l'apprentissage automatique. Elles étaient environ 15 à 30 fois plus rapides ou 30 à 80 fois plus économes en énergie que les CPU et GPU de l'époque. Nous utilisons les TPU dans tous nos produits. À chaque fois que vous faites une recherche, à chaque fois que vous parlez à Google. En fait, ce sont les TPU qui ont alimenté AlphaGo lors de son match historique contre Lee Sedol.

Sundar Pichai

Comme vous le savez, l'apprentissage automatique comporte deux composantes : l'entraînement, c'est-à-dire la façon dont nous construisons le réseau de neurones, l'entraînement est très intensif en calcul, et l'inférence est ce que nous faisons en temps réel de sorte que lorsque vous lui montrez une photo, nous reconnaissons s'il s'agit d'un chien ou d'un chat, et ainsi de suite. Les TPU de l'année dernière étaient optimisés pour l'inférence.

Sundar Pichai

L'entraînement est très intensif en termes de calcul. Pour vous donner une idée, chacun de nos modèles de traduction automatique nécessite un entraînement de plus de trois milliards de mots pendant une semaine sur environ 100 GPU. Nous avons donc travaillé dur et je suis très heureux d'annoncer notre prochaine génération de TPU, les Cloud TPU, qui sont optimisés pour l'entraînement et l'inférence.

Sundar Pichai

Ce que vous voyez derrière moi est une carte Cloud TPU. Elle comporte quatre puces et chaque carte est capable de 180 billions d'opérations en virgule flottante par seconde. Nous l'avons conçue pour nos centres de données, vous pouvez donc facilement les empiler. Vous pouvez en mettre 64 dans un seul grand superordinateur, nous appelons cela des pods TPU, et chaque pod est capable de 11,5 pétaflops.

Sundar Pichai

C'est une avancée importante dans l'infrastructure technique pour l'ère de l'IA. La raison pour laquelle nous l'avons nommée Cloud TPU est que nous la proposons via la Google Cloud Platform. Ainsi, les Cloud TPU arrivent sur Google Compute Engine à partir d'aujourd'hui. Nous voulons que Google Cloud soit le meilleur cloud pour l'apprentissage automatique et nous voulons donc fournir à nos clients une large gamme de matériels, qu'il s'agisse de CPU, de GPU, y compris les excellents GPU annoncés par NVIDIA la semaine dernière, et maintenant les Cloud TPU. Cela jette donc les bases de progrès significatifs.