Dust : Orchestration de l'IA et des données d'entreprise
6 octobre 2023
Intelligence Artificielle
Introduction et Vision de Dust
Nous travaillons avec des machines sur le lieu de travail depuis des décennies, et certaines d'entre elles font des choses incroyables. Mais on dirait qu'elles sont encore un peu loin d'être magiques pour accomplir les tâches auxquelles nous sommes tous confrontés quotidiennement. L'équipe marketing capable de comprendre ce dont l'équipe d'ingénierie parlait lors de la dernière sortie de fonctionnalité sans déranger un ingénieur. Ou l'équipe d'ingénierie capable de comprendre si la dernière réunion commerciale est réellement une liste de spécifications et d'exigences ou juste un certain nombre d'éléments de liste de souhaits que des clients ou prospects qui croient encore au Père Noël énuméraient. Ou même simplement la capacité pour chaque membre d'une équipe de comprendre ce que le PDG vient de dire à propos de la vision à cinq ans et comment cela se traduit dans ce sur quoi ils devraient se concentrer la semaine prochaine. Il semble que cela soit en tant que changer en ce moment, ce qui est passionnant. Je suis le cofondateur de Dust, une entreprise qui est née et s'est construite autour de cette dernière génération de modèles d'intelligence artificielle axés sur la génération de grands modèles de langage en particulier. Ce qui nous passionne incroyablement chez Dust, c'est la capacité de diviser et de refactoriser l'information à mesure qu'elle circule au sein d'une équipe, au sein d'une entreprise, et de la rendre utile à la volée pour ceux qui doivent accélérer le rythme auquel l'équipe prend des décisions ou fait avancer le produit. C'est donc ce qui nous passionne, et sans plus attendre, je vais vous faire une démonstration rapide de certaines fonctionnalités de Dust.
Démonstration de l'Assistant Helper et Dora
Je vais parler de moi en tant que fondateur de l'entreprise et administrateur de l'espace de travail, et je vais également vous présenter notre nouvelle employée. Elle s'appelle Dora. Elle vient de rejoindre l'équipe et elle a hâte de commencer. Dora est chez Dust et elle se demande comment elle peut utiliser Dust, qui semble être omniprésent dans l'équipe. L'une des premières choses sur lesquelles je pense que nous devons vraiment nous concentrer avec ces modèles puissants est la couche d'expérience et d'application à laquelle tout le monde ici va être confronté. Nous avons ces outils incroyables, mais ils ne se comportent pas toujours de manière prévisible ou facile à comprendre. Les rendre utilisables au quotidien sera l'un des principaux facteurs qui accéléreront le déploiement de cette technologie sur le lieu de travail. Chez Helper, comment puis-je utiliser l'assistant ? Helper ici a été configuré par Dust. Il intègre certaines informations sur l'entreprise. Il intègre également le ton de l'entreprise, et il comprend que Dora a récemment rejoint l'équipe et qu'elle peut avoir besoin d'informations assez détaillées. Bien sûr, il essaiera de fournir des références à partir des sources de données présentes.
Comparaison des Modèles et Sécurité
Ce sur quoi nous nous concentrons vraiment, c'est d'apporter la puissance et le potentiel de ces grands modèles de langage, qui sont très bons pour les choses générales, avec l'ensemble de données personnalisées, sur mesure et parfois sensibles que les entreprises souhaitent utiliser chaque jour. Dora a quelques informations. Elle est assez enthousiaste. Elle va maintenant essayer d'utiliser certains modèles bruts dont elle a entendu parler mais qu'elle n'a pas eu l'occasion d'utiliser. Maintenant, je sais que certains d'entre vous ici et peut-être même beaucoup chez Stripe sont impatients de savoir lequel de GPT-4 et Claude fonctionne le mieux, et je parle des modèles, pas des entreprises. Mais l'une des choses qui nous passionne, c'est de les comparer et d'obtenir simplement pour la même question, "Hé, quels sont quelques faits sur Station F ?", pour essayer de voir comment ces modèles se comportent et d'accepter le fait qu'ils vont se comporter de différentes manières selon les sujets, selon les cas d'utilisation. Nous croyons vraiment que c'est en vous formant réellement et en réapprenant à travailler avec des machines qu'une partie du potentiel de ces grands modèles de langage peut être libérée. Maintenant, bien sûr, ces informations ici dans GPT-4 continuent. Voilà. Très bien, chez GPT-4, tu es à la longueur maximale d'un tweet, s'il te plaît.
Intégration des Données d'Entreprise (RAG)
Bien sûr, avoir accès aux modèles bruts est une tâche vraiment utile, et nous pensons que chaque équipe devrait déployer l'IA générative de manière sécurisée, d'une manière qui soit également facile à surveiller et parfois assortie de garde-fous par l'équipe de sécurité. Car bien sûr, ce qui va être intéressant, c'est d'intégrer maintenant les données de l'entreprise. "Hé, chez Dust", maintenant Dust est un assistant qui connaît réellement l'entreprise et toutes les sources de données qui ont été autorisées par l'administrateur. "Quel est notre plan pour le Stripe AI Day ?" Il va maintenant effectuer une génération augmentée par récupération. Il a évidemment trouvé des informations dans plusieurs sources de données. Nous supportons actuellement Google Docs, Slack, Notion, GitHub, la pile logicielle habituelle où l'information est actuellement dispersée. Il essaie de comprendre. Voilà. Cette démo, apparemment à 13h, et j'avais dit lors de la dernière répétition que j'aimerais que l'équipe se fige, arrête de déployer, ou du moins me dise s'ils allaient pousser des choses, ce qu'ils n'ont pas fait, donc j'espère que tout fonctionne encore. Mais il ne semble pas y avoir de détails sur ce que nous allons réellement présenter, et c'est parce que j'ai complètement oublié d'ajouter certaines données concernant notre brillante idée d'intégrer Dora l'Exploratrice. C'est le document où j'ai eu cette idée géniale de dire : "Hé, on va parler de Dora l'Exploratrice et centrer la démo sur elle." Donc ce que je devrais faire maintenant, c'est simplement ajouter cette source de données dans le champ d'application de l'assistant, et nous allons simplement nous ré-authentifier ici et ajouter le fichier de présentations où se trouve ma brillante idée pour le Stripe AI Day.
Assistants Personnalisés et Feedback Fred
Croisons les doigts, nous verrons à quelle vitesse cela s'intègre. Maintenant, de retour à Dora, elle va en fait essayer de restreindre le comportement d'un assistant à ses besoins spécifiques. L'une des choses qui la passionne est d'obtenir des retours. Elle veut obtenir des retours et pouvoir stocker les commentaires qu'elle reçoit de ses collègues dans toute l'entreprise, mais aussi transformer ces retours en un ensemble d'exercices exploitables, quelque chose qu'elle peut vraiment utiliser pour progresser chaque jour. L'un des bâtisseurs de l'espace de travail, c'est moi pour les besoins de cette démo, a en fait créé un assistant personnalisé pour l'espace de travail qui va se comporter exactement de cette manière. Je vais juste regarder... Je crois que je l'ai appelé Feedback Fred. Voilà. Feedback Fred est un assistant qui va se comporter comme un coach pour cadres. Il va utiliser les données fournies sur certaines sources de données internes où les collègues partagent réellement des retours, mais il va transformer ces retours en un ensemble d'exercices exploitables ou de choses qui peuvent être intégrées par Dora dans son propre quotidien. Nous avons défini des paramètres spécifiques autour du modèle sous-jacent et de son comportement. Nous ne voulons pas que Feedback Fred devienne fou, nous avons donc en fait baissé la température sur celui-ci pour ceux qui savent ce qu'est la température, mais cela pourrait être une façon intéressante de voir évoluer Feedback Fred. Je vais enregistrer cela. Maintenant, si Dora sollicite Feedback Fred en ce moment, il n'y a pas de sources de données. "Feedback Fred, tu as des retours ?" Voilà. J'ai en fait ajouté les sources de données, donc Feedback Fred m'en donne. La démo en direct fonctionne très bien. Ce sont quelques-uns des points dont nous avons effectivement parlé avec Fred et que j'étais censé ajouter après l'avoir sollicité pour la première fois, mais je suppose que je reçois les retours maintenant. Et nous pourrions en avoir une version plus courte. Pour conclure, ce qui nous passionne vraiment chez Dust, ce n'est pas forcément de construire le plus grand modèle ou le meilleur modèle pour le moment. Nous pensons qu'il y aura un temps pour cela. Mais ce qui, selon nous, va bloquer et ralentir le déploiement à grande échelle de ces modèles sur le lieu de travail, c'est de réunir d'une manière sûre, compréhensible et utilisable au quotidien, la puissance de ces modèles et les données que tout le monde traite jour après jour. Merci beaucoup.
Q&A : Différence avec Dashworks et Profil Utilisateur
Quelle serait la différence clé avec un produit comme Dashworks ?
Oui, l'une des façons dont nous avons décidé de nous concentrer et de construire un produit est d'avoir un profil d'utilisateur spécifique en tête. Nous ne pensons pas nécessairement que les développeurs seront les seuls à libérer la puissance de ces modèles sur le lieu de travail. Nous avons donc décidé de nous concentrer sur des personnes que nous appelons des bâtisseurs, des personnes qui ne savent pas toujours coder mais qui croient vraiment qu'elles peuvent plier les logiciels à leur volonté et qui ont parfois été bloquées. Toutes les applications et l'intégralité de l'application Dust fonctionnent sur notre propre plateforme, qui est une plateforme d'orchestration open-source pour les grands modèles de langage. Ainsi, selon votre niveau technique, vous pouvez aller aussi loin que nécessaire pour plier réellement le comportement des assistants à vos spécifications exactes. Et bien que nous pensions qu'il soit très important de commencer très facilement, nous pensons également qu'il est important de construire sur une plateforme qui soit extensible et composable de cette manière. J'ai appris d'une entreprise de paiement que parfois, faire abstraction d'une partie de la complexité peut vous mener très, très loin. Merci.
Q&A : Agents et Automatisation
Avez-vous des projets pour des agents ou quelque chose qui fait des choses ? Par exemple, s'il vous plaît, faites un résumé exécutif de toutes les réunions de cette semaine chaque lundi matin, quelque chose comme ça.
Oui, nous en avons, et je pense que cela touche à un point très important de toute cette vague technologique. Nous faisons en sorte que certains assistants fassent des choses assez précisément. Ils ont une fenêtre de temps spécifique pré-configurée sur un ensemble spécifique de comportements et de préférences par l'utilisateur, et nous croyons vraiment à l'activation de cette étape suivante. Mais vous devez être vraiment sûr que la qualité est bonne. Car je pense que les gens jugeront la performance de ces outils en fonction de leur expérience quotidienne, et non d'une immense page d'aide sur un site web qui dit que c'est génial mais que parfois ça ne marche pas, ou d'une fenêtre contextuelle qui dit de ne pas faire confiance à tout ce que ce produit va vous dire mais de l'utiliser quand même. Donc je pense que nous hésitons un peu à déployer des agents et à les laisser faire n'importe quoi, mais nous sommes très enthousiastes quant à ce que les gens essaient de faire, c'est-à-dire laisser une machine s'occuper des tâches ingrates et se concentrer sur la partie la plus passionnante de son rôle.
Q&A : Utilisation des API et Modèles
Vous appuyez-vous sur des API ?
Oui, nous nous appuyons sur des API. En fait, je ne sais pas si vous l'avez vu sur le premier écran, nous mettons les modèles bruts à disposition de ceux qui souhaitent les utiliser. Je trouve que c'est un peu dommage pour les gens de ne pas pouvoir utiliser ces modèles aujourd'hui. Nous nous appuyons donc sur les modèles d'Anthropic, nous nous appuyons sur les modèles d'OpenAI. Nous serons ravis d'intégrer Mistral dès qu'ils seront disponibles. Pour nous, ce n'est pas forcément là que se situera la différenciation fondamentale de Dust aujourd'hui. C'est vraiment sur l'orchestration et la facilité d'utilisation que nous pensons avoir une carte à jouer.
Q&A : Collaboration entre Agents
Et juste pour montrer différents types d'agents, prévoyez-vous de les faire collaborer d'une certaine manière ?
Oui, c'était l'une des façons vraiment passionnantes dont nous avons commencé à voir des conversations apparaître. Vous pouvez avoir plusieurs assistants dans la même conversation, et bien sûr, il y a des étapes suivantes qui semblent passionnantes et que nous serons ravis d'explorer. Encore une fois, je pense que cela revient à un niveau de confiance et de réaction émotionnelle face à ces machines qui prennent le relais. Ce ne sera donc pas forcément une question de performance dans un livre blanc qui pourrait vous dire que c'est correct 97 % du temps. Quel est mon ressenti quant à la probabilité que j'aie l'air stupide si je les laisse simplement tourner du vendredi après-midi au lundi matin ? Mais nous sommes vraiment enthousiasmés par le potentiel de les enchaîner, de les faire collaborer, de les faire se défier les uns les autres, tout cela est tout à fait d'actualité.
Q&A : Modèle d'Affaires
Quel est votre modèle d'affaires ?
C'est très original et c'est un petit secret, mais je suis prêt à vous le donner : logiciel en tant que service (SaaS). Nous pensons qu'il y aura différentes manières dont les entreprises à l'échelle ou les grandes sociétés voudront être facturées. Encore une fois, inspiration de l'entreprise de paiement. Certaines entreprises connaissent l'interchange, d'autres non, et votre modèle d'affaires doit s'adapter à l'endroit où elles trouvent de la valeur dans votre produit. Nous sommes fondamentalement convaincus que le fait de pouvoir amener une équipe et de l'aider à collaborer sur ses tâches quotidiennes autour de ces modèles est la valeur que nous apportons, et donc facturer sur une base de coût majoré pour certaines parties du produit auxquelles nous accédons par des tiers nous convient parfaitement. Nous en sommes au tout début de notre parcours et nous travaillons principalement avec des partenaires de conception en ce moment, c'est donc une question à laquelle nous réfléchissons et que nous étudions, mais nous n'avons pas encore entièrement publié nos statistiques et nos chiffres.