Juste avant Noël 2023, la petite équipe de Cognition avait du mal à mettre en place un serveur de données particulièrement complexe pour le tout nouveau assistant de codage de la startup d'IA basée à San Francisco, Devin. Ils avaient passé des heures à étudier les documents d'installation et à essayer différentes commandes, mais n'arrivaient pas à le faire fonctionner. Fatigués et frustrés, ils ont décidé de voir comment Devin allait gérer la situation.
Lorsque l’IA est entrée en action, elle a dérouté ses créateurs, car elle « exécutait les commandes les plus sorcières et de magie noire », se souvient le co-fondateur et chef de produit Walden Yan, 21 ans.
Pendant un moment, il semblait que Devin ne ferait pas mieux qu’eux. Ensuite, le voyant d’un terminal de serveur qui était rouge depuis des heures est devenu vert. Le serveur de données était opérationnel.
Ils se sont rendu compte que Devin avait supprimé un fichier système défectueux que l'équipe avait manqué. « C'est à ce moment-là que j'ai vraiment réalisé à quel point l'ingénierie logicielle allait changer », explique Yan.
Il s'agissait de la première tâche majeure accomplie par Devin et d'une preuve de concept pour la vision de Cognition d'une IA qui simplifie le codage. Aujourd'hui, près d'un an plus tard, Devin s'occupe des tâches d'ingénierie de base : détecter et corriger les bogues, mettre à jour les fragments de code et les migrer entre les plates-formes. Donnez-lui une instruction simple : « nettoyer cette base de code », créez un plan d'action et exécutez-le. La plupart du temps, ça marche.
C'est une approche différente de celle d'autres acteurs plus connus et plus importants dans ce domaine encore en plein essor, comme Github (que Microsoft a acheté pour 7,5 milliards de dollars en 2018) et Codeium, évalué à 1,3 milliard de dollars, qui fournissent des assistants numériques permettant d'aider les gens à écrire. codez avec des suggestions basées sur l'IA.
Mais Devin est un agent d'IA autonome qui, en théorie, écrit du code lui-même, sans intervention humaine, et peut mener à bien des projets entiers généralement confiés aux développeurs (le nom Devin vient de « dev », une abréviation du terme). « Ce que nous avons vu est une réelle opportunité », déclare Scott Wu, 28 ans, co-fondateur et PDG de Cognition, « de passer de la rédaction de textes à la réalisation de tâches ».
Le code généré par l’IA commence déjà à changer l’industrie. En octobre, le PDG de Google, Sundar Pichai, a déclaré que plus d'un quart du nouveau code du géant de la technologie était écrit par l'IA. Chez Github, qui a atteint un taux d'exécution annuel de 2 milliards de dollars en 2024, son outil de complétion de code a représenté 40 % de la croissance des revenus cette année, a déclaré en juillet le PDG de Microsoft, Satya Nadella.
L'analyste de Pitchbook, Brendan Burke, affirme que le codage de l'IA est devenu le cas d'utilisation le plus financé de l'IA générative, les startups s'y étant concentrées ayant levé plus d'un milliard de dollars au cours du seul premier semestre 2024.
Les revenus réels commencent tout juste à augmenter : le cabinet de recherche IDC s’attend à ce qu’ils dépassent à peine 4 milliards de dollars d’ici 2029. Plusieurs startups de codage d’IA ont dépassé les 10 millions de dollars de revenus annuels ; Cognition a refusé de partager les revenus, mais le président Russell Kaplan affirme que des dizaines de clients se sont inscrits, avec un contrat annuel typique à six ou sept chiffres.
Mais l’opportunité est suffisamment intéressante pour que des géants comme Anthropic, Amazon et IBM aient lancé leurs propres outils de codage, ainsi que des startups comme Poolside (évaluée à 3 milliards de dollars) et Anysphere (évaluée à 400 millions de dollars).
La capacité d'écrire du code est déjà devenue une « valeur sûre » pour le modèle d'IA typique, déclare Ritu Jyoti, analyste chez IDC, qui note que le leader dans le domaine reste ChatGPT d'OpenAI. Mais le codage de l’IA qui peut fonctionner de manière entièrement autonome, comme ce que développe Cognition, « entraînera un changement radical ».
Ce sont les entreprises qui ont investi jusqu'à présent dans Cognition
Ce n’est peut-être pas une bonne nouvelle pour les 5 millions d’Américains qui travaillent comme programmeurs et gagnent un salaire médian de 130 000 dollars, sans parler des 13 millions de programmeurs en Inde et en Chine. Wu insiste sur le fait que des pertes massives d’emplois ne sont pas imminentes et que le domaine est « limité par l’offre ».
Les programmeurs de tous les jours sont peut-être prudents, mais les investisseurs adorent ça. Le Founders Fund de Peter Thiel et Khosla Ventures parient sur Wu et son équipe de 25 personnes, en investissant 176 millions de dollars dans Cognition lors d'un tour de table de série B en avril, portant sa valorisation à 2 milliards de dollars six mois seulement après sa création. L'injection de liquidités est intervenue trois mois seulement après que la startup a clôturé une série A de 21 millions de dollars en janvier.
Ses clients incluent la société de gestion des dépenses de 300 millions de dollars Ramp, qui l'utilise pour écrire des tests et nettoyer le code mort, et la plate-forme de données MongoDB de 1,7 milliard de dollars, pour laquelle Devin met à jour l'architecture de code obsolète, économisant ainsi des millions à ses clients, déclare le chef de produit Sahir Azam. . Les programmeurs de la fintech Nubank, estimée à 8 milliards de dollars, l'utilisent quant à eux pour des tâches telles que la mise à jour des référentiels de code.
Il est encore tôt, mais John Luttig, partenaire du Founders Fund, a investi dans Cognition en partie parce qu'il estime qu'il présente suffisamment d'avantages pour qu'il « soit très difficile de les rattraper en matière d'agents de chiffrement ».
Microsoft semble avoir une intuition similaire, ayant signé un partenariat en mai pour proposer Devin aux développeurs sur son cloud Azure, le directeur technologique Kevin Scott le qualifiant d'outil « extraordinaire » lors de la conférence annuelle des développeurs de l'entreprise.
Mais la Silicon Valley regorge d’entreprises qui avaient un glorieux avantage sur Amazon et Google, jusqu’à ce qu’elles ne le fassent plus.
Les promoteurs de Cognition parient que si quelqu'un peut créer la machine à coder ultime, ce sont trois programmeurs de classe mondiale qui ont les distinctions pour le prouver. Les fondateurs sont tous des programmeurs médaillés d'or de niveau olympique qui se sont rencontrés sur le circuit de programmation compétitif. Wu était un génie des mathématiques à l'école primaire avec un classement de « grand maître légendaire » (le plus élevé) sur Codeforces, un site de réseautage pour programmeurs qui organise des concours de codage. Eric Glyman, investisseur providentiel de Cognition et PDG de Ramp, affirme que Wu possède l'un des «cinq meilleurs QI de tous ceux que j'ai jamais rencontrés».
« Scott est clairement brillant, curieux et doté d'une ambition sans limites », déclare Sarah Guo, une spécialiste du capital-risque qui a investi dans Cognition lors de trois cycles de financement par l'intermédiaire de sa société, Conviction.
Wu est également un ancien de Forbes 30 Under 30 – il figurait sur la liste en 2019 pour son ancienne entreprise, Lunchclub, qui utilise l'intelligence artificielle pour organiser des réunions de réseautage. Un investisseur de Cognition a déclaré à Forbes que Wu avait quitté l'entreprise en 2022 parce que ses intérêts s'étaient déplacés ailleurs, et que Lunchclub, qui a levé environ 30 millions de dollars, allait de l'avant.
Les programmeurs assurent que « Devin » n'est pas ce qu'ils promettent
Cognition a lancé Devin en mars et a généré beaucoup de buzz. Dans une vidéo de démonstration qui a accumulé 30 millions de vues sur X, la société a affirmé que Devin avait « passé avec succès des entretiens pratiques d’ingénierie auprès de grandes sociétés d’IA » et accompli des tâches de codage complexes. Certains ingénieurs ont été impressionnés par les compétences techniques de Devin ; d'autres craignaient pour leur emploi. Peu de temps après la sortie, une vidéo de Wu en tant qu'élève de septième dominant un concours de mathématiques a refait surface, avec des commentateurs en ligne plaisantant : « Ce n'est pas un humain, c'est une IA » et « Devin est juste Scott qui répond à vos questions sur une application de messagerie ». .
Ensuite, Carl Brown, un développeur indépendant bien connu d'Austin, au Texas, a dénoncé les manigances. Dans une vidéo intitulée « Debunking Devin », visionnée plus de 500 000 fois, il accuse Cognition de survendre son ingénieur en IA. Leur examen a révélé que Devin avait mis beaucoup plus de temps qu'un humain ne pourrait terminer le travail et qu'il avait introduit des erreurs en cours de route.
Des expériences comme celles-ci ont amené certains à se demander si Devin n’était simplement pas un air plus gonflé dans la bulle de l’IA.
Demandez-lui de concevoir une interface utilisateur flashy et les résultats sont ternes, déclare Krish Manair, ingénieur chez Labelbox, société d'étiquetage de données, qui a testé les capacités de création d'applications Web de l'outil.
Plusieurs fondateurs rivaux ont déclaré à Forbes qu'ils pensaient que l'entreprise promettait trop sur les capacités de Devin, donnant l'impression qu'un ingénieur pouvait utiliser Devin directement pour coder n'importe quoi. Ses capacités actuelles, affirment-ils, sont beaucoup plus limitées et orientées vers des tâches prédéfinies telles que le nettoyage du code existant.
Dans une démo live, Forbes a demandé à Devin de créer une application pour accorder une guitare. Il l'a créé en 10 minutes environ, mais l'application n'a pas pu identifier correctement les notes de musique jouées pour la tester, et les fondateurs de Cognition ne savaient pas pourquoi.
« Il y a toujours cet écart entre le battage médiatique sur ce qui est possible et ce qui fonctionne de manière fiable », déclare Varun Mohan, PDG de la startup de codage rivale Codeium.
Wu admet que Devin est loin d'être parfait. « Dans le monde réel, l'ingénierie logicielle est très compliquée », dit-il. « Les humains écrivent des erreurs tout le temps. » Et pour être honnête, plusieurs détracteurs ont été impressionnés par les capacités de l’outil.
Devin s'est considérablement amélioré au cours des sept mois qui ont suivi son lancement, explique Wu, en partie grâce aux commentaires des premières entreprises clientes qui semblent accepter l'agent comme un travail en cours. «Nous ne considérons pas cet outil comme quelque chose que nous espérons magique», déclare Vitor Olivier, CTO de Nubank. «Nous sommes prudemment optimistes.» Dans certains cas, dit-il, les ingénieurs ayant accès à Devin étaient huit fois plus rapides dans leur travail.
Plus tôt cette année, cela a donné à Devin la possibilité de lancer des IA subordonnées pour l'aider, mais lorsque Cognition a testé ce nouveau mode « gestionnaire », il a découvert que les sous-Devins lanceraient leurs propres sbires, qui à leur tour en lanceraient encore plus, créant ainsi de nouveaux ennemis. une vaste boucle sans fin de bureaucratie de l’IA. « Nous avons finalement dû annuler le travail parce qu'ils continuaient à déléguer le travail », explique Kaplan.
Cela dit, Kaplan note que l'outil fonctionne mieux lorsque plusieurs Devins travaillent simultanément sur différents projets, comme une « armée de jeunes ingénieurs ». C'est une expression qui met probablement mal à l'aise certaines personnes qui codent pour gagner leur vie, et Wu dit qu'une partie de la négativité envers la cognition vient de l'anxiété quant à savoir si l'IA éliminera les emplois en génie logiciel. Devin pourrait permettre aux entreprises de réaliser davantage de projets, affirme-t-il, en embauchant des humains pour effectuer le travail le plus significatif.
« Il y a vraiment beaucoup de peur », dit-il. « Les gens se posent beaucoup de questions sur ce qui se passe dans ce nouveau paradigme. »
