Cette semaine, une startup d'entraînement IA appelée Shift a annoncé qu'elle nettoierait gratuitement les maisons des New-Yorkais, avec des projets d'expansion dans d'autres villes, dont Londres. En regardant mon propre appartement, je comprends l'attrait. Mais il y a un hic – il y a toujours un hic.

En échange du nettoyage, Shift veut des images de ses nettoyeurs au travail : frotter la vaisselle, essuyer les comptoirs, épousseter les tables, laver les sols. Elle veut des vidéos de tout ce travail domestique ennuyeux que nous sous-traiterions volontiers si nous le pouvions – et que les entreprises de robotique s'efforcent d'apprendre aux machines à faire pour nous vendre quelque chose qui le fera à notre place. C'est plus difficile qu'il n'y paraît. Contrairement aux chatbots, générateurs d'images et autres outils d'IA qui ont explosé ces dernières années, les robots doivent gérer le monde physique – comprendre l'espace, le mouvement, la force, la friction, les formes et matériaux étranges, l'éclairage difficile, et tout ce que les humains saisissent instinctivement. C'est pourquoi des choses généralement faciles pour nous, comme plier du linge, ramasser une pomme ou verser un verre d'eau, se sont avérées exaspérantes à codifier pour les roboticiens.

Apprendre aux machines à faire ces choses nécessite beaucoup de données. Les textes, images et vidéos peuvent être facilement extraits d'Internet à une échelle industrielle – souvent sans compenser les personnes qui les ont créés. Le monde physique est plus difficile à extraire, et encore plus difficile à extraire discrètement sans payer. Cela rend l'accès à des données de haute qualité un goulot d'étranglement massif pour les entreprises développant l'IA physique, donc des startups comme Shift deviennent créatives. Elles ne sont pas seules. En Inde, des reportages récents ont révélé que la plateforme de services à domicile Pronto utilise les maisons des clients comme source de séquences d'entraînement IA pour des tâches comme cuisiner, nettoyer et faire la lessive. Pronto dit qu'elle n'enregistre que si les clients y consentent explicitement – on ne sait pas ce que les clients reçoivent en retour, à part une copie des images – mais la pratique a déclenché une vague de réactions négatives, des startups rivales insistant qu'elles n'ont jamais enregistré à l'intérieur des maisons pour entraîner l'IA.

D'autres startups se concentrent sur la mise à l'échelle de la collecte de données. Human Archive, basée dans la Silicon Valley, espère s'associer avec des entreprises comme Pronto et faire enregistrer leurs activités par des travailleurs à la tâche avec des casquettes-caméras pas très élégantes. Les chapeaux collectent des images du point de vue du porteur – exactement le genre de données « égocentriques » ou à la première personne dont les entreprises de robotique ont besoin pour apprendre aux machines comment les humains naviguent dans l'espace physique. Shift sollicite également directement les consommateurs, affirmant avoir payé des dizaines de milliers de personnes dans 15 pays pour enregistrer leurs activités via son application. Certaines entreprises sautent carrément le travail utile, payant des travailleurs pour effectuer les mêmes tâches physiques encore et encore pendant que des caméras et capteurs capturent chaque mouvement – transformant des activités physiques routinières comme plier des serviettes, ramasser des tasses et transporter des boîtes en précieux matériel d'entraînement IA.

Et certaines données proviennent de robots déjà déployés dans le monde. Malgré le battage médiatique, la véritable automatisation est encore loin – d'où le besoin de toutes ces données – mais les entreprises sont impatientes de commercialiser des produits quand même, utilisant les données des maisons des clients pour améliorer le produit. Beaucoup comptent sur des travailleurs à distance pour intervenir lorsque les robots se coincent inévitablement ; elles utiliseront aussi ces données. Bien sûr, échanger des données contre quelque chose de valeur n'est pas nouveau – les entreprises offrent des réductions, commodités et services gratuits en échange d'un accès à vos données depuis des années, des cartes de fidélité et cookies aux dashcams, applications d'assurance surveillant la conduite, et cet odieux téléviseur intelligent qui montre toujours des publicités. Ce qui est nouveau, c'est le type de données que les entreprises sont prêtes à payer. Pour l'instant, cela signifie peut-être laisser un humain nettoyer votre maison gratuitement avec un chapeau chic pour qu'éventuellement, une entreprise puisse vous vendre un robot pour le faire à sa place.