本周,一家人工智能训练初创公司Shift宣布将为纽约市民免费打扫房屋,并计划扩展到包括伦敦在内的其他城市。环顾我自己的公寓,我理解这种吸引力。但有个陷阱——总是有陷阱。

作为交换,Shift希望获得清洁工工作的镜头:擦洗盘子、擦拭台面、掸去桌子上的灰尘、拖地。它想要所有那些我们乐意外包的无聊家务劳动的视频——而机器人公司正竞相教机器做这些事,以便向我们出售能替我们做这些事的设备。这比听起来难。与近年来爆发的聊天机器人、图像生成器和其他AI工具不同,机器人必须应对物理世界——理解空间、运动、力、摩擦、奇怪的形状和材料、尴尬的光线以及人类本能掌握的一切。这就是为什么对我们来说通常简单的事情,比如叠衣服、捡起苹果或倒一杯水,对机器人学家来说却难以编码。

教机器做这些事情需要大量数据。文本、图像和视频可以轻松地从互联网上大规模抓取——通常不补偿创造它们的人。物理世界更难抓取,更难在不付费的情况下悄悄抓取。这使得获取高质量数据成为开发物理AI的公司的巨大瓶颈,因此像Shift这样的初创公司正在变得有创意。他们并不孤单。在印度,最近的报道显示,家庭服务平台Pronto一直在利用客户的家作为AI训练素材的来源,用于烹饪、清洁和洗衣等家务。Pronto表示,只有在客户明确选择加入时才会录制镜头——不清楚客户能得到什么回报,除了获得一份镜头副本——但这一做法引发了强烈反对,竞争对手初创公司坚称他们从未在家中录制过用于训练AI的镜头。

其他初创公司专注于规模化数据收集。硅谷的Human Archive希望与Pronto等公司合作,让零工工人戴着不那么时尚的相机帽子记录他们的活动。这些帽子从佩戴者的视角收集镜头——正是机器人公司需要的“自我中心”或第一人称数据,以教机器如何导航物理空间。Shift也直接接触消费者,声称已向15个国家的数万人支付费用,通过其应用记录他们的活动。一些公司完全跳过有用的工作,支付工人一遍又一遍地完成完全相同的体力任务,同时摄像头和传感器捕捉每一个动作——将叠毛巾、捡杯子、搬箱子等单调的体力活动转化为有价值的AI训练材料。

还有一些数据来自已经部署在现实世界中的机器人。尽管有炒作,真正的自动化还有很长的路要走——因此需要所有这些数据——但公司急于推出产品,利用客户家中的数据来改进产品。许多公司依赖远程工人在机器人不可避免地卡住时介入;他们也会使用这些数据。当然,用数据换取有价值的东西并不新鲜——多年来,公司一直提供折扣、便利和免费服务以换取你的数据,从会员卡和cookies到行车记录仪、监控驾驶行为的保险应用,以及那台总是显示广告的可恶的智能电视。新鲜的是公司愿意付费的数据类型。目前,这可能意味着让一个人戴着时髦的帽子免费打扫你的家,这样最终,公司可以卖给你一个机器人来代替它。