今週、ShiftというAIトレーニングスタートアップが、ニューヨークの家を無料で掃除すると発表した。ロンドンを含む他の都市への拡大も計画している。自分のアパートを見渡すと、その魅力はわかる。でも、落とし穴がある。いつだって落とし穴はあるものだ。

掃除と引き換えに、Shiftは清掃員の作業風景を撮影したいという。皿洗い、カウンター拭き、テーブルのほこり払い、モップがけ。私たちが喜んで外注したい退屈な家事労働、そしてロボット企業が機械に教え込もうと競っている作業の映像だ。それは口で言うほど簡単ではない。近年爆発的に普及したチャットボットや画像生成AIなどのツールと違い、ロボットは物理世界に対処しなければならない。空間、動き、力、摩擦、奇妙な形や素材、不自然な照明、人間が本能的に理解するあらゆるものを理解する必要がある。だからこそ、服をたたむ、リンゴを拾う、コップに水を注ぐといった人間には簡単なことが、ロボット工学者にとっては頭を悩ませるものとなっている。

機械にそれらの作業を教えるには大量のデータが必要だ。テキスト、画像、動画は産業規模でインターネットから簡単に収集できる。多くの場合、作成者に報酬を支払うことなく。物理世界は収集が難しく、さらに報酬を払わずにこっそり収集するのはさらに難しい。そのため、高品質なデータへのアクセスは物理AIを開発する企業にとって大きなボトルネックとなっており、Shiftのようなスタートアップは創造的にならざるを得ない。彼らだけではない。インドでは、ホームサービスプラットフォームのProntoが、料理、掃除、洗濯などの家事のAIトレーニング映像のソースとして顧客の家を利用していることが最近の報道で明らかになった。Prontoは、顧客が明示的にオプトインした場合のみ録画するとしているが、顧客がその見返りに何を得るのかは明らかではない(映像のコピー以外)。しかし、この慣行は反発の波を引き起こし、競合スタートアップは自社は家の中をAIトレーニングのために録画したことはないと主張している。

他のスタートアップはデータ収集の規模拡大に注力している。シリコンバレー拠点のHuman Archiveは、Prontoのような企業と提携し、ギグワーカーにスタイリッシュとは言い難いカメラ付き帽子をかぶせて活動を記録してもらおうとしている。その帽子は装着者の視点からの映像を収集する。ロボット企業が人間の物理空間の移動方法を機械に教えるために必要な、まさに「自己中心的」または一人称視点のデータだ。Shiftも消費者に直接アプローチし、15カ国で数万人にアプリを通じて活動を記録してもらい、報酬を支払ったと主張している。企業によっては、役に立つ作業を完全にスキップし、カメラとセンサーがすべての動きを捉える中、同じ物理的タスクを何度も繰り返し行う労働者に報酬を支払っている。タオルをたたむ、コップを拾う、箱を運ぶといった単調な身体活動を貴重なAIトレーニング資料に変えているのだ。

また、すでに世の中に出ているロボットからデータを得ることもある。誇大広告にもかかわらず、真の自動化はまだ遠い。だからこそこれだけのデータが必要なのだが、企業はとにかく製品を出荷したがっており、顧客の自宅からのデータを使って製品を改善している。多くは、ロボットがどうしても行き詰まったときに介入するリモートワーカーに依存しており、そのデータも利用する。もちろん、何か価値あるものとデータを交換することは新しいことではない。企業は長年、ロイヤルティカードやクッキー、ドライブレコーダー、運転を監視する保険アプリ、あの忌々しい広告を表示するスマートテレビなど、データへのアクセスと引き換えに割引、利便性、無料サービスを提供してきた。新しいのは、企業が対価を払っても構わないと思うデータの種類だ。今のところ、それはつまり、おしゃれな帽子をかぶった人間に無料で家を掃除させ、最終的には企業が代わりにロボットを売りつけるために、そのデータを利用するということだ。