Фрилансеры, которые обучают гуманоидных роботов у себя дома

Люди в Нигерии и Индии закрепляют iPhone на своих головах и снимают, как они занимаются домашними делами.

Когда Зевс, студент-медик, живущий в городе на холме в центральной Нигерии, возвращается в свою студию после долгого дня в больнице, он включает кольцевую лампу, закрепляет iPhone на лбу и начинает снимать себя. Он поднимает руки перед собой, как лунатик, и кладёт простыню на кровать. Он движется медленно и осторожно, чтобы убедиться, что его руки остаются в кадре.

Зевс — это собиратель данных для Micro1, американской компании из Пало-Альто, которая собирает данные из реального мира для продажи компаниям робототехники. Когда компании, такие как Tesla, Figure AI и Agility Robotics, спешат построить гуманоидов — роботов, предназначенных для воспроизведения движений человека на фабриках и в домах — видео, снятые фрилансерами, такими как Зевс, становятся самым популярным способом их обучения.

Micro1 нанял тысячи контрактных работников более чем из 50 стран, включая Индию, Нигерию и Аргентину, где множество технически подкованной молодёжи ищет работу. Они закрепляют iPhone на голове и снимают, как складывают белье, моют посуду и готовят еду. Работа хорошо оплачивается по местным стандартам и подкрепляет местную экономику, но это вызывает острые вопросы о конфиденциальности и информированном согласии. И работа может быть сложной — и странной.

Зевс нашел эту работу в ноябре, когда люди начали везде говорить о ней на LinkedIn и YouTube. «Это будет отличной возможностью оставить свой след и предоставить данные, которые будут использоваться для обучения роботов в будущем», — подумал он.

Зевсу платят 15 долларов в час, что является хорошим доходом в напряженной экономике Нигерии с высокой безработицей. Но как яркому студенту, мечтающему стать врачом, ему скучно гладить одежду часами каждый день.

«Мне это не нравится», — говорит он. «Я тот человек, которому требуется... техническая работа, которая заставляет меня думать».

Зевс и все остальные рабочие, опрошенные MIT Technology Review, просили называть их только вымышленными именами, потому что они не имели права говорить о своей работе.

Гуманоидные роботы печально известны своей сложностью в строительстве, потому что манипулирование физическими предметами — это сложный навык для освоения. Но развитие больших языковых моделей, лежащих в основе чатботов, таких как ChatGPT, вдохновило смену парадигмы в робототехнике. Так же как большие языковые модели научились генерировать слова, обучаясь на огромных объемах текста из интернета, многие исследователи считают, что гуманоидные роботы могут научиться взаимодействовать с миром, обучаясь на массивных объемах данных движения.

Однако робототехника требует намного более сложных данных о физическом мире, и это намного сложнее найти. Виртуальные симуляции могут обучить роботов выполнять акробатику, но не то, как захватывать и перемещать предметы, потому что симуляции борются с моделированием физики с идеальной точностью. Для того чтобы роботы работали на фабриках и служили домохозяйками, могут понадобиться данные из реального мира, несмотря на то, что их сбор отнимает много времени и дорого.

Инвесторы лихорадочно вливают деньги в решение этой проблемы, потратив более 6 миллиардов долларов на гуманоидных роботов в 2025 году. И домашняя запись данных становится растущей экономикой фриланса по всему миру. Компании по работе с данными, такие как Scale AI и Encord, набирают собственные армии собирателей данных, в то время как DoorDash платит курьерам за то, чтобы они снимали себя, выполняющих домашние дела. И в Китае рабочие в десятках государственных центров по обучению роботов носят наголовные дисплеи виртуальной реальности и экзоскелеты, чтобы обучить гуманоидных роботов открывать микроволновую печь и протирать стол.

«Спрос очень велик и растет очень быстро», — говорит Али Ансари, генеральный директор Micro1. Он оценивает, что компании робототехники теперь тратят более 100 миллионов долларов в год на покупку данных из реального мира у его компании и других подобных.

День из жизни

Работники Micro1 проверяются ИИ-агентом по имени Зара, который проводит интервью и просматривает образцы видео домашних дел. Каждую неделю они отправляют видео, на которых они выполняют домашние дела, следуя списку инструкций о том, как держать руки видимыми и двигаться с естественной скоростью. Видеозаписи рецензируются как ИИ, так и человеком и либо одобряются, либо отклоняются. Затем они аннотируются ИИ и командой из сотен людей, которые помечают действия в кадре.

«Спрос очень велик и растет очень быстро».

Али Ансари, генеральный директор Micro1

Поскольку этот подход к обучению роботов находится в зачаточном состоянии, пока не ясно, что составляет хорошие обучающие данные. Тем не менее, «вам нужно дать много и много вариаций, чтобы робот хорошо обобщал для базовой навигации и манипулирования миром», — говорит Ансари.

Но многие рабочие говорят, что создание разнообразного «контента с домашними делами» в их крошечных домах — это вызов. Зевс, студент, живущий в скромной студии, изо всех сил пытается снять что-либо, кроме глажения одежды каждый день. Арджун, репетитор в Дели, Индия, тратит час на съёмку 15-минутного видео, потому что он так много времени тратит на придумывание новых домашних дел.

«Сколько контента [можно сделать] в доме? Сколько контента?» — говорит он.

Есть также щекотливый вопрос о конфиденциальности. Micro1 просит рабочих не показывать свои лица в камеру и не раскрывать личную информацию, такую как имена, номера телефонов и даты рождения. Затем она использует ИИ и рецензентов-людей, чтобы удалить всё, что проскользнёт.

Но даже без лиц видеозаписи захватывают интимный срез жизни рабочих: интерьеры их домов, их имущество, их распорядок дня. И понять, какую личную информацию они могут записывать, пока занимаются домашними делами перед камерой, может быть сложно. Рецензирование такого материала может не отфильтровать чувствительную информацию за пределами наиболее очевидных идентификаторов.

Для рабочих с семьями, держать личную жизнь вне камеры — это постоянный компромисс. Арджун, отец двух дочерей, должен вытащить свою двухлетнюю дочь из кадра. «Иногда очень сложно работать, потому что моя дочь маленькая», — говорит он.

Саша, банкир, ставший собирателем данных в Нигерии, ходит на цыпочках, когда вешает белье снаружи в общем жилом комплексе, чтобы не снимать своих соседей, которые смотрят на неё в недоумении.

«Это займет больше времени, чем люди думают».

Кен Голдберг, Калифорнийский университет Беркли

Хотя рабочие, опрошенные MIT Technology Review, понимают, что их данные используются для обучения роботов, никто из них не знает точно, как их данные будут использоваться, храниться и передаваться третьим сторонам, включая компании робототехники, которым Micro1 продает данные. По причинам конфиденциальности, говорит Ансари, Micro1 не называет своих клиентов и не раскрывает работникам конкретный характер проектов, в которых они участвуют.

«Важно, чтобы, если рабочие занимаются этим, они были информированы самими компаниями об намерениях... куда может привести эта технология и как это может повлиять на них в долгосрочной перспективе», — говорит Ясмин Котури, профессор компьютерных систем, ориентированных на человека, в Университете Мэриленда.

Иногда, по словам некоторых рабочих, они видели других рабочих, спрашивающих на канале Slack компании, могла ли бы компания удалить их данные. Micro1 отказалась комментировать, удаляются ли такие данные.

«Люди добровольно это делают», — говорит Ансари. «Они могут остановить работу в любой момент».

Голодные по данным

Когда тысячи рабочих выполняют свои домашние дела по-разному в разных домах, некоторые робототехники задаются вопросом, достаточно ли надежны собранные от них данные для безопасного обучения роботов.

«То, как мы живём в наших домах, не всегда правильно с точки зрения безопасности», — говорит Аарон Пратер, робототехник в ASTM International. «Если эти люди обучают эти плохие привычки, которые могут привести к инциденту, то это не хорошие данные». И огромный объём собираемых данных затрудняет их проверку на качество. Но Ансари говорит, что компания отклоняет видео, показывающие небезопасные способы выполнения задачи, в то время как неуклюжие движения могут быть полезны, чтобы обучить роботов тому, что они не должны делать.

Затем есть вопрос о том, сколько данных нам нужно. Micro1 говорит, что у неё есть десятки тысяч часов видеозаписи, в то время как Scale AI объявила, что собрала более 100 000 часов.

«Это займет длительное время», — говорит Кен Голдберг, робототехник из Калифорнийского университета Беркли. Большие языковые модели обучались на тексте и изображениях, которые потребовали бы 100 000 лет на прочтение человеком, и гуманоидные роботы могут потребовать ещё больше данных, потому что управление суставами робота ещё более сложнее, чем генерирование текста. «Это займет больше времени, чем люди думают», — говорит он.

Когда Датту, студент инженерного факультета, живущий в оживленном технологическом центре в Индии, приходит домой после полного дня занятий в университете, он пропускает ужин и спешит на свой крошечный балкон, заполненный горшками с цветами и гантелями. Он закрепляет iPhone на лбу и снимает, как складывает один и тот же набор одежды снова и снова.

Его семья смотрит на него с недоумением. «Это похоже на какую-то космическую технологию для них», — говорит он. Когда он рассказывает своим друзьям о своей работе, «они просто поражены идеей, что они могут получить зарплату за запись домашних дел».

Жонглирование учебой в университете с записью данных, а также другие работы по аннотации данных, сказывается на нём. Тем не менее, «кажется, что ты делаешь что-то другое, чем весь остальной мир», — говорит он.

Фрилансеры, которые обучают гуманоидных роботов у себя дома

День из жизни

Голодные по данным

Похожие материалы

Переход на кастомизацию AI-моделей — архитектурный императив

The Download: инструменты ИИ в здравоохранении и культурная война Пентагона против Anthropic

Бенчмарки ИИ сломаны. Вот что нам нужно вместо них

ИИ-инструментов для здоровья стало больше чем когда-либо — но насколько хорошо они работают?