По мере роста спроса на обучение и совершенствование моделей ИИ стартап Deccan AI, поставляющий данные постобработки и оценочные работы, привлёк $25 млн в своем первом крупном раунде финансирования, при этом большая часть этой работы выполняется рабочей силой экспертов на базе Индии.

Раунд Series A в виде акций возглавлен A91 Partners при участии Susquehanna International Group и Prosus Ventures.

Хотя ведущие лаборатории ИИ, включая OpenAI и Anthropic, разрабатывают базовые модели внутри компании, большая часть работ по постобработке — от генерации данных до оценки и обучения с подкреплением — все чаще передается на аутсорсинг, так как компании стремятся сделать системы надежными в реальных условиях использования. Deccan становится одним из новых стартапов, обслуживающих этот спрос.

Основанная в октябре 2024 года, Deccan предоставляет услуги, начиная от помощи моделям в улучшении возможностей кодирования и агентов до обучения систем взаимодействию с внешними инструментами, такими как программные интерфейсы (API), которые подключают модели ИИ к программным системам.

Стартап работает с ведущими лабораториями над задачами, такими как генерация экспертной обратной связи, выполнение оценок и создание сред для обучения с подкреплением, а также обслуживает предприятия через продукты, включая свой пакет оценки Helix и платформу автоматизации операций. Работа также эволюционирует, поскольку модели выходят за рамки текста в так называемые «мировые модели», которые лучше понимают физическое окружение, включая робототехнику и системы компьютерного зрения.

Клиентами Deccan являются Google DeepMind и Snowflake, согласно информации компании. Она подключила около 10 клиентов и выполняет несколько десятков активных проектов одновременно, рассказал в интервью основатель Rukesh Reddy.

Стартап, расположенный в районе Сан-Франциско с крупной операционной группой в Хайдарабаде, насчитывает около 125 сотрудников и опирается на сеть более чем 1 млн участников, включая студентов, экспертов в области и докторов наук. Примерно от 5 000 до 10 000 участников активны в типичный месяц, сообщил Reddy TechCrunch.

Примерно 10% базы участников Deccan имеют продвинутые степени, такие как магистратура и докторантура, хотя доля выше среди активных участников в зависимости от требований проекта, рассказал Reddy.

Рынок услуг обучения ИИ стремительно расширился наряду с ростом больших языковых моделей, при этом компании, такие как принадлежащая Meta Scale AI и её конкурент Surge AI, а также стартапы Turing и Mercor конкурируют за предоставление услуг разметки данных, оценки и обучения с подкреплением.

«Качество остается нерешённой проблемой», — сказал Reddy, добавив, что допустимость ошибок при постобработке «близка к нулю», поскольку ошибки могут напрямую повлиять на производительность модели в боевой среде. Это делает постобработку более сложной, чем более ранние этапы, требуя высокоточных, специфичных для предметной области данных, которые сложнее масштабировать.

Работа также очень чувствительна ко времени, сказал он, с ИИ-лабораториями, иногда требующими больших объёмов высококачественных данных в течение дней, что затрудняет баланс между скоростью и точностью.

Сектор столкнулся с критикой в отношении условий труда и оплаты, при этом большие группы концертных рабочих часто используются для генерации обучающих данных. Reddy сказал, что доход на платформе Deccan варьируется от примерно $10 до $700 в час, при этом топ-участники зарабатывают до $7 000 в месяц.

Индия становится хабом для таланта в области обучения ИИ

Несмотря на то, что её клиенты в основном базируются в США ИИ-лабораториях, большинство участников Deccan находятся в Индии. Конкуренты, такие как Turing и Mercor, также нанимают подрядчиков из этой страны, но работают в более широком наборе развивающихся рынков.

Deccan выбрала сосредоточить большую часть своей рабочей силы в Индии, чтобы лучше управлять качеством, сказал Reddy. «Многие из наших конкурентов идут в 100+ стран в поиске экспертов», — сказал он. «Если у вас есть операции только в одной стране, намного легче поддерживать качество».

Этот подход подчеркивает текущую позицию Индии в глобальной цепочке стоимости ИИ — как поставщика талантов и обучающих данных, а не разработчика передовых моделей, которые остаются сосредоточены среди горстки компаний США и нескольких игроков в Китае.

Однако Reddy сказал, что Deccan начала нанимать таланты из нескольких других рынков, включая США, для специализированной экспертизы в геопространственных данных и проектировании полупроводников.

Reddy сказал, что Deccan была построена как «родная компания GenAI», в отличие от традиционных фирм по разметке данных, которые начали с задач компьютерного зрения. Это означает, что она сосредоточилась на высокомастерской работе с самого начала.

Deccan выросла в 10 раз за последний год и теперь имеет двузначный миллионный годовой доход, сказал Reddy, отказавшись делиться конкретными цифрами. Около 80% её дохода поступает от пяти крупнейших клиентов, что отражает концентрированный характер рынка передовых ИИ, добавил он.