Большие языковые модели, обученные на обширных наборах данных, могут ускорить исследования геномики, упростить медицинскую документацию, улучшить диагностику в реальном времени, поддержать клиническое принятие решений, ускорить открытие лекарств и даже создать синтетические данные для продвижения экспериментов.

Однако их потенциал для преобразования биомедицинских исследований часто натыкается на узкое место: помимо структурированных данных, которые использует здравоохранение, эти модели испытывают трудности в пограничных случаях, таких как редкие заболевания и необычные состояния, где надёжные репрезентативные данные дефицитны.

Компания Mantis Biotech из Нью-Йорка заявляет, что разрабатывает решение для заполнения этого пробела в доступности данных. Платформа компании интегрирует данные из различных источников для создания синтетических наборов данных, которые используются для построения так называемых «цифровых двойников» человеческого тела: основанных на физике предсказательных моделей анатомии, физиологии и поведения.

Компания позиционирует эти цифровые двойники для использования в агрегации и анализе данных. Эти цифровые двойники можно использовать для изучения и тестирования новых медицинских процедур, обучения хирургических роботов, а также для моделирования и прогнозирования медицинских проблем или даже поведенческих паттернов. Например, спортивная команда могла бы предсказать вероятность получения травмы ахиллова сухожилия конкретным игроком НФЛ на основе его недавних показателей, тренировочной нагрузки, диеты и того, как долго он активен, как объяснила TechCrunch основательница и генеральный директор Mantis Джорджия Витчел в недавнем интервью.

Для построения этих двойников платформа Mantis сначала берёт данные из различных источников, таких как учебники, камеры захвата движения, биометрические датчики, журналы тренировок и медицинская визуализация. Затем она использует систему на основе LLM для маршрутизации, валидации и синтеза различных потоков данных и пропускает всю эту информацию через физический движок для создания высокодетальных рендеров этого набора данных, которые затем можно использовать для обучения предсказательных моделей.

«Мы можем взять все эти разрозненные источники данных и превратить их в предсказательные модели для того, как люди будут выступать. Поэтому каждый раз, когда вы хотите предсказать, как будет выступать человек, это действительно хороший вариант использования для нашей технологии», — сказала Витчел.

Слой физического движка здесь ключевой, как рассказала Витчел TechCrunch, потому что он помогает платформе улучшать доступную информацию, основывая сгенерированные синтетические данные и реалистично моделируя физику анатомии.

«Если бы я попросила вас сделать оценку позы руки для человека, у которого отсутствует палец, это было бы действительно, действительно сложно, потому что нет общедоступных наборов данных с отмеченными позициями руки человека, у которого отсутствует палец. Мы могли бы создать этот набор данных очень легко, потому что мы просто берём нашу физическую модель и говорим: удалить палец X, перестроить модель», — сказала она.

Поскольку платформа Mantis заполняет пробелы в источниках данных, Витчел считает, что существует потенциал для её широкого использования в биомедицинской отрасли, где информация о процедурах или пациентах может быть сложной для доступа, неструктурированной или разбросанной по различным источникам. Она подчеркнула пограничные случаи или редкие заболевания, где данные трудно получить, так как часто существуют этические и нормативные ограничения на включение данных пациентов в общедоступные наборы данных или использование их для обучения моделей ИИ.

«Вы знаете, когда видите трёхлетнего ребёнка, который бегает с куклой Барби и держит её за одну ногу, и ударяет её о стол? Я хочу, чтобы люди имели такой подход к нашим цифровым двойникам», — сказала она. «Я думаю, это откроет людям идею о том, что виртуальных людей можно тестировать. Я чувствую, что в настоящее время люди работают с совершенно противоположным мышлением, что полностью имеет смысл, потому что приватность людей должна уважаться. На самом деле, я не думаю, что данные людей должны вообще эксплуатироваться, особенно когда у вас есть эти цифровые двойники».

На данный момент Mantis добилась успеха в профессиональном спорте, вероятно потому, что существует потребность в моделировании высокопроизводительных спортсменов. Витчел сказала, что одним из основных клиентов стартапа является команда НБА.

«Мы создаём цифровые представления спортсменов, где по сути показывается: вот как этот спортсмен прыгал, не только сегодня, но и каждый день в течение прошлого года, и вот как меняются их прыжки с течением времени в зависимости от того, сколько они спят или сколько раз они поднимают руки выше головы», — объяснила она.

Стартап недавно привлёк $7,4 млн в ходе раунда seed-финансирования во главе с Decibel VC при участии Y Combinator, нескольких бизнес-ангелов и Liquid 2. Средства будут использованы на найм персонала, рекламу, маркетинг и функции выхода на рынок.

Следующий этап для Mantis, по словам Витчел, — это продолжить разработку технологии и в конечном итоге выпустить платформу для широкой общественности, ориентируясь на профилактическое здравоохранение. Компания также работает над адаптацией для фармацевтических лабораторий и исследователей, работающих над испытаниями FDA, с целью получения информации о том, как пациенты реагируют на лечение.