На этой неделе Anthropic объявила, что ограничила выпуск своей новейшей модели под названием Mythos, поскольку она слишком способна находить уязвимости безопасности в программном обеспечении, которым пользуются люди по всему миру.
Вместо того чтобы выпустить Mythos для широкой публики, лаборатория передовых разработок будет делиться ей с группой крупных компаний и организаций, управляющих критической онлайн-инфраструктурой, от Amazon Web Services до JPMorgan Chase.
OpenAI, похоже, рассматривает аналогичный план для своего следующего инструмента кибербезопасности. Официальная идея заключается в том, чтобы позволить этим крупным предприятиям опередить злоумышленников, которые могли бы использовать передовые LLM для проникновения в защищённое программное обеспечение.
Но слово «якобы» в приведённом выше предложении намекает на то, что в этой стратегии выпуска может быть больше, чем просто кибербезопасность или раздувание способностей модели.
Дэн Лахав, генеральный директор лаборатории искусственного интеллекта в области кибербезопасности Irregular, рассказал TechCrunch в марте, до выпуска Mythos, что хотя обнаружение уязвимостей инструментами ИИ имеет значение, конкретная ценность любой слабости для злоумышленника зависит от многих факторов, включая то, как их можно использовать в комбинации.
«Вопрос, который я всегда задаю себе, — это нашли ли они что-то, что можно эксплуатировать очень значимым образом, будь то индивидуально или как часть цепочки?» — сказал Лахав.
Anthropic утверждает, что Mythos способна эксплуатировать уязвимости намного лучше, чем её предыдущая модель Opus. Но неясно, является ли Mythos действительно универсальной моделью для кибербезопасности. Стартап Aisle, специализирующийся на искусственном интеллекте в области кибербезопасности, заявил, что смог воспроизвести большую часть того, что Anthropic утверждает, что достигла Mythos, используя меньшие модели с открытыми весами. Команда Aisle утверждает, что эти результаты показывают, что не существует единой модели глубокого обучения для кибербезопасности, а всё зависит от конкретной задачи.
Учитывая, что Opus уже считалась революционным инструментом для кибербезопасности, есть ещё одна причина, по которой лаборатории передовых разработок могут хотеть ограничить свои выпуски крупными организациями: это создаёт эффект маховика для корпоративных контрактов, затрудняя конкурентам копирование их моделей с использованием дистилляции — метода, который использует передовые модели для дешёвого обучения новых LLM.
«Это маркетинговое прикрытие факта, что модели высокого уровня теперь заблокированы корпоративными соглашениями и больше недоступны небольшим лабораториям для дистилляции», — предположил Дэвид Крошо, разработчик программного обеспечения и генеральный директор стартапа exe.dev, в публикации в социальных сетях. «К тому времени, когда вы и я сможем использовать Mythos, будет новая версия высокого уровня, которая будет доступна только для предприятий. Этот конвейер помогает поддерживать корпоративные доллары в движении (что составляет большинство доходов), поскольку компании дистилляции остаются на втором месте», — добавил Крошо.
Этот анализ соответствует тому, что мы видим в экосистеме ИИ: гонка между лабораториями передовых разработок, разрабатывающими крупнейшие и наиболее способные модели, и компаниями вроде Aisle, которые опираются на несколько моделей и рассматривают открытые исходные LLM, часто из Китая и часто предположительно разработанные посредством дистилляции, как путь к экономическому преимуществу.
Лаборатории передовых разработок в этом году стали занимать более жёсткую позицию в отношении дистилляции, при этом Anthropic публично раскрыла то, что она утверждает, являются попытками китайских фирм скопировать её модели, и три ведущие лаборатории — Anthropic, Google и OpenAI — объединились для выявления дистилляторов и их блокировки, согласно отчёту Bloomberg.
Дистилляция угрожает бизнес-модели лабораторий передовых разработок, поскольку исключает преимущества, обеспечиваемые использованием огромных объёмов капитала в масштабе. Блокировка дистилляции, таким образом, уже стоит того, но избирательный подход к выпуску также даёт лабораториям способ дифференцировать их корпоративные предложения по мере того, как эта категория становится ключом к прибыльному развёртыванию.
Остаётся неясным, угрожает ли Mythos или любая новая модель безопасности интернета, и тщательное развёртывание технологии — это ответственный путь вперёд.
Anthropic не ответила на наши вопросы о том, связано ли решение также с проблемами дистилляции на момент публикации, но компания могла найти хитроумный подход к защите интернета — и своего результата.