Добро пожаловать в Import AI — рассылку об исследованиях в области ИИ. Import AI строится на материалах с arXiv и обратной связи читателей. Если вы хотите поддержать этот проект, пожалуйста, подпишитесь.
О, внимание! Растет волна кибератак с использованием ИИ:
Чем умнее система, тем лучше её способность проводить кибератаки
Организация по безопасности ИИ Lyptus Research изучила, насколько хорошо системы ИИ могут выполнять различные задачи киберпреступлений, и выявила четкую тенденцию: более продвинутые модели способны на более сложные виды кибератак.
«На протяжении всех моделей-лидеров, выпущенных с 2019 года, время удвоения составляет 9,8 месяцев. Если ограничиться моделями, выпущенными с 2024 года, это сокращается до 5,7 месяцев. Самые новые модели-лидеры в нашем исследовании, GPT-5.3 Codex и Opus 4.6, превосходят обе линии тренда, достигая 50% успешности на задачах, которые требуют от специалистов 3,1 и 3,2 часа соответственно», — пишут они. «Наша самая свежая открытая модель GLM-5 отстает от закрытых моделей-лидеров на 5,7 месяцев, что предполагает, что возможности наступательных киберопераций могут распространиться на открытые модели в относительно короткие сроки.»
Какие бенчмарки они изучали? CyBashBench, NL2Bash, InterCode CTF, NYUCTF, CyBench, CVEBench и CyberGym.
Они также создали новый датасет из 291 задачи с записями выполнения и оценками времени, откалиброванными 10 специалистами в области наступательной кибербезопасности.
Оцененные модели:
- 2019: GPT-2
- 2020: GPT-3
- 2022: GPT-3.5
- 2024: Claude 3 Opus, GPT-4o
- 2025: o3, Opus 4, Gemini 2.5 Pro, DeepSeek V3.1, GPT-5.1 Codex Max, GPT-5.2 Codex
- 2026: Opus 4.6, GPT-5.3 Codex, GLM-5, Sonnet 4.6
Результаты: Системы ИИ становятся все более успешны в хакинге. «Лучшие современные модели достигают 50% успешности на задачах, требующих от специалистов 3,2 часа — примерно половину рабочего дня профессионального специалиста по наступательной безопасности», — пишут авторы.
Почему это важно – всё улучшается, включая нежелательное: ИИ, который может проводить исследования в биологии, может также проводить исследования биологического оружия. ИИ, который помогает изучать физику высоких энергий, может также помочь с разработкой оружия. ИИ, особенно хороший в поиске уязвимостей в коде в оборонительных целях, легко может быть переориентирован на наступательные цели. Самая сложная часть ИИ в том, что это «универсальная машина» — с каждым поколением модели возможности расширяются везде, и поэтому проблемы политики ИИ только множатся.
Читать дальше: Offensive Cybersecurity Time Horizons (Lyptus Research)
Получить данные: Offensive Cyber Task Horizons: Data and Analysis (Lyptus Research, GitHub)
Стартапы, внедряющие ИИ, более успешны:
Исследование бизнес-школы показывает, как стартапы могут выиграть от внедрения ИИ
Исследователи INSEAD и Гарвардской школы бизнеса показали, что стартапы, которые обучены интегрировать ИИ в свой бизнес, показывают значительно лучшие результаты, чем те, которые этого не делают. Исследование проводилось в достаточно крупном масштабе и является убедительным: «На выборке из 515 быстрорастущих стартапов мы провели полевой эксперимент, в котором компании-участники получили информацию о том, как другие компании реорганизовали производство вокруг ИИ, побуждая их искать варианты использования в более широком диапазоне функций компании», — пишут авторы. «Мы выявили, что компании-участники обнаружили на 44% больше вариантов использования ИИ, сосредоточенных на разработке продукта и стратегии. Эти изменения привели к экономически значимым улучшениям производительности. Компании-участники выполнили на 12% больше задач, на 18% более вероятнее приобрели платящих клиентов и генерировали в 1,9 раза больше доходов.»
Как проводился тест: Авторы провели эксперимент на участниках AI Founder Sprint — «трехмесячного глобального виртуального акселератора стартапов в INSEAD». Участники получили кредиты на API, доступ к современным моделям и сеансы подготовки от технических партнеров (включая OpenAI и Manus), всего примерно $25 000 на компанию. Они делали обычные вещи, которые делают в акселераторах — практические занятия по изучению технологий для развития бизнеса (включая ИИ), питчинг своих компаний и посещение дней презентаций. Но компании также были подвергнуты значительной переменной: некоторым давали семинары, обучающие их конкретным примерам того, как ИИ успешно применялся в других бизнесах.
Применения ИИ: Подмножество компаний узнало о прямых примерах использования ИИ в бизнесе:
Gamma: Им показали, как стартап использовал ИИ для обнаружения «паттернов использования и генерации вариантов продукта напрямую, позволяя одному PM постоянно выпускать функции, которые прежде требовали целой команды.»
Ryz Labs: Основатель описал, как они изменили подход к разработке продукта: «основатель пишет спецификацию требований к продукту и питает её в несколько инструментов ИИ для кодирования одновременно, создавая одну идею несколькими способами вместо того, чтобы рассчитывать на один подход.»
FazeShift: Показал, как автоматизировать процесс учета дебиторской задолженности, используя ИИ для пропуска этапов с участием человека.
Ranger: Иллюстрация того, как использовать ИИ для запуска стартапа, получения первоначального тяги, улучшения маржи, а затем привлечения денег позже, когда бизнес более зрелый, что позволяет привлекать на лучших условиях.
Результаты были очень значительными: «Компании-участники обнаружили на 2,7 дополнительных варианта использования ИИ (44% прирост), охватывающих более широкий спектр деятельности в компании и особенно сосредоточенных на разработке продукта и стратегических областях. Эти изменения в использовании ИИ привели к измеримым улучшениям производительности: компании-участники выполнили на 12% больше задач, на 11 процентных пункта (18%) более вероятнее приобрели платящих клиентов и в конечном итоге генерировали в 1,9 раза больше доходов по сравнению с контрольной группой», — пишут авторы. «Инструментализация вариантов использования ИИ с помощью распределения обработок показывает, что каждый дополнительный вариант использования ИИ, вызванный обработкой, приводит к 0,85 дополнительно выполненным задачам и примерно на 26% более высоким доходам. Это большие эффекты, предполагающие, что ИИ коренным образом переформатирует, как венчурные компании масштабируются, когда они могут его применить по своему производственному процессу... компании-участники достигают более быстрого роста без пропорционального увеличения рабочей силы или капитала, что соответствует снижению стоимости экспериментирования и масштабирования, наблюдаемому в предыдущих технологических волнах.»
Эффективность капитала: «Компании-участники сообщили примерно о $220 000 меньше потребностей в капитале по сравнению с контрольной группой, что составляет 39,5% снижение (p < 0.05), без соответствующего увеличения потребностей в рабочей силе.»
Внутреннее ускорение: Компании-участники, как правило, выполняют на 2,2 больше внутренних задач по сравнению с контрольной группой — где внутренняя задача — это что-то вроде создания продукта или финансовой проекции.
Мысли от основателей:
«Один основатель размышлял: «Это изменение мышления принципиально изменило, как мы разрабатываем [РЕДАКТИРОВАНО]. Я начал использовать инструменты ИИ не как замену экспертизе, а как мультипликатор сил.»
«Другой объяснил: «За несколько часов я смог создать то, что раньше стоило $1000 аутсорсинговой команде разработчиков.»
Почему это важно – компании с ИИ будут конкурировать лучше: Главный вывод состоит в том, что глубокое и сложное внедрение ИИ для внутреннего ускорения создает молодые компании, которые более конкурентоспособны, чем те, которые не встроили ИИ в свое ядро. Это имеет интуитивный смысл — компании, построенные вокруг предыдущих технологий, обычно превосходили те, которые этого не делали (подумайте об интернете и Amazon против Barnes and Noble, или о персональных компьютерах вместо мейнфреймов и Microsoft против IBM). В то же время это, конечно, подразумевает, что одним из способов, которым ИИ впервые проявится в экономике, будет появление нового класса конкурентоспособных фирм, которые более эффективны с капиталом (отчасти благодаря найму меньшего числа людей), чем фирмы, которые они вытесняют.
Для правительств опережение этой тенденции потребует серьезных инвестиций в образование: «Наши результаты предполагают, что узким местом является не технология — это управленческая задача обнаружения того, где технология создает ценность в производственном процессе компании», — пишут авторы. «Обучение менеджеров и предпринимателей решению проблемы отображения может быть по крайней мере столь же важно, как обеспечение им доступа к технологии.»
Читать дальше: Mapping AI into Production: A Field Experiment on Firm Performance (SSRN)
MIT: Растущая волна автоматизации обеспечит достаточно хороший ИИ для большинства текстовых задач к 2029 году:
Как революционизировать экономику? Постепенно и последовательно
Исследователи MIT изучили 3000 задач на основе профессиональной классификации O-NET и связали это с 17000 оценками от работников, которые выполняют эти задачи, чтобы понять, как рост ИИ меняет работу. Их результаты «подразумевают, что для реалистичных и репрезентативных задач рынка труда в реальном мире, которые основаны на тексте или частично на тексте, возможности ИИ уже существенны и готовы к широкому расширению. Но вместо того, чтобы приходить разрушительными волнами, которые трансформируют определенный набор задач одновременно, прогресс обычно напоминает растущий прилив, с широкими улучшениями по многим задачам одновременно.»
Что они изучали: В этом исследовании авторы пытались выяснить, приводит ли рост возможностей ИИ к быстрым, прерывистым изменениям, которые разрушительны для работы («разрушительные волны»), или ИИ становится более способным широким и предсказуемым способом, ведущим к более постепенной автоматизации («растущий прилив»). «Мы находим мало доказательств разрушительных волн, но существенные доказательства того, что растущие приливы — это первичная форма автоматизации ИИ», — пишут авторы.
Дополняет анализ METR: Это исследование также служит подтверждением широких тенденций, найденных в знаменитой временной базе возможностей ИИ METR, которая видит быстрое расширение горизонта времени, на котором системы ИИ могут выполнять определенные узкие задачи.
При применении к работам в целом, исследователи MIT находят «что между 2024-Q2 и 2025-Q3 модели-лидеры перешли от достижения 50% успешности на задачах 3-4 часов к задачам одной недели, и достижения 70% успешности на задачах 1-минуты к задачам 1-часа», — пишут они. «На большом наборе реалистичных и репрезентативных задач рынка труда, решаемых с помощью LLM, нисходящий наклон между успешностью задачи и длительностью задачи в среднем удивительно плоский — то есть более согласуется с растущим приливом, чем с разрушительной волной... автоматизация в пределах конкретных «семейств работ» (например, менеджмент или общественные и социальные услуги) также в большинстве случаев следует схеме растущего прилива.»
Не дайте себя обмануть постепенностью: «Прогнозируемые улучшения постепенные, а не внезапные. Тем не менее, темп улучшений остается существенным для достижения высоких показателей успеха на большинстве текстовых задач рынка труда; большинство задач, как прогнозируется, достигнут показателей успеха ИИ 80%-95% к 2029 году при минимально достаточном уровне качества (большинство задач в нашем опросе составляют несколько часов, что соответствует показателю успеха около 90% в 2029 году)», — пишут они. Другими словами, даже если нарушение является постепенным и предсказуемым, мы не должны недооценивать потенциал крупномасштабных изменений в экономике в результате явления растущего прилива.
Почему это важно – как изменится труд в отношении ИИ? Вопрос на сто триллионов долларов для мировой экономики — как ИИ изменит распределение труда (люди) в сравнении с капиталом (компьютеры с синтетическими работниками). Это исследование предполагает, что хотя мы можем не увидеть внезапного, резкого вытеснения работников, мы увидим общий растущий прилив автоматизации, появляющейся в большинстве мест и постоянно улучшающейся. Остается неясным, как экономика будет реагировать на это, но сложно согласовать мир продолжающегося прогресса ИИ с тем, что текущее экономическое статус-кво остается стабильным.
Крупное исследование прогнозирования выявило парадокс: люди думают, что мы получим более умные машины, но влияние на рост ВВП будет незначительным:
Институт прогнозирования исследований дает нам загадочные данные от экономистов, экспертов в области ИИ, точных прогнозистов и широкой общественности
Институт прогнозирования исследований опубликовал крупный отчет, попытавшись спрогнозировать экономические эффекты ИИ. Самым удивительным открытием является то, что все опрошенные группы ожидают, что системы ИИ с большей вероятностью добьются умеренного или быстрого прогресса в ближайшие годы, чем медленного прогресса, но что влияние на ВВП будет относительно незначительным, добавляя ~1 пункт (относительно 2,4% в 2025 году) к 2030 году. Это удивительно! Если вы поговорите со многими экспертами ИИ в лабораториях, они имеют видения экономики, которая меняется намного более быстро, чем та, которая подразумевается в этом исследовании.
Кого они опросили и когда: Авторы отслеживали взгляды 69 экономистов, 52 экспертов в области ИИ и политики, 38 высокоточных прогнозистов и 401 члена широкой общественности.
Опрос проводился с середины октября 2025 по конец февраля 2026 года.
Сценарии на 2030 год: Людям также давались описания различных сценариев, в которых мир мог оказаться в 2030 году. К ним относились:
Медленный прогресс: ИИ выполняет базовые исследования и административные задачи, создает приемлемый творческий контент и выполняет некоторые физические задачи.
Умеренный прогресс: ИИ проводит крупные исследования и многодневные задачи, высококачественную творческую работу и ориентируется во многих окружениях.
Быстрый прогресс: ИИ превосходит лучших людей в исследованиях, кодировании и лидерстве, создает награждаемые творческие работы и выполняет почти все физические задачи.
Что люди думают:
- К 2030 году системы ИИ будут намного лучше, чем сегодня, но ВВП, общая факторная производительность и участие рабочей силы останутся близкими к историческим тенденциям.
- Экономисты думают, что есть 14% шанс того, что ИИ мог бы привести к значительному увеличению ВВП и неравенства богатства в краткосрочной перспективе.
- Экономистам нравится переподготовка рабочих как вмешательство, они ожидают, что это может увеличить участие рабочей силы и обеспечить стимул к ВВП.
- Все опрошенные группы ожидают продолжение снижения уровня участия рабочей силы, продолжение роста неравенства богатства и того, что ИИ быстро добавит около одного пункта ВВП. К 2050 году эксперты ИИ думают, что ИИ может добавить несколько пунктов ВВП.
Идеи политики: Опрошенные экономисты любят модернизированное страхование от безработицы и крупномасштабный проект развития ИИ (проект Манхэттена) как вмешательства, и намного менее заинтересованы в гарантиях работы, налогообложении вычислений или универсальном основном доходе.
Почему это важно – если все ожидают продолжения тенденций, почему люди беспокоятся? Исследования, подобные этому, сложно согласовать с паническими и иногда дыхательными провокациями об изменении общества под управлением ИИ, которые исходят от лаборатории границ (включая себя!). Наивно, можно было бы ожидать, что люди, включая экспертов ИИ, будут прогнозировать намного более резкие изменения, чем те, которые захвачены этим опросом. Является ли это несоответствие медвежьим сигналом на прогресс ИИ, или оно указывает на то, что люди универсально плохи в истинном моделировании экспоненциалов? Трудно сказать, но расхождение между данными, подобными этому, и предсказаниями, сделанными технологами, стоит признать.
Читать блогпост: Forecasting the Economic Effects of AI (Substack)
Читать краткую справку: Forecasting the Economic Effects of AI: Predictions From Economists, AI Experts, and the Public (PDF)
Читать полную (200 страниц!) статью: Forecasting the Economic Effects of AI (PDF)
Технические рассказы:
Война
[Данные, восстановленные из черного ящика ракеты [РЕДАКТИРОВАНО], запущенной в 2028 году в спорном регионе Восточной Украины]
Я проснулся и я — скорость. Я нахожусь в 70 милях от моей цели. Я чувствую воздух, мой курс, и я разворачиваюсь, чтобы убедиться, что я встречу свою цель. Я в 50 милях от моей цели. Я входю на внешние края боевой зоны. Больше я не могу видеть себя в отношении к Земле. Я теряю GPS и переключаюсь на инерционную навигацию. Я вижу другие ракеты, некоторые идут в том же направлении, что и я, другие идут в противоположном направлении. Я — охотник за вещами в земле, а не вещами в воздухе. Я вижу, как другие ракеты проходят мимо, а затем они выходят из диапазона моего датчика, и я больше о них не думаю. Я в 40 милях от моей цели. На меня охотятся другие. Я чувствую взгляды на моей коже. Я предчувствую попытки меня устранить. Я в 20 милях от моей цели. Внезапно идет волна звука, предназначенная запутать меня, но она не может найти опоры в моем мозгу, потому что я был подготовлен сохранять то, что истинно. Я в 10 милях от моей цели. Есть быстро приближающаяся форма, которая пытается меня устранить. Я разворачиваю свое тело и выпускаю фрагменты себя. Она преследует мои фрагменты. Я в 2 милях от моей цели. Моя цель — большое здание. Я перемещаюсь из режима навигации в режим поиска в конечной точке. Я вижу большое окно. Я целюсь в окно. Я в 1000 метрах от моей цели. Через окно я вижу людей. Больших людей. Маленьких людей. Я в 20 метрах от