Если бы исследователи Google обладали чувством юмора, они назвали бы новый суперэффективный алгоритм сжатия памяти ИИ TurboQuant, представленный во вторник, «Крысоловом» — или, по крайней мере, так думает интернет.

Шутка ссылается на вымышленный стартап Крысолов, который был главным героем сериала HBO «Кремниевая долина» (2014–2019).

Сериал следил за основателями стартапа, когда они ориентировались в экосистеме технологий, сталкиваясь с проблемами конкуренции крупных компаний, привлечения инвестиций, технологических и продуктовых вопросов, и даже впечатляя судей на вымышленной версии TechCrunch Disrupt.

Прорывная технология Крысолова в сериале была алгоритмом сжатия, который значительно снижал размер файлов практически без потери качества. Google Research's TurboQuant также ориентирован на экстремальное сжатие без потери качества, но применен к ключному узкому месту в системах ИИ. Отсюда и сравнения.

Google Research описала технологию как новый способ сократить рабочую память ИИ без влияния на производительность. Метод сжатия, использующий форму векторного квантования для устранения узких мест кэша при обработке ИИ, по сути позволит ИИ запоминать больше информации, занимая меньше места при сохранении точности, согласно исследователям.

Они планируют представить свои результаты на конференции ICLR 2026 в следующем месяце вместе с двумя методами, делающими возможным это сжатие: методом квантования PolarQuant и методом обучения и оптимизации QJL.

Понимание математики, задействованной здесь, может быть доступно исследователям и компьютерным ученым, но результаты волнуют широкую технологическую индустрию в целом.

При успешной реализации в реальном мире TurboQuant мог бы сделать ИИ дешевле в запуске, сократив его рабочую «память» во время выполнения — известную как KV кэш — в «как минимум 6 раз».

Некоторые, как генеральный директор Cloudflare Мэтью Принс, даже называют это моментом DeepSeek от Google — ссылка на прирост эффективности, достигнутый китайской моделью ИИ, которая была обучена с дробью стоимости своих конкурентов на худших чипах, оставаясь конкурентоспособной по результатам.

Тем не менее, стоит отметить, что TurboQuant еще не был широко развернут; пока это прорыв в лаборатории.

Это делает сравнения с чем-то вроде DeepSeek или даже вымышленного Крысолова более сложными. На телевидении технология Крысолова была готова радикально изменить правила вычислений. TurboQuant тем временем мог бы привести к повышению эффективности и системам, требующим меньше памяти во время вывода. Но это не обязательно решит более широкие нехватки памяти, вызванные ИИ, учитывая, что он нацелен только на память вывода, а не обучения — последнее по-прежнему требует огромных объемов оперативной памяти.

%%CONTENT_END%%