Conntour привлекла $7M от General Catalyst и Y Combinator для создания AI поисковой системы по видео системам безопасности
Индустрия технологий наблюдения сегодня в центре внимания, но не по лучшим причинам. На фоне скандала, когда служба иммиграции и таможни США использовала сеть камер Flock для наблюдения за людьми, и критики в адрес компании Ring за разработку функций, позволяющих правоохранительным органам просить домовладельцев поделиться видео их окрестностей, разгорается широкая дискуссия о безопасности, приватности и о том, кто имеет право наблюдать за кем.
Однако контроверсия не стирает рынки, и постоянное совершенствование vision-language моделей только добавило ветра в паруса компаний, разрабатывающих новые способы помощи компаниям в мониторинге происходящего на их территории.
По словам Матана Голднера, со-основателя и CEO стартапа видеонаблюдения Conntour, этика в этой области достаточно важна, поэтому его компания весьма избирательна в выборе клиентов. Это может показаться неудачным бизнес-решением для стартапа, работающего всего два года, но Голднер говорит, что может себе это позволить, поскольку у Conntour уже есть несколько крупных государственных и публичных клиентов, включая Бюро по контролю наркотиков Сингапура.
«Тот факт, что у нас есть такие крупные клиенты, позволяет нам их выбирать и сохранять контроль [...] Мы действительно контролируем, кто это использует, какой это вариант использования, и можем выбирать то, что считаем моральным и, конечно, законным. Мы используем всё своё суждение и принимаем решения на основе конкретных клиентов, с которыми, как мы знаем, правильно обойдёмся, потому что знаем, как они это будут использовать», — сказал Голднер в эксклюзивном интервью TechCrunch.
Такой успех помог Conntour не только быть разборчивой. Инвесторы обратили внимание: стартап недавно привлёк раунд финансирования в размере $7 млн от General Catalyst, Y Combinator, SV Angel и Liquid 2 Ventures.
Голднер сказал, что раунд был закрыт за 72 часа. «Я думаю, что я запланировал около 90 встреч за восемь дней, и уже через три дня — мы начали в понедельник и к среде во второй половине дня всё было готово», — сказал он.
Тем не менее, Conntour может быть прав в своей избирательности, особенно учитывая, насколько мощными стали AI инструменты в этом пространстве. Собственная видеоплатформа компании использует AI модели, которые позволяют персоналу безопасности делать запросы к видеопотокам на естественном языке для поиска любого объекта, человека или ситуации в записях в реальном времени — это поисковая система, похожая на Google, но специально созданная для видео безопасности. Она также может самостоятельно отслеживать и обнаруживать угрозы на основе предварительно установленных правил и автоматически выводить оповещения.
В отличие от устаревших систем, которые зависят от предварительно заданных определений или параметров для обнаружения конкретных объектов, паттернов движения или поведения, Conntour утверждает, что его система использует модели естественного языка и видения, что придаёт ей высокую степень гибкости и удобства использования. Пользователь может спросить: «Найди случаи, когда кто-то в кроссовках передавал сумку в холле», и система Conntour быстро найдёт все записанные или живые видеопотоки, чтобы вернуть релевантные результаты.
И поскольку платформа встраивает AI модели, пользователи могут просто задавать вопросы о видео и получать ответы в текстовом виде, сопровождаемые релевантными видеопотоками, а также создавать отчёты об инцидентах.
Однако основной конкурентный аргумент компании — это масштабируемость. Голднер объяснил, что платформа отличается от других сервисов AI видеопоиска тем, что разработана для эффективного масштабирования систем, состоящих из тысяч камер. По его словам, система Conntour может отслеживать до 50 видеопотоков с одного потребительского GPU вроде Nvidia RTX 4090.
Компания достигает этого, используя несколько моделей и логических систем, а затем определяя, какие модели и системы алгоритм должен использовать для каждого запроса, чтобы требовать минимальное количество вычислительной мощности и давать пользователям лучшие результаты.
Conntour утверждает, что её система может быть развёрнута полностью на месте, полностью в облаке или в комбинированном виде. Она может интегрироваться с большинством уже используемых систем безопасности или служить полностью самостоятельной платформой видеонаблюдения.
Но в индустрии видеонаблюдения долгое время существует проблема: качество видеонаблюдения зависит только от качества снятого видео. Трудно разглядеть детали в видео плохо освещённой автостоянки, записанном камерой низкого разрешения с грязной линзой.
Голднер говорит, что Conntour решает эту неизбежность, предоставляя оценку уверенности вместе с результатами поиска. Если качество видеопотока из камеры недостаточно хорошее, система вернёт результаты с низкими уровнями уверенности.
В будущем Голднер говорит, что самой большой технической проблемой является обеспечение полного уровня возможностей LLM в системе при сохранении её эффективности.
«У нас есть две вещи, которые мы хотим делать одновременно, и они противоречат друг другу. С одной стороны, мы хотим предоставить полную гибкость естественного языка, в стиле LLM, чтобы позволить вам спросить что угодно. С другой стороны, есть эффективность, так что мы хотим, чтобы она использовала очень мало ресурсов, потому что обработка тысяч видеопотоков — это просто безумие. Это противоречие — это самый большой технический барьер и проблема в нашей области, и над этим мы работаем очень, очень усердно», — добавил он.