Приложение для создания заметок Granola на основе искусственного интеллекта, оценённое в 250 миллионов долларов, стало популярным инструментом среди основателей технологических компаний и венчурных капиталистов. Однако один разработчик убежден, что существует спрос на более приватную локальную альтернативу с единовременной платой без подписки. Это привело к созданию нового приложения для Mac под названием Talat.
Разработчик из Йоркшира в Англии Ник Пейн, назвавший себя компьютерным энтузиастом, говорит, что идея создания локального AI-блокнота для встреч появилась в основном в результате серии счастливых случайностей.
«Я думаю, что Granola потрясающая; это яркий пример того, что можно сделать с приложением Electron [фреймворк для построения десктопных приложений], если уделить ему достаточно внимания и заботы», — рассказал он TechCrunch. «Когда я впервые его попробовал, я был очарован тем, что ему удалось записывать системный аудиопоток на моём Mac без записи видео, что было стандартным способом в то время. Это привело к большому количеству исследований и открытию относительно нового и плохо задокументированного Apple API».
Чтобы упростить работу с этим API (Core Audio Taps, который позволяет разработчикам подключаться к аудиопотокам Mac), Пейн решил создать библиотеку с открытым исходным кодом AudioTee.
«В то время я постепенно собирал набор инструментов, но я никогда не находил ничего, что чувствовалось бы как самостоятельный продукт, а не просто крутая техническая демонстрация», — сказал Пейн. «Современные облачные модели транскрибирования — те же поставщики, которые использует Granola, — невероятные, и это очень впечатляет видеть, как ваша речь разворачивается на экране практически в реальном времени. Но меня всегда беспокоило, что компромисс требовал предоставления не только моих данных, но и моих аудиоданных; моего собственного голоса», — добавил он.
Затем он наткнулся на программный набор инструментов FluidAudio — фреймворк Swift, который обеспечивает полностью локальное и низколатентное аудио AI на устройствах Apple. Это позволяет запускать небольшие и быстрые модели транскрибирования прямо на Neural Engine Mac — выделенном оборудовании Apple для обработки AI.
Это было то, что заставило Пейна понять, что он может превратить своё исследование в реальный продукт — тот, в котором ваш аудиопоток никогда не покидает ваш Mac, а ваши транскрипции не хранятся на серверах другой компании.
Talat, разработанный вместе с давним другом и бывшим коллегой Пейна Майком Франклином, является результатом интереса Пейна к аудиопространству. Результат — 20 МБ приложение с единовременной платой, которое не требует создания учётной записи или даже отправки данных аналитики разработчикам. Нет никаких текущих сборов.
Хотя некоторые AI-блокноты для встреч могут иметь больше функций, Talat предлагает упрощённый набор возможностей. Он захватывает аудиопоток с микрофона вашего компьютера, когда вы находитесь в приложениях для видеоконференций, таких как Zoom, Teams, Meet и другие, и транскрибирует его в реальном времени. Приложение пытается определить говорящих в реальном времени, но вы можете переназначить их при необходимости. Вы также можете делать заметки, редактировать, удалять или разделять сегменты транскрипции. Когда встреча закончится, локальная языковая модель создаёт резюме с ключевыми моментами, решениями и пунктами действий.
Заметки, транскрипции и резюме в Talat также доступны для поиска.
Помимо аспекта приватности, Пейн сказал, что целью является предоставление пользователям больше вариантов.
«Мы акцентируем внимание на настраиваемости и даём пользователям возможность контролировать, где идут их данные: выбрать собственную языковую модель, автоматически экспортировать в Obsidian, вебхуки, которые выталкивают данные при завершении встречи, MCP сервер», — объяснил он, что это стандартизированный способ подключения AI-инструментов к внешним источникам данных, «для его извлечения по требованию».
Под капотом AI представляет собой комбинацию — «в основном собранную и абстрагированную за FluidAudio», — отметил Пейн, отдав должное за выполнение большей части тяжёлой работы. Для части резюмирования приложение по умолчанию использует модель AI под названием Qwen3-4B-4bit, которая может работать даже на относительно скромном оборудовании.
Однако пользователи могут переключиться на любого облачного поставщика языковой модели на свой выбор, или они могут выбрать один из двух вариантов Parakeet — моделей распознавания речи, разработанных Nvidia, — или указать его на Ollama (инструмент для локального запуска AI-моделей), давая им больше контроля над опытом. Со временем Talat добавит поддержку большего количества встроенных вариантов и будет иметь интеграции с другими приложениями, такими как Google Calendar и Notion.
При запуске пользователи с компьютерами на базе процессоров M-series (те, которые работают на собственных процессорах Apple, начиная с M1), могут загрузить приложение и попробовать его бесплатно с 10 часами записей, прежде чем решить покупку.
Talat доступен за 49 долларов во время этой предварительной версии, которая всё ещё находится в активной разработке.
Когда приложение достигнет выпуска версии 1.0, цена увеличится до 99 долларов.
Пейн и Франклин самостоятельно финансируют Talat и планируют сохранить основной продукт как единовременную покупку в будущем.