Компания Cohere, занимающаяся корпоративным ИИ, в четверг запустила свою первую голосовую модель: Transcribe — это открытая модель автоматического распознавания речи, которую можно использовать для задач, таких как создание заметок и анализ речи.

Относительно лёгкая при размере всего в 2 миллиарда параметров, модель предназначена для использования на потребительских GPU для тех, кто хочет размещать её на собственных серверах. В настоящее время она поддерживает 14 языков: английский, французский, немецкий, итальянский, испанский, португальский, греческий, нидерландский, польский, китайский, японский, корейский, вьетнамский и арабский.

Cohere утверждает, что Transcribe превосходит такие модели, как Zoom Scribe v1, IBM Granite 4.0 1B, ElevenLabs Scribe v2 и Qwen3-ASR-1.7B Speech в рейтинге Open ASR на Hugging Face, достигая среднего процента ошибок слов (WER) в 5,42, что ниже, чем у любой другой модели в тестовом сравнении.

Компания утверждает, что Transcribe имела среднюю степень выигрыша в 61% перед другими моделями, когда человеческие оценивающие оценивали её транскрибирования по точности, согласованности и практичности. Однако модель отстала от своих конкурентов при транскрибировании португальского, немецкого и испанского языков.

Cohere утверждает, что Transcribe может обработать 525 минут аудио за минуту, что является высоким показателем для своего класса моделей.

Компания планирует интегрировать Transcribe в свою корпоративную платформу оркестрации агентов North и делает модель доступной через свой API бесплатно. Модель также будет доступна на Model Vault, управляемой платформе вывода Cohere.

Модели распознавания речи становятся всё более популярными по мере растущего спроса на приложения для создания заметок и диктовки, такие как Granola и Wispr Flow.

В начале этого года Cohere, как сообщается, сообщила инвесторам, что генерировала годовой повторяющийся доход в размере 240 миллионов долларов в 2025 году, а генеральный директор Айдан Гомес заявил, что стартап может выйти на IPO «в скором времени».