Cohere запустила открытую модель голоса специально для транскрибирования

Компания Cohere, занимающаяся корпоративным ИИ, в четверг запустила свою первую голосовую модель: Transcribe — это открытая модель автоматического распознавания речи, которую можно использовать для задач, таких как создание заметок и анализ речи.

Относительно лёгкая при размере всего в 2 миллиарда параметров, модель предназначена для использования на потребительских GPU для тех, кто хочет размещать её на собственных серверах. В настоящее время она поддерживает 14 языков: английский, французский, немецкий, итальянский, испанский, португальский, греческий, нидерландский, польский, китайский, японский, корейский, вьетнамский и арабский.

Cohere утверждает, что Transcribe превосходит такие модели, как Zoom Scribe v1, IBM Granite 4.0 1B, ElevenLabs Scribe v2 и Qwen3-ASR-1.7B Speech в рейтинге Open ASR на Hugging Face, достигая среднего процента ошибок слов (WER) в 5,42, что ниже, чем у любой другой модели в тестовом сравнении.

Компания утверждает, что Transcribe имела среднюю степень выигрыша в 61% перед другими моделями, когда человеческие оценивающие оценивали её транскрибирования по точности, согласованности и практичности. Однако модель отстала от своих конкурентов при транскрибировании португальского, немецкого и испанского языков.

Cohere утверждает, что Transcribe может обработать 525 минут аудио за минуту, что является высоким показателем для своего класса моделей.

Компания планирует интегрировать Transcribe в свою корпоративную платформу оркестрации агентов North и делает модель доступной через свой API бесплатно. Модель также будет доступна на Model Vault, управляемой платформе вывода Cohere.

Модели распознавания речи становятся всё более популярными по мере растущего спроса на приложения для создания заметок и диктовки, такие как Granola и Wispr Flow.

В начале этого года Cohere, как сообщается, сообщила инвесторам, что генерировала годовой повторяющийся доход в размере 240 миллионов долларов в 2025 году, а генеральный директор Айдан Гомес заявил, что стартап может выйти на IPO «в скором времени».

Поделиться: Telegram

Anthropic одержала победу в суде над администрацией Трампа в споре с Министерством обороны

Федеральный судья постановил, что администрация Трампа должна отменить недавние ограничения, введённые в отношении AI-компании. Судья Рита Лин назвала действия государства попыткой подорвать деятельность Anthropic и нарушением свободы слова компании.

2 мин Источник

Новости 26.03.2026

Теперь вы можете передать свои чаты и личную информацию из других чатботов прямо в Gemini

Google запускает "инструменты переключения", которые упростят переход пользователей других чатботов на Gemini. Новая функция позволяет передавать "воспоминания" (личную информацию) и даже полные истории чатов из других ИИ-ассистентов, чтобы пользователи не тратили время на переобучение Gemini.

2 мин Источник

Новости 26.03.2026

Википедия ужесточает политику использования ИИ при написании статей

Сайт, политика которого может меняться, долгое время борется с проблемой текстов, написанных искусственным интеллектом. На этой неделе Википедия запретила использование текстов, созданных ИИ, своими редакторами, хотя и не полностью исключила ИИ из редакционных процессов платформы.

1 мин Источник

Новости 26.03.2026

OpenAI отказывается ещё от одного побочного проекта: режима для взрослых в ChatGPT

Это лишь последний из нескольких побочных проектов, от которых стартап отказался на протяжении прошлой недели. OpenAI приостановил разработку "эротического режима" для ChatGPT, вызывавшего критику со стороны правозащитных групп и собственных сотрудников компании.

2 мин Источник

Cohere запустила открытую модель голоса специально для транскрибирования

Похожие материалы

Anthropic одержала победу в суде над администрацией Трампа в споре с Министерством обороны

Теперь вы можете передать свои чаты и личную информацию из других чатботов прямо в Gemini

Википедия ужесточает политику использования ИИ при написании статей

OpenAI отказывается ещё от одного побочного проекта: режима для взрослых в ChatGPT