Pico tts что это за программа - TurboComputer.ru
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд (пока оценок нет)
Загрузка...

Pico tts что это за программа

Pico tts что это за программа

Краткое описание:
Синтезатор речи Google.

Описание:
Синтезатор речи Google озвучивает текст, который виден на экране устройства. Где это может пригодиться?
• В Google Play Книгах можно пользоваться функцией «Чтение вслух».
• В Google Переводчике можно слушать произношение слов.
• При использовании TalkBack и других специальных возможностей озвучиваются ваши действия.
• Также в Play Маркете есть много других приложений, в которых применяется синтез речи.

Чтобы включить Синтезатор речи Google, нажмите «Настройки > Язык и ввод > Синтез речи». В этом разделе также можно обновить Синтезатор речи, если он уже включён.

Функция доступна на следующих языках: английский (Австралия, Великобритания, Индия, США), бенгальский (Бангладеш), венгерский, датский, индонезийский, испанский (Испания, США), итальянский, кантонский (Гонконг), корейский, мандаринский (Китай, Тайвань), немецкий, нидерландский, норвежский, польский, португальский (Бразилия), русский, тайский, турецкий, финский, французский, хинди и японский.

English (GB):
https :// redirector.gvt1.com/edgedl/andro >43 .zvoice
https :// redirector.gvt1.com/edgedl/andro >43 .zvoice

English (US):
https :// redirector.gvt1.com/edgedl/andro >45 .zvoice

Deutsch:
https :// redirector.gvt1.com/edgedl/andro >41 .zvoice

Français:
https :// redirector.gvt1.com/edgedl/andro >42 .zvoice

Español:
https :// redirector.gvt1.com/edgedl/andro >40 .zvoice
https :// redirector.gvt1.com/edgedl/andro >42 .zvoice

Українська:
https :// redirector.gvt1.com/edgedl/andro >9 .zvoice

Если имеется в виду «заставить» Синтезатор речи Google, то — НИКАК.
Нужно найти и установить себе приложение, которое предназначено для чтения выделенного текста, в том числе и в браузере. И воспользоваться этим приложением.

Синтезатор речи Google таким приложением не является. Он является СИНТЕЗАТОРОМ РЕЧИ. Т.е. он выполняет функцию «синтеза речи» для других приложений, которые, например, умеют читать текст, выделенный в браузере.

Требуется Android: 4.0.3+ / 4.4+ (версии NEON)
версия 3.15.18.200023596: Google Text-to-Speech (Синтезатор речи Google) (Пост #74145208)
версия 3.15.17 (arm64): Google Text-to-Speech (Синтезатор речи Google) (Пост #73983262)
версия 3.14.12 (х86): Google Text-to-Speech (Синтезатор речи Google) (Пост #71271601)
версия 3.14.9 (arm NEON / х86): Google Text-to-Speech (Синтезатор речи Google) (Пост #68825031)
версия 3.14.7 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #67805151)
версия 3.14.6 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #67774008)
версия 3.13.3 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #66083564)
версия 3.13.2 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #65379722)
версия 3.12.9 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #63509245)
версия 3.12.8 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #63043156)
версия 3.12.2 (arm NEON)(8.0+): Google Text-to-Speech (Синтезатор речи Google) (Пост #61587537)
версия 3.11.12 (x86): Google Text-to-Speech (Синтезатор речи Google) (Пост #60176689)
версия 3.13.3 (х86): Google Text-to-Speech (Синтезатор речи Google) (Пост алекс12 #66130177)
версия 3.11.12 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #60176689)
версия 3.11.11 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #60078544)
версия 3.11.10 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #60011739)
версия 3.10.10 (x86): Google Text-to-Speech (Синтезатор речи Google) (Пост #53996581)
версия 3.10.10 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #53750543)
версия 3.10.9 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #53624469)
версия 3.10.9 (arm): Google Text-to-Speech (Синтезатор речи Google) (Пост onkolog #54031480)
версия 3.9.14 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #50474547)
версия 3.9.11 (x86): com.google.android.tts_3.9.11_x86.apk ( 13,56 МБ )

версия 3.9.11 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #49869119)
версия 3.9.11 (arm): Google Text-to-Speech (Синтезатор речи Google) (Пост #49947229)
версия 3.9.6 mod: Google Text-to-Speech (Синтезатор речи Google) (Пост #49816808)
версия 3.9.6 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #49779491)
версия 3.8.17 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #49830320)
версия 3.8.16 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #47954663)
версия 3.8.16 (arm): Google Text-to-Speech (Синтезатор речи Google) (Пост #48232188)
версия 3.8.16 (x86): com.google.android.tts_3.8.16_x86.apk ( 13,39 МБ )

версия 3.8.14 (arm NEON): Google Text-to-Speech (Синтезатор речи Google) (Пост #47207737)
версия 3.8.14 (arm + x86): Google Text-to-Speech (Синтезатор речи Google) (Пост #47211873)
версия 3.8.13 (arm): Google Text-to-Speech (Синтезатор речи Google) (Пост #47007743)
версия 3.8.11 (arm): Google Text-to-Speech (Синтезатор речи Google) (Пост #46813869)
версия 3.7.12.2235583.arm.arm_neon: Google Text-to-Speech (Синтезатор речи Google) (Пост #42962600)
версии 3.5.6 — 3.7.12 ( Mod ): Google Text-to-Speech (Синтезатор речи Google) (Пост #41685110)
версия 3.7.12.2235583.arm: Google Text-to-Speech (Синтезатор речи Google) (Пост #39130185)
версия 3.7.12.2235583.x86: Google Text-to-Speech (Синтезатор речи Google) (Пост #43152607)
версия 3.5.6.2080558.arm.neon: Google Text-to-Speech (Синтезатор речи Google) (Пост #41509182)
версия 3.5.6.2080558.arm: Google Text-to-Speech (Синтезатор речи Google) (Пост #39130185)
версия 3.5.5.2050975.arm: Google Text-to-Speech (Синтезатор речи Google) (Пост #39130185)
версия 3.4.6.1819666.arm ( Mod ): Google Text-to-Speech (Синтезатор речи Google) (Пост #39607460)
версия 3.4.6.1819666.x86: Google Text-to-Speech (Синтезатор речи Google) (Пост #41207944)
версия 3.4.5.1772910.x86: Google Text-to-Speech (Синтезатор речи Google) (Пост #38792138)
версия 3.4.5.1772910: Google Text-to-Speech (Синтезатор речи Google) (Пост #38792138)
версия 3.3.13.1635260.arm: Google Text-to-Speech (Синтезатор речи Google) (Пост #36434603)
версия 3.3.12.1616444: Google Text-to-Speech (Синтезатор речи Google) (Пост #36222401)
версия 3.2.12.1369973: Google Text-to-Speech (Синтезатор речи Google) (Пост #34162389)
версия 3.1.3.1162895: com.google.android.tts_3.1.3.1162895.apk ( 13,04 МБ )

Сообщение отредактировал iMiKED — 22.11.19, 06:03

Экранный диктор для Андроид или смартфон для незрячего

Для незрячих и слабовидящих пользователей устройств на системе Android основным источником информации о происходящем на экране является синтезатор речи. До тех пор, пока поддержка тактильных дисплеев не будет окончательно разработана и отлажена, TTS (text to speech) имеет большое значение для пользователей с особыми потребностями.

Выбор русскоязычного синтезатора речи

Для ОС Android выпущено много синтезаторов речи, однако поддержка русского языка обеспечена далеко не у всех. Основная проблема – многоязычные тексты, с которыми некоторым голосовым движкам трудно справиться. Рассмотрим основные TTS системы.

Acapela TTS Voices

Один из самых популярных мультиязычных синтезаторов речи от Acapela Group доступен и для Android. Для синтезированных голосов характерно высокое качество речи и хорошая стабильность работы.

Движок Acapela TTS Voices можно без проблем найти и установить из Play Market. Программа бесплатная, но после ее первого запуска будет предложено купить и установить русский голос «Alyona» стоимостью 3,99 €.

SVOX Classic TTS

На втором месте среди коммерческих движков стоит SVOX Classic TTS. Синтезированная речь неплохого качества, но программа иногда не распознает заглавные латинские буквы. Также возникают вопросы в чтении цифр.

На Play Market есть бесплатная триальная версия русского голоса, которую можно свободно загрузить и протестировать в течение 2 недель.

eSpeak

Благодаря группе Eyes-Free Project на ОС Android, начиная с версии 1.6, был портирован кроссплатформенный Open-Source синтезатор eSpeak, поддерживающий русский язык. По сравнению с коммерческими программами, скорость и качество речи не сильно велики, но вполне приемлемы.

Первоначальная настройка

Установив TTS, нужно произвести его первоначальные настройки. Идем в такой последовательности:

Далее выбираем движок по умолчанию и выставляем желаемую скорость произношения. Запускаем приложение, проверяем чтение образца текста в боксе. С помощью ползунков выставляем дополнительные опции.

Использование экранного диктора

Для Android версии 3.2 и выше разработчиками Google выпущена утилита TalkBack , по функционалу напоминающая «Экранный диктор» для Windows. Начиная с Android Jelly Bean, приложение переустанавливается в систему и активируется из «Настройки» – «Специальные возможности». Для запуска следует передвинуть ползунок в положение «On».

Функции программы TalkBack:

  • Перечисление элементов на мониторе с одновременным их описанием;
  • Голосовые уведомления о происходящих событиях;
  • Уведомление о звонках и SMS-сообщениях;
  • Аудио и вибрационный отклик от устройства.
Читайте также:  Бинг бар что это за программа

В своей работе утилита использует интерфейс TTS, установленный в системе по умолчанию. И хотя TalkBack уже относится к системным программам, она все же имеет один недостаток – для первоначальной активации нужен визуальный контроль, поэтому позаботьтесь о присутствии друга или члена семьи при первом знакомстве с приложением!

Управление Android-устройством с помощью TalkBack

Для девайсов с Android 4.0 и старше возможно управление с помощью прослушивания элементов экрана, которые находятся непосредственно под пальцем при его движении. Для этого в настройках TalkBack следует включить опцию «Изучение касанием».

После включения запустится демонстрационный ролик в двух частях, позволяющий обучиться:

  1. Управлению девайсом с помощью ощупывания и последующего выбора элемента экрана.
  2. Основным приемам скроллинга списков.

После обучения управление Android-устройством на ощупь обычно не вызывает затруднений:

  • Для выбора и активации элемента под пальцем необходимо оторвать палец от экрана и коснуться еще раз;
  • Для выбора элемента без предварительного ощупывания необходимо быстро дотронуться его дважды;
  • Скроллинг делается двумя пальцами без отрыва их от экрана;
  • При скроллинге раздается звук разной тональности, сигнализирующий о текущем положении в списке.

Подытоживая можно отметить: при правильно выбранной начальной настройке системы работа с устройствами под ОС Android для слабовидящих или слепых пользователей не сильно отличается от работы в стандартном режиме.

Обзор мобильных Text-To-Speech движков

Если Ваш родной язык не английский и Вы не пишете приложения только для iPhone, то Вам придется достаточно трудно, если Вы захотите найти подходящий инструментарий для разработки т.н. мобильных «voice-enabled» приложений.

В данном обзоре приведена классификация и описаны самые достойные из рода mobile TTS engine.

Я занимаюсь исследованиями в области проектирования интерфейсов мобильных устройств для людей с ограниченными возможностями зрения. Для реализации одного из моих проектов мне потребовался движок генерации голоса с мультиязыковой поддержкой (как минимум два языка – английский и русский). Это и послужило причиной поиска синтезатора речи.

Для удобства разделим движки TTS на три класса:

  • коммерческие;
  • свободные (решения лицензированные по GPL, LGPL и более «мягким» лицензиям типа BSD License или wxWindows Licence, которые допускают коммерческую разработку продуктов);
  • встроенные (средства, предоставляемые самой операционной системой).

Коммерческие движки

SVOX Mobile TTS


Цена: n/a
Языки: 26, включая русский
Субъективная оценка качества звучания: высокое
Мобильные ОС: Android, Symbian, Windows CE/Windows Mobile, BREW
Возможность разработки коммерческих продуктов: есть

Компания SVOX имеет наиболее «вкусный» с технической точки зрения продукт — SVOX Mobile TTS. Однако, поскольку компания работает в основном в B2B сегменте, на мои два письма с запросом цены они так и не ответили.

Acapela TTS


Цена: 2800€ плюс так называемая run-time license, за которую в самом лучшем случае придется платить по 49€ за каждое распространенное приложение
Языки: 23, включая русский
Субъективная оценка качества звучания: высокое
Мобильные ОС: Symbian, Windows CE/Windows Mobile, Embedded Linux, iOS
Возможность разработки коммерческих продуктов: есть

Сотрудники Acapela Group оказались намного более общительными и ответили буквально через полчаса после заполнения вот этой заявки.

Цена, указанная в шапке, относится к таким операционным системам как Windows Mobile и Symbian, однако бизнес-модель Acapela разнится в зависимости от выбранной ОС. К примеру, наиболее сильно они продвигают направление iOS, для которого сделан отдельный сайт. Там можно зарегистрироваться и бесплатно получить evaluation версию их движка. Цена голого SDK для бывшей iPhone OS составляет 250€. Так же с каждого проданного Вами в App Store приложения снимаются немалые проценты.

Отмечу, что Acapela предоставляет «облачный» синтез речи, а так-же портирование SDK под любую платформу.

Loquendo Embedded TTS


Цена: 3000€ плюс проценты с каждого проданного Вами мобильного приложения
Языки: 26, включая русский
Субъективная оценка качества звучания: высокое
Мобильные ОС: Android, Symbian, Windows CE/Windows Mobile, Embedded Linux, iOS, Maemo, Moblin, MeeGo, PalmOS
Возможность разработки коммерческих продуктов: есть

Движок Loquendo обладает специальными тегами, позволяющими делать речь более естественной, подмешивая такие не совсем «речевые» фишки как кашель, смех и прочее.

Их движок отвечает спецификации SSML 1.0 рекомендованной W3C.

Sakrament TTS


Цена: 1500€ для одной ОС, при покупке пакета сразу для двух языков предоставляется скидка в размере 25%, что составляет 2250€
Языки: английский, русский
Субъективная оценка качества звучания: среднее
Мобильные ОС: Symbian, Windows Mobile
Возможность разработки коммерческих продуктов: есть

Качества синтеза речи Sakrament TTS вполне достаточно, что бы озвучивать короткие фразы типа номеров телефонов или названий приложений. Описание всех версий SDK можно получить здесь.

Свободные движки

Flite

Цена: нет
Языки: английский плюс возможность компиляции языков FestVox
Субъективная оценка качества звучания: низкое
Мобильные ОС: Android, Windows CE/Windows Mobile, iOS, PalmOS
Возможность разработки коммерческих продуктов: есть (CMU licence)

В мире настольных систем хорошо известен синтезатор речи Festival. Он имеет порт под названием Flite для мобильных устройств и встраиваемых систем, который распространяется под их собственной X11-like лицензией, позволяющей свободно распространять данное ПО кому угодно, а так же строить на его основе как коммерческие, так и свободные приложения. Существуют порты для Windows CE/Windows Mobile, PalmOS, Android и iOS.

eSpeak


Цена: нет
Языки: 39, включая русский
Субъективная оценка качества звучания: среднее
Мобильные ОС: Android, Windows CE/Windows Mobile
Возможность разработки коммерческих продуктов: нет (GNU GPL)

Инструкция для компиляции движка под WM включена в дистрибутив, однако на этой платформе eSpeak имеет одно существенное ограничение – генерация голоса возможна только в WAV файл. Собранный TTS engine для Windows Mobile можно получить здесь.

eSpeak портирован на Android. Самый простой способ его попробовать — это установить из Android Market’а приложение TTS Service Extended, которое позволяет переключаться между встроенным движком и eSpeak. Данный TTS движок распространяется на условиях GNU GPL.

Встроенные решения

Встроенные решения присутствуют только в Symbian и Android. По какой-то неизвестной причине Microsoft лишила свою мобильную ОС соответствующего программного интерфейса (MS SAPI).

Symbian

Цена: нет
Языки: английский
Субъективная оценка качества звучания: крайне низкое
Возможность разработки коммерческих продуктов: есть

Встроенный TTS от Symbian Foundation скрывается в классе CMdaAudioPlayerUtility. Хотя в его документации ничего об этом не сказано, он все же позволяет синтезировать речь. К сожалению, русский язык не поддерживается. Качество генерации английской речи очень низкое. Без подготовки довольно трудно понять, что именно он произнес.

Дополнительные языковые пакеты можно загрузить здесь, однако список поддерживаемых телефонов крайне мал. Установка пакетов для русского языка на устройство под управлением Symbain OS S60 5th не дала ожидаемых результатов, встроенный TTS так и не заговорил по-русски.

Отмечу, что имеется достаточно удобное расширение API под названием NSS TTS Utility API, описание которого можно найти здесь.

Andro />
Цена: нет
Языки: английский, французский, немецкий, итальянский, испанский
Субъективная оценка качества звучания: среднее
Возможность разработки коммерческих продуктов: есть

Встроенная функциональность синтеза речи в Android доступна с версии 1.6. Прекрасное введение в тему можно найти в блоге разработчиков. Android TTS API является не чем иным, как оберткой над SVOX Pico, русский язык, которым, к сожалению, не поддерживается.

Заключение

Выводы каждому придется делать в зависимости от требований к разрабатываемому продукту. Для коммерческих решений крайне важно качество синтеза речи, поэтому выбирать стоит из двух движков – Acapela TTS и Loquendo Embedded TTS. При выборе движка для open source проекта крайне важную роль будет играть список целевых ОС.

Читайте также:  Orbitum что это за программа

Лично для себя я выбрал eSpeak, поскольку мой проект академического толка и я могу себе позволить использование продукта лицензированного по GNU GPL.

Somethings

problems and solutions

суббота, 23 июля 2011 г.

Синтез речи в Andro >

Не так давно пришлось прикручивать к нашему приложению озвучку с помощью Text-to-Speech (TTS). Об этом-то я и хочу сегодня рассказать.

Quick Start

TTS можно использовать двумя способами. Во-первых, можно завязываться на конкретный движок, покупать библиотеку и работать через неё. Про этот вариант ничего не могу сказать, знаю только теоретически. Второй, общеизвестный вариант — использовать стандартное API. Голоса в этом случае являются просто приложениями, установленными в системе.

Вообще-то заставить приложение говорить не так сложно, и мануалов по этому поводу полно. Но для полноты картины приведу начальные сведения.

Начиная с версии 1.6 в SDK есть стандартный класс TextToSpeech .

Подключение в приложение

Простейшая схема такова:

MainActivity.java

Все вроде понятно. Создали экземпляр TextToSpeech , инициализировали в специальном листенере (задавать голос мы можем только в onInit ), и с тех пор можем синтезировать и проигрывать речь с помощью метода speak . Обращу внимание, что это только схема, более приближенное к реальности приложение можно найти в примере к статье.

Метод speak

Рассмотрим подробнее сигнатуру метода speak :

speak(String text, int queueMode, HashMap params)

text Текст, который нужно прочитать queueMode

  • TextToSpeech.QUEUE_FLUSH , если хочется, чтобы предыдущая фраза прерывалась и сразу начиналась следующая
  • TextToSpeech.QUEUE_ADD , если хочется, чтобы предыдущая фраза договорилась до конца только после этого началась следующая

params Массив дополнительных параметров. Возможные параметры:

  • TextToSpeech.Engine.KEY_PARAM_STREAM — поток, в котором будет воспроизводиться звук.
  • TextToSpeech.Engine.KEY_PARAM_UTTERANCE_ID — идентификатор фразы. Пригодится, если хочется обрабатывать событие окончания говорения, и при этом не запутаться в произносимых фразах.

Другие полезные методы

TTS engines

Вкратце расскажу об известных TTS-движках. Как уже говорилось ранее, голоса — это просто сторонние приложения. Посмотрим, что у нас есть под Android.

Pico Стандартный TTS-движок, знает 5 языков, поставляется бесплатно. Говорит неплохо, но русского не знает. eSpeak Свободный TTS-движок. Знает очень много языков. По-русски тоже говорит, но отвратительно. SVOX Довольно известный движок. Под Android распространяется следующим образом. Есть бесплатная программа-оболочка и платные голоса, которыми можно управлять из этой оболочки. Голосов очень много. Достаточно неплохо говорит по-русски, хотя есть проблемы с ударениями. В общем-то голос SVOX оказался единственным вариантом для русской озвучки приложения. Loquendo Также известный и качественный движок. К сожалению, в Android представлен мало. Для английского языка есть голос Susan, а вот для русского языка приложения нет, хотя вообще-то Loquendo говорить по-русски умеет.

А теперь немного о сложностях.

Проверка наличия голосовых данных

Pico TTS поставляется по умолчанию с системой. Но на некоторых моделях телефонов не установлены голосовые пакеты. Внешне это проявляется, например, в том, что в системных настройках синтеза речи всё задизаблено и предлагается скачать и установить некие ресурсы:

В официальном мануале описан способ обработки этой ситуации.

CheckVoiceActivity.java

Особенности работы под Android 2.1

Наше приложение должно было разговаривать не абы каким голосом, а исключительно красивым. Соответственно, была задача выбрать нужный нам TTS-движок из всех установленных у пользователя. В Android 2.2 у класса TextToSpeech есть метод setEngineByPackageName , но что делать в 2.1, где такого метода нет?

Существует известный обход этой проблемы, с использованием дополнительной программы и дополнительной библиотеки. В плане юзабилити, конечно, не ахти, ведь придется заставлять пользователя ставить какой-то сторонний софт. Зато работает. Итак:

  • Устанавливаем на телефон приложение Text-to-speech Extended (ссылка на маркет: market://details? >)
  • Подключаем к нашему приложению библиотеку от eyes-free.
  • Вместо привычного TextToSpeech используем класс TextToSpeechBeta из этой библиотеки

Имеет смысл написать класс-оболочку такого примерно вида:

TextToSpeechWrapper

Конкретная реализация может быть и другой.

Конфигурируем TTS

Нам нужно сконфигурировать TTS определенным голосом. Голос, в свою очередь, определяется следующими параметрами:

  • Engine — задается функцией setEngineByPackageName .
  • Locale — задается функцией setLanguage .

Вариант 1, легкий, но редкий

Так работает Loquendo. Пишем:

И всё начинает работать.

Вариант 2, сложный и частый

Так работают Pico и SVOX. У них есть оболочка (engine) и подключаемые модули (голоса). Рассмотрим на примере Pico

Тоже вроде все работает. Проблемы начинаются, когда у одной локали оказывается несколько голосов. Такое имеет место для SVOX. У одного языка может быть мужской, женский и детский голос. Это разные приложения, у них разные названия пакетов, но с точки зрения TTS все это одно и то же.

Если установлено несколько голосов для одной локали, выбран будет тот, который указан в настройках SVOX как дефолтный. Однако, мы это никак отследить не можем. Печально.

Общие проблемы для обоих вариантов

TTS-движок задизаблен в настройках TextToSpeech

У меня так и не получилось отловить эту ситуацию. По идее, setEngineByPackageName должен бы вернуть ERROR , и мы бы догадались, что что-то не так. Но он отрабатывает на ура, и приложение разговаривает, чем попало.

Галочка «Использовать мои настройки»

Это тоже достаточно вредная штука, и её нужно учитывать. Дело в том, что пользователь может выставить собственные настройки TTS и эту галочку.

И тогда вся ваша конфигурация не будет применяться. Отслеживать состояние этой настройки можно с помощью метода areDefaultsEnforced (в Android 2.2 и выше. Если версия меньше, нужен TTSE и метод areDefaultsEnforcedExtended )

Заключение

Собственно, вот и все, что накопилось за те две недели, что я занимаюсь озвучкой приложения. Субъективное ощущение от этого API — сыровато. Не хватает доступа ко всем настройкам TTS в системе. Для пользователя они слишком сложные и неочевидные («Мои настройки» — яркий пример). Разнобой в опциях различных TTS-движков также печалит. В общем, использовать TTS не так сложно, а вот обрабатывать различные его состояния — целое дело.

Ссылки

Пример

Исходники к статье прилагаются. Там рассмотрены следующие ситуации:

  • Простая инициализация TTS
  • Проверка голосовых данных Pico
  • Использование TextToSpeechBeta

Синтезатор Речи Google Что Это

Описание

Описание

Синтезатор речи Google озвучивает текст, который виден на экране устройства. Это позволяет:

• пользоваться функцией Чтение вслух в Google Play Книгах

• слушать произношение слов в Google Переводчике

• пользоваться TalkBack и другими специальными возможностями (все действия при этом озвучиваются)

• работать со многими другими приложениями из Play Маркета.

Поддерживаемые языки: английский (Великобритания, Индия, США), индонезийский, испанский (Испания, США), итальянский, кантонский, корейский, мандаринский, немецкий, нидерландский, польский, португальский (Бразилия), русский, тайский, турецкий, французский, хинди и японский.

[Android] Синтезатор речи от Google. Ваш телефон заговорит по-русски

Языковые движки и синтезаторы (TTS text-to-speech) для русского языка никогда не были чем-то совершенным. В отличие от английских, чье развитие шло постоянно и неуклонно, лучшим представителем отечественных синтезаторов уже более десяти лет был мужской голос Николай от компании Acapela. Конкуренцию ему в последние годы составляли два вполне приличных женских варианта — Алена (Acapela) и Катерина, позднее — Катерина II (ScanSoft RealSpeak).

Для повседневного использования требовались определенные усилия, а уж для мобильных платформ, в первую очередь Android, они подходили лишь в связке с персональным компьютером, заставляя перегонять текст в звук, чтобы позднее воспроизводить стандартным Mp3 плеером на конечном устройстве.

Читайте также:  Рейтинг программ для записи дисков

Некоторую надежду на прогресс, как это часто бывает, дарила корпорация добра Google, см. наш материал:

Site Link: Русские голосовые движки и применение Google Api TTS . До недавнего времени максимум возможностей, предоставляемых поисковым гигантом, сводился к онлайн работе с их синтезатором. Результат, откровенно говоря, не был чем-то революционным. С примером работы Google API TTS вы можете ознакомиться на странице с общей информацией о Клубе.

Существовало и еще несколько решений, заточенных непосредственно под использование со смартфонами:

  • Поставляемый по умолчанию Pico TTS — без русского языка
  • IVONA Text-to-Speech — к сожалению, поддержка русского пока не реализована, хотя официальный голос Татьяна представлен на сайте разработчика
  • SVOX Classic Text To Speech Engine — единственная рабочая модель. Установка софта — бесплатная, пробный период на ознакомление. Конечная цена

3USD

Как видите, реально работает только решение SVOX. При всей реальности , работает система из рук вон плохо. То есть основное свое предназначение — читать по-русски, формально она выполняет, но читает плохо.

И вот, в конце мая года в Google Play появляется их новый абсолютно бесплатный Синтезатор речи Google. Этот продукт легко затыкает за пояс прошлые решения с использованием русских систем TTS, более того, по моему скромному мнению, этот женский голос лучше доступных решений для персональных компьютеров.

Ниже приведен небольшой демофрагмент полученный со смартфона с установленным синтезатором речи Google — русский женский голос (пока единственный из доступных)

Запись получена через стандартную программу для fb2 FBReader с подключенным модулем чтения TTS+ от Hyperionics Technology. Запись велась напрямую с телефона.

Если есть желание и необходимость, можно использовать любые читалки, так популярная Moonreader уже в дистрибутиве содержит модуль чтения, сами же создатели модуля TTS+ для FBReader настойчиво рекламируют свое приложение Voice Reader.

    Преимущества использования голосового синтеза Google для Android:
  • Качество. Лично для меня digalo Николай уходит в прошлое
  • Универсальность и совместимость с большинством читалок для смартфонов и планшетов. Дальнейшие удобства пользователя (например таймер сна, триггеры включения, паузы и пр.) — зависят от программы посредника
  • Стабильность работы. За 12 часов тестирования в разных условиях синтезатор ни разу не вылетал, чего нельзя сказать о программах читалках
  • Синтезатор не привязан к сети интернет и не потребляет дополнительных ресурсов на беспроводную передачу данных
  • Даже если вы не воспринимаете компьютерную речь в контексте озвучивания книг, это решение позволит вам апгрейдить своего мобильного друга. Гугль навигация начнет читать вам названия улиц, специальные приложения смогут озвучивать текст СМС и номера при входящих звонках.

    Кроме того, и это весьма полезно для слабовидящих или незрячих пользователей, теперь можно полноценно использовать TalkBack — аналог знакомого многим по работе на персоналках скрин-ридера Jaws. Эта система реализует потенциал Android для голосового оповещения о всех событиях на телефоне, позволяющего управлять им, не видя экрана.

      Недостатки в работе с синтезатором
  • Существенный минус для любителя аудиокниг — повышенное энергопотребление, за пару часов озвучивания вы потеряете до половины заряда аккумулятора
  • Неприятность, зафиксированная лишь во время проигрывания через динамик телефона: легкий fade in — затухание уровня звука в начале предложения. Через проводную гарнитуру, внешнее устройство и bluetooth этот эффект отсутствует
  • Нет поддержки пользовательских ударений и словарей
  • Особенных чудес ждать не приходится — это всего лишь компьютер, впрочем, некоторая холодность во время чтения кому-то может показаться приятным отдохновением после избытка театральности в работе отдельных исполнителей.

    Установка синтезатора предельно проста.

    Заходим на страницу продукта в магазине. Google Play, как обычно, известит вас о совместимости с вашим устройством — требуется Android 4.0.3 и выше, затем произойдет загрузка и установка. После чего нужно скачать голос :

    Настройки — Специальные возможности — Вывод функции текста в речь — Синтезатор речи Google (не пугайтесь грозного предупреждения, ничего нового о вас производитель через эту программу не узнает, ему и так все доподлинно известно) — скачать. И для спокойствия — перезагрузить.

    © Iudushka. Клуб Любителей Аудиокниг. www.abook-club.ru

    Синтезатор речи Google появился в Google Play

    Компания Google выпустила свой Синтезатор речи (Text-to-Speech) в виде отдельного приложения в Google Play Store. Таким образом, приложение может самостоятельно обновляться прямо из магазина, а владельцы устройств, на которых производители установили свой собственный синтезатор речи смогут попробовать и вариант от Google.

    Напомним, Синтезатор речи Google озвучивает текст, который виден на экране устройства. Это можно использовать для прочтения книг вслух, в переводчиках для озвучивания произношения слов, а также при использовании TalkBack и других специальных возможностей озвучиваются действия пользователя. Чтобы включить Синтезатор речи Google, необходимо перейти в Настройки Язык и ввод Синтез речи .

    Отметим, что функция доступна пока только на следующих языках: английский (Великобритания), английский (США), итальянский, испанский, корейский, немецкий и французский. Как можно легко заметить, русский отсутствует. Что, впрочем, не отменяет полезности программы для изучающих английский язык. Для работы требуется версия Android 4.0.3 или более поздняя.

    Синтезатор речи Google 3.5.6.2080558

    Синтезатор речи Google озвучивает текст, который виден на экране устройства. Он используется во многих приложениях.

    • В Google Play Книгах можно пользоваться функцией «Чтение вслух».
    • В Google Переводчике можно слушать произношение слов.
    • При использовании TalkBack и других специальных возможностей озвучиваются ваши действия.
    • Также в Play Маркете есть много других приложений, в которых применяется синтез речи.

    Включить Синтезатор речи Google можно в разделе «Настройки Язык и ввод Синтез речи». Если он уже включен, здесь его можно обновить.

    Поддерживаемые языки: английский (Великобритания), английский (Индия), английский (США), итальянский, испанский (Испания), испанский (США), корейский, немецкий, нидерландский, польский, португальский (Бразилия), русский, французский и японский.

    Синтезатор речи. Теперь и на русском

    Меня всегда огорчало, что в Android не было синтезатора речи на русском. Изначально выбор языков был ограничен английским, испанским, французским, немецким и итальянским. Существовали отдельные коммерческие движки, а также производители могли добавить в свои устройства какой-нибудь движок с нужным языком, видимо договорившись с разработчиком. Но хотелось поддержки из коробки от самой «корпорации добра».

    Вчера, включив WiFi на своем телефоне в метро, увидел, что на аппарат прилетело несколько обновлений, в том числе и Синтезатор речи Google с поддержкой русского языка. Сначала я не обратил внимания на данное обстоятельство, а сегодня вдруг подумал, а не могу ли использовать теперь движок с русским языком в своём приложении?

    Набросал простенький пример с кнопкой, чтобы услышать фразу из классики: «А Васька слушает да ест».

    Запустив приложение, услышал родную речь, произнесённую женским голосом.

    Сначала я использовал локаль по умолчанию Locale.getDefault(). Для большинства российских пользователей это сработает, но некоторые пользователи оставляют на телефоне другую локаль, поэтому решил явно указать Locale(«ru»). Наверное, так правильнее.

    Если к вам обновление Синтезатора речи Google ещё не прилетело, то можете скачать с Google Play по адресу https://play.google.com/store/apps/details? >

    Источники: http://www.androidpit.ru/app/com.google.android.tts, http://abook-club.ru/info%3D182/, http://www.ferra.ru/ru/games/news//11/08/google-android-tts/, http://trashbox.ru/link/google-text-to-speech-android, http://habrahabr.ru/post/224685/

    Как Из Адоба Удалить Ненужные Страницы

    как из адоба удалить ненужные страницыОбъединение файлов в единый файл PDFОбъединяйте файлы большинства форматов, включая мультимедийные, в единый, .

    Ссылка на основную публикацию
    Adblock
    detector