Převod textu na řeč

Amazon Polly

Amazon Polly vytváří mluvený výstup z textu přes službu AWS. V RichPear Home slouží jako TTS platforma pro hlasová oznámení do přehrávačů médií a automatizací.

Doména
amazon_polly
Typ
TTS platforma
Komunikace
cloudová služba AWS
Nastavení
configuration.yaml
01

Připravte vlastní AWS přístup

Pro Amazon Polly potřebujete vlastní AWS účet a oprávnění používat službu Polly. AWS účtuje převod podle počtu zpracovaných znaků; u nových účtů a některých hlasů může být dostupný Free Tier nebo kredit, ale aktuální limity vždy ověřte přímo v AWS ceníku.

Použijte přístupové údaje vytvořené ve svém AWS účtu. Nevkládejte cizí, sdílené ani veřejně nalezené klíče. Pokud klíče vytváříte ručně, použijte samostatného uživatele s omezeným oprávněním pro Polly, zapněte MFA tam, kde dává smysl, a klíče pravidelně obměňujte.

RichPear Home umí použít přímý pár aws_access_key_id a aws_secret_access_key, nebo profil uložený pro AWS nástroje jako profile_name. Tyto dva způsoby nekombinujte.

Co si připravit

  1. AWS Access Key ID a AWS Secret Access Key z vlastního účtu, případně název lokálního AWS profilu.
  2. Region, ve kterém chcete Polly používat, například eu-central-1 nebo výchozí us-east-1.
  3. Vybraný hlas, jazyk a engine podporované ve zvoleném regionu.
  4. Entitu přehrávače médií, na které se mají hlasová oznámení přehrát.
02

Přidejte TTS platformu do configuration.yaml

Amazon Polly se nastavuje ruční úpravou souboru configuration.yaml. Přidejte jej pod sekci tts, uložte konfiguraci a restartujte RichPear Home, aby se nová TTS platforma načetla.

Nejjednodušší varianta používá přímý pár přístupových klíčů. Pokud na zařízení spravujete více AWS účtů nebo nechcete klíče zapisovat do hlavního konfiguračního souboru, použijte místo nich profile_name.

Příklad konfigurace s českým hlasem

tts:
  - platform: amazon_polly
    aws_access_key_id: AWS_ACCESS_KEY_ID
    aws_secret_access_key: AWS_SECRET_ACCESS_KEY
    region_name: eu-central-1
    voice: Jitka
    output_format: mp3
03

Přehrajte oznámení přes akci TTS

Po restartu použijte akci tts.amazon_polly_say. Cílový přehrávač zadávejte explicitně, aby se oznámení nepustilo na nesprávném místě.

Pro běžné oznámení stačí textová zpráva. Pokud používáte jiný hlas než výchozí, přidejte do dat také odpovídající language a volby v options.

Příklad akce

action: tts.amazon_polly_say
target:
  entity_id: media_player.obyvak
data:
  message: "Pračka dokončila program."
  language: cs-CZ
  options:
    voice: Jitka
04

Použijte SSML, hlas a engine

Pokud chcete řídit pauzy, výslovnost nebo rychlost řeči, nastavte v konfiguraci text_type: ssml. Od té chvíle musí být všechny zprávy pro tuto TTS platformu obalené značkami <speak> a </speak>.

Volby voice, engine, output_format a sample_rate se musí shodovat s podporou zvoleného regionu a hlasu. RichPear Home podporuje formáty mp3, ogg_vorbis a pcm; dostupné hodnoty vzorkování jsou 8000, 16000, 22050 a 24000, podle formátu.

SSML ukázka

action: tts.amazon_polly_say
target:
  entity_id: media_player.obyvak
data:
  message: '<speak>Dveře jsou otevřené.<break time="800ms"/> Zkontrolujte chodbu.</speak>'
  language: cs-CZ
  options:
    voice: Jitka
    engine: standard
05

Zkontrolujte provoz a náklady

Po prvním přehrání ověřte, že vybraný přehrávač zprávu skutečně přehrál, jazyk odpovídá zvolenému hlasu a v systémovém logu nejsou chyby autentizace, regionu, hlasu nebo engine.

U automatizací omezte opakování zprávy. Smyčka, která generuje hlasový výstup příliš často, může rychle spotřebovat Free Tier nebo navýšit účet v AWS.

Výchozí hodnoty a omezení

  1. Výchozí region je us-east-1, výchozí hlas Joanna, výchozí engine standard a výchozí formát mp3.
  2. Pro mp3 a ogg_vorbis je výchozí vzorkování 22050, pro pcm je výchozí 16000.
  3. Hlas a jazyk musí odpovídat. Například český hlas Jitka používejte s jazykem cs-CZ.
  4. Ne každý hlas podporuje engine neural, long-form nebo generative; kompatibilitu ověřte v seznamu hlasů Amazon Polly.
URL

Lokální adresa systému

RichPear Home se v domácí síti běžně otevírá na http://rphome.local:8123. Pokud tato adresa v dané síti neodpoví, použijte http://IP-ADRESA:8123.