Převod textu na řeč
Amazon Polly
Amazon Polly vytváří mluvený výstup z textu přes službu AWS. V RichPear Home slouží jako TTS platforma pro hlasová oznámení do přehrávačů médií a automatizací.
- Doména
amazon_polly- Typ
- TTS platforma
- Komunikace
- cloudová služba AWS
- Nastavení
configuration.yaml
Připravte vlastní AWS přístup
Pro Amazon Polly potřebujete vlastní AWS účet a oprávnění používat službu Polly. AWS účtuje převod podle počtu zpracovaných znaků; u nových účtů a některých hlasů může být dostupný Free Tier nebo kredit, ale aktuální limity vždy ověřte přímo v AWS ceníku.
Použijte přístupové údaje vytvořené ve svém AWS účtu. Nevkládejte cizí, sdílené ani veřejně nalezené klíče. Pokud klíče vytváříte ručně, použijte samostatného uživatele s omezeným oprávněním pro Polly, zapněte MFA tam, kde dává smysl, a klíče pravidelně obměňujte.
RichPear Home umí použít přímý pár aws_access_key_id a aws_secret_access_key, nebo profil uložený pro AWS nástroje jako profile_name. Tyto dva způsoby nekombinujte.
Co si připravit
- AWS Access Key ID a AWS Secret Access Key z vlastního účtu, případně název lokálního AWS profilu.
- Region, ve kterém chcete Polly používat, například
eu-central-1nebo výchozíus-east-1. - Vybraný hlas, jazyk a engine podporované ve zvoleném regionu.
- Entitu přehrávače médií, na které se mají hlasová oznámení přehrát.
Přidejte TTS platformu do configuration.yaml
Amazon Polly se nastavuje ruční úpravou souboru configuration.yaml. Přidejte jej pod sekci tts, uložte konfiguraci a restartujte RichPear Home, aby se nová TTS platforma načetla.
Nejjednodušší varianta používá přímý pár přístupových klíčů. Pokud na zařízení spravujete více AWS účtů nebo nechcete klíče zapisovat do hlavního konfiguračního souboru, použijte místo nich profile_name.
Příklad konfigurace s českým hlasem
tts:
- platform: amazon_polly
aws_access_key_id: AWS_ACCESS_KEY_ID
aws_secret_access_key: AWS_SECRET_ACCESS_KEY
region_name: eu-central-1
voice: Jitka
output_format: mp3
Přehrajte oznámení přes akci TTS
Po restartu použijte akci tts.amazon_polly_say. Cílový přehrávač zadávejte explicitně, aby se oznámení nepustilo na nesprávném místě.
Pro běžné oznámení stačí textová zpráva. Pokud používáte jiný hlas než výchozí, přidejte do dat také odpovídající language a volby v options.
Příklad akce
action: tts.amazon_polly_say
target:
entity_id: media_player.obyvak
data:
message: "Pračka dokončila program."
language: cs-CZ
options:
voice: Jitka
Použijte SSML, hlas a engine
Pokud chcete řídit pauzy, výslovnost nebo rychlost řeči, nastavte v konfiguraci text_type: ssml. Od té chvíle musí být všechny zprávy pro tuto TTS platformu obalené značkami <speak> a </speak>.
Volby voice, engine, output_format a sample_rate se musí shodovat s podporou zvoleného regionu a hlasu. RichPear Home podporuje formáty mp3, ogg_vorbis a pcm; dostupné hodnoty vzorkování jsou 8000, 16000, 22050 a 24000, podle formátu.
SSML ukázka
action: tts.amazon_polly_say
target:
entity_id: media_player.obyvak
data:
message: '<speak>Dveře jsou otevřené.<break time="800ms"/> Zkontrolujte chodbu.</speak>'
language: cs-CZ
options:
voice: Jitka
engine: standard
Zkontrolujte provoz a náklady
Po prvním přehrání ověřte, že vybraný přehrávač zprávu skutečně přehrál, jazyk odpovídá zvolenému hlasu a v systémovém logu nejsou chyby autentizace, regionu, hlasu nebo engine.
U automatizací omezte opakování zprávy. Smyčka, která generuje hlasový výstup příliš často, může rychle spotřebovat Free Tier nebo navýšit účet v AWS.
Výchozí hodnoty a omezení
- Výchozí region je
us-east-1, výchozí hlasJoanna, výchozí enginestandarda výchozí formátmp3. - Pro
mp3aogg_vorbisje výchozí vzorkování22050, propcmje výchozí16000. - Hlas a jazyk musí odpovídat. Například český hlas
Jitkapoužívejte s jazykemcs-CZ. - Ne každý hlas podporuje engine
neural,long-formnebogenerative; kompatibilitu ověřte v seznamu hlasů Amazon Polly.
Lokální adresa systému
RichPear Home se v domácí síti běžně otevírá na http://rphome.local:8123. Pokud tato adresa v dané síti neodpoví, použijte http://IP-ADRESA:8123.