Online sinteza govora. Što su sintetizatori govora? Najbolji sintetizatori govora

Moderna tehnologija omogućuje generiranje govora izravno iz tiskanog teksta. Zamislite samo da možete tipkati tekst, koji će zatim biti izgovoren glasom po vašem izboru, intonacijom i brzinom po vašem izboru. I ovo nije fikcija, ovo je stvarnost.

Što je sintetizator govora?

Tekst u govor (TTS) sintetizatori govora- posebni programi koji vam omogućuju generiranje govornog signala (govor, glas) iz tiskanog teksta. Prvi spomen sinteze govora datira iz 10. stoljeća. Krajem 18. stoljeća znanstvenik Christian Kratzenstein izradio je model ljudskog vokalnog trakta koji može izgovarati pet samoglasnika (a, e, i, o, u).

Prvi računalni sintetizatori govora pojavili su se kasnih 1950-ih. Zvučali su prilično primitivno i takav se govor teško razumio. Rad na poboljšanju kvalitete sintetiziranog govora se nastavlja. Već danas se govor koji generiraju moderni sustavi za sintezu govora ponekad ne može razlikovati od pravog ljudskog govora.

Zašto vam je potreban sintetizator govora?

Sintetizator govora može vam biti koristan u mnogim slučajevima, na primjer:

Tijekom putovanja- samo upišite bilo koju frazu, a program će je izgovoriti na jeziku koji vam je potreban.
Za čitanje e-knjiga, tekstova, dokumenata- idete svojim poslom, a program vam čita naglas.
Za učenje stranih jezika- izvrsna prilika za besplatno vježbanje izgovora i govornih vještina.

Sintetizator govora A1 SpeechTRON

A1 GovorTRON- sintetizator engleskog govora iz teksta. Može se koristiti za čitanje bilješki, tekstualnih dokumenata, e-knjiga i drugih tekstualnih materijala (formati: tekst, RTF, DOC). Sintetizator govora (TTS) također se može koristiti pri učenju engleskog jezika. Program u potpunosti podržava Microsoft TTS SAPI 4.0, ima potpuno prilagodljivo sučelje, visoku kvalitetu zvuka, postavke brzine čitanja i snimanje datoteka. Postoji podrška za prilagođene i dodatne rječnike.

Sintetizator govora ReadPlease

Pročitaj molim te- sintetizator engleskog govora iz teksta. Može se koristiti za čitanje tekstova, međuspremnika, tekstualnih dokumenata, e-knjiga i drugih tekstualnih materijala (formati: tekst, RTF, DOC). Sintetizator govora (TTS) također se može koristiti pri učenju engleskog jezika. Nakon pokretanja, program se nalazi u ladici i njime se upravlja vrućim tipkama. Može se priključiti na različite prozore ili radnu površinu. Plaćena verzija ima podršku za dodatne jezike, standard AT&T Natural Voices i dodatne značajke. Program postoji u dvije verzije: besplatnoj i plaćenoj. Postoji podrška za prilagođene i dodatne rječnike.

Sintetizator govora ReadingBar

Traka za čitanje- sintetizator govora s bilo koje web stranice. Ovo je panel za preglednik Internet Explorer koji se nakon instalacije ugrađuje u preglednik i omogućuje čitanje bilo koje web stranice. Možete snimiti svoj glas u wav ili mp3 datoteku. Osim izgovora teksta, ReadBar također omogućuje označavanje riječi, njihovo prevođenje na 4 jezika i prikaz tumačenja riječi iz rječnika. Budite oprezni, ReadingBar neće raditi na operativnom sustavu Vista ili Internet Explorer 7.

Sintetizator govora FlameReader

FlameReader je višenamjenski sintetizator govora koji vam omogućuje generiranje govora iz bilo kojeg teksta ili datoteke. Samo odaberite tekst u bilo kojem programu ili dokumentu i FlameReader će ga odmah izgovoriti. Program ima mnogo mogućnosti: snimanje glasa u datoteku (wav i mp3), čitanje e-pošte, dokumenata, web stranica, presnimavanje PowerPoint prezentacija, prevođenje tekstova. Uvijek možete prilagoditi FlameReader na način koji vama odgovara odabirom glasovnog pokretača, brzine reprodukcije i drugih parametara. FlameReader dodaje navigacijsku traku paketu Microsoft Office, što olakšava korištenje. Program dolazi s praktičnim uređivačem audio datoteka.

Sintetizator govora Živi tekst u govor

Živi tekst u govor- višenamjenski sintetizator govora koji vam omogućuje ne samo izgovaranje riječi, tekstova i datoteka, već i njihovo snimanje (pretvaranje) u zvučne datoteke (MP3, WAV, OGG, VOX). Komplet uključuje ploču za preglednik Internet Explorer, koja vam omogućuje da izgovorite bilo koju web stranicu i pretvorite je u zvučnu datoteku.

Sintetizator govora YeoSoft Text to MP3 Speaker

YeoSoft Tekst u MP3 zvučnik- višenamjenski sintetizator govora koji vam omogućuje govorne tekstove i stvaranje audio knjiga u različitim audio formatima. Ovo je učinkovit alat za učenje stranih jezika. Podržava tehnologije SAPI 4 i 5, DOC i PDF datoteke, 10 jezika, rad s više datoteka istovremeno. Mogućnost dodavanja xml oznaka u tekst za kontrolu izgovora. Glasovne postavke: glasnoća, brzina, izbor glasovnog pokretača.

TextAloud sintetizator govora

TextAloud- program za generiranje govora iz teksta i datoteka. Generirani govor može se slušati pomoću računala ili snimiti kao mp3 ili wma datoteka. Sintesajzer podržava sljedeće vrste datoteka: DOC, PDF i HTML. Program također uključuje alatnu traku za Internet Explorer, Firefox i Outlook.

Sintetizator opširnog govora

TextSound- pretvarač teksta u audio (wav i mp3). Ovaj mali program pomoći će vam da brzo pretvorite tekst u govor i spremite ga kao audio datoteke. Program vam omogućuje obradu nekoliko datoteka odjednom i stvaranje popisa zadataka.

Čini se da sintetizatori govora instalirani na računalima ili mobilnim uređajima više nisu tako neobični programi kao prije. Zahvaljujući modernoj tehnologiji, obično stolno računalo može reproducirati ljudski glas.

Kako rade sintetizatori govora? Gdje se koriste? Koji je najbolji sintetizator govora? Odgovori na ova i druga pitanja predstavljeni su u ovom članku.

Opći koncept

Sintetizatori govora su posebni programi koji se sastoje od niza modula koji omogućuju prevođenje utipkanih tekstova u rečenice izgovorene ljudskim glasom. Nemojte misliti da su cijelu bazu riječi i izraza snimili stvarni ljudi u profesionalnim studijima. Fizički je nemoguće izvršiti takav zadatak. Biblioteka s tolikim brojem fraza ne može se instalirati ni na jedno moderno računalo, a kamoli na mobitel. U tu svrhu programeri su stvorili tehnologiju Text-to-Speech.

Opseg primjene

Sintetizatori govora koriste se u učenju stranih jezika, slušanju tekstova na stranicama knjiga, stvaranju vokalnih dijelova, izdavanju upita za pretraživanje u obliku izgovorenih fraza itd.

Koje vrste programa postoje? Ovisno o opsegu primjene, uslužni programi mogu se podijeliti u 2 vrste: obični koji pretvaraju upisani tekst u govor i posebni vokalni moduli koji se koriste u glazbenim aplikacijama.

Prednosti i nedostatci

U ovom trenutku računalo samo približno sintetizira ljudski govor. U najjednostavnijim programima možete uočiti probleme sa zvukom i ispravnim postavljanjem naglaska u raznim riječima. Sintetizatori govora instalirani na mobilnim uređajima troše puno energije. Često je moguće primijetiti neovlašteno preuzimanje dodatnih modula.

Prednosti uključuju jednostavnost percepcije. Mnogi korisnici smatraju da je mnogo lakše asimilirati audio informacije od bilo koje druge vrste.

Najbolji sintetizatori govora s ruskim glasovima

Program RHVoice kreirala je Olga Yakovleva. Standardna verzija aplikacije uključuje 3 glasa. Postavke su vrlo jednostavne. Program se može koristiti i kao samostalna aplikacija, kompatibilna sa SAPI5, i kao dodatni zaslonski modul.

Sintetizator govora Acapela razlikuje se od svojih analoga po idealnom izgovoru teksta. Aplikacija podržava više od 30 svjetskih jezika. U besplatnoj verziji dostupan je samo 1 ženski glas.

Vocalizator se često koristi u pozivnim centrima. Korisnik može prilagoditi naglasak, glasnoću i brzinu čitanja. Po potrebi se učitavaju dodatni rječnici. U aplikaciji postoji 1 ženski glas. Govorni mehanizam se automatski integrira u programe za čitanje knjiga u elektroničkom formatu.

Uslužni program eSpeak podržava više od 50 jezika. Nedostatak programa je što zvučne datoteke sprema samo u WAV formatu, što zahtijeva puno prostora na tvrdom disku.

Aplikacija Festival moćan je uslužni program za sintezu govora koji čak podržava finski i hindski.

Instalacija programa

Kako koristiti ovu vrstu aplikacije? Prvo morate instalirati program. Operacijski sustavi računala koriste standardni instalacijski program u kojem korisnik mora samo odabrati jezični modul koji podržava uslužni program. Instalacijski program za mobilne uređaje može se preuzeti sa službene web stranice, Google Play i App Store. Instalacija aplikacije odvija se automatski.

Prvo pokretanje programa

U ovoj fazi korisnik samo treba postaviti zadani jezik. Ponekad morate obratiti pažnju na kvalitetu zvuka. Standardna verzija podrazumijeva frekvenciju uzorkovanja od 4410 Hz, dubinu od 16 bita i brzinu prijenosa od 128 kbps. U mobilnom OS-u brojke mogu biti niže. Kao osnova se koristi određeni glas.

Filtri i ekvilizatori pomažu vam postići željeni zvuk. Korisnik ima tri opcije za prijevod teksta. Može tipkati rečenice na tipkovnici, uključiti zvuk postojeće datoteke ili instalirati ekstenziju preglednika koja pretvara sadržaj na web stranicama u govor. Dovoljno je zabilježiti potreban tijek radnje, boju glasa i jezik na kojem će se tekst izgovoriti. Za početak procesa reprodukcije kliknite na gumb "Start".

Rad sa složenim programima

U glazbenim aplikacijama postavke su mnogo složenije. U govornom modulu programa FL Studio korisnik može odabrati nekoliko vrsta glasova, kao i odrediti ton i brzinu reprodukcije. Naglasci se ispred slogova stavljaju pomoću simbola "_". Uz pomoć takvog sintetizatora govora možete stvoriti samo robotski glas.

Vocaloid je aplikacija profesionalnog tipa. Uz uobičajene parametre, korisnik može odabrati artikulaciju i glissando. Uslužni program ima bazu podataka s profesionalnim vokalima. Ako želite, možete prilagoditi cijele rečenice kako bi odgovarale bilješkama. Samo biblioteka s vokalima zauzima više od 4 GB u komprimiranom obliku.

"Google Speech Synthesizer": što je ovaj program?

U svibnju 2014. tvrtka je korisnicima pružila mogućnost isprobavanja novog besplatnog proizvoda. Što je Google Speech Synthesizer na Androidu? Ovo je program koji čita tekst na ekranu mobilnog uređaja ili tableta. Sada nema potrebe za instaliranjem uslužnih programa trećih strana koji zahtijevaju licencu. "Google Speech Synthesizer" koristi se prilikom čitanja e-knjiga, slušanja ispravnog izgovora riječi i pokretanja aplikacije TalkBack.

Nova verzija programa Google Speech Synthesizer 3.1 sada podržava engleski, talijanski, španjolski, korejski, njemački, nizozemski, poljski, portugalski, ruski i francuski. Gdje mogu pronaći glasovne pakete? Preuzimaju se iz same aplikacije.

Prednosti i nedostaci Google proizvoda

Osobitosti ženskog glasa ruskog govornog područja su njegov jasan, glasan zvuk i glatka intonacija. Brzina reprodukcije može se podesiti u postavkama programa. Korisnici koji koriste TalkBack i rusku lokalizaciju OS-a Android trebali bi biti oprezni pri prelasku na sintetizator govora ako je aplikacija prethodno prema zadanim postavkama bila postavljena na drugi glas. Možda ćete imati problema s održavanjem slušne kontrole nad svojim mobilnim uređajem. Gotovo svi glasovi, osim ruskog, ne mogu obraditi rečenice na ćirilici.

Među nedostacima se može primijetiti odgođena reakcija na čitanje tekstova koji se sastoje od fraza na različitim jezicima. Ruski glas se razlikuje po metalnim notama boje. Možete čuti zveckanje na niskim frekvencijama. Prednosti uključuju stabilnost aplikacije i prihvatljivu kvalitetu čitanja engleskih riječi.

"Google Speech Synthesizer": kako koristiti program

Da bi uslužni program radio kako treba, morate ga ažurirati na najnoviju verziju. Da biste aktivirali proces izgovora teksta, morate otvoriti postavke. U odjeljku "jezik i unos" morate označiti okvir "sinteza govora". Redak "zadani sustav" također treba primijetiti. Ne zaboravite da glasovne pakete u samom programu također treba ažurirati.

Problemi pri radu s uslužnim programom

Ako je potrebno, korisnik može onemogućiti aplikaciju. U najjednostavnijim uslužnim programima gumb za zaustavljanje nalazi se u samom programu. Deaktiviranje proširenja instaliranog u pregledniku vrši se onemogućavanjem dodatka ili potpunim uklanjanjem dodatka. Problemi mogu nastati i pri korištenju programa na mobilnom telefonu. Činjenica je da sintetizator govora automatski počinje učitavati jezične module koji korisniku nisu potrebni.

Ovaj proces oduzima puno vremena i značajno troši promet. Kako mogu onemogućiti Google Speech Synthesizer na svom mobilnom uređaju i riješiti se ovog problema? Najprije morate otvoriti postavke aplikacije. Zatim morate odabrati odjeljak "jezik i glasovni unos". Zatim morate označiti posljednji redak.

Nakon što ste odabrali glasovno pretraživanje, trebali biste kliknuti na križić pored stavke "izvanmrežno prepoznavanje govora". Zatim se preporučuje brisanje predmemorije aplikacije. Zatim morate ponovno pokrenuti svoj mobilni telefon. Da biste potpuno onemogućili uslužni program, morate otvoriti odjeljak "aplikacije" u postavkama, odabrati sintetizator govora s popisa i kliknuti gumb "zaustavi".

Deinstaliranje programa

Događa se da korisnik uopće ne koristi Google Speech Synthesizer. Je li moguće ukloniti uslužni program s mobilnog uređaja? Da biste to učinili, morate otvoriti Google Play. Zatim biste trebali odabrati sintetizator govora s popisa instaliranih programa i kliknuti na gumb "izbriši".

Rezultati

Aplikacije s jednostavnim sučeljem prikladne su za obične korisnike i osobe s invaliditetom. To može biti RHVoice ili Google Speech Synthesizer. Ruski glas će pročitati tekst prikazan na ekranu. Prosječnom korisniku ne treba više.

Glazbenicima se preporučuje da daju prednost profesionalnom programu Vocaloid. Aplikacija ima dodatne glasovne biblioteke i mnogo različitih opcija. Program će vam omogućiti da dobijete prirodan zvuk glasa. Uostalom, za glazbenike je toliko važno da računalna sinteza nije zamjetljiva uhu.

Sintetizatori govora su programi koji uzimaju tekst kao ulaz i sintetiziraju ljudski govor kao izlaz. Ovi programi imaju široku primjenu - u telefoniji, elektronički pomoćnici, za telefonski pristup web aplikacijama, u obrazovne svrhe, u pozivnim centrima itd. Glavni glasovni motori za reprodukciju ruskog govora su Realspeak, Digalo i Sakrament od Nuance, Acapela i Sakrament, redom.

Sintetizatori govora koji rade pod Windows sustavima:

Digalo (Acapela ELAN TTS)
Sintetizatori govora Acapela dostupni su na 23 jezika, uključujući ruski, i mogu govoriti u više od 50 glasova. Moguće ga je koristiti u više programa istovremeno (multichannel). Kvalitetan ruski izgovor, veliki rječnik ruskih riječi i naglasaka, sve vrste postavki i mogućnosti reprodukcije. Najkvalitetniji govorni paket je “Nikolaj”.

Nuance RealSpeak (bivši ScanSoft)
Podržava više od 20 jezika uključujući kineski, norveški i korejski i 30 glasova. Glas koji govori na ruskom je "Katerina". U mnogim pogledima, ovo je čak puno uspješnije rješenje za ruski jezik od Digala. Potpuno podržava SAPI5. Program se distribuira samo na komercijalnoj osnovi.

Motor Sakrament TTS
Program može reproducirati tekstove na ruskom jeziku. Postoji i verzija web stranice tvrtke na ruskom jeziku. Linija proizvoda Sakrament uključuje aplikaciju za komunikatore i PDA uređaje, program za ozvučavanje elektroničkih udžbenika i dokumenata. U paketu za ruski jezik možete birati između tri glasa (“Olga”, “Irina”, “Vjačeslav”). Podržava RTF i TXT ulazne formate, automatski prepoznaje kodiranje teksta, u potpunosti podržava SAPI govorne oznake i dodatne oznake semantičkog označavanja teksta za poboljšanje zvuka sintetiziranog govora. Pomoću oznaka možete postaviti naglasak, vrstu fragmenta teksta (datum, vrijeme, adresa, URL, e-mail, telefon, kratica itd.), parametre reprodukcije (glasnoću, brzinu, intonaciju), kao i druge parametre.

CoolReader
Program za ugodno čitanje knjiga s ekrana, čitanje naglas, oblikovanje i pretvaranje tekstova. Funkcija čitanja naglas razvijena je korištenjem MS SAPI 4.0 × 5.1 motora. Također radi s tekstovima na ruskom. Prepoznaje HTML, RTF, DOC (MS Word), TXT, FB2 (FictionBook) formate. Automatski prepoznaje rusko kodiranje dos, win, koi-8, kao i latin, utf-8 i unicode. Možete spremiti audioknjigu u MP3 formatu za slušanje na svom MP3 playeru. Rječnici izgovora s postavkama za svaki glasovni mehanizam povezani su zasebno. Podržani operativni sustavi: Win9x/ME/NT4.0/Win2K/XP.

ToM Reader
Aplikacija je preglednik teksta i sintetizator govora u isto vrijeme. Radi i na ruskom. Omogućuje stvaranje MP3 datoteka iz tekstova, moguće je povezati rječnike izgovora i može raditi sa zip arhivama. Podržani formati datoteka: HTML, RTF, MS Word, TXT, kodiranja: ANSI, KOI, OEM. Maksimalna veličina datoteke za otvaranje je 12 MB.

Speak Aloud je program za čitanje i spremanje u datoteku uz pretvaranje teksta u TXT, PDF, HTML, RTF formatima u audio MP3, WAV, WMA, OGG, VOX, AU, AIFF, MP4, FLAC, SWF. Možete prilagoditi intonaciju, boju glasa i kvalitetu reprodukcije zvuka. Podržana je skupna obrada datoteka. Radi pod operativnim sustavima: Windows 2000/XP/Vista

Govorilka
Reproducira tekst na ruskom. Omogućeno je snimanje teksta koji se čita u audio datoteku (*.WAV, *.MP3), kao i reguliranje brzine čitanja i visine glasa. Možete dodati rječnike izgovora, pa je vrlo lako ispraviti izgovor pojedinih riječi i fraza. Može raditi s velikim datotekama, otvara tekstove iz .doc, HTML datoteka. Također pamti položaj kursora pri izlasku iz programa (kako bi kasnije mogao početi čitati s istog mjesta).

Za razliku od prethodnog predstavnika, Cantor 2 je “napredniji” sustav za sintetiziranje vokalnih dionica, ali za svoju cijenu. Također ima verziju kao zaseban program. Iako je vst-instrument analog piano-rolla u sekvenceru: pogledajte sučelje (slika 4).

Budući da je ovaj dodatak vrlo instrumentiran, može manipulirati velikim brojem glasovnih parametara. Ali svejedno morate započeti konstruiranjem fraze slog po slog. Kao što možda pretpostavljate, to se radi pomoću piano roll-a. Tu je i alatna traka s uobičajenim "olovkama", "gumicama" itd. Zapravo, pokušajmo sintetizirati gore spomenuti izraz "hej, yo, hajde"! Nacrtajmo događaje u obliku pravokutnih područja i označimo svaki od njih, kao na slici 5.

Kao što vidite, nisu sve riječi napisane iznad događaja. Na primjer, riječ "hajde" rastavljena je na dva sloga - "com" i "on". Pažljivi korisnici primijetit će da se fonemi automatski pišu ispod - ovo je prilično zgodna značajka. Ako idete u detalje i nijanse, onda morate imati vrlo dobru ideju o tome što su fonemi i druge suptilne nijanse zvuka govora, dostupne samo uskim stručnjacima. Samo ćemo ostaviti kako jest i vidjeti kako funkcionira općenito. Ali to nije sve. Sada, u midi dijelu pjesme Cantor 2, također trebamo registrirati dio prema kojem će naše riječi (slogovi) zvučati. Učinimo to kao na slici 6.

Sada možemo uključiti reprodukciju u sekvenceru i osigurati da imamo zvuk na izlazu.

Zatim, prilagodimo neke nijanse zvuka. Dopustite mi da odmah napomenem da za proučavanje svih nijansi postavljanja Cantora 2 morate napisati cijelu knjigu. U ovom članku ćemo pogledati opće parametre. Dakle, prvo, možete odabrati gotov glas. Dostupno ih je desetak. Možete ih otvoriti na vrhu programa, u opciji Učitaj glas (Slika 7).

Zadana je bila "Nikki", ali sam je promijenio u "Luther". Možete isprobati različite glasove, i ženske i muške.

Drugo, tu je odjeljak s efektima (zapravo, odjeljak s efektima, slika 8).

Dostupna su 4 efekta - Distorzija, Echodelay, Chorus i Reverb. Iako se ti isti efekti mogu dodati zasebno.

O rubrikama Fonem i Glas nema smisla govoriti, jer... Prilično ih je teško naučiti i samo prilično specijalizirani stručnjak može razumjeti njihove postavke. Iako vam nitko ne brani da u tim dijelovima okrećete gumbe i tako mijenjate zvuk. Ili proučite teoriju sinteze govora, kao i Cantor korisnički priručnik, kako biste razumjeli kako bi sve to trebalo funkcionirati. Općenito, postoji dosta parametara, dobiveni zvuk je prilično složen i prilično primitivan.

No, i početnik, ako se potrudi, može dobiti zvuk sličan onome što sam ja dobio.

Fruity Loops Studio

Možda će se mnogi od vas, nakon što su vidjeli Fruity Loops, iznenaditi kako je dospio u ovaj članak, jer vjerojatnije je da nije sintetizator govora. Stvar je u tome što u svom arsenalu ima vrlo dobar sintetizator govora. Zove se Speech Synthesizer. Iako nije dostupan kao zasebni dodatak, možete umetnuti sam FL kao vst dodatak u svoju radnu stanicu i tamo koristiti njegov sintetizator govora. Ali još uvijek radije stvaram dio govora u samom FL-u, zatim ga izvozim u audio datoteku i zatim ga koristim na bilo kojoj radnoj stanici.

Dakle, pokušajmo kreirati paket iz prethodnog primjera izravno u FL Studiju. Umetnimo ovaj dodatak u naš projekt (slika 9).

Čim ga dodamo u projekt, automatski će se pojaviti prozor koji će od nas tražiti da unesemo naš tekst. Ne morate dugo razmišljati i odmah unesite našu frazu iz gornjih primjera (slika 10).

Osim toga, možete odmah postaviti druge parametre govora, poput glasa (dostupno je oko 20 glasova), stila izgovora, načina (šapatom, aspiracijom ili normalno) te postavki tempa i visine. Savjetujem vam da odmah postavite tempo (imam ga, recimo, 140, prema tempu projekta). Gumb Slušaj omogućuje vam slušanje dijela u hodu, prije nego što ga izradite. Nakon što smo odabrali potrebne parametre, kliknite na potvrdni okvir, program će nas pozvati da spremimo našu datoteku sa kreiranim govornim dijelom i novi dio sa vokalima će biti kreiran u projektu (slika 11).

Ne trebamo se mučiti - Speech Synthesizer je za nas kreirao pjesmu, a to je Fruity Slicer s dijelom kreiranim u njemu, podijeljenim na note, gdje svaka riječ odgovara zasebnoj noti (na slici 11 desno možete vidjeti da imamo dio sa 4 komada ). Osim toga, Piano roll je stvorio zapise za note s potpisanim riječima, što je vrlo zgodno (Sl. 12).

Sve je sasvim jasno i jednostavno. Nema potrebe zapisivati foneme ili birati slogove kako bi fraza zvučala ispravno. Dovoljno je samo unijeti frazu - već će zvučati prilično podnošljivo i čitljivo. Tada možete jednostavno preurediti riječi i izvesti dio u željeni audio format. Možete se i sami uvjeriti slušajući primjer.

Koji je najbolji od recenziranih sintetizatora govora?

Moje osobno mišljenje: bolji je govor uživo, vokal uživo. Ako birate između gore navedenih programa, onda, naravno, po broju postavki i parametara pobjeđuje Cantor 2. Štoviše, tvrdi da nije samo sintetizator govora, već čak i vokalni sintetizator. Ako odaberete praktičnost, jednostavnost i kvalitetu zvuka, preferiram Speech Synthesizer iz Fruity loopsa.

Dodatak urednika

Tu je i besplatni program za sintezu govora -. Možete konfigurirati različite parametre i, nakon prethodnog slušanja, generirati rezultat u audio datoteku.

Danas se sintetizatori govora, koji se koriste u stolnim računalnim sustavima ili mobilnim uređajima, više ne čine neobičnim. Tehnologije su već daleko odmakle i omogućile reprodukciju ljudskog glasa. U nastavku ćemo pogledati kako to sve radi, gdje se koristi sintetizator govora, kako odabrati takav uređaj i na koje potencijalne probleme korisnik može naići pri kupnji takvog uređaja. Što su sintetizatori govora? Gdje se mogu koristiti? Sintetizatori govora su posebni programi koji se sastoje od nekoliko modula. Ovi vam programi omogućuju prevođenje teksta upisanog na tipkovnici u običan ljudski govor u obliku zvuka. Bilo bi naivno vjerovati da prateće biblioteke sadrže apsolutno sve riječi ili moguće izraze koje su u studijima snimili stvarni ljudi. To je jednostavno nemoguće na fizičkoj razini. Knjižnice izraza također bi bile tolike veličine da se jednostavno ne bi mogle instalirati čak ni na moderne tvrde diskove velikog kapaciteta, a kamoli na mobilne uređaje. Osim toga, razvijena je tehnologija nazvana Text-to-Speech, što znači "tekst u govor". Sintetizatori govora postali su najrašireniji u nekoliko područja. Jedno od tih područja uključuje samostalno učenje stranih jezika, kada korisnik treba čuti pravilan izgovor riječi. Sintetizatori govora također se koriste za slušanje knjiga umjesto čitanja, stvaranje lokalnih i govornih dijelova prilikom snimanja glazbe i izdavanje upita za pretraživanje u obliku glasovnih fraza ili riječi. Takve uređaje mogu koristiti i osobe s invaliditetom.

Sintetizatori govora: vrste programa

Svi sintesajzeri govora, ovisno o području upotrebe, mogu se podijeliti u dvije glavne vrste: standardni programi, koji se koriste za izravno pretvaranje govora u tekst, i govorni ili vokalni moduli, koji se koriste u glazbenim aplikacijama. Kako bismo detaljnije razmotrili ovo pitanje, razmotrit ćemo obje klase programa, međutim, naglasak će još uvijek biti više na sintetizatorima govora za njihovu neposrednu namjenu.

Prednosti i nedostaci jednostavnih govornih aplikacija. Što se tiče prednosti i nedostataka programa ove vrste, prvo pogledajmo nedostatke. Prije svega, vrijedi reći da je računalo još uvijek tehnički uređaj. U ovoj fazi razvoja može vrlo približno sintetizirati ljudski govor. Često u najjednostavnijim programima postoje problemi s stavljanjem naglaska u riječi i niskom kvalitetom zvuka. Mobilni uređaji obično imaju povećanu potrošnju energije. U nekim slučajevima uočeno je i neovlašteno preuzimanje govornih modula. Međutim, ovdje ima i dosta prednosti. Mnogi percipiraju slušne informacije bolje od vizualnih. Dakle, jasna prednost je lakoća percepcije. Kako pravilno koristiti sintetizator govora? Recimo nešto više o osnovnim principima korištenja ove vrste programa. Prvo, bilo koja vrsta sintetizatora govora može se instalirati bez ikakvih problema. U stacionarnim sustavima koristi se standardni instalater, čiji će glavni zadatak biti odabir podržanih jezičnih modula. Za mobilne uređaje instalacijsku datoteku možete preuzeti iz službene trgovine ili repozitorija kao što su AppStore ili Google Play.

Nakon toga, aplikacija će se automatski instalirati. Prilikom prvog pokretanja, u pravilu, ne morate napraviti nikakve postavke osim odabira zadanog jezika. Međutim, u nekim slučajevima program može od vas tražiti da odaberete kvalitetu zvuka. Standardna verzija s frekvencijom uzorkovanja od 4410 Hz, dubinom od 16 bita i brzinom od 128 kbps koristi se posvuda. Kod mobilnih uređaja slične brojke su nešto niže. Za osnovu se uzima određeni glas. Kada koristite standardni obrazac izgovora, upotrebom ekvilizatora i filtara, možete postići zvuk upravo ove boje. Prilikom korištenja možete odabrati nekoliko opcija za prijevod teksta: ručni prijevod teksta, čitanje postojećeg teksta iz datoteke, integracija u druge aplikacije s mogućnošću aktiviranja rezultata pretraživanja ili čitanja tekstualnog sadržaja na internetskim stranicama. Ovdje će biti dovoljno odabrati željenu opciju akcije, glas i jezik na kojem će se tekst izgovoriti. Mnogi programi imaju nekoliko vrsta glasova, i ženskih i muških. Za aktiviranje procesa reprodukcije možete koristiti gumb za pokretanje.

Ako govorimo o tome kako onemogućiti sintetizator govora, može postojati nekoliko opcija. U najjednostavnijem slučaju možete koristiti gumb za zaustavljanje reprodukcije u samom programu. Ako je sintesajzer integriran u preglednik, deaktivacija se provodi u postavkama proširenja potpunim uklanjanjem dodatka. S mobilnim uređajima, unatoč trenutnom isključivanju, mogu se pojaviti neki problemi, o kojima će biti riječi u nastavku. Na primjer, unos teksta i postavke provode se na složeniji način. Pogledajmo FLStudio aplikaciju. Ima vlastiti govorni modul u kojem možete odabrati nekoliko vrsta glasova, promijeniti brzinu reprodukcije ili postavke tonova. Da biste stavili naglasak, morate upotrijebiti simbol “_” ispred sloga. Međutim, takav sintesajzer prikladan je samo za stvaranje robotskih glasova. Vocaloid paket iz Yamahe već se može klasificirati kao program profesionalne razine. Ovdje je u potpunosti implementirana tehnologija pretvaranja teksta u govor.

Osim standardnih parametara, u postavkama možete postaviti glissando i artikulaciju. Također možete koristiti biblioteke s vokalima profesionalnih izvođača, sastavljati pojedinačne riječi i cijele fraze, prilagoditi ih različitim notama i još mnogo toga. Uopće ne čudi da samo s vokalima ovaj softverski paket zauzima više od 4 GB u instalacijskoj distribuciji. Nakon raspakiranja volumen se povećava dva do tri puta.

U ovoj recenziji usredotočit ćemo se samo na jednostavne aplikacije. Pogledajmo najpopularnije od njih. Prema većini korisnika, RH Voice je najbolji sintetizator govora. Ovaj ruski razvoj stvorila je Olga Yakovleva. U standardnoj verziji programa dostupna su samo tri glasa - Elena, Alexander, Irina. Postavljanje programa je vrlo jednostavno. Sama aplikacija može se koristiti i kao samostalni program, kompatibilan sa SAPi5, i kao ekranski modul.

Još jedna zanimljiva aplikacija je Acapela. Njegova glavna značajka je gotovo savršena glasovna gluma teksta na više od 30 jezika. U jednostavnoj verziji aplikacije dostupna je samo jedna glasovna opcija - Alena. Još jedna moćna aplikacija sa ženskim glasom je Milena. Ovaj program se vrlo često koristi u pozivnim centrima. Postoje mnoge postavke za postavljanje naglaska, podešavanje glasnoće, brzine čitanja, kao i instaliranje dodatnih rječnika. Glavna razlika između ovog programa je u tome što govorni mehanizam mora biti ugrađen u programe kao što su Cool Reader, Full Screen Caller ID, Moon+ Reader Pro. Najmoćniji uslužni program za sintezu i prepoznavanje govora je program Festival. Dizajniran je za Mac OSX i Linux sustave. Ova aplikacija dolazi s otvorenim kodom. Uz standardne jezične pakete, podržava finski i hindi. Još jedna aplikacija za govor je eSpeak. Podržava više od 50 jezika. Glavni nedostatak ovog programa je što sintetizirane govorne datoteke sprema isključivo u WAV formatu. Poznato je da ovaj format zauzima puno prostora. Ovaj je program višeplatformski i može se koristiti čak i na mobilnim sustavima.

Google Android: problemi sa sintetizatorom govora

Korisnici, kada instaliraju "materinji" sintetizator govora iz Googlea, vrlo se često žale da spontano omogućuje učitavanje dodatnih jezičnih modula. To ne samo da traje dugo, već i ozbiljno troši promet. Riješiti se ovog problema na Android sustavima vrlo je jednostavno. Da biste to učinili, morate koristiti izbornik postavki. Ovdje idemo na odjeljak za jezik i glasovni unos. Ovdje je potrebno u opciji offline govornog prepoznavanja odabrati glasovno pretraživanje i kliknuti na križić (onemogućiti). Također se preporučuje dodatno brisanje predmemorije aplikacije i ponovno pokretanje uređaja. U nekim ćete slučajevima možda morati onemogućiti obavijesti unutar same aplikacije.

Što se događa na kraju? Ukratko, možemo reći da su najjednostavniji programi prikladni za obične korisnike. Lider u mnogim ocjenama je program RHVoice.Međutim, za glazbenike koji trebaju postići prirodan zvuk glasa, tako da se ne osjeti razlika između live i računalne sinteze, bolje je dati prednost programima poput Vocaloid.Mnogi dodatni glas danas se proizvode knjižnice za takve programe. Postavke ovih aplikacija imaju toliko mogućnosti da primitivne aplikacije nisu ni blizu.