Online sinteza govora. Šta su sintetizatori govora? Najbolji sintisajzeri govora

Moderna tehnologija vam omogućava da generirate govor direktno iz štampanog teksta. Zamislite samo da možete ukucati tekst, koji će potom biti izgovoren glasom po vašem izboru, intonacijom i brzinom po vašem izboru. I ovo nije fikcija, ovo je realnost.

Šta je sintisajzer govora?

Text to Speech (TTS) sintisajzeri govora- posebni programi koji vam omogućavaju generiranje govornog signala (govora, glasa) iz štampanog teksta. Prvi spomen sinteze govora datira iz 10. veka. Krajem 18. vijeka, naučnik Kristijan Kracenštajn stvorio je model ljudskog vokalnog trakta koji je sposoban da izgovori pet samoglasničkih glasova (a, e, i, o, u).

Prvi kompjuterski bazirani sintisajzeri govora pojavili su se kasnih 1950-ih. Zvučale su prilično primitivno, a takav se govor teško mogao razumjeti. Rad na poboljšanju kvaliteta sintetizovanog govora se nastavlja. Već danas se govor koji stvaraju moderni sistemi za sintezu govora ponekad ne razlikuje od pravog ljudskog govora.

Zašto vam je potreban sintetizator govora?

Sintetizator govora može vam biti koristan u mnogim slučajevima, na primjer:

Tokom putovanja- samo upišite bilo koju frazu i program će je izgovoriti na jeziku koji vam je potreban.
Za čitanje e-knjiga, tekstova, dokumenata- idete svojim poslom, a program vam čita naglas.
Za učenje stranih jezika- odlična prilika za besplatno vježbanje izgovora i govornih vještina.

Sintetizator govora A1 SpeechTRON

A1 SpeechTRON- sintisajzer engleskog govora iz teksta. Može se koristiti za čitanje bilješki, tekstualnih dokumenata, e-knjiga i drugih tekstualnih materijala (formati: tekst, RTF, DOC). Sintetizator govora (TTS) se također može koristiti prilikom učenja engleskog jezika. Program u potpunosti podržava Microsoft TTS SAPI 4.0, ima potpuno prilagodljiv interfejs, visok kvalitet zvuka, postavke brzine čitanja i snimanje datoteka. Postoji podrška za prilagođene i dodatne rječnike.

Sintetizator govora ReadPlease

ReadPlease- sintisajzer engleskog govora iz teksta. Može se koristiti za čitanje tekstova, međuspremnika, tekstualnih dokumenata, e-knjiga i drugih tekstualnih materijala (formati: tekst, RTF, DOC). Sintetizator govora (TTS) se također može koristiti prilikom učenja engleskog jezika. Nakon pokretanja, program se nalazi u traci i njime se upravlja pomoću prečaca. Može se priključiti na različite prozore ili radnu površinu. Plaćena verzija ima podršku za dodatne jezike, AT&T Natural Voices standard i dodatne funkcije. Program postoji u dvije verzije: besplatna i plaćena. Postoji podrška za prilagođene i dodatne rječnike.

Sintetizator govora ReadingBar

ReadingBar- sintisajzer govora sa bilo koje web stranice. Ovo je panel za pretraživač Internet Explorer, koji se nakon instalacije ugrađuje u pretraživač i omogućava vam čitanje bilo koje web stranice. Možete snimiti svoj glas u wav ili mp3 datoteku. Osim izgovora teksta, ReadBar vam također omogućava da označite riječi, prevedete ih na 4 jezika i prikažete interpretaciju riječi iz rječnika. Budite oprezni, ReadingBar neće raditi na operativnom sistemu Vista ili Internet Explorer 7.

FlameReader sintetizator govora

FlameReader je multifunkcionalni sintetizator govora koji vam omogućava generiranje govora iz bilo kojeg teksta ili datoteke. Samo odaberite tekst u bilo kojem programu ili dokumentu i FlameReader će ga odmah izgovoriti. Program ima brojne mogućnosti: snimanje glasa u fajl (wav i mp3), čitanje e-pošte, dokumenata, web stranica, presnimavanje PowerPoint prezentacija, prevođenje tekstova. Uvijek možete prilagoditi FlameReader na način koji vam odgovara odabirom glasovnog mehanizma, brzine reprodukcije i drugih parametara. FlameReader dodaje navigacijsku traku u Microsoft Office paket, što ga čini lakšim za korištenje. Program dolazi sa praktičnim uređivačem audio datoteka.

Sintetizator govora Alive Text to Speech

Živi tekst u govor- multifunkcionalni sintisajzer govora koji vam omogućava ne samo da izgovorite riječi, tekstove i datoteke, već i da ih snimite (konvertujete) u zvučne datoteke (MP3, WAV, OGG, VOX). Komplet uključuje panel za pretraživač Internet Explorer, koji vam omogućava da glasno izrazite bilo koju web stranicu i pretvorite ih u zvučne datoteke.

Sintetizator govora YeoSoft Text to MP3 Speaker

YeoSoft Text to MP3 zvučnik- multifunkcionalni sintetizator govora koji vam omogućava da glasno izrazite tekstove i kreirate audio knjige u različitim audio formatima. Ovo je efikasan alat za učenje stranih jezika. Podržava SAPI 4 i 5 tehnologije, DOC i PDF datoteke, 10 jezika, rad sa više datoteka istovremeno. Mogućnost dodavanja xml oznaka u tekst radi kontrole izgovora. Postavke glasa: jačina zvuka, brzina, izbor glasovnog mehanizma.

TextAloud sintetizator govora

TextAloud- program za generiranje govora iz teksta i datoteka. Generisani govor se može ili slušati pomoću računara ili snimiti kao mp3 ili wma fajl. Sintisajzer podržava sljedeće tipove datoteka: DOC, PDF i HTML. Program takođe uključuje traku sa alatkama za Internet Explorer, Firefox i Outlook.

Opširni sintetizator govora

TextSound- pretvarač teksta u audio (wav i mp3). Ovaj mali program će vam pomoći da brzo pretvorite tekst u govor i sačuvate ga kao audio datoteke. Program vam omogućava obradu nekoliko datoteka odjednom i kreiranje liste zadataka.

Sintisajzeri govora instalirani na računarima ili mobilnim uređajima više ne izgledaju kao neobični programi kao prije. Zahvaljujući modernoj tehnologiji, običan desktop računar može da reprodukuje ljudski glas.

Kako rade sintisajzeri govora? Gdje se koriste? Koji je najbolji sintetizator govora? Odgovori na ova i druga pitanja predstavljeni su u ovom članku.

Opšti koncept

Sintetizatori govora su posebni programi koji se sastoje od niza modula koji pružaju mogućnost prevođenja otkucanih tekstova u rečenice izgovorene ljudskim glasom. Ne treba misliti da su cijelu bazu riječi i fraza snimili stvarni ljudi u profesionalnim studijima. Fizički je nemoguće izvršiti takav zadatak. Biblioteka sa tako velikim brojem fraza ne može se instalirati ni na jedan savremeni računar, a kamoli na mobilni telefon. U tu svrhu, programeri su kreirali tehnologiju Text-to-Speech.

Područje primjene

Sintetizatori govora se koriste za učenje stranih jezika, slušanje tekstova na stranicama knjiga, kreiranje vokalnih dijelova, izdavanje upita za pretraživanje u obliku izgovorenih fraza itd.

Koje vrste programa postoje? Ovisno o obimu primjene, uslužni programi se mogu podijeliti u 2 tipa: obični koji pretvaraju kucani tekst u govor i posebne vokalne module koji se koriste u muzičkim aplikacijama.

Prednosti i nedostaci

U ovom trenutku, kompjuter sintetizuje ljudski govor samo približno. U najjednostavnijim programima možete uočiti probleme sa zvukom i ispravnim postavljanjem naglaska u različitim riječima. Sintisajzeri govora instalirani na mobilnim uređajima troše mnogo energije. Često je moguće primijetiti neovlašteno preuzimanje dodatnih modula.

Prednosti uključuju lakoću percepcije. Mnogi korisnici smatraju da je mnogo lakše da asimiliraju audio informacije od bilo koje druge vrste.

Najbolji sintisajzeri govora sa ruskim glasovima

Program RHVoice kreirala je Olga Yakovleva. Standardna verzija aplikacije uključuje 3 glasa. Postavke su vrlo jednostavne. Program se može koristiti i kao samostalna aplikacija, kompatibilna sa SAPI5, i kao dodatni ekranski modul.

Acapela sintisajzer govora razlikuje se od svojih analoga po svom idealnom izgovoru teksta. Aplikacija podržava više od 30 jezika svijeta. U besplatnoj verziji dostupan je samo 1 ženski glas.

Vokalizer se često koristi u pozivnim centrima. Korisnik može podesiti naglasak, jačinu zvuka i brzinu čitanja. Dodatni rječnici se učitavaju ako je potrebno. U aplikaciji postoji 1 ženski glas. Govorni mehanizam se automatski integriše u programe za čitanje knjiga u elektronskom formatu.

Uslužni program eSpeak podržava preko 50 jezika. Nedostatak programa je to što snima zvučne datoteke samo u WAV formatu, što zahtijeva puno prostora na vašem tvrdom disku.

Aplikacija Festival je moćan uslužni program za sintezu govora koji čak podržava finski i hindi.

Instalacija programa

Kako koristiti ovu vrstu aplikacije? Prvo morate instalirati program. Računalni operativni sistemi koriste standardni instalater, u kojem korisnik treba samo da odabere jezički modul koji uslužni program podržava. Instalacioni program za mobilne uređaje može se preuzeti sa službene web stranice, Google Playa i App Store-a. Instalacija aplikacije se odvija automatski.

Prvo pokretanje programa

U ovoj fazi, korisnik samo treba da podesi podrazumevani jezik. Ponekad morate obratiti pažnju na kvalitet zvuka. Standardna verzija podrazumijeva frekvenciju uzorkovanja od 4410 Hz, dubinu od 16 bita i brzinu prijenosa od 128 kbps. U mobilnom OS-u, brojke mogu biti niže. Kao osnova se koristi određeni glas.

Filteri i ekvilajzeri vam pomažu da postignete željeni zvuk. Korisnik ima tri opcije za prevođenje teksta. Može kucati rečenice na tastaturi, uključiti zvuk postojeće datoteke ili instalirati ekstenziju pretraživača koja pretvara sadržaj na web stranicama u govor. Dovoljno je zabilježiti potreban tok radnje, tembar glasa i jezik na kojem će se tekst izgovoriti. Da biste započeli proces reprodukcije, kliknite na dugme “Start”.

Rad sa složenim programima

U muzičkim aplikacijama podešavanja su mnogo složenija. U govornom modulu programa FL Studio korisnik može odabrati nekoliko vrsta glasova, kao i odrediti ton i brzinu reprodukcije. Naglasci se stavljaju ispred slogova pomoću simbola "_". Uz pomoć takvog sintisajzera govora možete stvoriti samo robotski glas.

Vocaloid je aplikacija profesionalnog tipa. Pored uobičajenih parametara, korisnik može odabrati artikulaciju i glisando. Uslužni program ima bazu podataka sa profesionalnim vokalima. Ako želite, možete prilagoditi cijele rečenice tako da odgovaraju bilješkama. Biblioteka sa samo vokalima zauzima više od 4 GB u komprimovanom obliku.

"Google Speech Synthesizer": šta je ovo program?

U maju 2014. godine kompanija je korisnicima pružila priliku da isprobaju novi besplatni proizvod. Šta je Google Speech Synthesizer na Androidu? Ovo je program koji čita tekst na ekranu mobilnog uređaja ili tableta. Sada nema potrebe za instaliranjem uslužnih programa trećih strana za koje je potrebna licenca. "Google Speech Synthesizer" se koristi prilikom čitanja e-knjiga, slušanja pravilnog izgovora riječi i pokretanja aplikacije TalkBack.

Nova verzija programa Google Speech Synthesizer 3.1 sada podržava engleski, italijanski, španski, korejski, njemački, holandski, poljski, portugalski, ruski i francuski. Gdje mogu pronaći glasovne pakete? Preuzimaju se iz same aplikacije.

Prednosti i mane Google proizvoda

Posebnosti ženskog glasa na ruskom jeziku su njegov jasan, glasan zvuk i glatka intonacija. Brzina reprodukcije se može podesiti u postavkama programa. Korisnici koji koriste TalkBack i lokalizaciju Android OS-a na ruskom jeziku trebali bi biti oprezni pri prelasku na sintetizator govora ako je aplikacija prethodno po defaultu podešena na drugi glas. Možda ćete imati problema s održavanjem zvučne kontrole vašeg mobilnog uređaja. Gotovo svi glasovi, osim ruskog, nisu u stanju da obrađuju rečenice na ćirilici.

Među nedostacima može se primijetiti odgođena reakcija na čitanje tekstova koji se sastoje od fraza na različitim jezicima. Ruski glas odlikuje se metalnim notama boje. Možete čuti zveckanje na niskim frekvencijama. Prednosti uključuju stabilnost aplikacije i prihvatljiv kvalitet čitanja engleskih riječi.

"Google Speech Synthesizer": kako koristiti program

Da bi uslužni program radio kako treba, morate ga ažurirati na najnoviju verziju. Da biste aktivirali proces izgovaranja teksta, potrebno je da otvorite podešavanja. U odjeljku „jezik i unos“ trebate označiti polje za „sinteza govora“. Treba napomenuti i red “podrazumevani sistem”. Ne zaboravite da je potrebno ažurirati i glasovne pakete u samom programu.

Problemi pri radu sa uslužnim programom

Ako je potrebno, korisnik može onemogućiti aplikaciju. U najjednostavnijim uslužnim programima, dugme za zaustavljanje nalazi se u samom programu. Deaktiviranje ekstenzije instalirane u pretraživaču vrši se deaktiviranjem dodatka ili potpunim uklanjanjem dodatka. Problemi mogu nastati i prilikom korištenja programa na mobilnom telefonu. Činjenica je da sintetizator govora automatski počinje učitavati jezičke module koji korisniku nisu potrebni.

Ovaj proces traje dosta vremena i značajno troši promet. Kako mogu onemogućiti Google Speech Synthesizer na svom mobilnom uređaju i riješiti se ovog problema? Prvo morate otvoriti postavke aplikacije. Zatim morate odabrati odjeljak "jezik i glasovni unos". Zatim morate označiti posljednji red.

Nakon odabira glasovne pretrage, trebate kliknuti na križić pored stavke „vanmrežno prepoznavanje govora“. Tada se preporučuje brisanje predmemorije aplikacije. Zatim morate ponovo pokrenuti svoj mobilni telefon. Da biste potpuno onemogućili uslužni program, morate otvoriti odjeljak "aplikacije" u postavkama, odabrati sintetizator govora s popisa i kliknuti na dugme "stop".

Deinstaliranje programa

Dešava se da korisnik uopće ne koristi Google Speech Synthesizer. Da li je moguće ukloniti uslužni program s mobilnog uređaja? Da biste to učinili, morate otvoriti Google Play. Zatim trebate odabrati sintetizator govora sa liste instaliranih programa i kliknuti na dugme "izbriši".

Rezultati

Aplikacije sa jednostavnim interfejsom pogodne su za obične korisnike i osobe sa invaliditetom. To može biti RHVoice ili Google Speech Synthesizer. Ruski glas će pročitati tekst prikazan na ekranu. Prosječnom korisniku ne treba više.

Muzičarima se preporučuje da daju prednost profesionalnom programu Vocaloid. Aplikacija ima dodatne glasovne biblioteke i mnogo različitih opcija. Program će vam omogućiti da dobijete prirodan glas. Uostalom, za muzičare je toliko važno da kompjuterska sinteza nije uočljiva uhu.

Sintetizatori govora su programi koji uzimaju tekst kao ulaz i sintetizuju ljudski govor kao izlaz. Ovi programi se široko koriste – u telefoniji, elektronskim pomoćnicima, za telefonski pristup web aplikacijama, u obrazovne svrhe, u call centrima itd. Glavni glasovni motori za reprodukciju ruskog govora su Realspeak, Digalo i Sakrament iz Nuance, Acapela i Sakrament, respektivno.

Sintisajzeri govora koji rade pod Windows sistemima:

Digalo (Acapela ELAN TTS)
Acapela sintisajzeri govora dostupni su na 23 jezika, uključujući ruski, i mogu govoriti na više od 50 glasova. Moguće ga je koristiti u više programa istovremeno (višekanalni). Visokokvalitetan ruski izgovor, veliki rečnik ruskih reči i akcenata, sve vrste podešavanja i opcija reprodukcije. Najkvalitetniji glasovni paket je „Nikolai“.

Nuance RealSpeak (ranije ScanSoft)
Podržava više od 20 jezika uključujući kineski, norveški i korejski i 30 glasova. Glas koji govori na ruskom je „Katerina“. U mnogim aspektima, ovo je čak i mnogo uspešnije rešenje za ruski jezik od Digala. Potpuno podržava SAPI5. Program se distribuira samo na komercijalnoj osnovi.

Sakrament TTS motor
Program može reproducirati tekstove na ruskom jeziku. Postoji i verzija web stranice kompanije na ruskom jeziku. Linija proizvoda Sakrament uključuje aplikaciju za komunikatore i PDA, program za oglašavanje elektronskih udžbenika i dokumenata. U paketu za ruski jezik možete birati između tri glasa („Olga“, „Irina“, „Vjačeslav“). Podržava RTF i TXT ulazne formate, automatski prepoznaje kodiranje teksta, u potpunosti podržava SAPI govorne oznake i dodatne oznake semantičkog teksta za poboljšanje zvuka sintetiziranog govora. Pomoću tagova možete postaviti naglasak, vrstu fragmenta teksta (datum, vrijeme, adresa, URL, e-mail, telefon, skraćenica, itd.), parametre reprodukcije (jačina, brzina, intonacija), kao i druge parametre.

CoolReader
Program za udobno čitanje knjiga sa ekrana, čitanje naglas, formatiranje i konvertovanje tekstova. Funkcija čitanja naglas je razvijena pomoću MS SAPI 4.0 × 5.1 motora. Takođe radi sa tekstovima na ruskom jeziku. Prepoznaje HTML, RTF, DOC (MS Word), TXT, FB2 (FictionBook) formate. Automatski prepoznaje ruska kodiranja dos, win, koi-8, kao i latinica, utf-8 i unicode. Možete sačuvati audio knjigu u MP3 formatu za slušanje na svom MP3 plejeru. Rječnici izgovora sa postavkama za svaki glasovni mehanizam su povezani zasebno. Podržani operativni sistemi: Win9x/ME/NT4.0/Win2K/XP.

ToM Reader
Aplikacija je istovremeno i preglednik teksta i sintetizator govora. Radi i na ruskom. Omogućava kreiranje MP3 datoteka od tekstova, moguće je povezati rječnike izgovora, a može raditi i sa zip arhivama. Podržani formati datoteka: HTML, RTF, MS Word, TXT, kodiranja: ANSI, KOI, OEM. Maksimalna veličina datoteke za otvaranje je 12 MB.

Speak Aloud je program za čitanje i spremanje u datoteku sa pretvaranjem teksta u TXT, PDF, HTML, RTF formatima u audio MP3, WAV, WMA, OGG, VOX, AU, AIFF, MP4, FLAC, SWF. Možete prilagoditi intonaciju, tembar glasa i kvalitetu reprodukcije zvuka. Podržana je grupna obrada datoteka. Radi pod operativnim sistemima: Windows 2000/XP/Vista

Govorilka
Reproducira tekst na ruskom. Moguće je snimiti tekst koji se čita u audio fajl (*.WAV, *.MP3), kao i regulisati brzinu čitanja i visinu glasa. Možete dodati rječnike izgovora, pa je vrlo lako ispraviti izgovor pojedinih riječi i fraza. Može raditi sa velikim fajlovima, otvara tekstove iz .doc, HTML fajlova. Takođe pamti poziciju kursora pri izlasku iz programa (kako bi kasnije mogao da počne da čita sa istog mesta).

Za razliku od prethodnog predstavnika, Cantor 2 je "napredniji" sistem za sintetizaciju vokalnih dijelova, ali po cijeni. Takođe ima verziju kao poseban program. Iako je vst-instrument analog piano-rolla u sekvenceru: pogledajte interfejs (slika 4).

Budući da je ovaj dodatak visoko instrumentiran, može manipulirati velikim brojem glasovnih parametara. Ali još uvijek morate početi konstruiranjem fraze slog po slog. Kao što možete pretpostaviti, ovo se radi pomoću klavirske rolne. Tu je i traka sa alatkama sa uobičajenim "olovkama", "gumicama" itd. Zapravo, hajde da pokušamo sintetizirati gore spomenutu frazu "hej, yo, hajde"! Nacrtajmo događaje u obliku pravokutnih područja i označimo svaki od njih, kao na slici 5.

Kao što vidite, nisu sve riječi napisane iznad događaja. Na primjer, riječ "ajde" podijeljena je na dva sloga - "com" i "on". Pažljivi korisnici će primijetiti da se fonemi automatski pišu ispod - ovo je prilično zgodna karakteristika. Ako uđete u detalje i nijanse, onda morate imati vrlo dobru ideju o tome šta su fonemi i druge suptilne nijanse zvuka govora, dostupne samo uskim stručnjacima. Samo ćemo to ostaviti kako jeste i vidjeti kako funkcionira općenito. Ali to nije sve. Sada, u midi dijelu pjesme Cantor 2, također trebamo registrirati dio prema kojem će zvučati naše riječi (slogovi). Uradimo to kao na slici 6.

Sada možemo uključiti reprodukciju u sekvenceru i osigurati da imamo zvuk na izlazu.

Zatim, prilagodimo neke nijanse zvuka. Odmah da rezervišem da za proučavanje svih nijansi postavljanja Cantora 2 morate napisati čitavu knjigu. U ovom članku ćemo pogledati opće parametre. Dakle, prvo, možete odabrati gotov glas. Na raspolaganju ih je desetak. Možete ih otvoriti na vrhu programa, u opciji Učitaj glas (slika 7).

Podrazumevano je bilo "Nikki", ali sam ga promenio u "Luther". Možete isprobati različite glasove, i ženske i muške.

Drugo, postoji odeljak efekata (u stvari, odeljak Efekti, slika 8).

Dostupna su 4 efekta - Distortion, Echodelay, Chorus i Reverb. Iako se ti isti efekti mogu dodati zasebno.

O sekcijama Fonema i Glas nema smisla govoriti, jer... Prilično ih je teško naučiti i samo prilično specijalizirani stručnjak može razumjeti njihove postavke. Iako vas niko ne brani da u ovim delovima okrećete dugmad i tako menjate zvuk. Ili proučite teoriju sinteze govora, kao i Cantorov korisnički priručnik, kako biste razumjeli kako bi sve to trebalo funkcionirati. Općenito, ima dosta parametara, rezultirajući zvuk je prilično složen i prilično primitivan.

Međutim, čak i početnik, ako pokuša, može dobiti zvuk sličan onome što sam dobio.

Fruity Loops Studio

Možda će se mnogi od vas, nakon što su vidjeli Fruity Loops, iznenaditi kako je dospjelo u ovaj članak, jer je vjerojatnije nego ne sintisajzer govora. Stvar je u tome što u svom arsenalu ima veoma dobar sintetizator govora. Zove se Speech Synthesizer. I iako nije dostupan kao poseban dodatak, možete umetnuti sam FL kao vst dodatak u svoju radnu stanicu i tamo koristiti njegov Speech Synthesizer. Ali i dalje radije kreiram govorni dio u samom FL-u, zatim ga izvozim u audio datoteku, a zatim ga koristim na bilo kojoj radnoj stanici.

Dakle, hajde da pokušamo da kreiramo seriju iz prethodnog primera direktno u FL Studiju. Ubacimo ovaj dodatak u naš projekat (slika 9).

Čim ga dodamo u projekat, automatski će se pojaviti prozor koji će nas tražiti da unesemo naš tekst. Ne morate dugo razmišljati i odmah unesite našu frazu iz gornjih primjera (Sl. 10).

Osim toga, možete odmah podesiti druge parametre govora, kao što su glas (dostupno je oko 20 glasova), stil izgovora, način rada (šaptom, usisavanje ili normalan) i postavke tempa i visine tona. Savjetujem vam da odmah postavite tempo (imam ga recimo 140, prema tempu projekta). Dugme Slušaj vam omogućava da slušate dio u hodu, prije nego što ga kreirate. Nakon što smo odabrali potrebne parametre, kliknite na checkbox, program će od nas zatražiti da sačuvamo naš fajl sa kreiranim govornim delom i novi deo sa vokalom će biti kreiran u projektu (Sl. 11).

Ne trebamo se mučiti - Speech Synthesizer je za nas napravio stazu, a to je Fruity Slicer u kojem je kreiran dio, podijeljen na note, gdje svaka riječ odgovara posebnoj noti (na slici 11 desno možete vidjeti da imamo dio sa 4 komada). Pored toga, piano roll je kreirao numere za note sa potpisanim rečima, što je veoma zgodno (Sl. 12).

Sve je prilično jasno i jednostavno. Nema potrebe da zapisujete foneme ili birate slogove da bi fraza zvučala ispravno. Dovoljno je jednostavno unijeti frazu - već će zvučati prilično podnošljivo i čitko. Tada možete jednako lako preurediti riječi i izvesti dio u željeni audio format. Uvjerite se i sami slušajući primjer.

Koji je najbolji od pregledanih sintisajzera govora?

Moje lično mišljenje: živi govor, živi vokali su bolji. Ako izaberete neki od gore navedenih programa, onda po broju postavki i parametara, naravno, pobjeđuje Cantor 2. Štaviše, on tvrdi da nije samo sintisajzer govora, već čak i vokalni sintisajzer. Ako se odlučite za praktičnost, jednostavnost i kvalitetu zvuka, ja preferiram Speech Synthesizer iz Fruity loops.

Dodatak od urednika

Tu je i besplatni program za sintezu govora -. Možete konfigurirati različite parametre i, nakon prethodnog slušanja, generirati rezultat u audio datoteku.

Danas se sintisajzeri govora, koji se koriste u desktop računarskim sistemima ili mobilnim uređajima, više ne čine neuobičajenim. Tehnologije su već iskoračile daleko naprijed i omogućile reprodukciju ljudskog glasa. U nastavku ćemo pogledati kako sve to funkcionira, gdje se koristi sintetizator govora, kako odabrati takav uređaj i na koje potencijalne probleme korisnik može naići prilikom kupovine takvog uređaja. Šta su sintetizatori govora? Gdje se mogu koristiti? Sintisajzeri govora su posebni programi koji se sastoje od nekoliko modula. Ovi programi vam omogućavaju da prevedete tekst ukucan na tastaturi u običan ljudski govor u obliku zvuka. Bilo bi naivno vjerovati da prateće biblioteke sadrže apsolutno sve riječi ili moguće fraze koje su u studijima snimili stvarni ljudi. To je jednostavno nemoguće na fizičkom nivou. Biblioteke fraza također bi bile takve veličine da se jednostavno ne bi mogle instalirati čak ni na moderne hard diskove velikog kapaciteta, a kamoli na mobilne uređaje. Osim toga, razvijena je tehnologija koja se zvala Text-to-Speech, što znači "tekst u govor". Sintisajzeri govora su postali najrasprostranjeniji u nekoliko oblasti. Jedna od ovih oblasti je samostalno učenje stranih jezika, kada korisnik treba da čuje pravilan izgovor reči. Sintetizatori govora se također koriste za slušanje knjiga umjesto čitanja, stvaranje lokalnih i govornih dijelova pri snimanju muzike i izdavanje upita za pretraživanje u obliku zvučnih fraza ili riječi. Takve uređaje mogu koristiti i osobe sa invaliditetom.

Sintetizatori govora: vrste programa

Svi sintisajzeri govora, ovisno o području upotrebe, mogu se podijeliti u dva glavna tipa: standardni programi, koji se koriste za direktno pretvaranje govora u tekst, i govorni ili vokalni moduli koji se koriste u muzičkim aplikacijama. Da bismo detaljnije razmotrili ovo pitanje, razmotrit ćemo obje klase programa, međutim, naglasak će i dalje biti više na sintetizatorima govora za njihovu neposrednu svrhu.

Prednosti i nedostaci jednostavnih govornih aplikacija. Što se tiče prednosti i mana programa ove vrste, prvo pogledajmo nedostatke. Prije svega, vrijedi reći da je računar još uvijek tehnički uređaj. U ovoj fazi razvoja, on može vrlo približno sintetizirati ljudski govor. Često u najjednostavnijim programima postoje problemi sa stavljanjem naglaska u riječi i niskim kvalitetom zvuka. Mobilni uređaji obično imaju povećanu potrošnju energije. U nekim slučajevima je uočeno i neovlašteno preuzimanje govornih modula. Međutim, i ovdje postoji mnogo prednosti. Mnogi bolje percipiraju slušne informacije od vizuelnih. Dakle, jasna prednost je lakoća percepcije. Kako pravilno koristiti sintetizator govora? Recimo nešto više o osnovnim principima korištenja ove vrste programa. Prvo, bilo koji tip sintisajzera govora može se instalirati bez ikakvih problema. U stacionarnim sistemima koristi se standardni instalater, čiji će glavni zadatak biti odabir podržanih jezičkih modula. Za mobilne uređaje, možete preuzeti instalacionu datoteku iz službene trgovine ili spremišta kao što je AppStore ili Google Play.

Nakon toga, aplikacija će se automatski instalirati. Prilikom prvog pokretanja, po pravilu, ne morate vršiti nikakve postavke osim odabira zadanog jezika. Međutim, u nekim slučajevima, program može zatražiti od vas da odaberete kvalitet zvuka. Standardna verzija sa frekvencijom uzorkovanja od 4410 Hz, dubinom od 16 bita i brzinom od 128 kbps se koristi svuda. Kod mobilnih uređaja slične brojke su nešto niže. Za osnovu se uzima određeni glas. Kada koristite standardni obrazac izgovora, korištenjem ekvilajzera i filtera, možete postići zvuk upravo ovog tembra. Kada koristite, možete odabrati nekoliko opcija za prevođenje teksta: ručni prijevod teksta, čitanje postojećeg teksta iz datoteke, integracija u druge aplikacije s mogućnošću aktiviranja rezultata pretraživanja ili čitanja tekstualnog sadržaja na internet stranicama. Ovdje će biti dovoljno odabrati željenu opciju akcije, glas i jezik na kojem će se tekst izgovoriti. Mnogi programi imaju nekoliko vrsta glasova, ženskih i muških. Da biste aktivirali proces reprodukcije, možete koristiti dugme za pokretanje.

Ako govorimo o tome kako onemogućiti sintetizator govora, može postojati nekoliko opcija. U najjednostavnijem slučaju, možete koristiti dugme za zaustavljanje reprodukcije u samom programu. Ako je sintisajzer integrisan u pretraživač, deaktivacija se vrši u postavkama ekstenzije potpunim uklanjanjem dodatka. S mobilnim uređajima, unatoč trenutnom gašenju, mogu se pojaviti neki problemi o kojima će biti riječi u nastavku. Na primjer, unos teksta i podešavanja se izvode na složeniji način. Pogledajmo aplikaciju FLStudio. Ima svoj govorni modul u kojem možete odabrati nekoliko vrsta glasova, promijeniti brzinu reprodukcije ili postavke tona. Da biste stavili akcenat, morate koristiti simbol “_” ispred sloga. Međutim, takav sintisajzer je prikladan samo za stvaranje robotskih glasova. Paket Vocaloid iz Yamahe se već može klasificirati kao program na profesionalnom nivou. Tehnologija Text-to-Speech ovdje je u potpunosti implementirana.

Osim standardnih parametara, u postavkama možete podesiti glisando i artikulaciju. Također možete koristiti biblioteke s vokalima profesionalnih izvođača, komponirati pojedinačne riječi i cijele fraze, prilagoditi ih različitim notama i još mnogo toga. Uopšte nije iznenađujuće da samo sa vokalom ovaj softverski paket zauzima više od 4 GB u instalacijskoj distribuciji. Nakon raspakivanja, volumen se povećava dva do tri puta.

U ovom pregledu ćemo se fokusirati samo na jednostavne aplikacije. Pogledajmo najpopularnije od njih. Prema većini korisnika, RH Voice je najbolji sintetizator govora. Ovaj ruski razvoj kreirala je Olga Yakovleva. U standardnoj verziji programa dostupna su samo tri glasa - Elena, Alexander, Irina. Postavljanje programa je prilično jednostavno. Sama aplikacija se može koristiti i kao samostalan program, kompatibilan sa SAPi5, i kao ekranski modul.

Još jedna zanimljiva aplikacija je Acapela. Njegova glavna karakteristika je gotovo savršena glasovna gluma teksta na više od 30 jezika. U jednostavnoj verziji aplikacije dostupna je samo jedna glasovna opcija - Alena. Još jedna moćna aplikacija sa ženskim glasom je Milena. Ovaj program se vrlo često koristi u call centrima. Postoji mnogo postavki za podešavanje stresa, podešavanje jačine zvuka, brzine čitanja, kao i instaliranje dodatnih rječnika. Glavna razlika između ovog programa je u tome što motor govora mora biti ugrađen u programe kao što su Cool Reader, Full Screen Caller ID, Moon+ Reader Pro. Najmoćniji alat za sintezu i prepoznavanje govora je Festivalski program. Dizajniran je za Mac OSX i Linux sisteme. Ova aplikacija dolazi s otvorenim izvornim kodom. Pored standardnih jezičkih paketa, podržava finski i hindi. Druga govorna aplikacija je eSpeak. Podržava više od 50 jezika. Glavni nedostatak ovog programa je što sprema sintetizirane govorne datoteke isključivo u WAV formatu. Poznato je da ovaj format zauzima puno prostora. Ovaj program je višeplatformski i može se koristiti čak i na mobilnim sistemima.

Google Android: problemi sa sintisajzerom govora

Korisnici se prilikom instaliranja „nativnog“ sintisajzera govora iz Google-a vrlo često žale da on spontano omogućava učitavanje dodatnih jezičkih modula. Ovo ne samo da traje dugo, već i ozbiljno gubi saobraćaj. Riješiti se ovog problema na Android sistemima je vrlo lako. Da biste to uradili, potrebno je da koristite meni za podešavanja. Ovdje idemo na odjeljak za jezik i glasovni unos. Ovdje trebate odabrati glasovno pretraživanje u opciji vanmrežnog prepoznavanja govora i kliknuti na križić (onemogućiti). Također se preporučuje dodatno brisanje predmemorije aplikacije i ponovno pokretanje uređaja. U nekim slučajevima, možda ćete morati onemogućiti obavještenja unutar same aplikacije.

Šta se dešava na kraju? Da sumiramo, možemo reći da su najjednostavniji programi prikladni za obične korisnike. Lider po brojnim ocjenama je program RHVoice.Međutim, za muzičare koji trebaju postići prirodan zvuk glasa, kako se ne bi osjetila razlika između live i kompjuterske sinteze, bolje je dati prednost programima poput Vocaloid.Mnogo dodatnih glasova biblioteke se danas proizvode za takve programe. Postavke za ove aplikacije imaju toliko mogućnosti da primitivne aplikacije nisu ni blizu.