Spletna sinteza govora. Kaj so sintetizatorji govora? Najboljši sintetizatorji govora

Sodobna tehnologija vam omogoča ustvarjanje govora neposredno iz natisnjenega besedila. Samo predstavljajte si, da lahko vnesete besedilo, ki bo nato izgovorjeno z glasom po vaši izbiri, z intonacijo in hitrostjo po vaši izbiri. In to ni fikcija, to je resničnost.

Kaj je sintetizator govora?

Sintetizatorji govora besedila v govor (TTS).- posebni programi, ki vam omogočajo ustvarjanje govornega signala (govor, glas) iz natisnjenega besedila. Prva omemba sinteze govora sega v 10. stoletje. Konec 18. stoletja je znanstvenik Christian Kratzenstein ustvaril model človeškega glasilnega trakta, ki je sposoben izgovoriti pet samoglasnikov (a, e, i, o, u).

Prvi računalniški sintetizatorji govora so se pojavili v poznih petdesetih letih prejšnjega stoletja. Zvenele so precej primitivno in takšen govor je bilo mogoče razumeti z velikimi težavami. Delo za izboljšanje kakovosti sintetiziranega govora se nadaljuje. Že danes se govor, ki ga ustvarjajo sodobni sistemi za sintezo govora, včasih ne razlikuje od pravega človeškega govora.

Zakaj potrebujete sintetizator govora?

Sintetizator govora vam lahko koristi v številnih primerih, na primer:

Med potjo- samo vnesite katero koli frazo in program jo bo izgovoril v jeziku, ki ga potrebujete.
Za branje e-knjig, besedil, dokumentov- greste po svojih opravilih in program vam bere na glas.
Za učenje tujih jezikov- odlična priložnost za brezplačno vadbo izgovorjave in govorjenja.

Sintetizator govora A1 SpeechTRON

A1 SpeechTRON- sintetizator angleškega govora iz besedila. Lahko se uporablja za branje zapiskov, besedilnih dokumentov, e-knjig in drugih besedilnih gradiv (formati: besedilo, RTF, DOC). Pri učenju angleščine se lahko uporablja tudi sintetizator govora (TTS). Program v celoti podpira Microsoft TTS SAPI 4.0, ima popolnoma prilagodljiv vmesnik, visoko kakovost zvoka, nastavitve hitrosti branja in snemanje datotek. Obstaja podpora za prilagojene in dodatne slovarje.

Sintetizator govora ReadPlease

Preberi Prosim- sintetizator angleškega govora iz besedila. Lahko se uporablja za branje besedil, odložišč, besedilnih dokumentov, e-knjig in drugih besedilnih materialov (formati: besedilo, RTF, DOC). Pri učenju angleščine se lahko uporablja tudi sintetizator govora (TTS). Po zagonu se program nahaja v pladnju in ga upravljate z vročimi tipkami. Lahko se priključi na različna okna ali namizje. Plačljiva različica ima podporo za dodatne jezike, standard AT&T Natural Voices in dodatne funkcije. Program obstaja v dveh različicah: brezplačni in plačljivi. Obstaja podpora za prilagojene in dodatne slovarje.

Sintetizator govora ReadingBar

ReadingBar- sintetizator govora s katere koli spletne strani. To je plošča za brskalnik Internet Explorer, ki se po namestitvi vgradi v brskalnik in omogoča branje poljubnih spletnih strani. Svoj glas lahko posnamete v datoteko wav ali mp3. Poleg izgovorjave besedila ReadBar omogoča tudi označevanje besed, njihovo prevajanje v 4 jezike in prikaz razlage besed iz slovarja. Bodite previdni, ReadingBar ne bo deloval v operacijskem sistemu Vista ali Internet Explorerju 7.

Sintetizator govora FlameReader

FlameReader je večnamenski sintetizator govora, ki vam omogoča ustvarjanje govora iz katerega koli besedila ali datoteke. Samo izberite besedilo v katerem koli programu ali dokumentu in FlameReader ga bo takoj izgovoril. Program ima številne zmožnosti: snemanje glasu v datoteko (wav in mp3), branje elektronske pošte, dokumentov, spletnih strani, presnemavanje PowerPoint predstavitev, prevajanje besedil. FlameReader lahko vedno prilagodite tako, da vam ustreza, tako da izberete glasovni mehanizem, hitrost predvajanja in druge parametre. FlameReader zbirki Microsoft Office doda navigacijsko vrstico, kar olajša uporabo. Program ima priročen urejevalnik zvočnih datotek.

Sintetizator govora Živo besedilo v govor

Živo besedilo v govor- večnamenski sintetizator govora, ki vam omogoča ne le izgovarjanje besed, besedil in datotek, temveč tudi njihovo snemanje (pretvorbo) v zvočne datoteke (MP3, WAV, OGG, VOX). Komplet vključuje ploščo za brskalnik Internet Explorer, ki vam omogoča glasovno predvajanje poljubnih spletnih strani in njihovo pretvorbo v zvočne datoteke.

Sintetizator govora YeoSoft Text to MP3 Speaker

YeoSoft Besedilo v MP3 zvočnik- večnamenski sintetizator govora, ki vam omogoča glas besedil in ustvarjanje zvočnih knjig v različnih zvočnih formatih. To je učinkovito orodje za učenje tujih jezikov. Podpira tehnologije SAPI 4 in 5, datoteke DOC in PDF, 10 jezikov, delo z več datotekami hkrati. Možnost dodajanja oznak xml v besedilo za nadzor izgovorjave. Glasovne nastavitve: glasnost, hitrost, izbira glasovnega mehanizma.

Sintetizator govora TextAloud

TextAloud- program za ustvarjanje govora iz besedila in datotek. Ustvarjeni govor lahko poslušate z računalnikom ali posnamete kot datoteko mp3 ali wma. Sintetizator podpira naslednje vrste datotek: DOC, PDF in HTML. Program vključuje tudi orodno vrstico za Internet Explorer, Firefox in Outlook.

Sintetizator besednega govora

TextSound- pretvornik besedila v zvok (wav in mp3). Ta majhen program vam bo pomagal hitro pretvoriti besedilo v govor in ga shraniti kot zvočne datoteke. Program omogoča obdelavo več datotek hkrati in ustvarjanje seznama opravil.

Zdi se, da sintetizatorji govora, nameščeni v računalnikih ali mobilnih napravah, niso več tako nenavadni programi kot prej. Zahvaljujoč sodobni tehnologiji lahko običajen namizni računalnik reproducira človeški glas.

Kako delujejo sintetizatorji govora? Kje se uporabljajo? Kateri je najboljši sintetizator govora? Odgovori na ta in druga vprašanja so predstavljeni v tem članku.

Splošni koncept

Sintetizatorji govora so posebni programi, sestavljeni iz številnih modulov, ki omogočajo prevajanje natipkanih besedil v stavke, ki jih izgovori človeški glas. Ne mislite, da so celotno zbirko besed in besednih zvez posneli resnični ljudje v profesionalnih studiih. Fizično je nemogoče opraviti takšno nalogo. Knjižnice s tako velikim številom fraz ni mogoče namestiti na noben sodoben računalnik, kaj šele na mobilni telefon. V ta namen so razvijalci ustvarili tehnologijo Text-to-Speech.

Področje uporabe

Sintetizatorji govora se uporabljajo pri učenju tujih jezikov, poslušanju besedil na straneh knjig, ustvarjanju vokalnih delov, izdajanju iskalnih poizvedb v obliki govorjenih fraz itd.

Katere vrste programov obstajajo? Glede na obseg uporabe lahko pripomočke razdelimo na 2 vrsti: navadne, ki pretvarjajo vtipkano besedilo v govor, in posebne vokalne module, ki se uporabljajo v glasbenih aplikacijah.

Prednosti in slabosti

Trenutno računalnik sintetizira človeški govor le približno. V najpreprostejših programih lahko opazite težave z zvokom in pravilno postavitvijo poudarka v različnih besedah. Sintetizatorji govora, nameščeni na mobilnih napravah, porabijo veliko energije. Pogosto je mogoče opaziti nepooblaščeno nalaganje dodatnih modulov.

Prednosti vključujejo enostavnost zaznavanja. Mnogi uporabniki menijo, da je veliko lažje asimilirati zvočne informacije kot katere koli druge vrste.

Najboljši sintetizatorji govora z ruskimi glasovi

Program RHVoice je ustvarila Olga Yakovleva. Standardna različica aplikacije vključuje 3 glasove. Nastavitve so zelo preproste. Program se lahko uporablja kot samostojna aplikacija, združljiva s SAPI5, in kot dodatni zaslonski modul.

Sintetizator govora Acapela se od svojih analogov razlikuje po idealni izgovorjavi besedila. Aplikacija podpira več kot 30 jezikov sveta. V brezplačni različici je na voljo samo 1 ženski glas.

Vokalizator se pogosto uporablja v klicnih centrih. Uporabnik lahko prilagodi poudarek, glasnost in hitrost branja. Po potrebi se naložijo dodatni slovarji. V aplikaciji je 1 ženski glas. Govorni mehanizem je samodejno integriran v programe za branje knjig v elektronski obliki.

Pripomoček eSpeak podpira več kot 50 jezikov. Slabost programa je, da zvočne datoteke shranjuje samo v formatu WAV, kar zahteva veliko prostora na trdem disku.

Aplikacija Festival je zmogljiv pripomoček za sintezo govora, ki podpira celo finščino in hindijščino.

Namestitev programa

Kako uporabljati to vrsto aplikacije? Najprej morate namestiti program. Računalniški operacijski sistemi uporabljajo standardni namestitveni program, v katerem mora uporabnik samo izbrati jezikovni modul, ki ga podpira pripomoček. Namestitveni program za mobilne naprave lahko prenesete z uradne spletne strani, Google Play in App Store. Namestitev aplikacije se izvede samodejno.

Prvi zagon programa

Na tej stopnji mora uporabnik samo nastaviti privzeti jezik. Včasih morate upoštevati kakovost zvoka. Standardna različica vključuje frekvenco vzorčenja 4410 Hz, globino 16 bitov in bitno hitrost 128 kbps. V mobilnem OS so lahko številke nižje. Za osnovo je uporabljen določen glas.

Filtri in izenačevalniki vam pomagajo doseči želeni zvok. Uporabnik ima tri možnosti za prevajanje besedila. Lahko tipka stavke na tipkovnico, vklopi zvok obstoječe datoteke ali namesti razširitev brskalnika, ki pretvori vsebino spletnih strani v govor. Dovolj je, da zabeležite zahtevani potek dejanja, tember glasu in jezik, v katerem bo besedilo izgovorjeno. Za začetek postopka predvajanja kliknite gumb »Start«.

Delo s kompleksnimi programi

V glasbenih aplikacijah so nastavitve veliko bolj zapletene. V govornem modulu programa FL Studio lahko uporabnik izbere več vrst glasov, pa tudi določi ton in hitrost predvajanja. Poudarki so pred zlogi postavljeni s simbolom »_«. S pomočjo takšnega sintetizatorja govora lahko ustvarite le robotski glas.

Vocaloid je aplikacija profesionalnega tipa. Poleg običajnih parametrov lahko uporabnik izbere artikulacijo in glissando. Pripomoček ima bazo podatkov s profesionalnimi vokali. Če želite, lahko celotne stavke prilagodite opombam. Samo knjižnica z vokali zavzema več kot 4 GB v stisnjeni obliki.

"Google Speech Synthesizer": kaj je ta program?

Maja 2014 je podjetje uporabnikom omogočilo, da preizkusijo nov brezplačen izdelek. Kaj je Google Speech Synthesizer v sistemu Android? To je program, ki bere besedilo na zaslonu mobilne naprave ali tablice. Zdaj ni več treba nameščati pripomočkov tretjih oseb, ki zahtevajo licenco. »Google Speech Synthesizer« se uporablja pri branju e-knjig, poslušanju pravilne izgovorjave besed in zagonu aplikacije TalkBack.

Nova različica programa Google Speech Synthesizer 3.1 zdaj podpira angleški, italijanski, španski, korejski, nemški, nizozemski, poljski, portugalski, ruski in francoski jezik. Kje najdem glasovne pakete? Prenesejo se iz same aplikacije.

Prednosti in slabosti Googlovega izdelka

Posebnosti rusko govorečega ženskega glasu so njegov jasen, glasen zvok in gladka intonacija. Hitrost predvajanja lahko prilagodite v nastavitvah programa. Uporabniki, ki uporabljajo TalkBack in rusko jezikovno lokalizacijo operacijskega sistema Android, naj bodo previdni pri preklopu na sintetizator govora, če je bila aplikacija prej privzeto nastavljena na drug glas. Morda boste imeli težave z ohranjanjem slušnega nadzora mobilne naprave. Skoraj vsi glasovi, razen ruskega, ne morejo obdelati stavkov v cirilici.

Med pomanjkljivostmi je mogoče opaziti zapoznelo reakcijo na branje besedil, sestavljenih iz stavkov v različnih jezikih. Ruski glas odlikujejo kovinske note tembra. Morda boste slišali ropotanje pri nizkih frekvencah. Prednosti vključujejo stabilnost aplikacije in sprejemljivo kakovost branja angleških besed.

"Google Speech Synthesizer": kako uporabljati program

Da bo pripomoček deloval, kot bi moral, ga morate posodobiti na najnovejšo različico. Če želite aktivirati postopek govorjenja besedila, morate odpreti nastavitve. V razdelku »jezik in vnos« morate potrditi polje »Sinteza govora«. Upoštevati je treba tudi vrstico "privzeti sistem". Ne pozabite, da je treba posodobiti tudi glasovne pakete v samem programu.

Težave pri delu s pripomočkom

Po potrebi lahko uporabnik onemogoči aplikacijo. V najpreprostejših pripomočkih se gumb za zaustavitev nahaja v samem programu. Deaktiviranje razširitve, nameščene v brskalniku, se izvede tako, da onemogočite dodatek ali popolnoma odstranite vtičnik. Težave lahko nastanejo tudi pri uporabi programa na mobilnem telefonu. Dejstvo je, da sintetizator govora samodejno začne nalagati jezikovne module, ki jih uporabnik ne potrebuje.

Ta postopek traja veliko časa in znatno porabi promet. Kako lahko onemogočim Google Speech Synthesizer na svoji mobilni napravi in se znebim te težave? Najprej morate odpreti nastavitve aplikacije. Nato morate izbrati razdelek »jezik in glasovni vnos«. Nato morate označiti zadnjo vrstico.

Ko izberete glasovno iskanje, morate klikniti križec poleg elementa »prepoznavanje govora brez povezave«. Nato je priporočljivo izbrisati predpomnilnik aplikacije. Nato morate znova zagnati mobilni telefon. Če želite popolnoma onemogočiti pripomoček, morate v nastavitvah odpreti razdelek »aplikacije«, na seznamu izbrati sintetizator govora in klikniti gumb »ustavi«.

Odstranjevanje programa

Zgodi se, da uporabnik Google Speech Synthesizer sploh ne uporablja. Ali je mogoče odstraniti pripomoček iz mobilne naprave? Če želite to narediti, morate odpreti Google Play. Nato izberite sintetizator govora s seznama nameščenih programov in kliknite gumb »izbriši«.

Rezultati

Aplikacije s preprostim vmesnikom so primerne za običajne uporabnike in osebe s posebnimi potrebami. To je lahko RHVoice ali Google Speech Synthesizer. Ruski glas bo prebral besedilo, prikazano na zaslonu. Povprečni uporabnik ne potrebuje več.

Glasbenikom priporočamo, da dajo prednost profesionalnemu programu Vocaloid. Aplikacija ima dodatne glasovne knjižnice in veliko različnih možnosti. Program vam bo omogočil, da dobite naraven zvok glasu. Konec koncev je za glasbenike tako pomembno, da računalniška sinteza ni zaznavna za uho.

Sintetizatorji govora so programi, ki sprejmejo besedilo kot vhod in sintetizirajo človeški govor kot izhod. Ti programi so zelo razširjeni – v telefoniji, elektronski pomočniki, za telefonski dostop do spletnih aplikacij, v izobraževalne namene, v klicnih centrih itd. Glavni glasovni motorji za reprodukcijo ruskega govora so Realspeak, Digalo in Sakrament iz Nuance, Acapela oziroma Sakrament.

Sintetizatorji govora, ki delujejo v sistemih Windows:

Digalo (Acapela ELAN TTS)
Sintetizatorji govora Acapela so na voljo v 23 jezikih, vključno z ruščino, in lahko govorijo v več kot 50 glasovih. Možna je uporaba v več programih hkrati (večkanalni). Kakovostna ruska izgovorjava, velik slovar ruskih besed in naglasov, vse vrste nastavitev in možnosti predvajanja. Najkakovostnejši govorni paket je Nikolaj.

Nuance RealSpeak (prej ScanSoft)
Podpira več kot 20 jezikov, vključno s kitajščino, norveščino in korejščino, ter 30 glasov. Glas, ki govori v ruščini, je "Katerina". V mnogih pogledih je to celo veliko bolj uspešna rešitev za ruski jezik kot Digalo. V celoti podpira SAPI5. Program se distribuira samo komercialno.

Motor Sakrament TTS
Program lahko reproducira besedila v ruskem jeziku. Obstaja tudi različica spletnega mesta podjetja v ruskem jeziku. Linija izdelkov Sakrament vključuje aplikacijo za komunikatorje in dlančnike, program za ozvočenje elektronskih učbenikov in dokumentov. V paketu za ruski jezik lahko izbirate med tremi glasovi ("Olga", "Irina", "Vjačeslav"). Podpira vhodne formate RTF in TXT, samodejno prepozna kodiranje besedila, v celoti podpira govorne oznake SAPI in dodatne semantične oznake besedila za izboljšanje zvoka sintetiziranega govora. Z oznakami lahko nastavite poudarek, vrsto besedilnega fragmenta (datum, čas, naslov, URL, e-pošta, telefon, okrajšava itd.), Parametre predvajanja (glasnost, hitrost, intonacijo) in druge parametre.

CoolReader
Program za udobno branje knjig z zaslona, glasno branje, oblikovanje in pretvorbo besedil. Funkcija branja na glas je razvita z motorji MS SAPI 4.0 × 5.1. Deluje tudi z besedili v ruščini. Prepoznava formate HTML, RTF, DOC (MS Word), TXT, FB2 (FictionBook). Samodejno prepozna rusko kodiranje dos, win, koi-8, pa tudi latin, utf-8 in unicode. Zvočno knjigo lahko shranite v formatu MP3 za poslušanje v predvajalniku MP3. Slovarji izgovorjave z nastavitvami za vsak glasovni pogon so povezani posebej. Podprti operacijski sistemi: Win9x/ME/NT4.0/Win2K/XP.

Bralec ToM
Aplikacija je pregledovalnik besedil in sintetizator govora hkrati. Deluje tudi v ruščini. Omogoča ustvarjanje datotek MP3 iz besedil, možno je povezati slovarje izgovorjave in lahko deluje z arhivi zip. Podprti formati datotek: HTML, RTF, MS Word, TXT, kodiranja: ANSI, KOI, OEM. Največja velikost datoteke za odpiranje je 12 MB.

Speak Aloud je program za branje in shranjevanje v datoteko s pretvorbo besedila v formatih TXT, PDF, HTML, RTF v zvočne MP3, WAV, WMA, OGG, VOX, AU, AIFF, MP4, FLAC, SWF. Prilagodite lahko intonacijo, tember glasu in kakovost reprodukcije zvoka. Podprta je paketna obdelava datotek. Deluje pod operacijskimi sistemi: Windows 2000/XP/Vista

Govorilka
Reproducira besedilo v ruščini. Prebrano besedilo je mogoče posneti v zvočno datoteko (*.WAV, *.MP3) ter regulirati hitrost branja in višino glasu. Dodate lahko slovarje izgovorjave in tako zelo enostavno popravite izgovorjavo posameznih besed in fraz. Lahko dela z velikimi datotekami, odpira besedila iz .doc, HTML datotek. Zapomni si tudi položaj kazalca ob izhodu iz programa (da lahko kasneje začne brati z istega mesta).

Za razliko od prejšnjega predstavnika je Cantor 2 bolj "napreden" sistem za sintezo vokalnih delov, vendar za svojo ceno. Ima tudi različico kot ločen program. Čeprav je vst-instrument analog piano-rolla v sekvencerju: poglejte si vmesnik (slika 4).

Ker je ta vtičnik zelo instrumentiran, lahko manipulira z velikim številom glasovnih parametrov. Toda še vedno morate začeti s sestavljanjem besedne zveze zlog za zlogom. Kot morda ugibate, se to naredi s klavirskim zvitkom. Obstaja tudi orodna vrstica z običajnimi "svinčniki", "radirkami" itd. Pravzaprav poskusimo sintetizirati besedno zvezo "hej, jo, daj no", omenjeno zgoraj! Narišimo dogodke v obliki pravokotnih območij in vsako od njih tudi označimo, kot na sliki 5.

Kot lahko vidite, besede niso vse zapisane nad dogodki. Na primer, beseda "pridi" je razdeljena na dva zloga - "com" in "on". Pozorni uporabniki bodo opazili, da so fonemi samodejno napisani spodaj - to je precej priročna funkcija. Če greste v podrobnosti in nianse, potem morate imeti zelo dobro predstavo o tem, kaj so fonemi in drugi subtilni odtenki zvoka govora, ki so dostopni le ozkim strokovnjakom. Pustili ga bomo tako, kot je, in videli bomo, kako na splošno deluje. A to še ni vse. Zdaj moramo v midi delu skladbe Cantor 2 registrirati tudi del, po katerem bodo zvenele naše besede (zlogi). Naredimo kot na sliki 6.

Zdaj lahko vklopimo predvajanje v sekvencerju in poskrbimo, da imamo na izhodu nekaj zvoka.

Nato prilagodimo nekaj zvočnih odtenkov. Naj takoj rezerviram, da morate za preučevanje vseh odtenkov nastavitve Cantorja 2 napisati celo knjigo. V tem članku si bomo ogledali splošne parametre. Torej, najprej lahko izberete že pripravljen glas. Na voljo jih je okoli ducat. Odprete jih lahko na vrhu programa, v opciji Naloži glas (slika 7).

Privzeto je bilo "Nikki", vendar sem ga spremenil v "Luther". Poskusite lahko različne glasove, tako ženske kot moške.

Drugič, tu je razdelek z učinki (pravzaprav razdelek z učinki, slika 8).

Na voljo so 4 učinki - Distortion, Echodelay, Chorus in Reverb. Čeprav je te iste učinke mogoče dodati ločeno.

O razdelkih Fonem in Glas nima smisla govoriti, ker... Težko se jih je naučiti in le dokaj specializiran strokovnjak lahko razume njihove nastavitve. Čeprav vam nihče ne brani, da v teh delih zavrtite gumbe in s tem spremenite zvok. Ali pa se poglobite v teorijo sinteze govora in uporabniški priročnik Cantor, da boste razumeli, kako naj bi vse skupaj delovalo. Na splošno je parametrov kar veliko, nastali zvok je precej zapleten in precej primitiven.

Vendar pa lahko tudi začetnik, če se potrudi, dobi podoben zvok, kot sem ga dobil jaz.

Studio Fruity Loops

Morda boste mnogi od vas, ki ste videli Fruity Loops, presenečeni, kako je prišel v ta članek, saj je bolj verjetno kot ne sintetizator govora. Stvar je v tem, da ima v svojem arzenalu zelo dober sintetizator govora. Imenuje se Sintetizator govora. In čeprav ni na voljo kot ločen vtičnik, lahko sam FL vstavite kot vtičnik vst v svojo delovno postajo in tam uporabite njegov sintetizator govora. Še vedno pa raje ustvarim govorni del v samem FL, ga nato izvozim v zvočno datoteko in nato uporabim v kateri koli delovni postaji.

Torej, poskusimo ustvariti paket iz prejšnjega primera neposredno v FL Studio. Vstavimo ta vtičnik v naš projekt (slika 9).

Takoj, ko ga dodamo v projekt, se samodejno prikaže okno, ki nas pozove, da vnesemo svoje besedilo. Ni vam treba dolgo razmišljati in takoj vnesite našo frazo iz zgornjih primerov (slika 10).

Poleg tega lahko takoj nastavite druge govorne parametre, kot so glas (na voljo je približno 20 glasov), slog izgovorjave, način (šepetano, pridihano ali normalno) ter nastavitve tempa in višine. Svetujem vam, da takoj nastavite tempo (jaz ga imam, recimo, 140, glede na tempo projekta). Gumb Poslušaj vam omogoča, da del poslušate sproti, preden ga ustvarite. Ko smo izbrali potrebne parametre, kliknemo potrditveno polje, program nas pozove, da shranimo našo datoteko z ustvarjenim govornim delom in v projektu se ustvari nov del z vokali (slika 11).

Ni se nam treba truditi - Speech Synthesizer je za nas ustvaril skladbo, ki je Fruity Slicer z delom, ustvarjenim v njem, razdeljenim na note, kjer vsaka beseda ustreza ločeni noti (na sliki 11 na desni lahko vidite da imamo del s 4 kosi ). Poleg tega je Piano roll ustvaril skladbe za note s podpisanimi besedami, kar je zelo priročno (slika 12).

Vse je precej jasno in preprosto. Ni vam treba zapisovati fonemov ali izbirati zlogov, da bi fraza zvenela pravilno. Dovolj je, da preprosto vnesete frazo - že bo zvenela precej znosno in berljivo. Nato lahko prav tako enostavno preuredite besede in izvozite del v želeno zvočno obliko. O tem se lahko prepričate sami, če poslušate primer.

Kateri je najboljši od pregledanih sintetizatorjev govora?

Moje osebno mnenje: živ govor, živi vokal je boljši. Če izbirate med zgoraj omenjenimi programi, potem po številu nastavitev in parametrov seveda zmaga Cantor 2. Poleg tega trdi, da ni le sintetizator govora, ampak celo vokalni sintetizator. Če se odločite za udobje, preprostost in kakovost zvoka, imam raje Speech Synthesizer podjetja Fruity loops.

Dodatek uredništva

Obstaja tudi brezplačen program za sintezo govora -. Konfigurirate lahko različne parametre in po predhodnem poslušanju ustvarite rezultat v zvočno datoteko.

Danes se sintetizatorji govora, ki se uporabljajo v namiznih računalniških sistemih ali mobilnih napravah, ne zdijo več nenavadni. Tehnologije so že stopile daleč naprej in omogočile reprodukcijo človeškega glasu. V nadaljevanju si bomo ogledali, kako vse skupaj deluje, kje se uporablja sintetizator govora, kako takšno napravo izbrati in na kakšne morebitne težave lahko uporabnik naleti pri nakupu takšne naprave. Kaj so sintetizatorji govora? Kje jih je mogoče uporabiti? Sintetizatorji govora so posebni programi, sestavljeni iz več modulov. Ti programi vam omogočajo prevajanje besedila, vnesenega na tipkovnici, v običajen človeški govor v obliki zvoka. Naivno bi bilo verjeti, da priložene knjižnice vsebujejo popolnoma vse besede ali možne besedne zveze, ki so jih v studiih posneli resnični ljudje. To je na fizični ravni preprosto nemogoče. Tudi besedna zveza knjižnice bi bila tako velika, da jih preprosto ne bi bilo mogoče namestiti niti na sodobne trde diske velikih kapacitet, kaj šele mobilne naprave. Poleg tega je bila razvita tehnologija, imenovana Text-to-Speech, kar pomeni »besedilo v govor«. Sintetizatorji govora so postali najbolj razširjeni na več področjih. Eno od teh področij je tudi samostojno učenje tujih jezikov, ko mora uporabnik slišati pravilno izgovorjavo besede. Sintetizatorji govora se uporabljajo tudi za poslušanje knjig namesto branja, ustvarjanje lokalnih in govornih delov pri snemanju glasbe in izdajanje iskalnih poizvedb v obliki glasovnih fraz ali besed. Takšne naprave lahko uporabljajo tudi invalidi.

Sintetizatorji govora: vrste programov

Vse sintetizatorje govora, odvisno od področja uporabe, lahko razdelimo na dve glavni vrsti: standardne programe, ki se uporabljajo za neposredno pretvorbo govora v besedilo, in govorne ali vokalne module, ki se uporabljajo v glasbenih aplikacijah. Da bi podrobneje obravnavali to vprašanje, bomo obravnavali oba razreda programov, vendar bo poudarek še vedno bolj na sintetizatorjih govora za njihov neposredni namen.

Prednosti in slabosti preprostih govornih aplikacij. Kar zadeva prednosti in slabosti tovrstnih programov, si najprej poglejmo slabosti. Najprej je treba povedati, da je računalnik še vedno tehnična naprava. Na tej stopnji razvoja lahko zelo približno sintetizira človeški govor. Pogosto v najpreprostejših programih obstajajo težave z naglasom besed in nizko kakovostjo zvoka. Mobilne naprave imajo običajno povečano porabo energije. V nekaterih primerih so opazili tudi nepooblaščeno nalaganje govornih modulov. Vendar pa je tukaj tudi veliko prednosti. Mnogi slušne informacije zaznavajo bolje kot vizualne. Jasna prednost je torej enostavnost zaznavanja. Kako pravilno uporabljati sintetizator govora? Povejmo nekaj več o osnovnih načelih uporabe te vrste programa. Prvič, katero koli vrsto sintetizatorja govora je mogoče namestiti brez težav. V stacionarnih sistemih se uporablja standardni namestitveni program, katerega glavna naloga bo izbira podprtih jezikovnih modulov. Za mobilne naprave lahko namestitveno datoteko prenesete iz uradne trgovine ali repozitorija, kot sta AppStore ali Google Play.

Po tem se bo aplikacija samodejno namestila. Ob prvem zagonu vam praviloma ni treba opraviti nobenih nastavitev razen izbire privzetega jezika. Vendar vas lahko v nekaterih primerih program pozove, da izberete kakovost zvoka. Povsod se uporablja standardna različica s frekvenco vzorčenja 4410 Hz, globino 16 bitov in bitno hitrostjo 128 kbps. Pri mobilnih napravah so podobne številke nekoliko nižje. Za osnovo je vzet določen glas. Pri uporabi standardnega vzorca izgovorjave lahko z uporabo izenačevalnikov in filtrov dosežete zvok točno tega tembra. Pri uporabi lahko izberete več možnosti prevajanja besedila: ročno prevajanje besedila, branje obstoječega besedila iz datoteke, integracija v druge aplikacije z možnostjo aktiviranja rezultatov iskanja ali branje besedilnih vsebin na spletnih straneh. Tukaj bo dovolj, da izberete želeno možnost dejanja, glas in jezik, v katerem bo govorjeno besedilo. Številni programi imajo več vrst glasov, tako ženske kot moške. Če želite aktivirati postopek predvajanja, lahko uporabite gumb za zagon.

Če govorimo o tem, kako onemogočiti sintetizator govora, lahko obstaja več možnosti. V najpreprostejšem primeru lahko uporabite gumb za zaustavitev predvajanja v samem programu. Če je sintetizator integriran v brskalnik, se deaktivacija izvede v nastavitvah razširitve s popolno odstranitvijo vtičnika. Pri mobilnih napravah se kljub takojšnji zaustavitvi lahko pojavijo nekatere težave, o katerih bomo govorili v nadaljevanju. Na primer, vnos besedila in nastavitve se izvajajo na bolj zapleten način. Poglejmo si aplikacijo FLStudio. Ima lasten govorni modul, v katerem lahko izberete več vrst glasov, spremenite hitrost predvajanja ali nastavitve tona. Če želite postaviti naglas, morate pred zlogom uporabiti simbol »_«. Vendar je tak sintetizator primeren le za ustvarjanje robotskih glasov. Yamahin paket Vocaloid že lahko uvrstimo med programe profesionalne ravni. Tu je v celoti implementirana tehnologija pretvorbe besedila v govor.

Poleg standardnih parametrov lahko v nastavitvah nastavite glissando in artikulacijo. Uporabite lahko tudi knjižnice z vokali profesionalnih izvajalcev, sestavljate posamezne besede in celotne fraze, jih prilagajate različnim notam in še veliko več. Sploh ni presenetljivo, da samo z vokali ta programski paket zasede več kot 4 GB v namestitveni distribuciji. Po razpakiranju se glasnost poveča za dva do trikrat.

V tem pregledu se bomo osredotočili le na preproste aplikacije. Oglejmo si najbolj priljubljene med njimi. Po mnenju večine uporabnikov je RH Voice najboljši sintetizator govora. Ta ruski razvoj je ustvarila Olga Yakovleva. V standardni različici programa so na voljo le trije glasovi - Elena, Alexander, Irina. Nastavitev programa je precej preprosta. Sama aplikacija se lahko uporablja kot samostojen program, združljiv s SAPi5, in kot zaslonski modul.

Druga zanimiva aplikacija je Acapela. Njegova glavna značilnost je skoraj popolno glasovno predvajanje besedila v več kot 30 jezikih. V preprosti različici aplikacije je na voljo samo ena glasovna možnost - Alena. Druga močna aplikacija z ženskim glasom je Milena. Ta program se zelo pogosto uporablja v klicnih centrih. Obstaja veliko nastavitev za nastavitev stresa, prilagajanje glasnosti, hitrosti branja, pa tudi namestitev dodatnih slovarjev. Glavna razlika med tem programom je, da mora biti govorni mehanizem vgrajen v programe, kot so Cool Reader, Full Screen Caller ID, Moon+ Reader Pro. Najmočnejši pripomoček za sintezo in prepoznavanje govora je program Festival. Zasnovan je za sisteme Mac OSX in Linux. Ta aplikacija ima odprtokodno kodo. Poleg standardnih jezikovnih paketov podpira finščino in hindijščino. Druga govorna aplikacija je eSpeak. Podpira več kot 50 jezikov. Glavna pomanjkljivost tega programa je, da sintetizirane govorne datoteke shranjuje izključno v formatu WAV. Znano je, da ta oblika zavzame veliko prostora. Ta program je večplatformski in se lahko uporablja celo v mobilnih sistemih.

Google Android: težave s sintetizatorjem govora

Uporabniki se pri namestitvi »domačega« Googlovega sintetizatorja govora zelo pogosto pritožujejo, da spontano omogoča nalaganje dodatnih jezikovnih modulov. To ne traja le dolgo časa, ampak tudi resno zapravlja promet. Znebiti se te težave v sistemih Android je zelo enostavno. Če želite to narediti, morate uporabiti meni z nastavitvami. Tukaj gremo v razdelek za jezik in glasovni vnos. Tukaj morate izbrati glasovno iskanje v možnosti prepoznavanja govora brez povezave in klikniti na križec (onemogoči). Priporočljivo je tudi, da dodatno počistite predpomnilnik aplikacij in znova zaženete napravo. V nekaterih primerih boste morda morali onemogočiti obvestila v sami aplikaciji.

Kaj se zgodi na koncu? Če povzamemo, lahko rečemo, da so najpreprostejši programi primerni za običajne uporabnike. Vodja v številnih ocenah je program RHVoice.Vendar pa je za glasbenike, ki morajo doseči naraven zvok glasu, tako da se razlika med živo in računalniško sintezo ne čuti, bolje dati prednost programom, kot je Vocaloid.Veliko dodatnih glasov za takšne programe se danes izdelujejo knjižnice. Nastavitve teh aplikacij imajo toliko možnosti, da primitivne aplikacije niso niti približno.