Sinteza e të folurit në internet. Çfarë janë sintetizuesit e të folurit? Sintetizuesit më të mirë të të folurit

Teknologjia moderne ju lejon të gjeneroni fjalim direkt nga teksti i printuar. Thjesht imagjinoni që mund të shkruani tekst, i cili më pas do të shqiptohet me zërin e zgjedhur, me intonacionin dhe shpejtësinë e zgjedhjes suaj. Dhe kjo nuk është trillim, ky është realitet.

Çfarë është një sintetizues i të folurit?

Sintetizuesit e të folurit "Tekst to Speech" (TTS).- programe speciale që ju lejojnë të gjeneroni një sinjal të folur (të folur, zë) nga teksti i printuar. Përmendja e parë e sintezës së të folurit daton në shekullin e 10-të. Në fund të shekullit të 18-të, shkencëtari Christian Kratzenstein krijoi një model të traktit vokal të njeriut të aftë për të shqiptuar pesë tinguj zanore (a, e, i, o, u).

Sintetizuesit e parë të të folurit të bazuar në kompjuter u shfaqën në fund të viteve 1950. Dukeshin mjaft primitive dhe një fjalim i tillë mund të kuptohej me shumë vështirësi. Puna për të përmirësuar cilësinë e të folurit të sintetizuar vazhdon. Tashmë sot, fjalimi i krijuar nga sistemet moderne të sintezës së të folurit ndonjëherë nuk dallohet nga fjalimi i vërtetë njerëzor.

Pse keni nevojë për një sintetizues të të folurit?

Një sintetizues i të folurit mund të jetë i dobishëm për ju në shumë raste, për shembull:

Gjatë udhëtimit- thjesht shkruani çdo frazë dhe programi do ta shqiptojë atë në gjuhën që ju nevojitet.
Për të lexuar e-libra, tekste, dokumente- ju merreni me biznesin tuaj dhe programi ju lexon me zë të lartë.
Për mësimin e gjuhëve të huaja- një mundësi e shkëlqyer për të praktikuar aftësitë e shqiptimit dhe të folurit falas.

Sintetizuesi i të folurit A1 SpeechTRON

A1 SpeechTRON- sintetizues i fjalës angleze nga teksti. Mund të përdoret për të lexuar shënime, dokumente teksti, e-libra dhe materiale të tjera tekstuale (formate: tekst, RTF, DOC). Një sintetizues i të folurit (TTS) mund të përdoret gjithashtu kur mësoni anglisht. Programi mbështet plotësisht Microsoft TTS SAPI 4.0, ka një ndërfaqe plotësisht të personalizueshme, cilësi të lartë zëri, cilësime të shpejtësisë së leximit dhe regjistrim skedari. Ekziston mbështetje për fjalorë të personalizuar dhe shtesë.

Sintetizuesi i të folurit Lexo të lutem

Lexoni Ju lutem- sintetizues i fjalës angleze nga teksti. Mund të përdoret për të lexuar tekste, clipboard, dokumente teksti, e-libra dhe materiale të tjera tekstuale (formate: tekst, RTF, DOC). Një sintetizues i të folurit (TTS) mund të përdoret gjithashtu kur mësoni anglisht. Pas nisjes, programi ndodhet në tabaka dhe kontrollohet nga çelësat e nxehtësisë. Mund të lidhet në dritare ose desktop të ndryshëm. Versioni me pagesë ka mbështetje për gjuhë shtesë, standardin AT&T Natural Voices dhe veçori shtesë. Programi ekziston në dy versione: falas dhe me pagesë. Ekziston mbështetje për fjalorë të personalizuar dhe shtesë.

Sintetizuesi i të folurit ReadingBar

Shiriti i Leximit- sintetizues i të folurit nga çdo faqe interneti. Ky është një panel për shfletuesin Internet Explorer, i cili, pas instalimit, futet në shfletues dhe ju lejon të lexoni çdo faqe në internet. Mund ta regjistroni zërin tuaj në skedar wav ose mp3. Përveç shqiptimit të tekstit, ReadBar ju lejon gjithashtu të nënvizoni fjalët, t'i përktheni ato në 4 gjuhë dhe të shfaqni interpretimin e fjalëve nga fjalori. Kini kujdes, ReadingBar nuk do të funksionojë në sistemin operativ Vista ose në Internet Explorer 7.

Sintetizuesi i të folurit FlameReader

FlameReaderështë një sintetizues shumëfunksional i të folurit që ju lejon të gjeneroni fjalim nga çdo tekst ose skedar. Thjesht zgjidhni tekstin në çdo program ose dokument dhe FlameReader do ta shqiptojë menjëherë. Programi ka shumë aftësi: regjistrimin e zërit në skedar (wav dhe mp3), leximin e postës elektronike, dokumentet, faqet e internetit, dublimin e prezantimeve në PowerPoint, përkthimin e teksteve. Mund ta personalizoni gjithmonë FlameReader në një mënyrë të përshtatshme për ju duke zgjedhur motorin e zërit, shpejtësinë e luajtjes dhe parametra të tjerë. FlameReader shton një shirit navigimi në paketën e Microsoft Office, duke e bërë më të lehtë përdorimin. Programi vjen me një redaktues të përshtatshëm të skedarëve audio.

Sintetizuesi i të folurit Tekst i gjallë në të folur

Tekst i gjallë në të folur- një sintetizues shumëfunksional i të folurit që ju lejon jo vetëm të shqiptoni fjalë, tekste dhe skedarë, por edhe t'i regjistroni (konvertoni) ato në skedarë tingulli (MP3, WAV, OGG, VOX). Kompleti përfshin një panel për shfletuesin Internet Explorer, i cili ju lejon të shprehni çdo faqe interneti dhe t'i konvertoni ato në skedarë zanor.

Sintetizuesi i të folurit Altoparlanti YeoSoft Tekst në MP3

Altoparlanti YeoSoft Teksti në MP3- një sintetizues shumëfunksional i të folurit që ju lejon të tingëlloni tekste dhe të krijoni libra audio në formate të ndryshme audio. Ky është një mjet efektiv për të mësuar gjuhë të huaja. Mbështet teknologjitë SAPI 4 dhe 5, skedarët DOC dhe PDF, 10 gjuhë, duke punuar me shumë skedarë njëkohësisht. Aftësia për të shtuar etiketa xml në tekst për të kontrolluar shqiptimin. Cilësimet e zërit: volumi, shpejtësia, zgjedhja e motorit të zërit.

Sintetizuesi i të folurit TextAloud

Tekst me zë të lartë- një program për gjenerimin e të folurit nga teksti dhe skedarët. Fjalimi i krijuar mund të dëgjohet duke përdorur një kompjuter ose të regjistrohet si skedar mp3 ose wma. Sintetizuesi mbështet llojet e mëposhtme të skedarëve: DOC, PDF dhe HTML. Programi përfshin gjithashtu një Toolbar për Internet Explorer, Firefox dhe Outlook.

Sintetizues i fjalës me fjalë

TekstiTingull- konvertues teksti në audio (wav dhe mp3). Ky program i vogël do t'ju ndihmojë të konvertoni shpejt tekstin në të folur dhe ta ruani atë si skedarë audio. Programi ju lejon të përpunoni disa skedarë në të njëjtën kohë dhe të krijoni një listë detyrash.

Sintetizuesit e të folurit të instaluar në kompjuterë ose pajisje celulare nuk duken më programe të pazakonta si më parë. Falë teknologjisë moderne, një kompjuter i zakonshëm desktop mund të riprodhojë zërin e njeriut.

Si funksionojnë sintetizuesit e të folurit? Ku përdoren? Cili është sintetizuesi më i mirë i të folurit? Përgjigjet për këto dhe pyetje të tjera janë paraqitur në këtë artikull.

Koncepti i përgjithshëm

Sintetizuesit e të folurit janë programe speciale që përbëhen nga një numër modulesh që ofrojnë aftësinë për të përkthyer tekstet e shtypura në fjali të folura nga një zë njerëzor. Ju nuk duhet të mendoni se e gjithë baza e të dhënave të fjalëve dhe frazave është regjistruar nga njerëz të vërtetë në studio profesionale. Është fizikisht e pamundur të kryhet një detyrë e tillë. Një bibliotekë me një numër kaq të madh frazash nuk mund të instalohet në asnjë kompjuter modern, e lëre më në celularë. Për këtë qëllim, zhvilluesit krijuan teknologjinë Text-to-Speech.

Fusha e zbatimit

Sintetizuesit e të folurit përdoren në mësimin e gjuhëve të huaja, dëgjimin e teksteve në faqet e librave, krijimin e pjesëve vokale, nxjerrjen e pyetjeve të kërkimit në formën e frazave të folura, etj.

Çfarë lloje programesh ekzistojnë? Në varësi të fushës së aplikimit, shërbimet mund të ndahen në 2 lloje: ato të rregullta që konvertojnë tekstin e shtypur në të folur dhe module speciale vokale të përdorura në aplikacionet muzikore.

Avantazhet dhe disavantazhet

Për momentin, kompjuteri sintetizon fjalën njerëzore vetëm përafërsisht. Në programet më të thjeshta, mund të vëzhgoni probleme me zërin dhe vendosjen e saktë të stresit me fjalë të ndryshme. Sintetizuesit e të folurit të instaluar në pajisjet celulare konsumojnë shumë energji. Shpesh është e mundur të vërehet shkarkimi i paautorizuar i moduleve shtesë.

Përparësitë përfshijnë lehtësinë e perceptimit. Shumë përdorues e kanë shumë më të lehtë të asimilojnë informacionin audio se çdo lloj tjetër.

Sintetizuesit më të mirë të të folurit me zërat rusë

Programi RHVoice u krijua nga Olga Yakovleva. Versioni standard i aplikacionit përfshin 3 zëra. Cilësimet janë shumë të thjeshta. Programi mund të përdoret si një aplikacion i pavarur, i pajtueshëm me SAPI5, ashtu edhe si një modul shtesë i ekranit.

Sintetizuesi i të folurit Acapela ndryshon nga analogët e tij në shqiptimin ideal të tekstit. Aplikacioni mbështet më shumë se 30 gjuhë të botës. Në versionin falas, disponohet vetëm 1 zë femëror.

Vokalizuesi përdoret shpesh në qendrat e thirrjeve. Përdoruesi mund të rregullojë theksin, volumin dhe shpejtësinë e leximit. Nëse është e nevojshme, ngarkohen fjalorë shtesë. Ka 1 zë femër në aplikacion. Motori i të folurit integrohet automatikisht në programe për leximin e librave në format elektronik.

Programi eSpeak mbështet mbi 50 gjuhë. Disavantazhi i programit është se ruan skedarët e zërit vetëm në formatin WAV, gjë që kërkon shumë hapësirë në hard diskun tuaj.

Aplikacioni Festival është një mjet i fuqishëm për sintezën e të folurit që mbështet edhe finlandisht dhe hindisht.

Instalimi i programit

Si të përdorni këtë lloj aplikacioni? Së pari ju duhet të instaloni programin. Sistemet operative kompjuterike përdorin një instalues standard, në të cilin përdoruesi duhet të zgjedhë vetëm modulin gjuhësor të mbështetur nga programi. Instaluesi për pajisjet celulare mund të shkarkohet nga faqja zyrtare e internetit, Google Play dhe App Store. Instalimi i aplikacionit ndodh automatikisht.

Nisja e parë e programit

Në këtë fazë, përdoruesi duhet vetëm të vendosë gjuhën e paracaktuar. Ndonjëherë ju duhet të vini re cilësinë e zërit. Versioni standard nënkupton një frekuencë kampionimi prej 4410 Hz, një thellësi prej 16 bit dhe një shpejtësi bit prej 128 kbps. Në sistemin operativ celular, shifrat mund të jenë më të ulëta. Një zë specifik përdoret si bazë.

Filtrat dhe barazuesit ju ndihmojnë të arrini tingullin e dëshiruar. Përdoruesi ka tre opsione për përkthimin e tekstit. Ai mund të shtypë fjali në tastierë, të aktivizojë audion e një skedari ekzistues ose të instalojë një shtesë të shfletuesit që konverton përmbajtjen në faqet e internetit në të folur. Mjafton të vërehet mënyra e kërkuar e veprimit, timbri i zërit dhe gjuha në të cilën do të flitet teksti. Për të filluar procesin e riprodhimit, klikoni në butonin "Start".

Puna me programe komplekse

Në aplikacionet muzikore, cilësimet janë shumë më komplekse. Në modulin e të folurit të programit FL Studio, përdoruesi mund të zgjedhë disa lloje zërash, si dhe të specifikojë tonin dhe shpejtësinë e riprodhimit. Theksimet vendosen para rrokjeve duke përdorur simbolin "_". Me ndihmën e një sintetizuesi të tillë të të folurit, mund të krijoni vetëm një zë robotik.

Vocaloid është një aplikacion i tipit profesional. Përveç parametrave të zakonshëm, përdoruesi mund të zgjedhë artikulimin dhe glissando. Shërbimi ka një bazë të dhënash me vokale profesionale. Nëse dëshironi, mund të rregulloni fjali të tëra për t'iu përshtatur shënimeve. Vetëm biblioteka me vokale merr më shumë se 4 GB në formë të ngjeshur.

"Google Speech Sinthesizer": çfarë është ky program?

Në maj 2014, kompania u dha përdoruesve mundësinë për të provuar një produkt të ri falas. Çfarë është Google Speech Sinthesizer në Android? Ky është një program që lexon tekstin në ekranin e një pajisjeje celulare ose tabletë. Tani nuk ka nevojë të instaloni shërbime të palëve të treta që kërkojnë licencë. "Google Speech Sinthesizer" përdoret kur lexoni libra elektronikë, dëgjoni shqiptimin e saktë të fjalëve dhe hapni aplikacionin TalkBack.

Versioni i ri i programit Google Speech Synthesizer 3.1 tani mbështet anglisht, italisht, spanjisht, koreanisht, gjermanisht, holandisht, polonisht, portugalisht, rusisht dhe frëngjisht. Ku mund të gjej paketat zanore? Ato shkarkohen nga vetë aplikacioni.

Avantazhet dhe disavantazhet e produktit nga Google

Veçoritë e zërit femëror që flet rusisht janë tingulli i tij i qartë, me zë të lartë dhe intonacioni i qetë. Shpejtësia e riprodhimit mund të rregullohet në cilësimet e programit. Përdoruesit që përdorin TalkBack dhe lokalizimin në gjuhën ruse të sistemit operativ Android duhet të kenë kujdes kur kalojnë në sintetizuesin e të folurit nëse aplikacioni ishte vendosur më parë në një zë tjetër si parazgjedhje. Mund të keni probleme me mbajtjen e kontrollit dëgjimor të pajisjes tuaj celulare. Pothuajse të gjithë zërat, përveç rusishtes, nuk janë në gjendje të përpunojnë fjali në cirilik.

Ndër disavantazhet, mund të vërehet një reagim i vonuar ndaj leximit të teksteve të përbërë nga fraza në gjuhë të ndryshme. Zëri rus dallohet nga notat metalike të timbrit. Ju mund të dëgjoni një zhurmë në frekuenca të ulëta. Përparësitë përfshijnë stabilitetin e aplikacionit dhe cilësinë e pranueshme të leximit të fjalëve angleze.

"Google Speech Sinthesizer": si ta përdorni programin

Në mënyrë që programi të funksionojë siç duhet, duhet ta përditësoni atë në versionin më të fundit. Për të aktivizuar procesin e të folurit të tekstit, duhet të hapni cilësimet. Në seksionin "gjuhë dhe hyrje", duhet të kontrolloni kutinë "sinteza e të folurit". Duhet të theksohet gjithashtu rreshti "sistemi i parazgjedhur". Mos harroni se edhe paketat zanore në vetë program duhet të përditësohen.

Probleme kur punoni me shërbimin

Nëse është e nevojshme, përdoruesi mund të çaktivizojë aplikacionin. Në shërbimet më të thjeshta, butoni i ndalimit ndodhet në vetë programin. Çaktivizimi i një shtesë të instaluar në shfletues bëhet duke çaktivizuar shtesën ose duke hequr plotësisht shtesën. Probleme mund të lindin edhe kur përdorni programin në një telefon celular. Fakti është se sintetizuesi i të folurit fillon automatikisht të ngarkojë modulet e gjuhës që përdoruesi nuk ka nevojë.

Ky proces kërkon shumë kohë dhe konsumon ndjeshëm trafikun. Si mund ta çaktivizoj Google Speech Sinthesizer në pajisjen time celulare dhe të shpëtoj nga ky problem? Së pari ju duhet të hapni cilësimet e aplikacionit. Pastaj duhet të zgjidhni seksionin "hyrja e gjuhës dhe zërit". Tjetra ju duhet të shënoni rreshtin e fundit.

Pasi të keni zgjedhur kërkimin zanor, duhet të klikoni në kryqin pranë artikullit "Njohja e të folurit jashtë linje". Pastaj rekomandohet të fshini cache-in e aplikacionit. Më pas duhet të rinisni telefonin tuaj celular. Për të çaktivizuar plotësisht programin, duhet të hapni seksionin "aplikacionet" në cilësimet, të zgjidhni një sintetizues të të folurit nga lista dhe të klikoni në butonin "ndal".

Çinstalimi i një programi

Ndodh që përdoruesi të mos përdorë fare Google Speech Sinthesizer. A është e mundur të hiqni programin nga një pajisje celulare? Për ta bërë këtë, duhet të hapni Google Play. Pastaj duhet të zgjidhni sintetizuesin e të folurit nga lista e programeve të instaluara dhe të klikoni në butonin "fshij".

Rezultatet

Aplikacionet me një ndërfaqe të thjeshtë janë të përshtatshme për përdoruesit e zakonshëm dhe personat me aftësi të kufizuara. Kjo mund të jetë ose RHVoice ose Google Speech Sinthesizer. Një zë rus do të lexojë tekstin e shfaqur në ekran. Përdoruesi mesatar nuk ka nevojë për më shumë.

Muzikantëve u rekomandohet t'i japin përparësi programit profesional Vocaloid. Aplikacioni ka biblioteka shtesë zanore dhe shumë opsione të ndryshme. Programi do t'ju lejojë të merrni një zë të natyrshëm. Në fund të fundit, është kaq e rëndësishme për muzikantët që sinteza e kompjuterit të mos jetë e dukshme për veshin.

Sintetizuesit e të folurit janë programe që marrin tekstin si hyrje dhe sintetizojnë fjalimin e njeriut si dalje. Këto programe përdoren gjerësisht - në telefoni, asistentë elektronikë, për qasje telefonike në aplikacione në ueb, për qëllime arsimore, në qendrat e thirrjeve, etj. Motorët kryesorë të zërit për riprodhimin e të folurit rus janë Realspeak, Digalo dhe Sakrament nga Nuance, Acapela dhe Sakrament, përkatësisht.

Sintetizuesit e të folurit që funksionojnë nën sistemet Windows:

Digalo (Acapela ELAN TTS)
Sintetizuesit e të folurit Acapela janë të disponueshëm në 23 gjuhë, duke përfshirë rusishten, dhe mund të flasin në më shumë se 50 zëra. Është e mundur të përdoret në disa programe njëkohësisht (shumë kanale). Shqiptim rusisht me cilësi të lartë, një fjalor i madh fjalësh dhe theksesh ruse, të gjitha llojet e cilësimeve dhe opsionet e riprodhimit. Paketa e zërit me cilësi më të lartë është "Nikolai".

Nuance RealSpeak (dikur ScanSoft)
Mbështet më shumë se 20 gjuhë, duke përfshirë kinezisht, norvegjeze dhe koreane dhe 30 zëra. Zëri që flet në Rusisht është "Katerina". Në shumë aspekte, kjo është edhe një zgjidhje shumë më e suksesshme për gjuhën ruse sesa Digalo. Mbështet plotësisht SAPI5. Programi shpërndahet vetëm mbi baza komerciale.

Motori Sakrament TTS
Programi mund të riprodhojë tekste në Rusisht. Ekziston gjithashtu një version i faqes së internetit të kompanisë në Rusisht. Linja e produkteve Sakrament përfshin një aplikacion për komunikuesit dhe PDA-të, një program për shprehjen e teksteve dhe dokumenteve elektronike elektronike. Në paketën për gjuhën ruse mund të zgjidhni nga tre zëra ("Olga", "Irina", "Vyacheslav"). Mbështet formatet e hyrjes RTF dhe TXT, njeh automatikisht kodimin e tekstit, mbështet plotësisht etiketat e të folurit SAPI dhe etiketat shtesë të shënimit semantik të tekstit për të përmirësuar tingullin e të folurit të sintetizuar. Duke përdorur etiketat, mund të vendosni theksin, llojin e fragmentit të tekstit (data, ora, adresa, URL, posta elektronike, telefoni, shkurtesa, etj.), parametrat e riprodhimit (vëllimi, shpejtësia, intonacioni), si dhe parametra të tjerë.

CoolReader
Një program për leximin komod të librave nga ekrani, leximin me zë të lartë, formatimin dhe konvertimin e teksteve. Funksioni i leximit me zë të lartë është zhvilluar duke përdorur motorët MS SAPI 4.0 × 5.1. Punon edhe me tekste në Rusisht. Njeh formatet HTML, RTF, DOC (MS Word), TXT, FB2 (FictionBook). Njeh automatikisht kodimet ruse dos, win, koi-8, si dhe latinisht, utf-8 dhe unicode. Ju mund të ruani një libër audio në formatin MP3 për të dëgjuar në luajtësin tuaj MP3. Fjalorët e shqiptimit me cilësime për çdo motor zanor janë të lidhur veçmas. Sistemet operative të mbështetura: Win9x/ME/NT4.0/Win2K/XP.

ToM Reader
Aplikacioni është një shikues teksti dhe sintetizues i të folurit në të njëjtën kohë. Punon edhe në Rusisht. Ju lejon të krijoni skedarë MP3 nga tekstet, është e mundur të lidhni fjalorë shqiptimi dhe mund të punoni me arkivat zip. Formatet e skedarëve të mbështetur: HTML, RTF, MS Word, TXT, kodimet: ANSI, KOI, OEM. Madhësia maksimale e skedarit për t'u hapur është 12 MB.

Speak Aloud është një program për të lexuar dhe ruajtur në një skedar me konvertimin e tekstit në formatet TXT, PDF, HTML, RTF në audio MP3, WAV, WMA, OGG, VOX, AU, AIFF, MP4, FLAC, SWF. Mund të personalizoni intonacionin, timbrin e zërit dhe cilësinë e riprodhimit të zërit. Përpunimi grupor i skedarëve mbështetet. Punon në sistemet operative: Windows 2000/XP/Vista

Govorilka
Riprodhon tekstin në Rusisht. Është e mundur të regjistroni tekstin që lexohet në një skedar audio (*.WAV, *.MP3), si dhe të rregulloni shpejtësinë e leximit dhe lartësinë e zërit. Ju mund të shtoni fjalorë shqiptimi, dhe kështu është mjaft e lehtë të korrigjoni shqiptimin e fjalëve dhe frazave individuale. Mund të punojë me skedarë të mëdhenj, hap tekste nga skedarët .doc, HTML. Ai gjithashtu kujton pozicionin e kursorit kur del nga programi (në mënyrë që më vonë të mund të fillojë të lexojë nga i njëjti vend).

Ndryshe nga përfaqësuesi i mëparshëm, Cantor 2 është një sistem më "i avancuar" për sintetizimin e pjesëve vokale, por me një çmim. Ai gjithashtu ka një version si një program i veçantë. Megjithëse instrumenti vst është një analog i piano-roll në sekuencer: hidhini një sy ndërfaqes (Fig. 4).

Meqenëse kjo shtojcë është shumë e instrumentuar, mund të manipulojë një numër të madh parametrash zëri. Por ju ende duhet të filloni duke ndërtuar një frazë rrokje pas rrokje. Siç mund ta merrni me mend, kjo bëhet duke përdorur një rrotull pianoje. Ekziston edhe një shirit veglash me "lapsat", "gomat" e zakonshme, etj. Në fakt, le të përpiqemi të sintetizojmë frazën "hej, yo, hajde" e përmendur më lart! Le t'i vizatojmë ngjarjet në formën e zonave drejtkëndore, dhe gjithashtu të etiketojmë secilën prej tyre, si në figurën 5.

Siç mund ta shihni, fjalët nuk janë shkruar të gjitha mbi ngjarjet. Për shembull, fjala "hajde" ndahet në dy rrokje - "com" dhe "on". Përdoruesit e vëmendshëm do të vërejnë se fonemat shkruhen automatikisht më poshtë - kjo është një veçori mjaft e përshtatshme. Nëse hyni në detaje dhe nuanca, atëherë duhet të keni një ide shumë të mirë se cilat janë fonemat dhe nuancat e tjera delikate të tingullit të të folurit, të arritshme vetëm për specialistë të ngushtë. Ne thjesht do ta lëmë atë ashtu siç është dhe do të shohim se si funksionon në përgjithësi. Por kjo nuk është e gjitha. Tani, në pjesën midi të këngës Cantor 2, duhet të regjistrojmë edhe një pjesë, sipas së cilës do të tingëllojnë fjalët (rrokjet) tona. Le ta bëjmë atë si në figurën 6.

Tani mund të aktivizojmë riprodhimin në sekuencues dhe të sigurohemi që të kemi pak zë në dalje.

Tjetra, le të rregullojmë disa nuanca të tingullit. Më lejoni të bëj një rezervë menjëherë që për të studiuar të gjitha nuancat e ngritjes së Cantor 2, duhet të shkruani një libër të tërë. Në këtë artikull, ne do të shqyrtojmë parametrat e përgjithshëm. Pra, së pari, mund të zgjidhni një zë të gatshëm. Ka rreth një duzinë prej tyre në dispozicion. Mund t'i hapni në krye të programit, në opsionin Load voice (Fig. 7).

Parazgjedhja ishte "Nikki", por e ndryshova në "Luther". Mund të provoni zëra të ndryshëm, si femra ashtu edhe meshkuj.

Së dyti, ekziston një seksion efektesh (në fakt, seksioni Efektet, Fig. 8).

Ekzistojnë 4 efekte në dispozicion - Distortion, Echodelay, Chorus dhe Reverb. Edhe pse këto efekte të njëjta mund të shtohen veçmas.

Nuk ka kuptim të flasim për rubrikat Foneme dhe Voice, sepse... Ato janë mjaft të vështira për t'u mësuar dhe vetëm një specialist mjaft i specializuar mund të kuptojë cilësimet e tyre. Edhe pse askush nuk po ju ndalon të rrotulloni pullat në këto seksione dhe kështu të ndryshoni tingullin. Ose pore mbi teorinë e sintezës së të folurit, si dhe manualin e përdorimit të Cantor, në mënyrë që të kuptoni se si duhet të funksionojë e gjithë kjo. Në përgjithësi, ka mjaft parametra, tingulli që rezulton është mjaft kompleks dhe mjaft primitiv.

Sidoqoftë, edhe një fillestar, nëse përpiqet, mund të marrë një tingull të ngjashëm me atë që kam marrë.

Fruity Loops Studio

Ndoshta shumë prej jush, pasi kanë parë Fruity Loops, do të habiten se si u fut në këtë artikull, sepse ka më shumë gjasa sesa jo sintetizues i të folurit. Puna është se ai ka një sintetizues shumë të mirë të të folurit në arsenalin e tij. Quhet Sintetizuesi i të folurit. Dhe megjithëse nuk është i disponueshëm si një shtojcë e veçantë, mund të futni vetë FL si një shtojcë vst në stacionin tuaj të punës dhe të përdorni Sintetizuesin e të folurit atje. Por unë ende preferoj të krijoj një pjesë të të folurit në vetë FL, pastaj ta eksportoj në një skedar audio dhe më pas ta përdor në çdo stacion pune.

Pra, le të përpiqemi të krijojmë grupin nga shembulli i mëparshëm direkt në FL Studio. Le ta fusim këtë shtojcë në projektin tonë (Fig. 9).

Sapo ta shtojmë atë në projekt, automatikisht do të shfaqet një dritare që na kërkon të futim tekstin tonë. Nuk duhet të mendoni për një kohë të gjatë dhe të futni menjëherë frazën tonë nga shembujt e mësipërm (Fig. 10).

Përveç kësaj, mund të vendosni menjëherë parametra të tjerë të të folurit, të tilla si zëri (në dispozicion rreth 20 zëra), stili i shqiptimit, modaliteti (i pëshpëritur, i aspiruar ose normal) dhe cilësimet e ritmit dhe zërit. Unë ju këshilloj që menjëherë të vendosni tempin (e kam, të themi, 140, sipas ritmit të projektit). Butoni Listen ju lejon të dëgjoni një pjesë menjëherë, përpara se ta krijoni atë. Pasi të kemi zgjedhur parametrat e nevojshëm, klikoni kutinë e kontrollit, programi do të na shtyjë të ruajmë skedarin tonë me pjesën e krijuar të të folurit dhe një pjesë e re me vokale do të krijohet në projekt (Fig. 11).

Nuk kemi nevojë të shqetësohemi - Speech Synthesizer krijoi një këngë për ne, e cila është një Fruity Slicer me një pjesë të krijuar në të, të ndarë në shënime, ku secila fjalë korrespondon me një shënim të veçantë (në figurën 11 në të djathtë mund të shihni se kemi një pjesë me 4 copë ). Përveç kësaj, piano roll ka krijuar këngë për nota me fjalë të nënshkruara, gjë që është shumë e përshtatshme (Fig. 12).

Gjithçka është mjaft e qartë dhe e thjeshtë. Nuk ka nevojë të shkruani fonema ose të zgjidhni rrokje për ta bërë frazën të tingëllojë e saktë. Mjafton thjesht të futni një frazë - ajo tashmë do të tingëllojë mjaft e tolerueshme dhe e lexueshme. Pastaj mund t'i riorganizoni po aq lehtë fjalët dhe ta eksportoni pjesën në formatin e dëshiruar audio. Ju mund ta shihni vetë duke dëgjuar një shembull.

Cili është më i miri nga sintetizuesit e të folurit të shqyrtuar?

Mendimi im personal: fjalimi i drejtpërdrejtë, vokali live janë më të mirë. Nëse zgjidhni nga programet e sipërpërmendura, atëherë sigurisht që fiton Cantor 2 për nga numri i cilësimeve dhe parametrave. Për më tepër, ai pretendon të jetë jo vetëm një sintetizues i të folurit, por edhe një sintetizues vokal. Nëse zgjidhni për lehtësi, thjeshtësi dhe cilësi të zërit, unë preferoj Speech Synthesizer nga Fruity loops.

Shtesë nga redaktorët

Ekziston gjithashtu një program falas për sintezën e të folurit -. Mund të konfiguroni parametra të ndryshëm dhe, pas dëgjimit paraprak, të gjeneroni rezultatin në një skedar audio.

Sot, sintetizuesit e të folurit, të cilët përdoren në sistemet kompjuterike desktop ose pajisjet mobile, nuk duken më të pazakontë. Teknologjitë tashmë kanë ecur shumë përpara dhe kanë bërë të mundur riprodhimin e zërit njerëzor. Më poshtë do të shikojmë se si funksionon gjithçka, ku përdoret një sintetizues i të folurit, si të zgjidhni një pajisje të tillë dhe çfarë problemesh të mundshme mund të hasë një përdorues kur blen një pajisje të tillë. Çfarë janë sintetizuesit e të folurit? Ku mund të përdoren? Sintetizuesit e të folurit janë programe speciale që përbëhen nga disa module. Këto programe ju lejojnë të përktheni tekstin e shtypur në tastierë në të folur të zakonshëm njerëzor në formën e audios. Do të ishte naive të besohej se bibliotekat shoqëruese përmbajnë absolutisht të gjitha fjalët ose frazat e mundshme që janë regjistruar në studio nga njerëz të vërtetë. Kjo është thjesht e pamundur në një nivel fizik. Bibliotekat e frazave do të ishin gjithashtu të një madhësie të tillë, saqë thjesht nuk mund të instaloheshin as në disqet moderne me kapacitet të madh, e lëre më në pajisjet mobile. Përveç kësaj, u zhvillua një teknologji që u quajt Text-to-Speech, që do të thotë "tekst në të folur". Sintetizuesit e të folurit janë bërë më të përhapur në disa fusha. Një nga këto fusha përfshin mësimin e pavarur të gjuhëve të huaja, kur përdoruesi duhet të dëgjojë shqiptimin e saktë të një fjale. Sintetizuesit e të folurit përdoren gjithashtu për të dëgjuar libra në vend të leximit, krijimin e pjesëve lokale dhe të të folurit gjatë regjistrimit të muzikës dhe lëshimin e pyetjeve të kërkimit në formën e frazave ose fjalëve të shprehura. Pajisjet e tilla mund të përdoren edhe nga personat me aftësi të kufizuara.

Sintetizuesit e të folurit: llojet e programeve

Të gjithë sintetizuesit e të folurit, në varësi të zonës së përdorimit, mund të ndahen në dy lloje kryesore: programe standarde, të cilat përdoren për të kthyer drejtpërdrejt fjalimin në tekst, dhe module të të folurit ose vokale, të cilat përdoren në aplikacionet muzikore. Për ta shqyrtuar këtë çështje në mënyrë më të detajuar, ne do të shqyrtojmë të dy klasat e programeve, megjithatë, theksi do të jetë akoma më shumë në sintetizuesit e të folurit për qëllimin e tyre të menjëhershëm.

Avantazhet dhe disavantazhet e aplikacioneve të thjeshta të të folurit. Për sa i përket avantazheve dhe disavantazheve të programeve të këtij lloji, së pari le të shohim disavantazhet. Para së gjithash, vlen të thuhet se një kompjuter është ende një pajisje teknike. Në këtë fazë të zhvillimit, ai mund të sintetizojë shumë afër fjalimin njerëzor. Shpesh në programet më të thjeshta ka probleme me vendosjen e stresit në fjalë dhe cilësi të ulët të zërit. Pajisjet celulare zakonisht përjetojnë rritje të konsumit të energjisë. Në disa raste, është vërejtur edhe shkarkim i paautorizuar i moduleve të të folurit. Sidoqoftë, këtu ka edhe shumë përparësi. Shumë e perceptojnë informacionin dëgjimor më mirë sesa informacionin vizual. Pra, avantazhi i qartë është lehtësia e perceptimit. Si të përdorni saktë sintetizuesin e të folurit? Le të themi pak më shumë për parimet bazë të përdorimit të këtij lloj programi. Së pari, çdo lloj sintetizuesi i të folurit mund të instalohet pa asnjë problem. Në sistemet e palëvizshme, përdoret një instalues standard, detyra kryesore e të cilit do të jetë zgjedhja e moduleve gjuhësore të mbështetura. Për pajisjet celulare, mund të shkarkoni skedarin e instalimit nga dyqani ose depoja zyrtare si AppStore ose Google Play.

Pas kësaj, aplikacioni do të instalohet automatikisht. Kur filloni për herë të parë, si rregull, nuk keni nevojë të bëni ndonjë cilësim përveç zgjedhjes së gjuhës së paracaktuar. Megjithatë, në disa raste, programi mund t'ju kërkojë të zgjidhni cilësinë e zërit. Versioni standard me një frekuencë kampionimi prej 4410 Hz, një thellësi prej 16 bit dhe një shpejtësi prej 128 kbps përdoret kudo. Në pajisjet celulare, shifra të ngjashme janë pak më të ulëta. Një zë i caktuar merret si bazë. Kur përdorni një model shqiptimi standard, përmes përdorimit të barazuesve dhe filtrave, mund të arrini tingullin pikërisht të këtij timbri. Kur përdorni, mund të zgjidhni disa opsione për përkthimin e tekstit: përkthim manual teksti, leximi i tekstit ekzistues nga një skedar, integrimi në aplikacione të tjera me aftësinë për të aktivizuar rezultatet e kërkimit ose për të lexuar përmbajtjen e tekstit në faqet në internet. Këtu do të mjaftojë të zgjidhni opsionin e dëshiruar të veprimit, zërin dhe gjuhën në të cilën do të flitet teksti. Shumë programe kanë disa lloje zërash, si femra ashtu edhe meshkuj. Për të aktivizuar procesin e riprodhimit, mund të përdorni butonin e fillimit.

Nëse flasim për mënyrën e çaktivizimit të sintetizuesit të të folurit, mund të ketë disa opsione. Në rastin më të thjeshtë, mund të përdorni butonin e ndalimit të riprodhimit në vetë programin. Nëse sintetizuesi është i integruar në shfletuesin, çaktivizimi kryhet në cilësimet e shtesës duke hequr plotësisht shtesën. Me pajisjet celulare, megjithë mbylljen e menjëhershme, mund të shfaqen disa probleme, të cilat do të diskutohen më poshtë. Për shembull, futja e tekstit dhe cilësimet kryhen në një mënyrë më komplekse. Le të hedhim një vështrim në aplikacionin FLStudio. Ka modulin e vet të të folurit, në të cilin mund të zgjidhni disa lloje zërash, të ndryshoni shpejtësinë e riprodhimit ose cilësimet e tonit. Për të vendosur një theks, duhet të përdorni simbolin "_" përpara një rrokjeje. Sidoqoftë, një sintetizues i tillë është i përshtatshëm vetëm për krijimin e zërave robotikë. Paketa Vocaloid nga Yamaha tashmë mund të klasifikohet si një program i nivelit profesional. Teknologjia e tekstit në të folur është zbatuar plotësisht këtu.

Përveç parametrave standardë, mund të vendosni glissando dhe artikulim në cilësimet. Ju gjithashtu mund të përdorni biblioteka me vokale nga interpretues profesionistë, të kompozoni fjalë individuale dhe fraza të tëra, t'i rregulloni ato në nota të ndryshme dhe shumë më tepër. Nuk është aspak për t'u habitur që vetëm me vokal, kjo paketë softuerësh zë më shumë se 4 GB në shpërndarjen e instalimit. Pas shpaketimit, vëllimi rritet dy deri në tre herë.

Në këtë përmbledhje do të përqendrohemi vetëm në aplikacione të thjeshta. Le të shohim më të njohurit prej tyre. Sipas shumicës së përdoruesve, RH Voice është sintetizuesi më i mirë i të folurit. Ky zhvillim rus u krijua nga Olga Yakovleva. Në versionin standard të programit, janë në dispozicion vetëm tre zëra - Elena, Alexander, Irina. Vendosja e programit është mjaft e thjeshtë. Vetë aplikacioni mund të përdoret si një program i pavarur, i pajtueshëm me SAPi5, ashtu edhe si një modul ekrani.

Një tjetër aplikacion interesant është Acapela. Karakteristika e tij kryesore është aktrimi zanor pothuajse i përsosur i tekstit në më shumë se 30 gjuhë. Në versionin e thjeshtë të aplikacionit, është i disponueshëm vetëm një opsion zanor - Alena. Një tjetër aplikacion i fuqishëm me zë femëror është Milena. Ky program përdoret shumë shpesh në qendrat e thirrjeve. Ka shumë cilësime për vendosjen e stresit, rregullimin e volumit, shpejtësinë e leximit, si dhe instalimin e fjalorëve shtesë. Dallimi kryesor midis këtij programi është se motori i të folurit duhet të jetë i integruar në programe si Cool Reader, Full Screen Caller ID, Moon+ Reader Pro. Përdorimi më i fuqishëm për sintezën dhe njohjen e të folurit është programi i Festivalit. Është projektuar për sistemet Mac OSX dhe Linux. Ky aplikacion vjen me kod me burim të hapur. Përveç paketave standarde të gjuhëve, ai mbështet finlandisht dhe hindisht. Një tjetër aplikacion i të folurit është eSpeak. Ai mbështet më shumë se 50 gjuhë. Disavantazhi kryesor i këtij programi është se ai ruan skedarët e sintetizuar të të folurit ekskluzivisht në formatin WAV. Dihet se ky format zë shumë hapësirë. Ky program është ndër-platformë dhe mund të përdoret edhe në sistemet celulare.

Google Android: probleme me sintetizuesin e të folurit

Përdoruesit, kur instalojnë sintetizuesin "amtare" të të folurit nga Google, shumë shpesh ankohen se ai në mënyrë spontane mundëson ngarkimin e moduleve shtesë gjuhësore. Kjo jo vetëm që kërkon një periudhë të gjatë kohore, por edhe dëmton rëndë trafikun. Heqja e këtij problemi në sistemet Android është shumë e lehtë. Për ta bërë këtë, duhet të përdorni menunë e cilësimeve. Këtu shkojmë te seksioni i hyrjes së gjuhës dhe zërit. Këtu ju duhet të zgjidhni kërkimin zanor në opsionin e njohjes së të folurit jashtë linje dhe të klikoni në kryq (çaktivizoni). Rekomandohet gjithashtu që të pastroni gjithashtu cache-in e aplikacionit dhe të rindizni pajisjen. Në disa raste, mund t'ju duhet të çaktivizoni njoftimet brenda vetë aplikacionit.

Çfarë ndodh në fund? Për ta përmbledhur, mund të themi se programet më të thjeshta janë të përshtatshme për përdoruesit e zakonshëm. Lider në shumë vlerësime është programi RHVoice.Megjithatë, për muzikantët që duhet të arrijnë një zë natyral, në mënyrë që të mos ndihet dallimi mes sintezës live dhe kompjuterit, është më mirë t'u jepet përparësi programeve si Vocaloid. Shumë zëra shtesë sot prodhohen biblioteka për programe të tilla. Cilësimet për këto aplikacione kanë aq shumë mundësi saqë aplikacionet primitive nuk janë as afër.