تركيب الكلام على الانترنت. ما هي أجهزة توليف الكلام؟ أفضل آلات توليف الكلام


تتيح لك التكنولوجيا الحديثة إنشاء الكلام مباشرة من النص المطبوع. فقط تخيل أنه يمكنك كتابة نص، والذي سيتم نطقه بعد ذلك بالصوت الذي تختاره، مع التجويد والسرعة التي تختارها. وهذا ليس خيالا، هذا هو الواقع.

ما هو مركب الكلام؟

مُركِّبات الكلام لتحويل النص إلى كلام (TTS).- برامج خاصة تسمح لك بإنشاء إشارة كلام (كلام، صوت) من النص المطبوع. يعود أول ذكر لتركيب الكلام إلى القرن العاشر. في نهاية القرن الثامن عشر، ابتكر العالم كريستيان كراتزنشتاين نموذجًا للجهاز الصوتي البشري القادر على نطق خمسة أصوات متحركة (a، e، i، o، u).

ظهرت أول آلات توليف الكلام المعتمدة على الكمبيوتر في أواخر الخمسينيات من القرن الماضي. لقد بدوا بدائيين للغاية، وكان من الممكن فهم مثل هذا الكلام بصعوبة كبيرة. يستمر العمل على تحسين جودة الكلام المركب. بالفعل اليوم، لا يمكن أحيانًا تمييز الكلام الناتج عن أنظمة تركيب الكلام الحديثة عن الكلام البشري الحقيقي.

لماذا تحتاج إلى مركب الكلام؟

يمكن أن يكون مُركِّب الكلام مفيدًا لك في العديد من الحالات، على سبيل المثال:
  • خلال الرحلة- فقط اكتب أي عبارة، وسيقوم البرنامج بنطقها باللغة التي تريدها.
  • لقراءة الكتب الإلكترونية والنصوص والوثائق- أنت تمارس عملك، والبرنامج يقرأ لك بصوت عالٍ.
  • لتعلم اللغات الأجنبية- فرصة رائعة لممارسة مهارات النطق والتحدث مجانًا.

مركب الكلام A1 SpeechTRON

A1 سبيتشترون- مركب الكلام باللغة الإنجليزية من النص. يمكن استخدامه لقراءة الملاحظات والمستندات النصية والكتب الإلكترونية والمواد النصية الأخرى (التنسيقات: نص، RTF، DOC). يمكن أيضًا استخدام مُركِّب الكلام (TTS) عند تعلم اللغة الإنجليزية. يدعم البرنامج بشكل كامل Microsoft TTS SAPI 4.0، ويحتوي على واجهة قابلة للتخصيص بالكامل، وجودة صوت عالية، وإعدادات سرعة القراءة، وتسجيل الملفات. هناك دعم للقواميس المخصصة والإضافية.

قراءة المركب الكلام من فضلك

إقرأ لو سمحت- مركب الكلام باللغة الإنجليزية من النص. يمكن استخدامها لقراءة النصوص والحافظات والمستندات النصية والكتب الإلكترونية والمواد النصية الأخرى (التنسيقات: text وRTF وDOC). يمكن أيضًا استخدام مُركِّب الكلام (TTS) عند تعلم اللغة الإنجليزية. بعد الإطلاق، يوجد البرنامج في الدرج ويتم التحكم فيه بواسطة مفاتيح التشغيل السريع. يمكن إرساءها على النوافذ أو سطح المكتب المختلفة. يحتوي الإصدار المدفوع على دعم للغات إضافية ومعيار AT&T Natural Voices وميزات إضافية. البرنامج موجود في نسختين: مجانية ومدفوعة. هناك دعم للقواميس المخصصة والإضافية.

مركب الكلام ReadingBar

شريط القراءة- مركب الكلام من أي صفحة ويب. هذه لوحة لمتصفح Internet Explorer، والتي بعد التثبيت تكون مدمجة في المتصفح وتسمح لك بقراءة أي صفحات ويب. يمكنك تسجيل صوتك إلى ملف wav أو mp3. بالإضافة إلى نطق النص، يتيح لك ReadBar أيضًا تمييز الكلمات وترجمتها إلى 4 لغات وعرض تفسير الكلمات من القاموس. كن حذرًا، لن يعمل ReadingBar على نظام التشغيل Vista أو Internet Explorer 7.

مركب الكلام FlameReader

قارئ اللهبهو مركب كلام متعدد الوظائف يسمح لك بإنشاء الكلام من أي نص أو ملف. ما عليك سوى تحديد النص في أي برنامج أو مستند، وسيقوم FlameReader بنطقه على الفور. يتمتع البرنامج بالعديد من الإمكانيات: تسجيل الصوت إلى ملف (wav وmp3)، وقراءة البريد الإلكتروني، والمستندات، وصفحات الويب، ودبلجة عروض PowerPoint التقديمية، وترجمة النصوص. يمكنك دائمًا تخصيص FlameReader بطريقة تناسبك عن طريق تحديد المحرك الصوتي وسرعة التشغيل والمعلمات الأخرى. يضيف FlameReader شريط تنقل إلى مجموعة Microsoft Office، مما يسهل استخدامه. يأتي البرنامج مع محرر ملفات صوتية مناسب.

مركب الكلام على قيد الحياة النص إلى كلام

النص على قيد الحياة إلى كلام- مركب كلام متعدد الوظائف يسمح لك ليس فقط بنطق الكلمات والنصوص والملفات، ولكن أيضًا بتسجيلها (تحويلها) إلى ملفات صوتية (MP3، WAV، OGG، VOX). تشتمل المجموعة على لوحة لمتصفح Internet Explorer، والتي تتيح لك التعبير عن أي صفحات ويب وتحويلها إلى ملفات صوتية.

مُركِّب الكلام YeoSoft Text إلى مكبر صوت MP3

برنامج YeoSoft لتحويل النص إلى مكبر صوت MP3- مركب كلام متعدد الوظائف يسمح لك بصوت النصوص وإنشاء كتب صوتية بتنسيقات صوتية مختلفة. هذه أداة فعالة لتعلم اللغات الأجنبية. يدعم تقنيات SAPI 4 و5، وملفات DOC وPDF، و10 لغات، ويعمل مع ملفات متعددة في وقت واحد. إمكانية إضافة علامات xml إلى النص للتحكم في النطق. إعدادات الصوت: مستوى الصوت، السرعة، اختيار المحرك الصوتي.

مركب الكلام TextAloud

TextAloud- برنامج لتوليد الكلام من النصوص والملفات. يمكن الاستماع إلى الكلام الذي تم إنشاؤه باستخدام جهاز كمبيوتر أو تسجيله كملف mp3 أو wma. يدعم المركب أنواع الملفات التالية: DOC، PDF، وHTML. ويتضمن البرنامج أيضًا شريط أدوات لمتصفحات Internet Explorer وFirefox وOutlook.

مركب الكلام المطول

TextSound- تحويل النص إلى صوت (wav و mp3). سيساعدك هذا البرنامج الصغير على تحويل النص إلى كلام بسرعة وحفظه كملفات صوتية. يتيح لك البرنامج معالجة عدة ملفات مرة واحدة وإنشاء قائمة بالمهام.

يبدو أن أجهزة توليف الكلام المثبتة على أجهزة الكمبيوتر أو الأجهزة المحمولة لم تعد برامج غير عادية كما كانت من قبل. بفضل التكنولوجيا الحديثة، يمكن لجهاز كمبيوتر سطح المكتب العادي إعادة إنتاج الصوت البشري.

كيف تعمل أجهزة توليف الكلام؟ أين يتم استخدامها؟ ما هو أفضل مركب الكلام؟ يتم عرض الإجابات على هذه الأسئلة وغيرها في هذه المقالة.

المفهوم العام

مُركِّبات الكلام عبارة عن برامج خاصة تتكون من عدد من الوحدات التي توفر القدرة على ترجمة النصوص المكتوبة إلى جمل ينطقها صوت بشري. لا تعتقد أن قاعدة البيانات الكاملة للكلمات والعبارات تم تسجيلها بواسطة أشخاص حقيقيين في استوديوهات احترافية. من المستحيل جسديًا إكمال مثل هذه المهمة. لا يمكن تثبيت مكتبة بها هذا العدد الكبير من العبارات على أي جهاز كمبيوتر حديث، ناهيك عن الهواتف المحمولة. ولهذا الغرض، أنشأ المطورون تقنية تحويل النص إلى كلام.

نطاق التطبيق

تُستخدم أجهزة توليف الكلام في تعلم اللغات الأجنبية، والاستماع إلى النصوص الموجودة على صفحات الكتب، وإنشاء أجزاء صوتية، وإصدار استعلامات بحث على شكل عبارات منطوقة، وما إلى ذلك.

ما هي أنواع البرامج الموجودة؟ اعتمادًا على نطاق التطبيق، يمكن تقسيم الأدوات المساعدة إلى نوعين: الأدوات العادية التي تحول النص المكتوب إلى كلام، والوحدات الصوتية الخاصة المستخدمة في تطبيقات الموسيقى.

المميزات والعيوب

في الوقت الحالي، يقوم الكمبيوتر بتجميع الكلام البشري تقريبًا فقط. في أبسط البرامج، يمكنك ملاحظة مشاكل الصوت والموضع الصحيح للضغط في كلمات مختلفة. تستهلك أجهزة توليف الكلام المثبتة على الأجهزة المحمولة الكثير من الطاقة. غالبًا ما يكون من الممكن ملاحظة التنزيل غير المصرح به لوحدات إضافية.

وتشمل المزايا سهولة الإدراك. يجد العديد من المستخدمين أن استيعاب المعلومات الصوتية أسهل بكثير من أي نوع آخر.

أفضل آلات توليف الكلام بالأصوات الروسية

تم إنشاء برنامج RHVoice بواسطة أولغا ياكوفليفا. يتضمن الإصدار القياسي للتطبيق 3 أصوات. الإعدادات بسيطة للغاية. يمكن استخدام البرنامج كتطبيق مستقل متوافق مع SAPI5 وكوحدة شاشة إضافية.

يختلف مُركِّب الكلام Acapela عن نظائره في نطق النص المثالي. يدعم التطبيق أكثر من 30 لغة حول العالم. في النسخة المجانية، يتوفر صوت أنثى واحد فقط.

غالبًا ما يستخدم Vocalizer في مراكز الاتصال. يمكن للمستخدم ضبط التركيز والحجم وسرعة القراءة. يتم تحميل قواميس إضافية إذا لزم الأمر. يوجد صوت نسائي واحد في التطبيق. يتم دمج محرك الكلام تلقائيًا في برامج قراءة الكتب بتنسيق إلكتروني.

تدعم الأداة المساعدة eSpeak أكثر من 50 لغة. عيب البرنامج هو أنه يحفظ ملفات الصوت فقط بتنسيق WAV، الأمر الذي يتطلب مساحة كبيرة على القرص الصلب الخاص بك.

يعد تطبيق المهرجان أداة قوية لتركيب الكلام تدعم اللغتين الفنلندية والهندية.

تثبيت البرنامج

كيفية استخدام هذا النوع من التطبيقات؟ أولا تحتاج إلى تثبيت البرنامج. تستخدم أنظمة تشغيل الكمبيوتر برنامج تثبيت قياسي، حيث يتعين على المستخدم فقط تحديد وحدة اللغة التي تدعمها الأداة المساعدة. يمكن تنزيل برنامج التثبيت للأجهزة المحمولة من الموقع الرسمي وGoogle Play وApp Store. يتم تثبيت التطبيق تلقائيًا.

الإطلاق الأول للبرنامج

في هذه المرحلة، يحتاج المستخدم فقط إلى تعيين اللغة الافتراضية. في بعض الأحيان تحتاج إلى ملاحظة جودة الصوت. يتضمن الإصدار القياسي تردد أخذ العينات 4410 هرتز، وعمق 16 بت ومعدل بت 128 كيلوبت في الثانية. في نظام التشغيل المحمول، قد تكون الأرقام أقل. يتم استخدام صوت محدد كأساس.

تساعدك المرشحات والمعادلات على تحقيق الصوت المطلوب. لدى المستخدم ثلاثة خيارات لترجمة النص. يمكنه كتابة الجمل على لوحة المفاتيح، أو تشغيل الصوت لملف موجود، أو تثبيت ملحق المتصفح الذي يحول المحتوى الموجود على صفحات الويب إلى كلام. يكفي ملاحظة مسار العمل المطلوب وجرس الصوت واللغة التي سيتم بها نطق النص. لبدء عملية التشغيل، انقر على زر "ابدأ".

العمل مع البرامج المعقدة

في تطبيقات الموسيقى، تكون الإعدادات أكثر تعقيدًا. في وحدة الكلام لبرنامج FL Studio، يمكن للمستخدم تحديد عدة أنواع من الأصوات، وكذلك تحديد النغمة وسرعة التشغيل. يتم وضع التشديد قبل المقاطع باستخدام الرمز "_". بمساعدة مركب الكلام هذا، يمكنك فقط إنشاء صوت آلي.

Vocaloid هو تطبيق من النوع الاحترافي. بالإضافة إلى المعلمات المعتادة، يمكن للمستخدم تحديد التعبير وglissando. تحتوي الأداة المساعدة على قاعدة بيانات تحتوي على غناء احترافي. إذا رغبت في ذلك، يمكنك ضبط الجمل بأكملها لتناسب الملاحظات. تشغل المكتبة التي تحتوي على غناء وحدها أكثر من 4 جيجابايت في شكل مضغوط.

"Google Speech Synthesizer": ما هو هذا البرنامج؟

في مايو 2014، أتاحت الشركة للمستخدمين فرصة تجربة منتج مجاني جديد. ما هو مُركِّب الكلام من Google على نظام Android؟ هذا هو البرنامج الذي يقرأ النص على شاشة الجهاز المحمول أو الجهاز اللوحي. الآن ليست هناك حاجة لتثبيت أدوات مساعدة تابعة لجهات خارجية تتطلب ترخيصًا. يُستخدم "Google Speech Synthesizer" عند قراءة الكتب الإلكترونية والاستماع إلى النطق الصحيح للكلمات وتشغيل تطبيق TalkBack.

الإصدار الجديد من برنامج Google Speech Synthesizer 3.1 يدعم الآن اللغات الإنجليزية والإيطالية والإسبانية والكورية والألمانية والهولندية والبولندية والبرتغالية والروسية والفرنسية. أين يمكنني العثور على حزم الصوت؟ يتم تنزيلها من التطبيق نفسه.

مميزات وعيوب المنتج من جوجل

خصوصيات الصوت الأنثوي الناطق بالروسية هي صوته الواضح والصاخب والتنغيم السلس. يمكن تعديل سرعة التشغيل في إعدادات البرنامج. يجب على المستخدمين الذين يستخدمون TalkBack وتوطين اللغة الروسية لنظام التشغيل Android توخي الحذر عند التبديل إلى مُركِّب الكلام إذا تم تعيين التطبيق مسبقًا على صوت مختلف بشكل افتراضي. قد تواجه مشكلة في الحفاظ على التحكم السمعي بجهازك المحمول. جميع الأصوات تقريبًا، باستثناء اللغة الروسية، غير قادرة على معالجة الجمل باللغة السيريلية.

من بين العيوب يمكن ملاحظة رد فعل متأخر لقراءة النصوص المكونة من عبارات بلغات مختلفة. يتميز الصوت الروسي بنغمات معدنية من الجرس. قد تسمع صوتًا من الطراز الأول عند الترددات المنخفضة. وتشمل المزايا استقرار التطبيق وجودة مقبولة لقراءة الكلمات الإنجليزية.

"Google Speech Synthesizer": كيفية استخدام البرنامج

لكي تعمل الأداة المساعدة كما ينبغي، تحتاج إلى تحديثها إلى الإصدار الأحدث. لتنشيط عملية نطق النص، تحتاج إلى فتح الإعدادات. في قسم "اللغة والإدخال"، تحتاج إلى تحديد مربع "تركيب الكلام". وتجدر الإشارة أيضًا إلى سطر "النظام الافتراضي". لا تنس أن الحزم الصوتية الموجودة في البرنامج نفسه تحتاج أيضًا إلى التحديث.

مشاكل عند العمل مع الأداة المساعدة

إذا لزم الأمر، يمكن للمستخدم تعطيل التطبيق. في أبسط المرافق، يوجد زر الإيقاف في البرنامج نفسه. يتم إلغاء تنشيط الامتداد المثبت في المتصفح عن طريق تعطيل الوظيفة الإضافية أو إزالة المكون الإضافي بالكامل. قد تنشأ مشاكل أيضًا عند استخدام البرنامج على الهاتف المحمول. الحقيقة هي أن مُركِّب الكلام يبدأ تلقائيًا في تحميل وحدات اللغة التي لا يحتاجها المستخدم.

تستغرق هذه العملية الكثير من الوقت وتستهلك حركة المرور بشكل كبير. كيف يمكنني تعطيل Google Speech Synthesizer على جهازي المحمول والتخلص من هذه المشكلة؟ تحتاج أولاً إلى فتح إعدادات التطبيق. ثم تحتاج إلى تحديد قسم "إدخال اللغة والصوت". بعد ذلك تحتاج إلى وضع علامة على السطر الأخير.

بعد تحديد البحث الصوتي، يجب عليك النقر فوق علامة التقاطع بجوار عنصر "التعرف على الكلام دون اتصال". ثم يوصى بحذف ذاكرة التخزين المؤقت للتطبيق. بعد ذلك، تحتاج إلى إعادة تشغيل هاتفك المحمول. لتعطيل الأداة المساعدة بالكامل، تحتاج إلى فتح قسم "التطبيقات" في الإعدادات، وتحديد مُركِّب الكلام من القائمة والنقر على زر "إيقاف".

إلغاء تثبيت برنامج

يحدث أن المستخدم لا يستخدم Google Speech Synthesizer على الإطلاق. هل من الممكن إزالة الأداة المساعدة من جهاز محمول؟ للقيام بذلك تحتاج إلى فتح Google Play. ثم يجب عليك تحديد مركب الكلام من قائمة البرامج المثبتة والنقر على زر "حذف".

نتائج

التطبيقات ذات الواجهة البسيطة مناسبة للمستخدمين العاديين والأشخاص ذوي الإعاقة. يمكن أن يكون هذا إما RHVoice أو Google Speech Synthesizer. سوف يقرأ الصوت الروسي النص المعروض على الشاشة. المستخدم العادي لا يحتاج إلى المزيد.

يُنصح الموسيقيون بإعطاء الأفضلية لبرنامج Vocaloid الاحترافي. يحتوي التطبيق على مكتبات صوتية إضافية والعديد من الخيارات المختلفة. سيسمح لك البرنامج بالحصول على صوت طبيعي. بعد كل شيء، من المهم جدًا بالنسبة للموسيقيين أن يكون التوليف الحاسوبي غير محسوس بالأذن.

مُركِّبات الكلام هي برامج تأخذ النص كمدخل وتوليف الكلام البشري كمخرج. تستخدم هذه البرامج على نطاق واسع - في الاتصالات الهاتفية، والمساعدين الإلكترونيين، للوصول عبر الهاتف إلى تطبيقات الويب، للأغراض التعليمية، في مراكز الاتصال، وما إلى ذلك. المحركات الصوتية الرئيسية لإعادة إنتاج الكلام الروسي هي Realspeak وDigalo وSakrament من Nuance وAcapela وSakrament، على التوالي.

أجهزة توليف الكلام التي تعمل ضمن أنظمة Windows:

ديجالو (أكابيلا إيلان TTS)
أجهزة توليف الكلام Acapela متوفرة بـ 23 لغة، بما في ذلك اللغة الروسية، ويمكنها التحدث بأكثر من 50 صوتًا. ومن الممكن استخدامه في عدة برامج في وقت واحد (متعدد القنوات). نطق روسي عالي الجودة، وقاموس كبير للكلمات واللهجات الروسية، وجميع أنواع الإعدادات وخيارات التشغيل. الحزمة الصوتية الأعلى جودة هي "Nikolai".

Nuance RealSpeak (المعروف سابقًا باسم ScanSoft)
يدعم أكثر من 20 لغة منها الصينية والنرويجية والكورية و30 صوتًا. الصوت الذي يتحدث باللغة الروسية هو "كاترينا". في كثير من النواحي، يعد هذا حلًا أكثر نجاحًا للغة الروسية من Digalo. يدعم بشكل كامل SAPI5. يتم توزيع البرنامج على أساس تجاري فقط.

محرك تحويل النص إلى كلام سكرامنت
يمكن للبرنامج إعادة إنتاج النصوص باللغة الروسية. هناك أيضًا نسخة من موقع الشركة باللغة الروسية. يشتمل خط إنتاج Sakrament على تطبيق لأجهزة الاتصال وأجهزة المساعد الرقمي الشخصي (PDA)، وهو برنامج للتعبير عن الكتب المدرسية والمستندات الإلكترونية. في حزمة اللغة الروسية، يمكنك الاختيار من بين ثلاثة أصوات ("أولغا"، "إيرينا"، "فياتشيسلاف"). يدعم تنسيقات الإدخال RTF وTXT، ويتعرف تلقائيًا على ترميز النص، ويدعم بشكل كامل علامات الكلام SAPI وعلامات ترميز النص الدلالي الإضافية لتحسين صوت الكلام المركب. باستخدام العلامات، يمكنك ضبط التركيز ونوع جزء النص (التاريخ والوقت والعنوان وعنوان URL والبريد الإلكتروني والهاتف والاختصار وما إلى ذلك)، ومعلمات التشغيل (الحجم والسرعة والتجويد)، بالإضافة إلى المعلمات الأخرى.

CoolReader
برنامج لقراءة الكتب بشكل مريح من الشاشة، والقراءة بصوت عال، وتنسيق وتحويل النصوص. تم تطوير وظيفة القراءة بصوت عالٍ باستخدام محركات MS SAPI 4.0 × 5.1. كما أنه يعمل مع النصوص باللغة الروسية. يتعرف على تنسيقات HTML وRTF وDOC (MS Word) وTXT وFB2 (FictionBook). يتعرف تلقائيًا على الترميزات الروسية dos وwin وkoi-8 بالإضافة إلى الترميزات اللاتينية وutf-8 وunicode. يمكنك حفظ كتاب صوتي بتنسيق MP3 للاستماع إليه على مشغل MP3 الخاص بك. قواميس النطق مع إعدادات كل محرك صوتي متصلة بشكل منفصل. أنظمة التشغيل المدعومة: Win9x/ME/NT4.0/Win2K/XP.

قارئ توم
التطبيق عبارة عن عارض نص ومركب الكلام في نفس الوقت. كما أنه يعمل باللغة الروسية. يتيح لك إنشاء ملفات MP3 من النصوص، ومن الممكن ربط قواميس النطق، ويمكن العمل مع أرشيفات مضغوطة. تنسيقات الملفات المدعومة: HTML، RTF، MS Word، TXT، الترميزات: ANSI، KOI، OEM. الحد الأقصى لحجم الملف الذي يمكن فتحه هو 12 ميجابايت.

Speak Aloud هو برنامج للقراءة والحفظ في ملف مع تحويل النص بتنسيقات TXT وPDF وHTML وRTF إلى ملفات صوتية MP3 وWAV وWMA وOGG وVOX وAU وAIFF وMP4 وFLAC وSWF. يمكنك تخصيص نغمة الصوت وجرس الصوت وجودة إعادة إنتاج الصوت. يتم دعم المعالجة المجمعة للملفات. يعمل تحت أنظمة التشغيل: Windows 2000/XP/Vista

جوفوريلكا
يستنسخ النص باللغة الروسية. من الممكن تسجيل النص الذي تتم قراءته في ملف صوتي (*.WAV، *.MP3)، بالإضافة إلى تنظيم سرعة القراءة ونبرة الصوت. يمكنك إضافة قواميس النطق، وبالتالي يكون من السهل جدًا تصحيح نطق الكلمات والعبارات الفردية. يمكن أن يعمل مع الملفات الكبيرة، ويفتح النصوص من ملفات .doc وملفات HTML. ويتذكر أيضًا موضع المؤشر عند الخروج من البرنامج (حتى يتمكن لاحقًا من بدء القراءة من نفس المكان).

على عكس الممثل السابق، يعد Cantor 2 نظامًا أكثر "تقدمًا" لتجميع الأجزاء الصوتية، ولكن مقابل ثمن. كما أن لديها نسخة كبرنامج منفصل. على الرغم من أن أداة vst هي نظير لعزف البيانو في جهاز التسلسل: ألقِ نظرة على الواجهة (الشكل 4).

وبما أن هذا البرنامج المساعد مجهز بأدوات عالية، فيمكنه التعامل مع عدد كبير من المعلمات الصوتية. ولكن لا تزال بحاجة إلى البدء ببناء عبارة مقطع لفظي بمقطع لفظي. كما قد تتخيل، يتم ذلك باستخدام لفة البيانو. يوجد أيضًا شريط أدوات به "أقلام الرصاص" و"الممحاة" المعتادة وما إلى ذلك. في الواقع، دعونا نحاول تركيب عبارة "مرحبًا، يو، هيا" المذكورة أعلاه! لنرسم الأحداث على شكل مساحات مستطيلة، ونقوم أيضًا بتسمية كل منها، كما في الشكل 5.

وكما ترون، فإن الكلمات ليست كلها مكتوبة فوق الأحداث. على سبيل المثال، يتم تقسيم كلمة "come on" إلى مقطعين - "com" و"on". سيلاحظ المستخدمون اليقظون أن الصوتيات تُكتب تلقائيًا أدناه - وهذه ميزة ملائمة إلى حد ما. إذا ذهبت إلى التفاصيل والفروق الدقيقة، فأنت بحاجة إلى الحصول على فكرة جيدة جدًا عن ماهية الصوتيات والفروق الدقيقة الأخرى في صوت الكلام، والتي لا يمكن الوصول إليها إلا للمتخصصين الضيقين. سنترك الأمر كما هو ونرى كيف يعمل بشكل عام. ولكن هذا ليس كل شيء. الآن، في الجزء المتوسط ​​من مسار Cantor 2، نحتاج أيضًا إلى تسجيل الجزء الذي ستبدو عليه كلماتنا (المقاطع). دعونا نفعل ذلك كما في الشكل 6.

يمكننا الآن تشغيل التشغيل في جهاز التسلسل والتأكد من وجود بعض الصوت عند الإخراج.

بعد ذلك، دعونا نضبط بعض الفروق الدقيقة في الصوت. اسمحوا لي أن أحجز على الفور أنه لدراسة جميع الفروق الدقيقة في إعداد Cantor 2، تحتاج إلى كتابة كتاب كامل. في هذه المقالة سننظر في المعلمات العامة. لذلك، أولا، يمكنك اختيار صوت جاهز. هناك حوالي اثني عشر منهم المتاحة. يمكنك فتحها في الجزء العلوي من البرنامج، في خيار تحميل الصوت (الشكل 7).

الافتراضي كان "نيكي"، لكنني غيرته إلى "لوثر". يمكنك تجربة أصوات مختلفة، سواء الإناث أو الذكور.

ثانياً، يوجد قسم التأثيرات (في الواقع قسم التأثيرات، شكل 8).

هناك 4 تأثيرات متاحة - التشويه، وتردد صدى الصوت، والكورس، والتردد. على الرغم من أنه يمكن إضافة هذه التأثيرات نفسها بشكل منفصل.

لا فائدة من الحديث عن قسمي الصوت والصوت، لأن... من الصعب جدًا تعلمها ولا يستطيع فهم إعداداتها إلا متخصص متخصص إلى حد ما. رغم أن لا أحد يمنعك من قلب المقابض في هذه الأقسام وبالتالي تغيير الصوت. أو قم بدراسة نظرية تركيب الكلام، بالإضافة إلى دليل مستخدم كانتور، من أجل فهم كيفية عمل كل شيء. بشكل عام، هناك الكثير من المعلمات، والصوت الناتج معقد للغاية وبدائي للغاية.

ومع ذلك، حتى المبتدئ، إذا حاول، يمكن أن يحصل على صوت مشابه لما حصلت عليه.

استوديو حلقات الفواكه

ربما سيتفاجأ الكثير منكم، بعد أن شاهدوا Fruity Loops، بكيفية وصولها إلى هذه المقالة، لأنه على الأرجح مركب الكلام. الشيء هو أنه يحتوي على مركب كلام جيد جدًا في ترسانته. يطلق عليه مركب الكلام. وعلى الرغم من أنه غير متوفر كمكون إضافي منفصل، يمكنك إدراج FL نفسه كملحق vst في محطة العمل الخاصة بك واستخدام مُركِّب الكلام الخاص به هناك. لكنني ما زلت أفضّل إنشاء جزء كلام في FL نفسها، ثم تصديره إلى ملف صوتي، ثم استخدامه في أي محطة عمل.

لذلك، دعونا نحاول إنشاء الدفعة من المثال السابق مباشرة في FL Studio. دعونا نقوم بإدراج هذا البرنامج المساعد في مشروعنا (الشكل 9).

بمجرد إضافته إلى المشروع، ستظهر نافذة تلقائيًا تطالبنا بإدخال النص الخاص بنا. ليس عليك التفكير لفترة طويلة وإدخال عبارتنا على الفور من الأمثلة أعلاه (الشكل 10).

بالإضافة إلى ذلك، يمكنك على الفور ضبط معلمات الكلام الأخرى، مثل الصوت (يتوفر حوالي 20 صوتًا)، ونمط النطق، والوضع (الهمس، أو الاستنشاق، أو العادي) وإعدادات الإيقاع ودرجة الصوت. أنصحك بضبط الإيقاع على الفور (لدي، على سبيل المثال، 140، وفقًا لإيقاع المشروع). يتيح لك زر الاستماع الاستماع إلى جزء سريعًا قبل إنشائه. بعد أن حددنا المعلمات الضرورية، انقر فوق مربع الاختيار، وسيطالبنا البرنامج بحفظ ملفنا بجزء الكلام الذي تم إنشاؤه وسيتم إنشاء جزء جديد به غناء في المشروع (الشكل 11).

لا نحتاج إلى أن نتعب أنفسنا - قام مُركِّب الكلام بإنشاء مسار لنا، وهو عبارة عن أداة تقطيع الفواكه مع جزء تم إنشاؤه فيه، مقسم إلى ملاحظات، حيث تتوافق كل كلمة مع ملاحظة منفصلة (في الشكل 11 على اليمين يمكنك أن ترى أن لدينا جزءًا مكونًا من 4 قطع). بالإضافة إلى ذلك، أنشأت لفة البيانو مسارات للملاحظات مع الكلمات الموقعة، وهي مريحة للغاية (الشكل 12).

كل شيء واضح وبسيط للغاية. ليست هناك حاجة لكتابة المقاطع الصوتية أو تحديد المقاطع لجعل العبارة سليمة. يكفي إدخال العبارة ببساطة - ستبدو بالفعل مقبولة ومقروءة تمامًا. ثم يمكنك بسهولة إعادة ترتيب الكلمات وتصدير الجزء إلى تنسيق الصوت المطلوب. يمكنك أن ترى بنفسك من خلال الاستماع إلى مثال.

ما هو أفضل ما تمت مراجعته من آلات توليف الكلام؟

رأيي الشخصي: الكلام المباشر والغناء المباشر أفضل. إذا اخترت من البرامج المذكورة أعلاه، فبالطبع يفوز Cantor 2 من حيث عدد الإعدادات والمعلمات، علاوة على ذلك، فإنه يدعي أنه ليس مجرد مُركِّب كلام، بل حتى مُركِّب صوتي. إذا اخترت الراحة والبساطة وجودة الصوت، فإنني أفضل مُركِّب الكلام من حلقات Fruity.

إضافة من المحررين

يوجد أيضًا برنامج مجاني لتوليف الكلام -. يمكنك تكوين معلمات مختلفة، وبعد الاستماع المسبق، قم بإنشاء النتيجة في ملف صوتي.

اليوم، لم تعد أجهزة توليف الكلام، المستخدمة في أنظمة الكمبيوتر المكتبية أو الأجهزة المحمولة، تبدو غير عادية. لقد تقدمت التقنيات بالفعل إلى الأمام وجعلت من الممكن إعادة إنتاج الصوت البشري. سننظر أدناه في كيفية عمل كل شيء، حيث يتم استخدام مُركِّب الكلام، وكيفية اختيار مثل هذا الجهاز، وما هي المشكلات المحتملة التي قد يواجهها المستخدم عند شراء مثل هذا الجهاز. ما هي أجهزة توليف الكلام؟ أين يمكن استخدامها؟ مُركِّبات الكلام هي برامج خاصة تتكون من عدة وحدات. تتيح لك هذه البرامج ترجمة النص المكتوب على لوحة المفاتيح إلى كلام بشري عادي في شكل صوت. سيكون من السذاجة الاعتقاد بأن المكتبات المصاحبة تحتوي على جميع الكلمات أو العبارات المحتملة التي تم تسجيلها في الاستوديوهات بواسطة أشخاص حقيقيين. وهذا ببساطة مستحيل على المستوى المادي. ستكون مكتبات العبارات أيضًا ذات حجم كبير بحيث لا يمكن تثبيتها حتى على محركات الأقراص الثابتة الحديثة ذات السعة الكبيرة، ناهيك عن الأجهزة المحمولة. بالإضافة إلى ذلك، تم تطوير تقنية تسمى تحويل النص إلى كلام، والتي تعني "تحويل النص إلى كلام". أصبحت أجهزة توليف الكلام أكثر انتشارًا في العديد من المجالات. تتضمن إحدى هذه المجالات التعلم المستقل للغات الأجنبية، عندما يحتاج المستخدم إلى سماع النطق الصحيح للكلمة. تُستخدم مُركِّبات الكلام أيضًا للاستماع إلى الكتب بدلاً من القراءة، وإنشاء أجزاء محلية وأجزاء كلامية عند تسجيل الموسيقى، وإصدار استعلامات بحث في شكل عبارات أو كلمات صوتية. ويمكن أيضًا استخدام هذه الأجهزة من قبل الأشخاص ذوي الإعاقة.

آلات توليف الكلام: أنواع البرامج

يمكن تقسيم جميع أجهزة توليف الكلام، اعتمادًا على مجال الاستخدام، إلى نوعين رئيسيين: البرامج القياسية، والتي تستخدم لتحويل الكلام مباشرة إلى نص، ووحدات الكلام أو الصوت، والتي تستخدم في تطبيقات الموسيقى. للنظر في هذه المشكلة بمزيد من التفصيل، سننظر في كلا فئتي البرامج، ومع ذلك، سيظل التركيز أكثر على مُركِّبات الكلام لغرضها المباشر.

مزايا وعيوب تطبيقات الكلام البسيطة. أما بالنسبة لمزايا وعيوب البرامج من هذا النوع، فلننظر أولاً إلى العيوب. بادئ ذي بدء، تجدر الإشارة إلى أن الكمبيوتر لا يزال جهازًا تقنيًا. في هذه المرحلة من التطور، يمكنه تقريبًا توليف الكلام البشري. غالبًا ما توجد في أبسط البرامج مشاكل في الضغط على الكلمات وانخفاض جودة الصوت. تواجه الأجهزة المحمولة عادةً زيادة في استهلاك الطاقة. وفي بعض الحالات، لوحظ أيضًا تنزيل غير مصرح به لوحدات الكلام. ومع ذلك، هناك أيضًا الكثير من المزايا هنا. يرى الكثيرون المعلومات السمعية أفضل من المعلومات المرئية. لذا فإن الميزة الواضحة هي سهولة الإدراك. كيفية استخدام مركب الكلام بشكل صحيح؟ دعنا نقول المزيد عن المبادئ الأساسية لاستخدام هذا النوع من البرامج. أولاً، يمكن تثبيت أي نوع من مُركِّبات الكلام دون أي مشاكل. في الأنظمة الثابتة، يتم استخدام المثبت القياسي، وتتمثل مهمته الرئيسية في اختيار وحدات اللغة المدعومة. بالنسبة للأجهزة المحمولة، يمكنك تنزيل ملف التثبيت من المتجر أو المستودع الرسمي مثل AppStore أو Google Play.

وبعد ذلك سيتم تثبيت التطبيق تلقائيا. عند البدء لأول مرة، كقاعدة عامة، لا تحتاج إلى إجراء أي إعدادات بخلاف تحديد اللغة الافتراضية. ومع ذلك، في بعض الحالات، قد يطلب منك البرنامج تحديد جودة الصوت. يتم استخدام الإصدار القياسي بتردد أخذ العينات 4410 هرتز وعمق 16 بت ومعدل بت 128 كيلوبت في الثانية في كل مكان. وفي الأجهزة المحمولة، الأرقام المماثلة أقل قليلاً. يتم أخذ صوت معين كأساس. عند استخدام نمط النطق القياسي، من خلال استخدام المعادلات والمرشحات، يمكنك تحقيق صوت هذا الجرس بالضبط. عند الاستخدام، يمكنك اختيار عدة خيارات لترجمة النص: الترجمة النصية اليدوية، وقراءة النص الموجود من ملف، والتكامل في التطبيقات الأخرى مع إمكانية تنشيط نتائج البحث أو قراءة محتوى النص على الصفحات عبر الإنترنت. هنا يكفي تحديد خيار الإجراء المطلوب والصوت واللغة التي سيتم بها نطق النص. العديد من البرامج لديها عدة أنواع من الأصوات، سواء الإناث أو الذكور. لتنشيط عملية التشغيل، يمكنك استخدام زر البداية.

إذا كنا نتحدث عن كيفية تعطيل مركب الكلام، فقد يكون هناك عدة خيارات. في أبسط الحالات، يمكنك استخدام زر إيقاف التشغيل الموجود في البرنامج نفسه. إذا كان المُركِّب مدمجًا في المتصفح، فسيتم إلغاء التنشيط في إعدادات الامتداد عن طريق إزالة المكون الإضافي تمامًا. مع الأجهزة المحمولة، على الرغم من الإغلاق الفوري، قد تنشأ بعض المشاكل، والتي سيتم مناقشتها أدناه. على سبيل المثال، يتم تنفيذ إدخال النص وإعداداته بطريقة أكثر تعقيدًا. دعونا نلقي نظرة على تطبيق FLStudio. يحتوي على وحدة الكلام الخاصة به، حيث يمكنك تحديد عدة أنواع من الأصوات، أو تغيير سرعة التشغيل أو إعدادات النغمة. لوضع لهجة، يجب عليك استخدام الرمز "_" قبل مقطع لفظي. ومع ذلك، فإن مثل هذا المركب مناسب فقط لإنشاء أصوات روبوتية. يمكن بالفعل تصنيف حزمة Vocaloid من Yamaha على أنها برنامج على المستوى الاحترافي. يتم تطبيق تقنية تحويل النص إلى كلام بالكامل هنا.

بالإضافة إلى المعلمات القياسية، يمكنك ضبط glissando والتعبير في الإعدادات. يمكنك أيضًا استخدام المكتبات التي تحتوي على غناء من فنانين محترفين، وتأليف كلمات فردية وعبارات كاملة، وضبطها على نغمات مختلفة، وغير ذلك الكثير. ليس من المستغرب على الإطلاق أنه مع الغناء وحده، تشغل حزمة البرامج هذه أكثر من 4 جيجابايت في توزيع التثبيت. بعد تفريغها، يزيد الحجم مرتين إلى ثلاث مرات.

في هذه المراجعة سنركز فقط على التطبيقات البسيطة. دعونا ننظر إلى الأكثر شعبية منهم. وفقا لمعظم المستخدمين، فإن RH Voice هو أفضل مركب للكلام. تم إنشاء هذا التطور الروسي بواسطة أولغا ياكوفليفا. في الإصدار القياسي من البرنامج، تتوفر ثلاثة أصوات فقط - إيلينا، ألكسندر، إيرينا. إعداد البرنامج بسيط للغاية. يمكن استخدام التطبيق نفسه كبرنامج مستقل، متوافق مع SAPi5، وكوحدة شاشة.

تطبيق آخر مثير للاهتمام هو Acapela. ميزته الرئيسية هي التمثيل الصوتي المثالي تقريبًا للنص بأكثر من 30 لغة. في الإصدار البسيط من التطبيق، يتوفر خيار صوتي واحد فقط - Alena. تطبيق قوي آخر بصوت أنثوي هو ميلينا. كثيرا ما يستخدم هذا البرنامج في مراكز الاتصال. هناك العديد من الإعدادات لضبط الضغط وضبط مستوى الصوت وسرعة القراءة بالإضافة إلى تثبيت قواميس إضافية. والفرق الرئيسي بين هذا البرنامج هو أن محرك الكلام يجب أن يكون مدمجًا في برامج مثل Cool Reader وFull Screen Caller ID وMoon+ Reader Pro. أقوى أداة لتوليف الكلام والتعرف عليه هي برنامج المهرجان. وهو مصمم لأنظمة Mac OSX وLinux. يأتي هذا التطبيق مع كود مفتوح المصدر. بالإضافة إلى حزم اللغات القياسية، فهو يدعم اللغتين الفنلندية والهندية. تطبيق آخر للكلام هو eSpeak. وهو يدعم أكثر من 50 لغة. العيب الرئيسي لهذا البرنامج هو أنه يحفظ ملفات الكلام المركبة حصريًا بتنسيق WAV. من المعروف أن هذا التنسيق يشغل مساحة كبيرة. هذا البرنامج متعدد المنصات ويمكن استخدامه حتى على الأنظمة المحمولة.

Google Android: مشاكل في مُركِّب الكلام

غالبًا ما يشتكي المستخدمون، عند تثبيت مُركِّب الكلام "الأصلي" من Google، من أنه يتيح تلقائيًا تحميل وحدات لغة إضافية. وهذا لا يستغرق فترة طويلة من الوقت فحسب، بل يؤدي أيضًا إلى إهدار حركة المرور بشكل خطير. يعد التخلص من هذه المشكلة على أنظمة Android أمرًا سهلاً للغاية. للقيام بذلك تحتاج إلى استخدام قائمة الإعدادات. هنا ننتقل إلى قسم اللغة والإدخال الصوتي. تحتاج هنا إلى تحديد البحث الصوتي في خيار التعرف على الكلام في وضع عدم الاتصال والنقر فوق علامة التقاطع (تعطيل). يوصى أيضًا بمسح ذاكرة التخزين المؤقت للتطبيق وإعادة تشغيل الجهاز. في بعض الحالات، قد تحتاج إلى تعطيل الإشعارات داخل التطبيق نفسه.

ما يحدث في نهاية المطاف؟ لتلخيص ذلك، يمكننا القول أن أبسط البرامج مناسبة للمستخدمين العاديين. الرائد في العديد من التصنيفات هو برنامج RHVoice، ومع ذلك، بالنسبة للموسيقيين الذين يحتاجون إلى تحقيق صوت طبيعي، بحيث لا يشعر الفرق بين التوليف المباشر والكمبيوتر، فمن الأفضل إعطاء الأفضلية لبرامج مثل Vocaloid. العديد من الأصوات الإضافية يتم إنتاج المكتبات اليوم لمثل هذه البرامج. تحتوي إعدادات هذه التطبيقات على العديد من الإمكانيات بحيث لا تكون التطبيقات البدائية قريبة من بعضها البعض.