أفضل من تغيير صوتك: يستخدم Hume AI شريط تمرير لإعادة تشكيل حدود صوت الذكاء الاصطناعي

يعمل الذكاء الاصطناعي على إعادة تشكيل حدود التفاعل بين الإنسان والحاسوب بمعدل غير مسبوق. ظهرت وظيفة التحكم الصوتي الخاصة بشركة Hume AI إلى حيز الوجود، مما أحدث ثورة تكنولوجية في التفاعل الصوتي للعالم الرقمي.

ويكمن الإنجاز الأساسي لهذه التكنولوجيا المبتكرة في قدرتها غير المسبوقة على ضبط التحكم الصوتي بدقة. غالبًا ما تقتصر أصوات الذكاء الاصطناعي التقليدية على أوضاع محددة مسبقًا، بينما يوفر هيوم حلاً مخصصًا جديدًا. ويمكن للمستخدمين ضبط صوتهم بدقة من خلال عشرة أبعاد، مما يحقق حرية غير مسبوقة في التعبير الصوتي.

音频 声波

ملاحظة لمصدر الصورة: تم إنشاء الصورة بواسطة الذكاء الاصطناعي، والصورة معتمدة من قبل مزود الخدمة Midjourney

تشبه هذه الأبعاد الصوتية العشرة القابلة للتعديل لوحة كاملة من الأصوات: من المذكر والمؤنث في الخصائص الجنسية، إلى الخجول والقوي في الحزم؛ ومن المنخفض إلى الخفيف في كثافة الصوت، إلى الخجول والثابت في مستويات الثقة. سواء كان الأمر يتعلق بالهدوء والإثارة الناتجين عن الحماس، أو وضوح وثراء خصائص الأنف، يمكن للمستخدمين تعديلها وفقًا لمحتوى قلوبهم. الاسترخاء، وطلاقة الصوت، ومستوى الطاقة، وضيق الصوت، كل بُعد يمنح الصوت إمكانيات عاطفية أكثر ثراءً.

الأمر الأكثر إثارة للصدمة هو أن كل هذه التعديلات المعقدة بسيطة للغاية. لا يحتاج المستخدمون إلى أي مهارات برمجية أو مهارات تصميم صوت احترافية، حيث يمكنهم ضبط خصائص الصوت في الوقت الفعلي من خلال أشرطة التمرير البديهية، تمامًا مثل الرسم بحرية على لوحة الألوان.

هذه التكنولوجيا لم تأتي من العدم. قام المؤسس المشارك للشركة والباحث السابق في Google DeepMind، آلان كوين، ببناء نموذج الكلام الفريد هذا من خلال الدراسة العميقة لبيانات الكلام عبر الثقافات واستطلاعات الرأي العاطفية. واستنادًا إلى منهج العلوم العاطفية، لم يعد الكلام مجرد صوت، بل أصبح أيضًا ناقلًا للعاطفة وتعبيرًا عنها.

بالنسبة للمطورين، يعني هذا تصميم صور رمزية صوتية فريدة لروبوتات خدمة العملاء والمساعدين الرقميين والمدرسين عبر الإنترنت وحتى ميزات إمكانية الوصول. وقد أظهرت منصة EVI2 الإمكانات الكبيرة لهذه التكنولوجيا: فقد تم تقصير وقت الاستجابة بنسبة 40%، وتقليل التكاليف بنسبة 30%، كما أنها توفر تجربة تفاعلية أكثر ذكاءً وطبيعية لسيناريوهات التطبيقات المختلفة.

بالمقارنة مع المكتبات الصوتية المعدة مسبقًا في OpenAI وElevenLabs، يعد حل Hume أكثر مرونة وسهولة في الاستخدام. فهو لا يوفر خيارات جاهزة فحسب، بل يمنح المستخدمين أيضًا حرية إبداعية حقيقية. حاليًا، يمكن للمطورين تجربة هذه الميزة مجانًا في بيئة الاختبار لمنصة Hume. وذكرت الشركة أنها ستواصل توسيع أبعاد الصوت القابلة للتعديل في المستقبل وستواصل تحسين جودة الصوت والتعبير.

وهذا ليس طفرة تكنولوجية فحسب، بل هو أيضا قفزة مهمة للذكاء الاصطناعي ليصبح أكثر تعاطفا وأقرب إلى التفاعل البشري. يستخدم هيوم التكنولوجيا لإعادة تعريف إمكانيات التفاعل الصوتي وفتح قناة جديدة للاتصال بين الذكاء الاصطناعي والعواطف البشرية.