ปัญญาประดิษฐ์กำลังกำหนดขอบเขตปฏิสัมพันธ์ระหว่างมนุษย์กับคอมพิวเตอร์ในอัตราที่ไม่เคยเกิดขึ้นมาก่อน ฟังก์ชันการควบคุมด้วยเสียงของ Hume AI เกิดขึ้น โดยนำการปฏิวัติทางเทคโนโลยีในการโต้ตอบด้วยเสียงมาสู่โลกดิจิทัล
ความก้าวหน้าหลักของเทคโนโลยีที่เป็นนวัตกรรมนี้อยู่ที่ความสามารถที่ไม่เคยมีมาก่อนในการปรับแต่งการควบคุมด้วยเสียงอย่างละเอียด เสียง AI แบบดั้งเดิมมักถูกจำกัดให้อยู่ในโหมดที่ตั้งไว้ล่วงหน้า ในขณะที่ Hume มอบโซลูชันส่วนบุคคลแบบใหม่ ผู้ใช้สามารถปรับเสียงของตนได้อย่างแม่นยำผ่าน 10 มิติ ทำให้ได้รับอิสระในการแสดงออกทางเสียงอย่างที่ไม่เคยมีมาก่อน
หมายเหตุแหล่งที่มาของรูปภาพ: รูปภาพนี้สร้างขึ้นโดย AI และรูปภาพนั้นได้รับอนุญาตจากผู้ให้บริการ Midjourney
มิติเสียงที่ปรับได้ทั้ง 10 ประการนี้เปรียบเสมือนชุดเสียงเต็มรูปแบบ: ตั้งแต่เสียงผู้ชายและผู้หญิง ไปจนถึงความขี้อายและกล้าแสดงออกอย่างมั่นใจ จากเสียงต่ำไปจนถึงเสียงเบา ไปจนถึงระดับความมั่นใจที่ขี้อายและหนักแน่น ไม่ว่าจะเป็นความสงบและความตื่นเต้นของความกระตือรือร้น หรือความชัดเจนและสมบูรณ์ของลักษณะจมูก ผู้ใช้สามารถปรับให้เข้ากับความพึงพอใจของตนเองได้ ความผ่อนคลาย ความคล่องแคล่วของเสียง ระดับพลังงาน และความกระชับของเสียง แต่ละมิติทำให้เสียงมีความเป็นไปได้ทางอารมณ์มากยิ่งขึ้น
สิ่งที่น่าตกใจที่สุดคือการปรับเปลี่ยนที่ซับซ้อนทั้งหมดนี้ทำได้ง่ายมาก ผู้ใช้ไม่จำเป็นต้องมีทักษะการเขียนโปรแกรมหรือการออกแบบเสียงระดับมืออาชีพ พวกเขาสามารถปรับแต่งลักษณะเสียงได้แบบเรียลไทม์ผ่านแถบเลื่อนที่ใช้งานง่าย เช่นเดียวกับการวาดภาพบนจานสีอย่างอิสระ
เทคโนโลยีนี้ไม่ได้มาจากไหนเลย Alan Cowen ผู้ร่วมก่อตั้งบริษัทและอดีตนักวิจัย Google DeepMind ได้สร้างโมเดลคำพูดที่ไม่เหมือนใครนี้โดยการศึกษาข้อมูลคำพูดข้ามวัฒนธรรมและการสำรวจอารมณ์อย่างลึกซึ้ง ตามวิธีการทางวิทยาศาสตร์ด้านอารมณ์ คำพูดไม่ได้เป็นเพียงเสียงอีกต่อไป แต่ยังเป็นตัวพาและการแสดงออกของอารมณ์อีกด้วย
สำหรับนักพัฒนา นี่หมายถึงการปรับแต่งอวาตาร์เสียงที่เป็นเอกลักษณ์สำหรับบอทบริการลูกค้า ผู้ช่วยดิจิทัล ครูสอนออนไลน์ และแม้แต่ฟีเจอร์การเข้าถึง แพลตฟอร์ม EVI2 ได้แสดงให้เห็นถึงศักยภาพที่สำคัญของเทคโนโลยีนี้: เวลาตอบสนองลดลง 40% ต้นทุนลดลง 30% และมอบประสบการณ์การโต้ตอบที่ชาญฉลาดและเป็นธรรมชาติมากขึ้นสำหรับสถานการณ์การใช้งานต่างๆ
เมื่อเปรียบเทียบกับไลบรารีเสียงที่ตั้งไว้ล่วงหน้าของ OpenAI และ ElevenLabs โซลูชันของ Hume มีความยืดหยุ่นและใช้งานง่ายกว่า ไม่เพียงแต่มีตัวเลือกสำเร็จรูปเท่านั้น แต่ยังให้อิสระในการสร้างสรรค์อย่างแท้จริงแก่ผู้ใช้อีกด้วย ปัจจุบัน นักพัฒนาสามารถสัมผัสประสบการณ์ฟีเจอร์นี้ได้ฟรีในสภาพแวดล้อมการทดสอบของแพลตฟอร์ม Hume บริษัทระบุว่าจะยังคงขยายมิติเสียงที่ปรับได้ต่อไปในอนาคต และปรับปรุงคุณภาพเสียงและการแสดงออกอย่างต่อเนื่อง
นี่ไม่ใช่แค่ความก้าวหน้าทางเทคโนโลยีเท่านั้น แต่ยังเป็นก้าวกระโดดที่สำคัญสำหรับปัญญาประดิษฐ์ที่จะเห็นอกเห็นใจมากขึ้นและใกล้ชิดกับปฏิสัมพันธ์ของมนุษย์มากขึ้น Hume กำลังใช้เทคโนโลยีเพื่อกำหนดนิยามใหม่ของความเป็นไปได้ของการโต้ตอบด้วยเสียง และเปิดช่องทางใหม่สำหรับการเชื่อมโยงระหว่าง AI และอารมณ์ของมนุษย์