OpenAI องค์กรวิจัยปัญญาประดิษฐ์ชื่อดัง ได้เผยแพร่บทความในบล็อกเมื่อวันที่ 29 มีนาคม เกี่ยวกับ Voice Engine เทคโนโลยีใหม่ล่าสุดของพวกเขา โมเดลนี้ถูกสร้างขึ้นในช่วงปลายปี 2565 สามารถสร้างเสียงพูดที่ฟังดูเป็นธรรมชาติและเหมือนกับเสียงของผู้พูดจริง โดยใช้เพียงตัวอย่างเสียงเพียง 15 วินาทีและข้อความป้อนเข้า ถึงแม้ว่าเทคโนโลยีนี้จะน่าทึ่ง แต่ OpenAI ก็มีความกังวลเกี่ยวกับการเผยแพร่สู่สาธารณะในวงกว้าง เนื่องจากมีโอกาสที่จะถูกนำไปใช้ในทางที่ผิด
Voice Engine ถูกใช้งานในหลาย ๆ แอปพลิเคชันแล้ว เช่น การใช้เป็นเสียงที่ตั้งไว้ล่วงหน้าใน API แปลงข้อความเป็นเสียงพูดของ OpenAI และการปรับปรุงคุณสมบัติ ChatGPT Voice และ Read Aloud เพื่อเข้าใจการใช้งานจริงของ Voice Engine OpenAI ได้ร่วมมือกับกลุ่มพันธมิตรที่ไว้ใจได้มาตั้งแต่ปลายปี 2565
ผลลัพธ์จากความร่วมมือนี้แสดงให้เห็นถึงผลลัพธ์ที่น่าสนใจ ตัวอย่างเช่น บริษัท Age of Learning ใช้ Voice Engine สำหรับเนื้อหาการศึกษาส่วนบุคคล HeyGen ใช้เทคโนโลยีนี้สำหรับการแปลวิดีโอ และ Dimagi ใช้เพื่อให้ข้อเสนอแนะแบบโต้ตอบกับเจ้าหน้าที่สาธารณสุข เทคโนโลยีนี้ยังถูกนำร่องในด้านการดูแลสุขภาพ โดยสถาบัน Norman Prince Neurosciences แห่ง Lifespan ใช้ Voice Engine เพื่อฟื้นฟูเสียงพูดของผู้ป่วยที่มีปัญหาทางการพูด
อย่างไรก็ตาม OpenAI ตระหนักดีถึงความเสี่ยงที่เกี่ยวข้องกับการสร้างเสียงพูดที่เลียนแบบเสียงของผู้คนอย่างใกล้ชิด โดยเฉพาะในช่วงที่มีการเลือกตั้ง เพื่อแก้ไขข้อกังวลเหล่านี้ บริษัทได้ดำเนินการตามมาตรการความปลอดภัยและนโยบายการใช้งานสำหรับพันธมิตรของตน เช่น ห้ามการแอบอ้างโดยไม่ได้รับความยินยอม ต้องขออนุญาตอย่างชัดแจ้งจากผู้พูดต้นฉบับ และใช้ลายน้ำเพื่อติดตามต้นทางของเสียงที่สร้างขึ้น
เมื่อเทคโนโลยีการสังเคราะห์เสียงพูดพัฒนาขึ้น OpenAI สนับสนุนให้ใช้มาตรการเชิงรุกเพื่อให้มั่นใจว่ามีการใช้งานอย่างมีความรับผิดชอบ ซึ่งรวมถึงการยกเลิกการใช้การยืนยันตัวตนด้วยเสียงสำหรับข้อมูลที่ละเอียดอ่อน การให้ความรู้แก่สาธารณชนเกี่ยวกับความสามารถและข้อจำกัดของ AI และการพัฒนาวิธีการติดตามต้นทางของเนื้อหา audiovisual
สอดคล้องกับความมุ่งมั่นด้านความปลอดภัยของ AI OpenAI ตัดสินใจที่จะเปิดตัว Voice Engine ให้ผู้ใช้งานบางกลุ่มทดลองใช้ก่อน แทนที่จะเผยแพร่สู่สาธารณะในวงกว้างในตอนนี้ ด้วยการแบ่งปันข้อมูลเชิงลึกเหล่านี้ บริษัทมีเป้าหมายเพื่อเริ่มต้นการสนทนาเกี่ยวกับอนาคตของเสียงสังเคราะห์และขั้นตอนที่จำเป็นในการควบคุมศักยภาพของเทคโนโลยีนี้
ที่มา : cryptoglobe
Facebook Comments