ระวัง! เสียงของคุณอาจถูกปลอม! OpenAI พัฒนาเทคโนโลยีโคลนเสียง เนียนจนน่ากลัว

Crypto News
Read Time2 Minute, 13 Second

OpenAI องค์กรวิจัยปัญญาประดิษฐ์ชื่อดัง ได้เผยแพร่บทความในบล็อกเมื่อวันที่ 29 มีนาคม เกี่ยวกับ Voice Engine เทคโนโลยีใหม่ล่าสุดของพวกเขา โมเดลนี้ถูกสร้างขึ้นในช่วงปลายปี 2565 สามารถสร้างเสียงพูดที่ฟังดูเป็นธรรมชาติและเหมือนกับเสียงของผู้พูดจริง โดยใช้เพียงตัวอย่างเสียงเพียง 15 วินาทีและข้อความป้อนเข้า ถึงแม้ว่าเทคโนโลยีนี้จะน่าทึ่ง แต่ OpenAI ก็มีความกังวลเกี่ยวกับการเผยแพร่สู่สาธารณะในวงกว้าง เนื่องจากมีโอกาสที่จะถูกนำไปใช้ในทางที่ผิด

Voice Engine ถูกใช้งานในหลาย ๆ แอปพลิเคชันแล้ว เช่น การใช้เป็นเสียงที่ตั้งไว้ล่วงหน้าใน API แปลงข้อความเป็นเสียงพูดของ OpenAI และการปรับปรุงคุณสมบัติ ChatGPT Voice และ Read Aloud เพื่อเข้าใจการใช้งานจริงของ Voice Engine OpenAI ได้ร่วมมือกับกลุ่มพันธมิตรที่ไว้ใจได้มาตั้งแต่ปลายปี 2565

ผลลัพธ์จากความร่วมมือนี้แสดงให้เห็นถึงผลลัพธ์ที่น่าสนใจ ตัวอย่างเช่น บริษัท Age of Learning ใช้ Voice Engine สำหรับเนื้อหาการศึกษาส่วนบุคคล HeyGen ใช้เทคโนโลยีนี้สำหรับการแปลวิดีโอ และ Dimagi ใช้เพื่อให้ข้อเสนอแนะแบบโต้ตอบกับเจ้าหน้าที่สาธารณสุข เทคโนโลยีนี้ยังถูกนำร่องในด้านการดูแลสุขภาพ โดยสถาบัน Norman Prince Neurosciences แห่ง Lifespan ใช้ Voice Engine เพื่อฟื้นฟูเสียงพูดของผู้ป่วยที่มีปัญหาทางการพูด

อย่างไรก็ตาม OpenAI ตระหนักดีถึงความเสี่ยงที่เกี่ยวข้องกับการสร้างเสียงพูดที่เลียนแบบเสียงของผู้คนอย่างใกล้ชิด โดยเฉพาะในช่วงที่มีการเลือกตั้ง เพื่อแก้ไขข้อกังวลเหล่านี้ บริษัทได้ดำเนินการตามมาตรการความปลอดภัยและนโยบายการใช้งานสำหรับพันธมิตรของตน เช่น ห้ามการแอบอ้างโดยไม่ได้รับความยินยอม ต้องขออนุญาตอย่างชัดแจ้งจากผู้พูดต้นฉบับ และใช้ลายน้ำเพื่อติดตามต้นทางของเสียงที่สร้างขึ้น

เมื่อเทคโนโลยีการสังเคราะห์เสียงพูดพัฒนาขึ้น OpenAI สนับสนุนให้ใช้มาตรการเชิงรุกเพื่อให้มั่นใจว่ามีการใช้งานอย่างมีความรับผิดชอบ ซึ่งรวมถึงการยกเลิกการใช้การยืนยันตัวตนด้วยเสียงสำหรับข้อมูลที่ละเอียดอ่อน การให้ความรู้แก่สาธารณชนเกี่ยวกับความสามารถและข้อจำกัดของ AI และการพัฒนาวิธีการติดตามต้นทางของเนื้อหา audiovisual

สอดคล้องกับความมุ่งมั่นด้านความปลอดภัยของ AI OpenAI ตัดสินใจที่จะเปิดตัว Voice Engine ให้ผู้ใช้งานบางกลุ่มทดลองใช้ก่อน แทนที่จะเผยแพร่สู่สาธารณะในวงกว้างในตอนนี้ ด้วยการแบ่งปันข้อมูลเชิงลึกเหล่านี้ บริษัทมีเป้าหมายเพื่อเริ่มต้นการสนทนาเกี่ยวกับอนาคตของเสียงสังเคราะห์และขั้นตอนที่จำเป็นในการควบคุมศักยภาพของเทคโนโลยีนี้

ที่มา : cryptoglobe

0 0

Facebook Comments

Next Post

Grayscale เปิดตัวกองทุนเพื่อการลงทุนแบบ Proof of Stake สำหรับเศรษฐี

Grayscale ประกาศว่ากำลังเปิดตัว “กองทุนรายได้แบบไดนามิก (Dynamic Income Fund)” ซึ่งจะมุ่งเน้นไปที่การลงทุนในโทเค็น Proof-of-stake บริษัทกล่าวในโพสต์ถึง X […]