ระวัง! เสียงของคุณอาจถูกปลอม! OpenAI พัฒนาเทคโนโลยีโคลนเสียง เนียนจนน่ากลัว

Read Time2 Minute, 13 Second

OpenAI องค์กรวิจัยปัญญาประดิษฐ์ชื่อดัง ได้เผยแพร่บทความในบล็อกเมื่อวันที่ 29 มีนาคม เกี่ยวกับ Voice Engine เทคโนโลยีใหม่ล่าสุดของพวกเขา โมเดลนี้ถูกสร้างขึ้นในช่วงปลายปี 2565 สามารถสร้างเสียงพูดที่ฟังดูเป็นธรรมชาติและเหมือนกับเสียงของผู้พูดจริง โดยใช้เพียงตัวอย่างเสียงเพียง 15 วินาทีและข้อความป้อนเข้า ถึงแม้ว่าเทคโนโลยีนี้จะน่าทึ่ง แต่ OpenAI ก็มีความกังวลเกี่ยวกับการเผยแพร่สู่สาธารณะในวงกว้าง เนื่องจากมีโอกาสที่จะถูกนำไปใช้ในทางที่ผิด

Voice Engine ถูกใช้งานในหลาย ๆ แอปพลิเคชันแล้ว เช่น การใช้เป็นเสียงที่ตั้งไว้ล่วงหน้าใน API แปลงข้อความเป็นเสียงพูดของ OpenAI และการปรับปรุงคุณสมบัติ ChatGPT Voice และ Read Aloud เพื่อเข้าใจการใช้งานจริงของ Voice Engine OpenAI ได้ร่วมมือกับกลุ่มพันธมิตรที่ไว้ใจได้มาตั้งแต่ปลายปี 2565

ผลลัพธ์จากความร่วมมือนี้แสดงให้เห็นถึงผลลัพธ์ที่น่าสนใจ ตัวอย่างเช่น บริษัท Age of Learning ใช้ Voice Engine สำหรับเนื้อหาการศึกษาส่วนบุคคล HeyGen ใช้เทคโนโลยีนี้สำหรับการแปลวิดีโอ และ Dimagi ใช้เพื่อให้ข้อเสนอแนะแบบโต้ตอบกับเจ้าหน้าที่สาธารณสุข เทคโนโลยีนี้ยังถูกนำร่องในด้านการดูแลสุขภาพ โดยสถาบัน Norman Prince Neurosciences แห่ง Lifespan ใช้ Voice Engine เพื่อฟื้นฟูเสียงพูดของผู้ป่วยที่มีปัญหาทางการพูด

อย่างไรก็ตาม OpenAI ตระหนักดีถึงความเสี่ยงที่เกี่ยวข้องกับการสร้างเสียงพูดที่เลียนแบบเสียงของผู้คนอย่างใกล้ชิด โดยเฉพาะในช่วงที่มีการเลือกตั้ง เพื่อแก้ไขข้อกังวลเหล่านี้ บริษัทได้ดำเนินการตามมาตรการความปลอดภัยและนโยบายการใช้งานสำหรับพันธมิตรของตน เช่น ห้ามการแอบอ้างโดยไม่ได้รับความยินยอม ต้องขออนุญาตอย่างชัดแจ้งจากผู้พูดต้นฉบับ และใช้ลายน้ำเพื่อติดตามต้นทางของเสียงที่สร้างขึ้น

เมื่อเทคโนโลยีการสังเคราะห์เสียงพูดพัฒนาขึ้น OpenAI สนับสนุนให้ใช้มาตรการเชิงรุกเพื่อให้มั่นใจว่ามีการใช้งานอย่างมีความรับผิดชอบ ซึ่งรวมถึงการยกเลิกการใช้การยืนยันตัวตนด้วยเสียงสำหรับข้อมูลที่ละเอียดอ่อน การให้ความรู้แก่สาธารณชนเกี่ยวกับความสามารถและข้อจำกัดของ AI และการพัฒนาวิธีการติดตามต้นทางของเนื้อหา audiovisual

สอดคล้องกับความมุ่งมั่นด้านความปลอดภัยของ AI OpenAI ตัดสินใจที่จะเปิดตัว Voice Engine ให้ผู้ใช้งานบางกลุ่มทดลองใช้ก่อน แทนที่จะเผยแพร่สู่สาธารณะในวงกว้างในตอนนี้ ด้วยการแบ่งปันข้อมูลเชิงลึกเหล่านี้ บริษัทมีเป้าหมายเพื่อเริ่มต้นการสนทนาเกี่ยวกับอนาคตของเสียงสังเคราะห์และขั้นตอนที่จำเป็นในการควบคุมศักยภาพของเทคโนโลยีนี้

Voice AI is by far the most dangerous modality.

Superhuman, persuasive voice is something we have minimal defences to.

Figuring out what to do about this should be one of our top priorities.

(We had sota models but didn’t release for this reason eg https://t.co/vjY99uCdTl) https://t.co/fKIZrVQCml
— Emad acc/acc (@EMostaque) March 29, 2024

If you haven't disabled voice authentication for your bank account and had a conversation with your family about AI voice impersonation yet, now would be a good time. https://t.co/TkpdGUfr76
— Noam Brown (@polynoamial) March 29, 2024

ที่มา : cryptoglobe

Post Views: 45

Facebook Comments

Grayscale เปิดตัวกองทุนเพื่อการลงทุนแบบ Proof of Stake สำหรับเศรษฐี

Sat Mar 30 , 2024

Grayscale ประกาศว่ากำลังเปิดตัว “กองทุนรายได้แบบไดนามิก (Dynamic Income Fund)” ซึ่งจะมุ่งเน้นไปที่การลงทุนในโทเค็น Proof-of-stake บริษัทกล่าวในโพสต์ถึง X […]

ข่าวที่เกี่ยวข้อง

Crypto News

ตู้ ATM Bitcoin ในไทย 2019 มีที่ไหนบ้าง? มีจริงหรือโมเม?

เวเนซุเอลาจะได้รับ Bitcoin ATM เครื่องแรก

BCH“คือความตาย” และ BSV เป็น “เหรียญขยะ” ผู้ก่อตั้ง Bitcoin.org กล่าว

Crypto นั้นไร้ค่า และ มันไม่ผ่านการทดสอบทางการเงินขั้นพื้นฐาน กล่าวโดย ที่ปรึกษาของ Bank of England

รัฐบาลซิมบับเวระงับการใช้งานอินเทอร์เน็ตส่งผลกระทบต่อเศรษฐกิจอย่างน่าตกใจ

ละครทีวี : Serie Crypto กำลังจะมา

Bitcoin จะอยู่รอดหากเกิดสงครามนิวเคลียร์ กล่าวโดยนาย Charlie Shrem

การปิดตัวของรัฐบาลสหรัฐทำให้ Bitcoin ETF เสียรูปขบวน VanEck กล่าว

ซัมซุงอาจเปิดตัวกระเป๋า blockchain wallet เป็นของตัวเองที่มาพร้อมกับ Galaxy S10