ระบบ AI สามารถสังเคราะห์เสียงพูด และเสียงดนตรีได้คล้ายมนุษย์แล้ว


2หลังจากที่สร้าง AI โชว์ผลงานเล่นหมากล้อมเอาชนะแชมป์โลกที่เป็นมนุษย์ได้สำเร็จแล้ว DeepMind ทีมพัฒนาระบบปัญญาประดิษฐ์ในเครือของ Google ก็ได้เปิดตัวผลงานล่าสุดที่ชื่อว่า WaveNet ที่สามารถสร้างโทนเสียงพูดที่ใกล้เคียงกับมนุษย์ได้มากยิ่งขึ้น ทั้งยังสามารถสร้างเสียงดนตรีจำลองได้เหมือนของจริงอีกด้วย

WaveNet ถูกสร้างขึ้นมาโดยมีเป้าหมายในการสร้างเสียงพูดสังเคราะห์ ที่มีความต่อเนื่องและลื่นไหลเปรียบเสมือนกับการพูดคุยในชีวิตจริง จากแต่เดิมที่เทคโนโลยีการจำลองเสียงพูดนั้นจะเป็นการสร้างประโยคสนทนาด้วยฐานข้อมูลเสียงพูดแบบคำสั้นๆ จำนวนมากแล้วนำมาเชื่อมต่อให้กลายเป็นประโยค ซึ่งแน่นอนว่าไม่มีความเป็นธรรมชาติเท่าไรนัก แต่สำหรับระบบ WaveNets นั้นจะเป็นการนำเอาเทคโนโลยีการเรียนรู้มาเสริมให้ระบบปัญญาประดิษฐ์ มีความสามารถเรียนรู้คลื่นเสียงในแต่ละแบบของมนุษย์ที่อัดเอาไว้ในฐานข้อมูล Text-to-Speech (TTS) ขนาดใหญ่ของกูเกิล จากนั้นจึงทำการสังเคราะห์คลื่นเสียงที่มีลักษณะคล้ายๆ กันที่มีความต่อเนื่องออกมา ซึ่งลักษณะเสียงนี้จะสามารถนำไปผสานกับตัวข้อความเพื่อแปลงเป็นเสียงพูดที่มีความหมายจริงๆ ได้นั่นเอง ซึ่งแน่นอนว่า เมื่อนำเอาระบบนี้มาใช้เรียนรู้เสียงเครื่องดนตรีปกติ ก็สามารถแสดงผลออกมาได้เป็นอย่างดีเช่นกัน

ไม่แน่ว่าอีกไม่นาน มนุษย์อย่างเราๆ อาจจะไม่สามารถแยกแยะเสียงบทสนทนาได้อีกต่อไปว่าเสียงไหนเป็นคนจริง หรือเสียงใดเป็นของ AI ก็เป็นได้ ซึ่งจะมีประโยชน์อย่างยิ่งในการสร้างระบบโต้ตอบกับลูกค้าอัตโนมัติในอนาคตอันใกล้อีกด้วย

You may be interested in

Latest post from Facebook

Related Posts

ดีแทค ส่งเสริมการใช้การงานดิจิทัล เพื่อให้ลูกค้าเข้าถึงบริการดิจิทัลได้อย่างทั่วถึงและเท่าเทียม

ดีแทค ตอบรับกระแสการเติบโตของโลกดิจิทัล เร่งติดสปีดการใช้งานดิจิทัลลูกค้าดีแทค พร้อมวาดแผนกลยุทธ์ดิจิทัลมุ่งสู่บริการที่มากกว่า โทรคมนาคม สร้างดิจิทัลอีโคซิสเต็มและเปลี่ยนผ่านโมเดลปฏิบัติการสู่ดิจิทัล ปูทางดีแทคแอปสู่ซูเปอร์แอป   [caption...