ที่ผ่านมามีการใช้ AI ( Artificial Intelligence ) ในการจดจำใบหน้า ทั้งในแอพบันเทิงเช่นไว้ตกแต่งรูปถ่ายเซลฟี่ หรือไลฟ์สด ไปจนถึงเรื่องจริงจังอย่างการสแกนใบหน้าเพื่อทำธุรกรรมต่างๆ
… รวมถึงด้านความมั่นคงอย่างการสอดส่องประชาชนตามที่สาธารณะในประเทศจีนด้วย
แต่ล่าสุด AI เริ่มถูกนำไปใช้อ่านริมฝีปากด้วยแล้ว เรียกว่าระบบ VSR (visual speech recognition) โดยมีหลายบริษัทกำลังวิจัยและพัฒนาอยู่
ตัวอย่างเช่น บ. Liopa ในไอร์แลนด์ ซึ่งได้สร้างระบบ SRAVI (Speech Recognition App for the Voice Impaired) เป็นซอฟต์แวร์ที่ใช้อ่านปากคนไข้ที่ขยับปากได้แต่ไม่มีเสียงออกมา โดยถือเป็นอุปกรณ์ทางการแพทย์อย่างหนึ่ง
และก็มีการเปิดเผยโดยเว็บไซต์ เว็บไซต์ Motherbord ซึ่งยังรายงานด้วยว่ายังมีอีกหลายบริษัทกำลังทำโดยยังไม่เผยเป้าหมายว่าจะไปใช้ในด้านไปน เช่นบริษัท Google, Huawei, Samsung และ Sony โดยต่างก็มีความคืบหน้าไปมาก
และเนื่องจากไม่เปิดเผยเป้าหมายนี้ ทำให้หลายฝ่ายมองว่าซอฟต์แวร์ SRAVI นี้อาจถูกนำไปอ่านปากผู้ต้องสงสัย ผ่านกล้องวงจรปิด หรือกล้องแอบถ่ายในที่สาธารณะ ด้วยเหตุผลด้านความมั่นคง ซึ่งอาจกระทบความเป็นส่วนตัวจองประชาชนได้
ทุกวันนี้เทคโนโลยีอ่านริมฝีปากสามารถจับบางคำจากการพูดได้ แต่ยังไม่สามารถจับทั้งประโยคยาวๆอย่างครบถ้วนได้ 100%
โดยถ้าอ้างอิงจากรายงานอย่างเป็นทางการล่าสุด 2 ปีที่แล้วของ Google Deepmind เมื่อปี 2018 พบว่า AI ยังมีความแม่นยำเพียงประมาณ 60% ในการอ่านปากถ้าหากไม่บ่งบอกหัวข้อว่าคุยเรื่องอะไรอยู่
แต่ผลจะดีขึ้นมากทันที ถ้ามีการบอกระบบไว้ว่าบทสนทนานั้นจะเกี่ยวกับอะไร โดยอัตราความแม่นยำจะได้มากถึง 86%
ข่าวจาก
vice.com/en/article/bvzvdw/tech-companies-are-training-ai-to-read-your-lips
ภาพประกอบจาก
neurohive.io/en/news/gan-network-can-do-lip-reading-and-output-speech