ลำโพงอัจฉริยะ พรมแดนถัดไป ของโลกคอมพิวเตอร์

หากจะพูดถึงเทคโนโลยีที่มีแนวโน้มจะมาแรงในอีกทศวรรษข้างหน้าก็เห็นทีว่าจะไม่มีอะไรเกินระบบ AI (Artificial Intelligence) หรือปัญญาประดิษฐ์ ซึ่งหากจะว่าไปแล้วก็ไม่ใช่ของใหม่นัก เพราะเป็นเทคโนโลยีที่อยู่คู่แวดวงไอทีมาโดยตลอดอย่างแนบเนียน ยกตัวอย่าง ระบบช่วยค้นหาใน Google ที่ช่วยให้ผู้ใช้บริการค้นหาสิ่งที่ต้องการได้ง่ายขึ้นเพียงปลายนิ้ว หรือระบบการแนะนำสินค้าที่น่าสนใจใน Amazon เป็นต้น เพียงแต่ช่วงสองสามปีที่ผ่านมานั้นระบบนิเวศของเทคโนโลยี AI ได้รับการพัฒนาให้ตอบสนองการใช้งานโดยมนุษย์ได้สะดวกและเป็นธรรมชาติมากขึ้นผ่านการสั่งด้วย “เสียง” ทำให้อุปกรณ์คอมพิวเตอร์ที่ดูธรรมดากลายเป็นผู้ช่วยดิจิทัลที่รู้ใจและสามารถรองรับคำสั่งของเราได้อย่างทันท่วงที

อย่างไรก็ตาม ระบบ AI ที่มีประสิทธิภาพเพียงอย่างเดียวไม่ได้เป็นสิ่งรับประกันว่าเทคโนโลยีนี้จะได้รับความนิยม เช่นเดียวกับนวัตกรรมคอมพิวเตอร์ครั้งอดีต ส่วนติดต่อผู้ใช้งานหรืออินเทอร์เฟสที่ใช้งานง่าย สะดวก และให้ความรู้สึกเป็นธรรมชาติ คือปัจจัยสำคัญที่จะช่วยให้ได้รับการยอมรับโดยผู้บริโภค สำหรับ AI ที่รองรับการสั่งด้วยเสียงนั้น ก็แน่นอนว่าจะต้องมีอินเตอร์เฟสกลางทำหน้าที่ประสานงานระหว่างคอมพิวเตอร์กับผู้ใช้ และลำโพง คือคำตอบ

ลำโพง : ปัจจัยแห่งความสำเร็จของ AI

แต่เดิมนั้นลำโพงทำหน้าที่แต่เพียงอย่างเดียว คือสังเคราะห์เสียงจากคอมพิวเตอร์ส่งผ่านเข้าสู่ประสาทหูของเรา แต่ไม่กี่ปีที่ผ่านมาเจ้าอุปกรณ์แสนเรียบง่ายตัวนี้ได้รับการพัฒนาขึ้นให้สามารถรองรับคำสั่งด้วยเสียงให้สามารถทำงานได้หลากหลายมากขึ้น ไม่ว่าจะเป็นการตรวจสอบสภาพอากาศ เล่นเพลงที่ชอบ และที่สำคัญคือ เป็นสื่อกลางระหว่างผู้ใช้กับอุปกรณ์ Smart Home อาทิ หลอดไฟ กลอนประตู หรือเครื่องปรับอุณหภูมิ ให้เจ้าของบ้านสามารถตั้งค่าและควบคุมการทำงานของอุปกรณ์เหล่านั้นด้วยการตะโกนใส่ลำโพงได้เลย

Amazon Echo ผู้บุกเบิกลำโพงอัจฉริยะเป็นรายแรก ๆ

สำหรับผู้เล่นหลักในตลาดนี้ก็มีด้วยกันหลายราย โดยผู้บุกเบิกเจ้าแรก ๆ ก็คือ Amazon ที่ได้เปิดตัวอุปกรณ์ตระกูล Echo หลายเวอร์ชัน ไม่ว่าจะเป็นในรูปแบบลำโพง ซึ่งล่าสุดคือ Echo Show ลำโพงผสมจอภาพสำหรับใช้ในการสนทนาวิดีโอคอล โดยอุปกรณ์ Echo ทั้งหมดถูกออกแบบให้ทำงานร่วมกับ Alexa ผู้ช่วยดิจิทัลที่รองรับการสั่งด้วยเสียงได้อย่างเป็นธรรมชาติ และสามารถอัปเกรดเพิ่มทักษะความสามารถได้หลากหลาย โดยมีหลักการใช้คล้ายกับที่เราโหลดแอปพลิเคชันมาเสริมความสามารถให้กับสมาร์ทโฟนและแท็บเล็ตนั่นเอง ยกตัวอย่าง เราสามารถเปิดใช้ทักษะ Uber ให้กับอุปกรณ์ Echo ทำให้สามารถเรียกรถ Uber ได้อย่างสะดวกด้วยการสั่งผ่าน Echo เป็นต้น

ผู้เล่นรายถัดมาที่มาแรงไม่แพ้กันคือ Google ที่ได้เปิดตัว Google Home ไปในช่วงที่ผ่านมา โดยเป็นอุปกรณ์รูปร่างเหมือนลำโพงที่มาพร้อมเทคโนโลยีสั่งด้วยเสียง Google Assistant ซึ่งรองรับคำสั่งได้หลากหลายไม่แพ้คู่แข่ง และดูเหมือนจะได้เปรียบกว่าด้วย เพราะผลการทดสอบโดย Stone Temple เอเจนซี่ด้านการตลาดออนไลน์แสดงให้เห็นว่า ผู้ช่วยดิจิทัลของ Google มีอัตราการตอบสนองต่อคำสั่งด้วยเสียงได้อย่างถูกต้องมากที่สุด โดยคิดเป็นร้อยละ 90.6 ของคำถามที่ถูกตอบทั้งหมด แต่น่าเสียดายที่ฮาร์ดแวร์ยังไม่มีความหลากหลายมากนัก เพราะมีแต่เฉพาะอุปกรณ์รูปแบบลำโพงแต่เพียงอย่างเดียว

Google Home คู่แข่งในตลาดของ Amazon Echo

และผู้เล่นรายล่าสุดที่เพิ่งประกาศเข้าสู่ตลาดเมื่อช่วงกลางปีนี้ก็คือ Apple โดยได้เปิดตัว HomePod ซึ่งเป็นอุปกรณ์ลำโพงขนาดเล็กสไตล์มินิมัลตามปรัชญาการออกแบบสินค้าของค่ายนี้ และแน่นอนว่าต้องรองรับการสั่งด้วยเสียงผ่านผู้ช่วยดิจิทัล Siri ที่เราคุ้นเคยกันดีจาก iPhone อย่างไรก็ดี ดูเหมือนว่า Apple จะไม่ได้พยายามชูจุดเด่นด้านความเป็นอัจฉริยะของ HomePod มากนัก (แน่นอนว่าส่วนหนึ่งเป็นเพราะ Siri เองก็ยังฉลาดไม่พอเมื่อเทียบกับคู่แข่ง โดยได้คะแนนความแม่นยำของการตอบคำถามเป็นอันดับสามจากผลการทดสอบโดย Stone Temple ในย่อหน้าที่แล้ว) แต่กลับพยายามชูจุดเด่นด้าน “คุณภาพเสียง” ที่กล่าวอ้างว่าดีเด่นแตกต่างจากคู่แข่งที่เน้นโฆษณาอรรถประโยชน์ที่จะได้รับจากการสั่งด้วยเสียงผ่านอุปกรณ์ลำโพงของตน จึงมีผู้วิเคราะห์ว่านี่เป็นเสมือนการยอมรับโดยกลาย ๆ จาก Apple ว่า ระบบ Siri ของตนยังไม่ถือว่าดีเด่นมาก และจัดอยู่ในระดับ “กำลังพัฒนา” เท่านั้น

Siri ยังฉลาดไม่พอ เมื่อเทียบกับคู่แข่ง โดยได้คะแนนความแม่นยำของการตอบคำถาม เป็นอันดับที่ 3 จากผลการทดสอบ

ประเด็นความท้าทายที่น่าสนใจ

แน่นอนว่าการมาถึงของเทคโนโลยีใหม่ย่อมต้องมีประเด็นความท้าทายให้ฟันฝ่ากว่าจะเป็นที่ยอมรับ สำหรับอุปกรณ์ลำโพงอัจฉริยะก็ไม่มีข้อยกเว้น เริ่มจากอุปสรรคด้าน “ภาษา” กับสำเนียงพูด ซึ่งนับว่าเป็นความท้าทายที่สำคัญที่สุด และดูเหมือนจะไม่สามารถแก้ไขได้โดยใช้ระยะเวลาอันสั้น เพราะลำพังสำเนียง

ภาษาอังกฤษก็มีหลากหลายมากพออยู่แล้ว และหากบริษัทเหล่านี้ต้องการตีตลาดลูกค้าต่างประเทศที่ใช้ภาษาและสำเนียงที่หลากหลายกันไปก็ต้องรีบเร่งพัฒนาระบบ AI ให้รองรับการรับคำสั่งด้วยคำพูดภาษาพื้นถิ่นได้อย่างเป็นธรรมชาติและไร้รอยต่อ จึงจะมั่นใจได้ว่าจะได้รับการตอบรับจากผู้บริโภคในตลาดดังกล่าว

และเมื่อพูดถึงความท้าทายด้านความเข้าใจภาษาพูดแล้ว อุปสรรคที่ตามมาก็คือจะทำอย่างไรที่ระบบ AI จะสามารถเข้าใจว่าเรากำลังถามคำถาม โดยไม่ต้อง Activate ด้วยคำพูดเปิด ผมจะยกตัวอย่างง่าย ๆ ว่า ก่อนหน้าที่จะเริ่มใช้งาน Siri บน iPhone เราก็ต้องพูดก่อนว่า “หวัดดี Siri” เพื่อเป็นการส่งสัญญาณให้มือถือเราทราบว่า “ฉันกำลังจะพูดกับนายแล้วนะ” ซึ่งตามความเห็นของผมคือ มันไม่เป็นธรรมชาติเอาซะเลย ลองคิดดูว่ามันจะเป็นการเพิ่มความรำคาญมากขนาดไหน หากทุกครั้งก่อนจะสั่งด้วยเสียงเราก็ต้องตะโกน “หวัดดี Siri” ใส่ HomePod อยู่ร่ำไป และมันจะดีกว่าหรือไม่ หากลำโพงอัจฉริยะเหล่านี้จะเก่งกาจพอที่จะสามารถแยกแยะได้โดยอัตโนมัติว่า ประโยคนี้หรือคำพูดนี้ฉันกำลังพูดกับเพื่อนที่อยู่ในห้อง และประโยคหรือคำพูดโน้นฉันกำลังพูดเพื่อสั่งการลำโพงไฮเทคเหล่านี้ได้โดยอัตโนมัติ?

คงจะดีกว่าไม่น้อย หากเราสามารถสื่อสารกับ Smart Speaker ได้อย่างเป็นธรรมชาติกว่านี้

สำหรับความท้าทายประการสุดท้ายที่จะกล่าวถึงและมีความสำคัญไม่แพ้กันก็คือ การอัปเกรดทักษะและความสามารถใหม่ ๆ ซึ่งในแง่มุมนี้ผมมีความคิดเห็นว่า ลำโพง+AI ก็คือแพลตฟอร์มหนึ่ง เหมือนกับ iPhone ที่มีระบบปฏิบัติการ iOS และสมาร์ทโฟนจากค่ายอื่นที่ใช้คู่กับ Android ซึ่งปัจจัยแห่งความสำเร็จไม่ได้อยู่ที่ความเสถียรกับความสมบูรณ์แบบของตัวระบบเองเท่านั้น แต่ขึ้นอยู่กับความสามารถในการรองรับแอปพลิเคชันซึ่งจะช่วยเพิ่มพูนความสามารถกับความสามารถใหม่ ๆ ให้กับอุปกรณ์ราคาแพงดังกล่าวด้วย เพราะถึงแม้ว่าฮาร์ดแวร์กับซอฟต์แวร์จากผู้ผลิตจะเพอร์เฟ็คมากขนาดไหน แต่หากไม่สามารถรองรับความต้องการของผู้บริโภคได้อย่างหลากหลายและรวดเร็วได้ ก็ย่อมที่จะต้องพ่ายแพ้กับคู่แข่งที่มีใจเปิดรับซอฟต์แวร์หรือแอปพลิเคชันจากผู้พัฒนาภายนอกอย่างแน่นอน ลำโพงอัจฉริยะก็เช่นเดียวกันที่ผู้พัฒนาแต่ละรายก็ต้องเร่งจัดทำ SDK เพื่อป้อนบรรดา Developer ผู้หิวกระหายแพลตฟอร์มใหม่สำหรับอวดโฉมฝีมือความคิดสร้างสรรค์ของตน หลังจากที่เริ่มอึน ๆ เอียน ๆ กับแพลตฟอร์มสมาร์ทโฟนกับแท็บเล็ต ที่ตลาดแอปพลิเคชันดูเหมือนจะเริ่มถึงจุดอิ่มตัวเสียแล้ว ทั้งนี้ ก็ต้องยอมรับว่า ค่ายที่มาแรงก็คงหนีไม่พ้น Amazon ซึ่งอุปกรณ์ Echo ได้มีการเปิดโอกาสให้ผู้บุคคลทั่วไปพัฒนาทักษะและความสามารถเสริมให้กับอุปกรณ์ตระกูลดังกล่าวเป็นที่เรียบร้อย

ความสามารถในการติดตั้งทักษะใหม่ คือปัจจัยสำคัญที่จะทำให้แพลตฟอร์ม Smart Speaker ประสบความสำเร็จ

สรุป

มนุษย์เราได้มีการพัฒนาวิธีปฏิสัมพันธ์กับคอมพิวเตอร์ให้สามารถใช้งานง่ายขึ้นตลอดเวลา เริ่มจากช่วงแรกของเทคโนโลยีคอมพิวเตอร์ส่วนบุคคลที่เราต้องสื่อสารผ่านการพิมพ์ตัวอักษร จนมาถึงยุคต่อมาที่เราเริ่มใช้เมาส์กับคีย์บอร์ด และในยุคปัจจุบันก็มาถึงการใช้นิ้วสัมผัสหน้าจอทัชสกรีน และในอนาคตอันไม่ไกลนี้เราก็คงสามารถใช้เสียงสั่งการผ่านลำโพงอัจฉริยะที่กำลังจะทยอยเข้าสู่ตลาดกันได้

แต่แน่นอนว่า ลำโพงอัจฉริยะพร้อม AI เหล่านี้ยังต้องฟันฝ่าอุปสรรคไม่น้อย ไม่ว่าจะเป็นกำแพงภาษา การสื่อสารที่เป็นธรรมชาติ หรือการเพิ่มเติมทักษะและความสามารถโดยผู้พัฒนาภายนอก ซึ่งเป็นกุญแจสำคัญทำให้แพลตฟอร์มสมาร์ทโฟนประสบความสำเร็จดังเช่นทุกวันนี้ ซึ่งหากผู้ผลิตรายใดสามารถทำได้ก่อนก็ย่อมเป็นผู้ชนะในศึกแพลตฟอร์มคอมพิวเตอร์ยุคหน้าดังกล่าวนี้แน่นอนครับ

Contributor

สรนาถ รัตนโรจน์มงคล

สรนาถ รัตนโรจน์มงคล

จบการศึกษาระดับปริญญาตรีจากคณะศิลปศาสตร์ มหาวิทยาลัยธรรมศาสตร์ รหัส 48 และปริญญาโทจากคณะนิเทศศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย รหัส 55 ชื่นชอบและติดตามความเคลื่อนไหวด้านเทคโนโลยีมานาน งานอดิเรกคือชอบถ่ายภาพควบคู่กับการเดินทาง

ปัจจุบันเป็นข้าราชการในโครงการพัฒนานักบริหารการเปลี่ยนแปลงรุ่นใหม่ (นปร.) รุ่นที่ 10 สำนักงาน ก.พ.ร. ติดตามอ่านบทความย้อนหลังได้ที่ www.bitwiredblog.com และชมเว็บไซต์ผลงานภาพถ่ายได้ที http://iviewphoto.me

You may be interested in

Latest post from Facebook

Related Posts

ดีแทค ส่งเสริมการใช้การงานดิจิทัล เพื่อให้ลูกค้าเข้าถึงบริการดิจิทัลได้อย่างทั่วถึงและเท่าเทียม

ดีแทค ตอบรับกระแสการเติบโตของโลกดิจิทัล เร่งติดสปีดการใช้งานดิจิทัลลูกค้าดีแทค พร้อมวาดแผนกลยุทธ์ดิจิทัลมุ่งสู่บริการที่มากกว่า โทรคมนาคม สร้างดิจิทัลอีโคซิสเต็มและเปลี่ยนผ่านโมเดลปฏิบัติการสู่ดิจิทัล ปูทางดีแทคแอปสู่ซูเปอร์แอป   [caption...