เมื่อช่วงปีที่ผ่านมา หลายคนน่าจะได้เคยเห็นข่าวใหญ่ในวงการหมากล้อม (Go) ว่ามีระบบปัญญาประดิษฐที่ชื่อว่า Alpha Go สามารถพัฒนาตัวเองด้วยการเรียนรู้จากข้อมูลที่ป้อนให้ จนมีฝีมือเก่งกาจยิ่งกว่าแชมป์ระดับโลกที่เป็นมนุษย์ได้อย่างสมบูรณ์แบบ แต่ล่าสุดนี้ทีมพัฒนาระบบปัญญาประดิษฐ์ตัวเดิมได้ยกระดับความน่าทึ่งขึ้นไปอีกขั้น เพราะ AI ตัวใหม่นี้สามารถเรียนรู้และพัฒนาฝีมือการเล่นหมากล้อมได้ด้วยตนเอง แบบไม่จำเป็นต้องป้อนข้อมูลใดๆ ให้แม้แต่น้อย
AlphaGo Zero คือชื่อของระบบปัญญาประดิษฐ์ตัวใหม่ซึ่งเปรียบเสมือนกับนักเล่นหมากล้อมมือใหม่ถอดด้าม ที่เริ่มต้นเรียนรู้จากพื้นฐานของการเล่น จนสามารถพัฒนาตัวเองให้สามารถโค่นเซียนหมากล้อมระดับโลกลงได้อย่างราบคาบ ภายในเวลาเพียง 1 เดือนเท่านั้น โดยจุดสำคัญที่ทำให้ตัว AlphaGo Zero มีความน่าทึ่งก็คือ ตัวมันเองไม่ได้พึ่งพาการป้อนข้อมูลจากทีมงานแม้แต่น้อย แต่ใช้การเรียนรู้ทริกและกลยุทธ์ต่างๆ ในการเดินหมากด้วยตนเองตั้งแต่วันแรกเลยทีเดียว
ทีมงาน Deepmind (หนึ่งในบริษัทเครือ Alphabet ของ Google) ได้ออกมาเปิดเผยว่า ที่ AlphaGo Zero สามารถเรียนรู้ได้ด้วยตัวเองอย่างรวดเร็วขนาดนี้ ก็เป็นเพราะพวกเขาได้ทำการพัฒนากระบวนการเรียนรู้แบบเสริมกำลัง (Reinforcement Learning : RL) ที่อาศัยการทำงานร่วมกันระหว่างโครงข่ายทางประสาท (Neural Networks) และอัลกอริทึมทรงประสิทธิภาพ (Powerful Search Algorithm) รุ่นล่าสุด จนทำให้ตัวมันสามารถคาดเดาทิศทางการเดินหมากของผู้เล่นอีกฝ่ายได้ รวมถึงเมื่อแต่ละเกมจบลง AlphaGo Zero ก็จะเรียนรู้ข้อบกพร่องรวมถึงจุดแข็งของตัวเองแล้วเก็บมาพัฒนาขีดความสามารถในการเดินหมากเกมถัดไปได้อย่างมีประสิทธิภาพ
ทั้งนี้ ทีมงาน Deepmind ได้มองว่า ความก้าวหน้าของ AlphaGo Zero คืออีกหนึ่งหมุดหมายสำคัญ ที่จะเป็นการเข้าใกล้เป้าหมายในการสร้างอัลกอริธึมที่มีความสามารถในการแก้ไขปัญหาหรือโจทย์ที่ยากๆ ทางวิทยาศาสตร์ได้ในอนาคต