AlphaGo กำลังบอกอะไรเรา?

โดย ผศ.ดร. ศุภวัฒน์ สุภัควงศ์

เผยแพร่: 15 ก.ย. 2562 00:00

346 views

www.facebook.com/drsupawat

Talk of the town ประจำสัปดาห์ที่ผ่านมา คงหนีไม่พ้นการประลองฝีมือในเกมส์หมากล้อมหรือ Go ระหว่าง Lee Sedol เซียนแนวหน้าของโลก กับ AlphaGo โรบอทซึ่งถูกพัฒนาโดยทีมนักวิจัยจาก Google หลายท่านคงทราบผลเป็นที่เรียบร้อยแล้ว โดย AlphaGo ประกาศศักดาคว้าชัยชนะไป 4 ต่อ 1 เกมส์

Just another game?

ผลการแข่งขันในครั้งนี้ทำให้ผมคิดถึงบทความที่เคยเขียนไว้เรื่อง "จะเกิดอะไรขึ้น...เมื่อเราต้องเทรดแข่งกับหุ่นยนต์” กล่าวถึงการต่อสู้กันระหว่าง Garry Kasporov ตำนานเซียนหมากรุกที่ดีที่สุดที่โลกเคยมีมา กับโรบอท Deep Blue โดยบริษัท IBM เมื่อปี 1997 ในครั้งนั้นถือเป็นครั้งแรกที่เซียนในตำนานท่านนี้ถูกยัดเยียดความปราชัยให้ และนั่นถือเป็นจุดเริ่มต้นของการเข้ามาครอบงำวงการหมากรุกของหุ่นยนต์ เพราะตั้งแต่ปี 2005 เป็นต้นมา หุ่นยนต์ก็ยัดเยียดความปราชัยให้มนุษย์มาตลอด จนเป็นสาเหตุให้เกิดการแยกให้มีลีกหุ่นยนต์แข่งกันเอง

ชัยชนะของ AlphaGo ในวันนี้ หลายท่านอาจมองว่า ก็เป็นแค่อีกเกมส์หนึ่ง ซึ่งไม่น่าจะมีนัยยะสำคัญอะไร? แต่ในความเป็นจริงแล้ว วิธีการเดินหมากของ Go นั้นซับซ้อนกว่าหมากรุกอยู่หลายขุม ขนาดก่อนการแข่งขัน ผู้เชี่ยวชาญในด้าน AI หลายท่านก็ยังมองว่า คงใช้เวลาอีกหลายปีกว่าที่หุ่นยนต์จะพัฒนามาตามทันและสู้กับเซียนอย่างสมน้ำสมเนื้อ

ในหนึ่งครั้ง หมากรุกจะมีวิธีการเดินเฉลี่ยที่ 35 แบบ ในขณะที่ Go จะมีรูปแบบการเดินเฉลี่ยถึง 250 แบบ นั่นหมายความว่า หลังจากในแต่ละครั้งของการเดิน จะมีรูปแบบการเดินเป็นเป็นไปได้อีก 250 แบบ เป็นเช่นนี้ไปเรื่อยๆ ซึ่งแน่นอนว่าแม้แต่ supercomputer ก็ยังไม่สามารถคาดการณ์ครอบคลุมผลทั้งหมดได้ ว่ากันว่าจำนวนรูปแบบการเดินของ Go มีมากกว่าจำนวนอะตอมทั้งจักรวาลเสียอีก

นั่นหมายความว่า หากหุ่นยนต์ต้องการที่จะเอาชนะคนในเกมส์นี้ จะอาศัยพลังความเป็นต่อในด้านการคำนวนของ supercomputer หรือการจำรูปแบบการเดินหมากอย่างเดียวไม่ได้แล้ว แต่ต้องสามารถอ่านเกมส์และคิดเองได้ด้วย

ดังนั้น ชัยชนะในครั้งนี้ของ AlphaGo อาจจะกล่าวได้ว่า เป็น Break Through ครั้งสำคัญอีกครั้งหนึ่งของ AI

AlphaGo ทำงานอย่างไร

กว่าจะมาเป็น AlphaGo ที่คว้าชัยชนะในวันนี้ได้ผ่านกระบวนการพัฒนาอยู่หลายขั้นตอน โดยผมขอสรุปเป็นไอเดียคร่าวๆ ประมาณนี้ครับ

ในขั้นตอนแรกเลย AlphaGo จะถูกโปรแกรมให้เรียนรู้ลักษณะการเดินหมากของเซียนกว่า 30 ล้านตาเดิน ทำให้รู้ว่าการเดินในครั้งต่อไปควรเลือกในรูปแบบใด (คนฝึกกับเซียนกว่า 30 ล้านครั้ง แน่นอนว่าคงต้องเก่งขึ้นบ้างล่ะ) แต่เท่านั้นไม่พอ ความน่าสนใจอยู่ที่ หลังจากได้เรียนรู้จากเซียนหมดแล้ว ในขั้นตอนต่อมา มันทำการแยกตัวออกมา แล้วแข่งกันเองอีกกว่าหนึ่งล้านครั้ง ใช่ครับ หุ่นยนต์แข่งกับหุ่นยนต์ ! โดยเก็บผลแพ้ชนะในแต่ละตาเพื่อ feedback กลับไปเพื่อพัฒนาเพิ่มเติมว่าลักษณะการเดินแบบไหนที่ทำให้แพ้หรือชนะ ทำให้ประสิทธิภาพของเจ้าโรบอทในขั้นตอนนี้ สูงขึ้นไปอีก

ขั้นตอนถัดๆ ไป เน้นการพัฒนาด้าน speed หรือความรวดเร็วในการตัดสินใจ และ Value หรือการเลือกเดินหมากโดยพิจารณาจากความน่าจะเป็นที่จะชนะ ก่อนทำทุกส่วนมาผนวกรวมกันในขั้นตอนสุดท้าย

(สำหรับผู้สนใจศึกษาเพิ่มเติมในรายละเอียด ผมแนะนำบทความเรื่อง “เจาะลึก ALPHAGO ทำงานอย่างไร” ซึ่งอธิบายการทำงานของเจ้า AI ตัวนี้อย่างน่าสนใจและเข้าใจง่าย)

แค่ Google เหรอที่สนใจ Go?

ในความเป็นจริง ไม่ใช่แค่ Google ครับ บริษัทยักษ์ใหญ่อื่นๆ ล้วนทุ่มทรัพยากรที่มีในการวิจัยและพัฒนาด้าน AI ไม่ว่าจะเป็น Microsoft, Twitter หรือ Facebook

ถึงขนาดที่ว่า นักวิจัย AI ของ Facebook นั่งทำงานห่างจาก Mark Zuckerberg อยู่ไม่กี่ฟุต ซึ่งเป็นตัวชี้ให้เห็นว่า Zuckerberg ให้ความสำคัญกับงาน AI มากน้อยขนาดไหน

ทำไมต้อง Go?

มันคือความท้าทายครับ ยักษ์ใหญ่เหล่านี้ทุ่มทรัพยากรในการพัฒนา AI ไม่ใช่เพื่อการเป็นผู้ชนะในเกมส์ Go หากแต่เป็นเพราะ

หนึ่ง ถ้าทีมของเขาชนะในเกมส์นี้ได้ซึ่งถือเป็นปัญหาที่ท้าทายมากทาง AI ก็จะเป็นประตูเปิดทางในการนำเอา AI ไปใช้งานในด้านอื่นๆ ที่ต่อยอดทางธุรกิจ (ยกตัวอย่างเช่น ฟังก์ชั่น auto-tagging friend บนภาพของ facebook หรือการค้นหารูปภาพของ Google) และ

สอง ผู้คว้าชัยในเกมส์นี้เสมือนเป็นการส่ง Statement of Intent ให้ผู้คนโดยรอบรู้ว่า “พี่ไม่ได้มาเล่นๆ” ความชัดเจนและความทุ่มเทในส่วนนี้จะเป็นตัวดึงดูดให้นักวิจัยชั้นยอดด้าน AI ซึ่งมีไม่เยอะมากเข้ามาเป็นส่วนหนึ่งขององค์กร

แล้วอย่างไรต่อ?

AI ในวันนี้ ได้พัฒนาไปไกลและเร็วกว่าที่หลายคนได้คาดการณ์ไว้...

ผมไม่ได้พูดถึงแค่ในเกมส์ Go นะครับ แต่หมายรวมถึง ทุกสิ่งอย่างที่เกี่ยวข้องกับการวางกลยุทธ์ (strategy) และการแข่งขัน (competition)

การเทรดการลงทุนก็เป็นหนึ่งในนั้น....อย่างที่เราทราบกันดีว่า ในตลาดพี่ใหญ่อย่างประเทศสหรัฐอเมริกา ปริมาณการซื้อขายในตลาดส่วนใหญ่ ล้วนมาจากระบบการซื้อขายอัตโนมัติทั้งนั้น (ประมาณ 60-73% จากผลการสำรวจเมื่อปี 2009) ซึ่ง AI หรือ machine learning ถือเป็นหนึ่งในกลยุทธ์ที่กองทุน (โดยเฉพาะในสาย Quantitative อย่าง Bridgewater Associates, Renaissance Technologies, D.E. Shaw, หรือ Two Sigma) มุ่งเน้นในการพัฒนาและให้ความสำคัญ

แล้วเดี๋ยวในครั้งต่อๆ ไป ผมจะมาเล่าถึงการใช้ AI ในการเทรดการลงทุนให้ฟังโดยเฉพาะ โชคดีในการลงทุนครับ ☺

ผศ.ดร. ศุภวัฒน์ สุภัควงศ์

ผศ. ดร.ศุภวัฒน์ สุภัควงศ์ (อาจารย์ Nine) - อดีตนักเรียนทุนรัฐบาล ศึกษาระดับปริญญาตรี-โท ที่ประเทศสหรัฐอเมริกา และปริญญาเอกที่ Imperial College London ปัจจุบันเป็นอาจารย์ประจำภาควิชาวิศวกรรมไฟฟ้าและคอมพิวเตอร์ คณะวิศวกรรมศาสตร์ มหาวิทยาลัยธรรมศาสตร์ อาจารย์เน้นงานวิจัยด้านการประมวลผลสัญญาณ time-series ประเภทต่างๆ หนึ่งในนั้นคือ การศึกษาพฤติกรรมการเปลี่ยนแปลงของราคาหลักทรัพย์ มีความสนใจและเป็นนักพัฒนา algorithms ต่างๆ ในแนวทางการลงทุนแบบ algorithmic and systematic trading

บทความอื่น ๆ ที่เกี่ยวข้อง