Future of Money (ตอนที่ 2): เมื่อหุ่นยนต์อ่านข่าวหุ้น
เคยมีการประมาณเอาไว้ว่า 90% ของข้อมูลทั้งหมดบนโลกนั้นเพิ่งถูกสร้างขึ้นมาในช่วงสองปีที่แล้ว
ขอบเขตของข้อมูลการเงินได้ขยายออกไปจนแทบขีดเส้นแบ่งไม่ถูกว่าอะไรคือข้อมูลการเงิน อะไรคือข้อมูลอื่นๆ
จากเดิมที่ข้อมูลการเงินมักเป็นข้อมูลจำพวก fundamentals และการบัญชี ขณะนี้ได้รวมไปถึงข่าวสารทั้งที่เป็นทางการและไม่เป็นทางการอย่าง เช่น การพูดคุยกันของมนุษย์ในโลกโซเชียลมีเดียเกี่ยวกับเทรนด์หรือสินทรัพย์ต่างๆ ไปเรียบร้อยแล้ว
ติดตามอ่านตอนแรกที่ : https://www.stock2morrow.com/article-detail.php?id=1363
บทความนี้จะพาท่านผู้อ่านไปสำรวจความเป็นไปได้ที่เทคโนโลยี “สมองกลอ่านภาษา”ที่ชื่อว่า Natural Language Processing (NLP) จะมาเปลี่ยนการลงทุนในโลกที่ข้อมูลกำลังถาโถมเข้ามาอย่างไม่มีที่สิ้นสุดนี้
อะไรคือ NLP
NLP คือหนึ่งในเทคนิคการประมวลข้อมูลภาษาที่นำเอาข้อมูลแบบ unstructured (ไร้รูปแบบ ไม่มีตัวเลขกำกับ) ไปแปลงให้กลายเป็นข้อมูลปลายทางที่มีรูปแบบขึ้น เพื่อเอาไปเชื่อมและวิเคราะห์ต่อกับข้อมูลอื่นๆ เช่น ข้อมูลการเงินของบริษัท ฯลฯ
เนื่องจากโลกของเรามีข้อมูล unstructured ปริมาณมหาศาลที่แทบไม่เคยถูกใช้ประโยชน์เลยในอดีต จึงทำให้ NLP กำลังกลายเป็นเทคนิคยอดนิยมในสาขาปัญญาประดิษฐ์ (AI) และ Machine Learning ในขณะนี้
อธิบายง่ายๆ ก็คือ สมมุติว่าเรามีเรื่องราวอยู่บนหน้ากระดาษ เป็นข้อมูล text เช่น:
“เรื่องกำไรในไตรมาสนี้นั้นคงยังต้องดูกันต่อไปนะครับ แม้ว่าจะมีเหตุระเบิดเกิดรุนแรงขึ้นในเมืองที่อาจส่งผลกระทบต่อยอดขายของเรา แต่โครงสร้างต้นทุนของเราน่าจะดีขึ้น และเรื่องที่เราคิดว่าสำคัญกว่าคือในไตรมาสหน้าทีมผู้บริหารของบริษัท กขค มองว่าน่าจะเข้าไป takeover บริษัท abc จากประเทศจีน เนื่องจากเรามองว่าบริษัท abc มีกระแสเงินสดที่ดูดี อีกทั้งเราจะได้รับเทคโนโลยีใหม่ๆ เข้ามาปรับใช้กับการให้บริการของเราเองด้วย เราจึงมองว่าน่าจะเป็นกลยุทธ์ acquisition ที่เหมาะสมแล้ว”
จะพูดว่าอ่านแล้วได้ใจความครบถ้วนเอาไปเทรดได้ก็ไม่ใช่ จะพูดว่าไม่มีสาระเลยในสามสี่ประโยคนี้ก็ไม่เชิง เพราะพออ่านจบเรารู้สึกได้ว่าผู้ประกาศจากบริษัท กขค อาจกำลังกลบเกลื่อน เปลี่ยนเรื่องฉับพลันจากความกังวลเรื่องกำไรในไตรมาสนี้ หรือเราอาจจะรู้สึกได้ว่าบริษัท กขค อาจแข็งแกร่งขึ้นในอนาคตจากการไปลงทุนในบริษัทจากประเทศจีน
ตอนแรกเรื่องราวแบบนี้จะเป็นข้อมูลที่ไม่ได้มีรูปแบบอะไรตายตัว เป็นเพียงข้อความ คำพูดมาเรียงๆ กัน บางทีเราอ่านเองก็สรุปใจความได้พอควร แต่บางทีก็ตีความไม่ง่ายขนาดนั้น มันจึงเคยเป็นเรื่องหินที่จะพยายามใช้สมองกลทำหน้าที่นี้ในอดีต แต่ในยุคที่เรามีเทคโนโลยี NLP เราสามารถให้คอมพิวเตอร์แปลงเรื่องราวเหล่านี้ให้ออกมาเป็นผลลัพธ์ต่างๆ นาๆ ไม่ว่าจะเป็น เรื่องราวนี้มีใจความเป็นเรื่องประเภทไหน ฟังดูแล้วบรรยากาศเป็นบวกหรือลบ ใช้คำศัพท์ระดับยากง่ายแค่ไหน ใช้สำนวนที่ซับซ้อนแค่ไหน ใช้คำศัพท์ที่ส่อให้เห็นถึงปัญหาเชิงกฎหมายแค่ไหน ฯลฯ ถือเป็นการแปลงข้อมูลที่ไร้ระเบียบและมีต้นทุนสูงในการตีความโดยมนุษย์ให้ออกมาเป็นข้อมูลที่มีรูปแบบมากขึ้น เพื่อที่จะนำไปรวมกับข้อมูลอื่นๆ ที่อยู่ในรูปแบบที่พร้อมใช้งานแล้ว จนสุดท้ายแล้วสามารถนำไปเป็นสัญญานในการเทรด
NLP เกี่ยวข้องกับการลงทุนอย่างไร
NLP สามารถช่วยจับใจความบางอย่างที่แฝงอยู่ในข้อมูลภาษาที่มนุษย์อาจมองข้ามไปหรือตีความผิดพลาด
ยกตัวอย่างเช่น เวลานักวิจัย equity ให้เรตติ้งว่า buy hold หรือ sell แท้จริงแล้วหากอ่านใจความของรายงานนั้นให้ดี จะมีสัญญานซ่อนอยู่ภายใต้ตัวอักษร คำศัพท์ที่ใช้ หรือสำนวน ว่าที่จริงแล้วเป็น hold ที่ค่อนไปทาง sell หรือเป็น buy ที่ค่อนไปทาง hold แปลว่ามันไม่ได้แดงเหลืองเขียว แบ่งเป็นสามสีแบบชัดเจนแบบที่สะท้อนในเรตติ้งตัวหลักเสมอไป
ซึ่งหากภาษาที่ซ่อนอยู่ในรายงานฉบับนี้สะท้อน fundamentals จริง (ที่จะมีผลต่อราคาในอนาคต) การที่เราจับสัญญานนี้ได้ก่อนก็จะทำให้เราได้เปรียบ และถึงแม้ว่าเราจะตั้งใจอ่านรายงานอย่างใจจดใจจ่อไม่ให้พลาดสัญญานเหล่านี้ มนุษย์เรามักมีอคติหรือการเอนเอียงทางความคิด (cognitive bias) ที่สมองกลจะไม่มี
อีกตัวอย่างที่น่าสนใจคือการใช้ NLP ในการวิเคราะห์ transcript ของ conference calls โดยบริษัทต่างๆ เพื่อพยากรณ์การเปลี่ยนแปลงของราคาหุ้นในอนาคต ในกรณีนี้เคยมีงานวิจัยพบว่าความยากง่ายของคำศัพท์และความยาวของช่วง Q&A กับนักวิเคราะห์หลังจากช่วงที่ทีมบริหารพูดจบมีผลต่อการที่บริษัทเหล่านี้จะออกมาประกาศในภายหลังว่าไตรมาสนี้กำไรจะไม่มากเท่าที่ตลาดคาดไว้ (ยิ่งช่วง Q&A สั้นยิ่งแย่ https://www.ssrn.com/abstract=1264966) นี่เป็นเพียงสองมิติใหม่จากการใช้ NLP แท้จริงแล้วยังมีอีกหลายมิติมากที่เราสามารถนำมาใช้ได้ ไม่ว่าจะเป็นโทนของการพูดว่าบรรยากาศเป็นบวกหรือลบในแต่ละช่วงของ conference call หรือแม้กระทั่งว่ามีคำศัพท์เกี่ยวกับกฎหมายมากน้อยแค่ไหน (เผื่อเป็นสัญญานว่ากำลังจะมีปัญหาทางกฎหมายในอนาคต)
และเนื่องจากทั้งโลกนี้มีจำนวนรายงาน ข่าวสาร และการแถลงข่าวโดยบริษัทต่างๆ จำนวนมากกว่าที่มนุษย์จะทำการอ่านและประมวลข้อมูลเหล่านี้ให้ออกมาเป็นมิติการลงทุนใหม่ๆ ด้วยตัวเองได้ การ automate ด้วย NLP จึงเป็นการลดต้นทุนอันมหาศาล และเป็นการปลดปล่อยให้นักวิเคราะห์เอาเวลาและทรัพยากรไปใช้กับกิจกรรมอื่นๆ ที่เทคโนโลยีสมองกลยังไปไม่ถึง
ผู้เขียนมองว่าจะมีการใช้ NLP ในวงการการเงินมากขึ้น โดยเฉพาะอย่างยิ่งเมื่อมีการ digitize การสื่อสารจากผู้บริหารหรือตัวแทนบริษัทให้กลายเป็นข้อมูลที่สมองกลเอาไปต่อยอดได้มากขึ้น อย่างไรก็ดี การใช้ NLP ยังไม่ใช่ทางออกแบบ “ม้วนเดียวจบ” เนื่องจากภาษาเป็นอะไรที่ค่อนข้างละเอียดอ่อนและเปลี่ยนแปลงไปตามบริบทของการสนทนา คำที่มีความหมายไม่ค่อยดีในบางเหตุการณ์ เช่น คำว่า “ป่วย” อาจไม่ได้มีความหมายที่เลวร้ายนักในการวิเคราะห์ conference call ของบริษัทในกลุ่มธุรกิจ health care ดังนั้นการทำ NLP ยังจำเป็นที่จะต้องได้รับการใส่ใจจากผู้เชี่ยวชาญครับ