เมื่อวันที่ 18 กรกฎาคมที่ผ่านมา ผมได้รับเกียรติจากตลาดหลักทรัพย์แห่งประเทศไทย
ให้ไปเป็น keynote speaker ในงาน IT Future for Capital Market โดยมีผู้เข้าฟังเป็นผู้บริหารทั้งในและนอกสายงาน IT จากหลายร้อยบริษัท
คงปฏิเสธไม่ได้ว่าทุกวันนี้คำว่า AI และ Big Data เป็นที่นิยมเหลือเกิน แต่ก็มีกังวลว่าเทคโนโลยีเหล่านี้จะถูกนำมาใช้งานและสร้างผลลัพธ์ต่อบริษัทอย่างจับต้องได้อย่างไร
ในตอนสุดท้ายของบทความนี้ผมจะสรุปอีก 2 บทเรียนสำคัญที่ผมคิดว่าน่าจะเป็นประโยชน์ต่อหลายๆ ท่านที่กำลังสร้างทีม data science หรือกำลังดูว่าบริษัทที่ท่านกำลังลงทุนอยู่ ดูท่าทีจะใช้ประโยชน์จากพลังของ Big Data ได้มากน้อยแค่ไหนในอนาคตครับ
สำหรับท่านที่ยังไม่ได้อ่านตอนที่ 1 เชิญอ่านได้ที่นี่ https://www.stock2morrow.com/article-detail.php?id=1620
บทเรียนที่ 3: ทิ้งความเชื่อผิดๆ เกี่ยวกับ Data Science
เนื่องจากคนที่เคยสัมผัสโปรเจกต์ data science และเหนื่อยรากเลือดคลุกคลีกับมันจริงๆ มีไม่มาก จึงเป็นธรรมดาที่จะเริ่มมีความเชื่อผิดๆ เกี่ยวกับ data science ออกมาตามความฮือฮาเกี่ยวกับพลังของ Big Data และ AI ในสื่อทั่วไป
ซึ่งเป็นเรื่องที่อันตรายเนื่องจากความเชื่อผิดๆ จะทำให้เราคาดหวังกับมันแบบผิดๆ และทำให้เราตัดสินใจใช้มันในรูปแบบที่อาจจะไม่เหมาะสมที่สุด
Myth#1 คือ “การมีข้อมูลและใช้ AI สามารถตอบได้ทุกอย่าง”
แม้จะดูเหมือนว่า AI จะเริ่มทำได้แล้วหลายอย่าง ไม่ได้แปลว่าควรใช้มันแก้ทุกอย่าง หลายปัญหาต้องการ solution ที่ low tech มีแค่บางปัญหาเท่านั้นที่คุ้มต้นทุนในการใช้ Big Data และ AI แก้
และถึงเป็นปัญหาที่ควรแก้ด้วย AI ก็ไม่ใช่ว่ามันจะฉลาดแก้ได้เหมือนยาวิเศษถึงขั้นที่เราโยนข้อมูลเข้าไปในกล่องแล้วจะได้คำตอบออกมาทันที ทุกอย่างมีที่มาที่ไป มีข้อมูลที่เป็นวัตถุดิบที่ดี และมีสถิติเป็นตัวสร้าง value
Myth#2 คือ “ข้อมูลควรแยกกันอยู่”
ที่มันแยกกันอยู่ทุกวันนี้ ส่วนหนึ่งเป็นเพราะว่าเจ้าของข้อมูลอยู่กันคนละที่ แต่อันที่จริงแล้วข้อมูลหลายๆ ประเภทจากหลายๆ สายงานควรถูกนำมารวมกันใน data warehouse หรือ data lake เพื่อป้องกันการทำงานซ้ำ การเสียเวลาขอข้อมูล การมีหลายเวอร์ชั่นของไฟล์ เนื่องจากพลังที่แท้จริงของ Big Data อยู่ที่การนำข้อมูลจากหลายๆ มิติมาวิเคราะห์ร่วมกัน
Myth#3 คือ “Big data เท่านั้นที่เราสน Small data ไม่มีประโยชน์”
แม้ว่าหลายคนจะให้ความสนใจไปที่ Big Data หรือข้อมูลขนาดใหญ่ เราไม่ควรมองข้ามข้อมูลขนาดเล็กหรือขนาดกลาง เนื่องจากถ้ามันเป็นข้อมูลที่ไม่เคยถูกนำมาใช้เลย ก็จะเป็นประโยชน์อย่างมากต่อองค์กร
แน่นอน ยิ่งใหญ่ยิ่งดี แต่คำว่า “Big” สำหรับผม ผมคิดว่ามันหมายถึง “Big Enough” หรือใหญ่พอที่เราจะมีความเชื่อมั่นในผลวิเคราะห์สถิติก็พอ
Myth#4 คือ “เราเชื่อการพยากรณ์โดย Machine Learning ได้ 100%”
แทบจะไม่มีอะไรในโลกสถิติที่มีโอกาสเกิดชึ้น 100% ขนาดทอยเหรียญให้ออกหัวก้อยยังไม่ 100% เลย (เพราะบางทีทอยแล้วหล่นกลางสันเหรียญ)
คุณภาพและความถูกต้องของการพยากรณ์โดย Machine Learning ขึ้นอยู่กับคุณภาพและปริมาณของข้อมูลกับคุณภาพของผู้วิเคราะห์ข้อมูล
คุณสามารถมีข้อมูลลูกค้าอันมหาศาลแต่หากผู้วิเคราะห์สร้างโมเดลผิดๆ ออกมา สิ่งที่โมเดลพยากรณ์ก็จะมีความผิดเพี้ยนไปจากโลกจริงอย่างน่าผิดหวัง
กลับกัน คุณอาจได้มือดีมาวิเคราะห์ข้อมูล แต่คุณกลับไม่มีข้อมูลคุณภาพให้หรือไม่มีทรัพยากรคอมพิวเตอร์ที่เหมาะสมให้กับเขา สุดท้ายก็จะพบกับการผิดหวังเช่นกัน
เพราะเบื้องหลังของ Machine Learning หรือกรรมวิธีการทำ predictive modeling อื่นๆ มีเพียงแค่หลักการสถิติ ข้อมูล และพลังในการคำนวนของคอมพิวเตอร์ ไม่มีเวทย์มนต์พิเศษใดๆ ทั้งสิ้น
บทเรียนที่ 4: ปัจจัยที่ทำให้โปรเจกต์ Big Data ประสบความสำเร็จ
การทำโปรเจกต์ Big Data เป็นงานที่มีรายละเอียดค่อนข้างมาก แต่ถ้าจะให้เลือกมาแค่ 2 ปัจจัยที่สำคัญที่สุดในการทำให้มัน “ปัง” ก็คือ
ปัจจัยที่ 1: การมีวิสัยทัศน์ตรงกันเกี่ยวกับการทำ Data Analytics
เนื่องจากการวิเคราะห์ข้อมูลเป็นกิจกรรมที่มีต้นทุนไม่น้อยและข้องเกี่ยวกับหลายๆ หน่วยงาน จึงมีความจำเป็นอย่างมากที่ผู้บริหารควรจะตกลงกันก่อนว่าบริษัทจะมีกิจกรรมนี้ไปเพื่ออะไร เช่น เพื่อเพิ่มยอดขายและลดต้นทุน หรือจะเพื่อคิดค้นนวัตกรรมใหม่ๆ
เมื่อเห็นตรงกันและมี buy-in ครบถ้วน การทำงานก็จะมีอุปสรรคน้อยลง มีเป้าหมายชัดเจนขึ้น และผลงานของทีม data science ก็มีโอกาสถูกนำไปใช้ประโยชน์จริงๆ มากขึ้น
ปัจจัยที่ 2: การบริหารทรัพยากรบุคคลในทีม data science
ทุกวันนี้ data scientist กำลังขาดตลาดอย่างรุนแรง ทว่าจริงๆ แล้วยังมีอีกหลายตำแหน่งที่ขาดไม่ได้เลยในการสร้างทีม data science ที่แข็งแกร่ง หนึ่งในนั้นคือ data engineer ผู้ปิดทองหลังพระ จะถือเป็นผู้เล่นสำคัญที่สุดในทีมเลยก็ว่าได้ เพราะเขาเป็นคนจัดระบบข้อมูลให้มีประสิทธิภาพและเช็คคุณภาพข้อมูลก่อนที่ทุกคนจะนำไปใช้
อีกหนึ่งปัญหาคือการ retain data scientists คนเก่งขององค์กร สองเหตุผลแรกๆ ที่ทำให้ data scientists หลายคนย้ายงาน คือ
หนึ่ง ข้อมูลไม่ได้ดีจริงและงานก็ไม่ได้ท้าทายจริง จริงอยู่ว่าเงินเดือนที่สูงย่อมเป็นตัวดึงดูดให้คนเก่งๆ เข้าหาคุณ แต่คนรุ่นใหม่ไฟแรงเหล่านี้ก็มองหาโอกาสในการท้าทายและฝึกฝนตนเองเหมือนกัน
และ สอง วัฒนธรรมที่ทำงานที่ไม่ตรงกับพวกเขา
วัฒนธรรมที่ว่านี้ “เชื่องช้าแต่เปลี่ยนบ่อย” จะขออะไรรอเป็นเดือน แต่เวลาเปลี่ยนโน่นเปลี่ยนนี่กลางโปรเจกต์จะเร็วมาก ทำให้พวกเขาอึดอัด
และวัฒนธรรมนี้ก็ “เชื่อใน seniority มากกว่า merit” ทำให้คนรุ่นใหม่รู้สึกว่าตนไม่ได้ถูก appreciate เท่ากับ value ที่ตนสร้าง อันนี้สำคัญเพราะผมมองว่าในอนาคต คนรุ่นใหม่เหล่านี้นั่นแหละที่จะเป็นผู้สร้าง value เกินครึ่งนึงของสิ่งที่บริษัทกำลังเอาออกมาขาย พวกเขาไม่ใช่แค่แรงงานธรรมดาๆ
สุดท้ายนี้ผมหวังว่าบทความนี้จะช่วยให้หลายๆ ท่านที่จะต้องข้องเกี่ยวกับการทำ data analytics มากขึ้นในอนาคต หรือกำลังศึกษาความพร้อมทางด้าน Big Data ของบริษัทที่ท่านกำลังทุนอยู่ เข้าใจถึงปัจจัยที่ทำให้มันรุ่งหรือล่มกันมากขึ้นนะครับ ไว้โอกาสหน้าผมจะมาขยายความเพิ่มในบางประเด็นครับ