คำ ๆ หนึ่งที่ผมคิดว่าเป็น Buzzword แห่งปี ที่คนใช้กันเยอะมาก และส่วนใหญ่ขาดความเข้าใจถึงความหมายจริง ๆ ของมัน คือคำว่า “Data Science” ครับ เรามาดูกันว่า Data Science คืออะไร ? แล้วต่างกับอีกคำที่คนใช้บ่อย ๆ ว่า “Machine Learning” ยังไงบ้าง
ผมก็เป็นคนหนึ่งที่สงสัยและไม่มั่นใจว่า Data Science มันหมายความว่าอะไรกันแน่ จนมาเรียนวิชา Introduction to Data Science ก็เลยได้ข้อสรุปที่น่าพอใจดังนี้ครับ
Data Science คืออะไร
Data Science หมายถึง การนำข้อมูลมาใช้ประโยชน์ เพื่อค้นหาสิ่งที่เราไม่รู้ (หรือเรียกแบบดูดีว่า Insights) นั่นเองครับ
ซึ่งแน่นอนว่าความหมายด้านบนฟังดูกว้างมาก จริง ๆ มันก็กว้างแบบนั้นแหละครับ คำว่า Data Science ครอบคลุมทุกอย่างที่เป็นขั้นตอนในการนำข้อมูลมาใช้ประโยชน์ เช่น:
Data Mining คือ การเอาข้อมูลในอดีตมาค้นหาแบบแผน (Pattern) เพื่อนำไปใช้ทำนายผล (Predict) ในอนาคต ตัวอย่างง่าย ๆ เลยก็คือ การนำข้อมูลการซื้อขายในอดีตมาทำนายว่าอนาคตอะไรจะขายดีในช่วงไหน
ตัวอย่างข้างต้นเป็น Summer Project ที่ผมทำในช่วงปิดเทอมนี้ด้วยครับ เดี๋ยวถ้าโปรเจคจบล่ะคงได้มาเล่าให้ฟังว่าทำอะไรไปบ้าง ได้ความรู้เยอะมากฮะ
Data Analysis คือ การวิเคราะห์ข้อมูลโดยใช้เทคนิคต่าง ๆ เพื่ออธิบายข้อมูล คำนี้เป็นคำที่ค่อนข้างกว้างเหมือนกันครับ เทคนิคต่าง ๆ ที่ใช้ ก็เช่น เราอาจจะลองพลอตกราฟ (Data Visualization) หรือเอาไปรัน Clustering พวกนี้สามารถเรียกว่าทำ Data Analysis ได้ทั้งหมดครับ
แล้ว Machine Learning คืออะไร
ในการทำ Data Science หรือ การเอาข้อมูลมาใช้ประโยชน์ เนี่ย เราไม่สามารถวิเคราะห์ข้อมูลได้ด้วยตาคนอย่างเดียวครับ ไม่ต้องถึงกับ Big Data แค่คนกรอกบัญชีลง Excel ก็พลาดได้ง่าย ๆ แล้ว (ถ้าอยากฟัง เดี๋ยวมาเล่าให้ฟังทีหลังว่า Big Data คืออะไรนะฮะ)
ด้วยเหตุผลข้างต้น เราเลยเอาคอมพิวเตอร์มาช่วย โดย Machine Learning หมายถึง การทำให้คอมพิวเตอร์สามารถเรียนรู้ด้วยตัวเองได้ !
ตัวอย่างการใช้ Machine Learning ที่เราเห็นได้ในข่าวล่าสุด ก็เช่น AlphaGo คอมพิวเตอร์เล่นโกะสุดเมพที่ชนะเซียนโกะทั่วโลกมาแล้วมากมาย อันนี้นอกจาก Machine Learning จะมีคำว่า Deep Learning มาด้วย ซึ่งขอไปศึกษาแพรพเดี๋ยวมาเล่าให้ฟังนะฮะ
หรือลองมาดูตัวอย่าง Machine Learning แบบเก๋ ๆ เอาคอมมาเรียนรู้วิธีเล่น Mario จนสามารถเล่นผ่านด่านได้ง่าย ๆ โดยไม่ต้องถอยหลัง แบบนี้
ส่วนในธุรกิจมีการนำ Machine Learning ไปใช้กับระบบต่าง ๆ มากมาย อาทิ:
- Credit Scoring (เอาไว้ให้คะแนนคนที่มาขอสินเชื่อ ว่าเค้าจะโกงมั้ย)
- Web Search (Google นั่นไง Product เค้ามี ML เต็มเลย)
- Recommender System (ระบบแนะนำสินค้าน่าซื้อ เช่น เวลาเราชอปใน Amazon จะเจอส่วนที่บอกว่าคนซื้อชิ้นนี้จะซื้อชิ้นนี้ด้วย)
- Spam Filter (ระบบป้องกันแสปมใน Email)
- ฯลฯ
บทความนี้ตีพิมพ์ครั้งแรกใน ByPerth
ขอบคุณข้อมูลบางส่วนจาก AnalyticsVidhya