สำหรับใครที่สนใจอยากเริ่มทำงานด้าน Data Science และเคยลองหาข้อมูลมาก่อน น่าจะเคยเห็นวงกลม 3 วงที่มาตัดกันเป็นความรู้สำหรับ Data Science รูปนี้ครับ ประกอบไปด้วย:
- Hacking – ความรู้ในการเขียนโปรแกรม
- Maths & Statistics – ความรู้ด้านคณิตศาสตร์
- Substantive – ความรู้ด้านธุรกิจ
เนื่องจากหลายคนเห็นแล้วเข้าใจผิดกับอาชีพ Data Scientist ว่าต้องรู้ทั้งหมดในรูปนี้ ถึงจะทำงานด้านนี้ได้
แต่ถ้าสังเกตุดี ๆ ตรงกลางวงกลม…
เค้าเขียนว่า “Data Science” ไม่ได้เขียนว่า “Data Scientist”
วีดิโอ: อธิบายสายอาชีพ Data Science และสกิลต่าง ๆ ที่ต้องเรียน
ส่วนหนึ่งของบทความนี้ แอดเคยเล่าให้ฟังส่วนหนึ่งในวีดิโอนี้แล้วครับ
Data Scientist กับ Data Science แตกต่างกันยังไง
วันก่อนแอดได้ฟัง Podcast ของ DataCamp ซึ่งสัมภาษณ์คุณ Drew Convay ซึ่งเป็นคนที่โพสเรื่องวงกลมนี้คนแรก จากการพูดคุยกับคนอื่น ๆ ใน NY (New York) Data Science Community ในปี 2010
คุณ Drew Convey เล่าให้ฟังว่าตั้งแต่เค้าโพสเรื่องนี้ไปในบลอคของเค้า ก็กลายเป็น Viral ที่มีคนพูดถึงเยอะมาก และมีคนเข้าใจผิดเยอะมากเช่นกันครับ
คนมักเข้าใจว่า การจะเป็น Data Scientist ต้องเก่งทั้ง Hacking, Maths & Statistics, และ Substantive
คุณ Drew Convey บอกว่า
“คนที่จะทำได้ครบทั้งหมดมันก็มี แต่ไม่ได้มีเยอะขนาดนั้น จริง ๆ แล้ววงกลมแต่ละอันในรูปนี้ คือ สกิลที่ทีม Data Science ควรมี”
Data Science หมายถึง การสร้างคุณค่าจากข้อมูลตั้งแต่ต้นจนจบ ซึ่งก็จะประกอบด้วยอาชีพต่าง ๆ ในสาย Data ได้แก่ Data Scientist, Data Analyst, และ Data Engineer
แต่ละอาชีพในสาย Data ต้องใช้ความรู้ด้านไหนกันบ้าง
Data Scientist – เน้น Maths & Statistics และมีความรู้ด้านธุรกิจในระดับหนึ่ง ความรู้โปรแกรมมิ่งมีก็ได้ (เป็นสาย Research) หรือมีก็ได้ (เป็นสายสร้าง Product)
Data Analyst – เน้นความรู้ด้านธุรกิจ ควรมีความรู้ด้าน Maths & Statistics บ้างเพื่อให้สามารถวิเคราะห์ข้อมูลได้ง่ายขึ้น ส่วนความรู้โปรแกรมมิ่งมีแค่ SQL ได้ประโยชน์มากแล้วครับ
Data Engineer – เน้นความรู้ด้านการเขียนโปรแกรม ถ้ามีความรู้ด้าน Maths & Statistics ก็จะสามารถช่วย Data Scientist ทำงานด้าน Machine Learning ได้ โดยเฉพาะการนำ ML Model ไปวางไว้ในระบบจริง
ทีม Data Science พอมีครบทุกด้านแล้ว ก็จะมีความรู้ทุกด้านในวงกลมนี้ สามารถนำความรู้มารวมกันเพื่อทำให้โปรเจค Data Science ประสบความสำเร็จได้นั่นเองครับ
ถ้าสนใจอ่านเพิ่มเติมเกี่ยวกับการทำงานในสาย Data Science สามารถอ่านได้เลยที่
ป.ล.ใครอยากเป็นอาชีพไหนกันบ้าง คอมเม้นท์ไว้ด้านล่างนี้ได้เลยครับ แอดจะได้จัดหาคอนเท้นด้านนี้มาให้อ่านกันมากขึ้นคร้าบ