คนมักเข้าใจผิดว่า ถ้าอยากเป็น Data Scientist ต้องเก่ง 3 สิ่งนี้

Share on facebook
Share on twitter
Share on linkedin

สำหรับใครที่สนใจอยากเริ่มทำงานด้าน Data Science และเคยลองหาข้อมูลมาก่อน น่าจะเคยเห็นวงกลม 3 วงที่มาตัดกันเป็นความรู้สำหรับ Data Science รูปนี้ครับ ประกอบไปด้วย:

data science venn diagram 1
Data Science Venn Diagram จากบลอคของคุณ Drew Convey
  1. Hacking – ความรู้ในการเขียนโปรแกรม
  2. Maths & Statistics – ความรู้ด้านคณิตศาสตร์
  3. Substantive – ความรู้ด้านธุรกิจ

เนื่องจากหลายคนเห็นแล้วเข้าใจผิดกับอาชีพ Data Scientist ว่าต้องรู้ทั้งหมดในรูปนี้ ถึงจะทำงานด้านนี้ได้

แต่ถ้าสังเกตุดี ๆ ตรงกลางวงกลม…

เค้าเขียนว่า “Data Science” ไม่ได้เขียนว่า “Data Scientist”

Data Scientist กับ Data Science แตกต่างกันยังไง

วันก่อนแอดได้ฟัง Podcast ของ DataCamp ซึ่งสัมภาษณ์คุณ Drew Convay ซึ่งเป็นคนที่โพสเรื่องวงกลมนี้คนแรก จากการพูดคุยกับคนอื่น ๆ ใน NY (New York) Data Science Community ในปี 2010

คุณ Drew Convey เล่าให้ฟังว่าตั้งแต่เค้าโพสเรื่องนี้ไปในบลอคของเค้า ก็กลายเป็น Viral ที่มีคนพูดถึงเยอะมาก และมีคนเข้าใจผิดเยอะมากเช่นกันครับ

คนมักเข้าใจว่า การจะเป็น Data Scientist ต้องเก่งทั้ง Hacking, Maths & Statistics, และ Substantive

คุณ Drew Convey บอกว่า

“คนที่จะทำได้ครบทั้งหมดมันก็มี แต่ไม่ได้มีเยอะขนาดนั้น จริง ๆ แล้ววงกลมแต่ละอันในรูปนี้ คือ สกิลที่ทีม Data Science ควรมี”

Data Science หมายถึง การสร้างคุณค่าจากข้อมูลตั้งแต่ต้นจนจบ ซึ่งก็จะประกอบด้วยอาชีพต่าง ๆ ในสาย Data ได้แก่ Data Scientist, Data Analyst, และ Data Engineer

แต่ละอาชีพในสาย Data ต้องใช้ความรู้ด้านไหนกันบ้าง

data engineer scientist analyst corporate  job career
ความต้องการของอาชีพสาย Data ในองค์กร จากบทความ Data Scientist vs Data Engineer

Data Scientist – เน้น Maths & Statistics และมีความรู้ด้านธุรกิจในระดับหนึ่ง ความรู้โปรแกรมมิ่งมีก็ได้ (เป็นสาย Research) หรือมีก็ได้ (เป็นสายสร้าง Product)

Data Analyst – เน้นความรู้ด้านธุรกิจ ควรมีความรู้ด้าน Maths & Statistics บ้างเพื่อให้สามารถวิเคราะห์ข้อมูลได้ง่ายขึ้น ส่วนความรู้โปรแกรมมิ่งมีแค่ SQL ได้ประโยชน์มากแล้วครับ

Data Engineer – เน้นความรู้ด้านการเขียนโปรแกรม ถ้ามีความรู้ด้าน Maths & Statistics ก็จะสามารถช่วย Data Scientist ทำงานด้าน Machine Learning ได้ โดยเฉพาะการนำ ML Model ไปวางไว้ในระบบจริง

ทีม Data Science พอมีครบทุกด้านแล้ว ก็จะมีความรู้ทุกด้านในวงกลมนี้ สามารถนำความรู้มารวมกันเพื่อทำให้โปรเจค Data Science ประสบความสำเร็จได้นั่นเองครับ

ถ้าสนใจอ่านเพิ่มเติมเกี่ยวกับการทำงานในสาย Data Science สามารถอ่านได้เลยที่ 3 ขั้นตอนสู่การทำงาน Data Science

ป.ล.ใครอยากเป็นอาชีพไหนกันบ้าง คอมเม้นท์ไว้ด้านล่างนี้ได้เลยครับ แอดจะได้จัดหาคอนเท้นด้านนี้มาให้อ่านกันมากขึ้นคร้าบ

Join the Conversation

1 Comment

Leave a comment

อ่านจบแล้วอยากพูดคุยต่อ? พิมพ์ไว้ตรงนี้ได้เลย แอดมาอ่านทุกอันครับ