ในตำแหน่งงานสาย Data นั้นมีมากมาย ไม่ว่าจะเป็น Data Scientist, Data Analyst, และ Data Engineer โดยเฉพาะในสองตำแหน่งอย่าง Data Scientist กับ Data Analyst ที่บางครั้งเนื้องานฟังดูมีความคล้ายคลึงกัน แต่ทั้งสองนี้ก็ไม่ซ้อนทับกันเสียทีเดียว
สำหรับใครที่สนใจสองงานนี้ แต่ยังไม่เห็นภาพถึงความเหมือนความแตกต่าง ในบทความนี้ เราจะมาอธิบายทั้งความเหมือนและความแตกต่าง โดยอ้างอิงข้อมูลจากคนที่ได้สัมผัสในเนื้องานของสองตำแหน่งนี้จริง ๆ
น้องเกิ้ล Data Analyst ที่เคยให้สัมภาษณ์กับทางเราไปก่อนหน้านี้เกี่ยวกับว่า Data Analyst ทำงานเกี่ยวกับอะไร และ คุณปั๊ฟ Data Scientist จาก Sertis ที่จะมาร่วมช่วยอธิบายตัวงานของ Data Analyst vs Data Scientist ให้เห็นภาพกันครับ
Data Scientist กับ Data Analyst ทำงานเกี่ยวกับอะไรบ้าง
Data Analyst ทำงานเกี่ยวกับอะไร
Data Analyst (DA) หรือ นักวิเคราะห์ข้อมูล เป็นงานที่นำข้อมูลของลูกค้ามาวิเคราะห์ให้เกิดประโยชน์ เช่น การหาข้อมูลธุรกิจเชิงลึก (ฺBusiness Insight) เพื่อนำไปสนับสนุนการติดสินใจ ต่อยอดในแผนกลยุทธ์ (Strategy) หรือแผนงานต่อ ๆ ไปตามความต้องการของลูกค้า
ซึ่งกว่าที่จะได้ข้อมูลเชิงลึกนั้น หลายครั้งข้อมูลที่ลูกค้าก็ไม่ได้เป็นระเบียบ ลูกค้าอาจจะนำข้อมูลก้อนใหญ่ ๆ มาให้เลยโดย DA ไม่สามารถนำไปวิเคราะห์ได้ทันที
จึงต้องมีการทำให้มันอยู่ในรูปแบบที่สะอาดและวิเคราะห์ได้ไวกว่าเดิม (กระบวนการทำให้ข้อมูลสะอาดขึ้นว่า เรียกว่า Data Wrangling, Data Transformation + Data Cleaning)
โดยการนำเสนอผลการวิเคราะห์นั้นต้องใช้ภาษาที่สื่อสารกับลูกค้าเข้าใจง่ายด้วย ถ้าพูดอะไรที่ตัวเองเข้าใจคนเดียว ลูกค้าก็จะงงและไม่อิน (หรือเค้าอาจจะเลิกฟังไปเลย ฮา) การสื่อสารจะมีทั้งในการนำเสนอเป็น Data Visualization เอาข้อมูลออกมาสร้างเป็นแผนภาพให้เข้าใจง่าย ๆ ครั้งไหนที่โจทย์มันยาก ต้องลงลึก เราก็อาศัย Model ทางสถิติมาช่วยหาคำตอบ
Data Scientist ทำงานเกี่ยวกับอะไร
Data Scientist (DS) หรือ นักวิทยาศาสตร์ข้อมูล การทำงานหลัก ๆ จะเป็นการวิเคราะห์ข้อมูลและนำมาพัฒนาเป็นโมเดล (Model) หรือเครื่องมือ (Tools) ที่ตอบโจทย์ทางธุรกิจ ช่วยในการตัดสินใจ โดยการวางกลยุทธ์ขององค์กร
อย่างที่ทำอยู่ในปัจจุบัน แบ่งเป็นสองส่วนหลัก ๆ คือการนำโมเดลมาวิเคราะห์และทำนายผล (Predictive Analytics) เช่น การพยากรณ์ยอดขายจากปัจจัยต่าง ๆ หรือใช้เป็นเครื่องมือที่ช่วยให้กระบวนการทำงานมีประสิทธิภาพมากขึ้น (Operations Optimization) เช่น การจัดตารางการผลิตสินค้า (Production Scheduling)
ทักษะที่ Data Analyst กับ Data Scientist ใช้ มีอะไรบ้าง?
ทั้งสองอาชีพนี้ มีทั้งทักษะที่ทับซ้อนและแตกต่างกันไป ตามรูปด้านล่างนี้เลย
ทักษะที่ Data Analyst และ Data Scientist ใช้ร่วมกัน
เช่น
- การนำข้อมูลเข้า/ปรับโครงสร้างก่อนนำไปวิเคราะห์ (Data ETL)
- ทักษะการเขียนโปรแกรม
- ความเข้าใจของธุรกิจลูกค้า
เรื่องของการเขียนโปรแกรม เช่น SQL, Python, R ซึ่งถือเป็นทักษะพื้นฐานสำหรับอาชีพสายข้อมูลในแทบทุกตำแหน่งอยู่แล้ว ส่วนความยากง่ายจะต่างกันขึ้นอยู่กับโจทย์ ตัวงาน และลักษณะข้อมูลที่นำมาใช้
เรื่องความเข้าใจธุรกิจของลูกค้า หากเราวิเคราะห์ข้อมูลลูกค้าไป แต่ไม่เข้าใจธรรมชาติธุรกิจลูกค้า มันจะไปต่อยอดการวิเคราะห์ได้ลำบาก ไม่เข้าใจ Trend ของ Data นั้น ๆ เช่น การจองของโรงแรมว่าทำไมเดือนนี้ยอดจองโรงแรมมันสูง ซึ่งถ้ามีความรู้เรื่องโรงแรมเราก็พอจะรู้ว่าปกติเดือนนี้มันคือ Seasonality ยอดขึ้นสูงเป็นเรื่องปกติ
ทักษะเรื่องคณิตศาสตร์ Maths / Statistics
องค์ความรู้เรื่องตัวเลข จำพวกสถิติ ความตื้นลึกจะต่างไปตามเนื้องานของแต่ละคน อย่างเช่น DA ที่ไม่ใช่ สาย Statistics Specialist อย่างน้องเกิ้ล (Data Analyst) อาจไม่ได้ลงทฤษฎี Stat มาก แต่ต้องเข้าใจไอเดียของ Descriptive Statistics เบื้องต้น อย่างการหา Growth หา Metrics ดี ๆ ที่เอาไปใส่ใน Insight หรือ Dashboard แล้วมันทรงพลังหรือก็คือเป็น Metrics ที่สามารถสร้างความหมายให้ลูกค้า
ส่วน DS จะมีการใช้ Statistics และ Probability ในการวิเคราะห์ ทำความเข้าใจข้อมูล ไปจนถึงความเข้าใจการทำงานและผลลัพธ์จากโมเดล เพื่อทำให้สามารถสร้าง Feature จากข้อมูลได้อย่างเหมาะสม สามารถนำไปปรับปรุงโมเดลให้ทำงานได้ดียิ่งขึ้นได้
ทักษะ Data Visualization
DA จะมีการใช้ Data Visualization มากกว่า เอาไปทำใส่สไลด์ลูกค้า หรือเอาไปทำเป็น Automated Dashboard ที่อัพเดตทุกวันให้ลูกค้าได้เช็คตัวเลขที่อัพเดตใหม่ทุกวัน
ส่วน Visualization ของ DS ก็มีทำบ้าง โดยจะทำในช่วงของ EDA (Exploratory Data Analysis) เพื่อดูลักษณะ Pattern และ Trend ข้อมูลว่าไปในลักษณะไหน
หากสนใจอยากรู้เรื่อง Data Visualization เพิ่มเติมว่าเค้าทำกันยังไง แนะนำให้อ่าน บทสัมภาษณ์กับทีมงาน Boonmee Lab ผู้เชี่ยวชาญ Data Visualization ในไทย เลยนะครับ
ทักษะ Business Domain Expertise (ความเข้าใจธรรมชาติธุรกิจของลูกค้า)
เป็นทักษะที่สองตำแหน่งใช้ทั้งคู่แต่โจทย์ที่ DA ได้รับส่วนใหญ่จะลงเชิงลึกในทางธุรกิจมากกว่า เลยต้องอาศัยความเข้าใจธุรกิจของลูกค้าเป็นพิเศษ
ในส่วนของ DS เนื่องจากทาง DS จะเน้นการสร้างโมเดลหรือเครื่องมือเพื่อนำไปช่วยในธุรกิจ เราจำเป็นต้องเข้าใจกระบวนการทำงาน และความต้องการของลูกค้าเพื่อที่จะนำเสนอ Solution ที่เหมาะสมให้นำไปใช้งานจริงให้เกิดประโยชน์สูงสุด
นอกจากนั้น เนื่องจากข้อมูลส่วนใหญ่จะมาจากข้อมูลทางธุรกิจของลูกค้า การที่เรามีความเข้าใจเชิงธุรกิจมากขึ้น จะทำให้เราสามารถประยุกต์ใช้องค์ความรู้ในการวิเคราะห์ พัฒนา Feature และพัฒนาโมเดลให้ดีขึ้นได้
ทักษะการทำงานกับข้อมูลแบบต่าง ๆ (Data Structure)
หน้าตาข้อมูลส่วนมากที่ DA เอามาใช้วิเคราะห์จะเป็น Structured Data เสียมากกว่า กล่าวคือเป็นข้อมูลที่เก็บอยู่ในรูปตาราง เช่นข้อมูลบน Excel หรือข้อมูลเทเบิลใน Database
ส่วน DS จะมีการใช้ข้อมูลทั้งที่เป็น Structured Data เช่นเดียวกับ DA แต่ก็จะมีโจทย์ที่เกี่ยวข้องกับ Unstructured Data เช่น ข้อมูลเสียง ข้อมูลเอกสาร ที่ไม่ได้อยู่ในรูปเทเบิลปกติด้วยเช่นกัน
ทักษะใดที่ Data Scientist ใช้กันเป็นหลัก?
ที่เห็นได้ชัดเจน จะเป็นสกิลเกี่ยวกับ Machine Learning เนื่องจากงานที่ DS ทำนั้นเกี่ยวของโดยตรงกับการเลือกใช้โมเดลรูปแบบต่าง ๆ และการพัฒนาโมเดลที่เหมาะสมกับข้อมูล
นอกจากนั้นยังมี Mathematics กับ Algorithm ที่นำมาใช้ในการแปลงข้อมูล ทำความเข้าใจและปรับปรุงโมเดล รวมไปถึงว่าในบางครั้งอาจมีการใช้ Algorithm อื่นๆ ที่ไม่ใช่ Machine Learning เช่น Search Algorithm มาใช้ในโจทย์ที่เกี่ยวข้อง
และสุดท้ายก็เป็นในส่วนของ Software Engineering เนื่องจากโมเดลที่พัฒนาขึ้นจะนำไปใช้จริงในระบบการทำงานจริง หรือประกอบกับเครื่องมืออื่น ๆ ทางธุรกิจ
อย่างไรก็ตาม ระดับสกิลเหล่านี้ในแต่ละงาน แต่ละโปรเจค ก็จะมีความแตกต่างกันออกไป
สรุป สิ่งที่ต้องเรียนรู้ของ Data Analyst VS Data Scientist
จากรูปและข้อมูลด้านบน เราสามารถสรุปออกมาได้ดังนี้
ทักษะของ Data Analyst
- Data Visualization
- การหาข้อมูลเชิงลึก (Insights)
- ความเข้าใจในอุตสาหกรรม (Business Domain)
- ทำงานกับข้อมูล Structured Data
- การสื่อสาร และการพรีเซ้นท์
ทักษะของ Data Scientist
- ความรู้วิศวกรรมซอฟแวร์ (Software Engineering)
- Machine Learning
- การตามหา Pattern ในข้อมูล
- ทำงานกับข้อมูล Structured Data และ Unstructured Data
- คณิตศาสตร์ Algebra & Calculus
ทักษะของทั้ง DA และ DS
- การดึงข้อมูลมาใช้งาน (ETL)
- ความรู้คณิตศาสตร์ (Maths)
- ความรู้ธุรกิจ
- การเขียนโปรแกรม
ตัวอย่างโปรเจคของ Data Analyst VS Data Scientist
หลังจากที่เราเข้าใจภาพรวมคร่าว ๆ ของตัวงานกับทักษะที่ต้องใช้ของสองตำแหน่งกันแล้ว
เพื่อให้ผู้อ่านเห็นภาพมากขึ้น เรามาลงลึกในตัวงานที่ทำจริง ๆ บ้างดีกว่า
มาดูกันว่า เมื่อมีลูกค้าติดต่องานเข้ามาในบริษัท แต่ละตำแหน่งจะได้รับ Requirement และ Request ลักษณะไหน ลูกค้าอยากให้แก้ปัญหาอะไร แล้วเราต้อง Deliver ตัวงานอะไรให้เค้าบ้าง
โปรเจคของ Data Analyst
โดยทั่วไป ในกรณีของ DA ลูกค้ามี Data ก้อนนึง เค้าอยากให้ทีมช่วยเอาข้อมูลมาหาข้อมูลเชิงลึก ไม่ว่าจะหา Sales Performance, Trend, วิเคราะห์กลุ่มลูกค้าและพฤติกรรมของกลุ่ม (Customer Segment)
ซึ่งส่วนใหญ่ DA อย่างน้องเกิ้ลจะใช้ SQL ในการทำ Data Wrangling เพื่อให้ได้ Table ที่กระชับ ไม่หน่วง เอาไปต่อกับ Visualization Tool เช่น Tableau, Power BI
Solution ที่ส่งให้ลูกค้าส่วนใหญ่มักเป็น Insight กล่าวคือนำ Insight ที่ได้ไปเสนอภาพรวมที่ผ่านมารวมถึง Recommendation ที่น่าสนใจ ซึ่งบางครั้งก็เป็นโจทย์แบบ One-time หรือ Monthly
และถ้าเป็น Dashboard ส่วนใหญ่จะทำเป็น Automated กล่าวคือมีการอัพเดตข้อมูลแบบ Daily หรือ Monthly นั่นเอง
โปรเจคของ Data Scientist
เนื่องด้วยโจทย์ทางฝั่ง DS อาจจะมีหลายแบบ และอาจแบ่งเป็นสองส่วนหลัก ๆ คือ การสร้างโมเดลเพื่อพยากรณ์ผล กับการสร้างเครื่องมือมาช่วยในกระบวนการทำงาน
ซึ่งตัวงานในส่วนแรก จะเกี่ยวข้องกับการนำข้อมูลมาวิเคราะห์หา Trend หา Pattern รวมถึงแปลงข้อมูลเป็น Feature สำหรับนำไปเทรนโมเดลที่จะเรียนรู้ Pattern จาก Historical Data และทำนายผล (ถ้าสนใจด้านนี้ ศึกษาเพิ่มเติมได้จาก บทความสอน Time Series Forecasting แบบละเอียด ได้เลยนะครับ) หรือจำแนกประเภทตามที่กำหนด ซึ่งผลลัพธ์จากโมเดลจะนำไปใช้ Support การตัดสินใจและวางกลยุทธ์เชิงธุรกิจ
ในอีกส่วนนึงที่เกี่ยวข้องกับ Optimization หรือ Automation นั้น จะเป็นการสร้างเครื่องมือหรือ Application ที่เป็น Machine Learning Model หรือ Algorithm อื่นๆ เพื่อลด Manual Work, Human Effort ในกระบวนการทำงาน ซึ่งเห็นได้ว่า Core Deliverables ส่วนใหญ่จะเป็นในรูปแบบ Tools หรือ Application นั่นเอง
สรุป Data Analyst กับ Data Scientist แตกต่างกันอย่างไร
จากที่กล่าวมาข้างต้นทั้งหมดนี้ แม้ว่าทั้งสองตำแหน่งจะมีความคล้ายคลึงกันในทั้งชื่อและการทำงาน แต่คงทำให้ผู้อ่านสามารถแยกถึงความแตกต่างของทั้งสองตำแหน่งได้แล้ว
และหากผู้อ่านท่านใดต้องการจะไปต่อยอดในสายงานนี้ ก็คงสามารถตอบตัวเองได้ในระดับหนึ่งแล้วว่าต้องการต่อยอดไปในทิศทางใด ทั้งนี้เนื่องจากสายงาน Data มีความกว้างขวาง และธรรมชาติของเนื้องานในตำแหน่งแต่ละที่นั้นไม่เหมือนกัน รายละเอียดตัวงานและทักษะในบทความนี้จึงเป็นเพียงส่วนนึงของบริษัทนึง
หากท่านผู้อ่านสนใจในตำแหน่งใดของบริษัทใด สามารถศึกษา Job Description ของตำแหน่งนั้น ๆ อีกทีเพื่อเช็คอีกครั้งว่าเป็นตำแหน่งที่ตรงกับความต้องการหรือไม่
และหากใครมีความสงสัยหรืออยากทำความรู้จักในตัวงานเพิ่มเติม สามารถติดต่อน้องเกิ้ล [Linkedin] เพื่อพูดคุยขอคำแนะนำเกี่ยวกับงานของ Data Analyst ซึ่งน้องเกิ้ลเคยเล่าให้กับทาง DataTH ไปแล้วครั้งนึงเกี่ยวกับอาชีพ Data Analyst ด้วยนะ คลิกอ่านได้ด้านล่างนี้เลย
และสามารถติดต่อคุณปั๊ฟ [Linkedin] สำหรับงาน Data Scientist (ทางเขาแนะนำมาว่าถ้าทักหรือจะแอดไปหา ใส่ใน message ตอนแอดหน่อยว่ามาจาก DataTH 555)
สุดท้ายนี้ ถ้าสนใจสายอาชีพด้านไหนของ Data แนะนำให้ลองอ่าน บทสัมภาษณ์คนทำงานสาย Data อื่น ๆ ในเว็บ DataTH ของเราเพิ่มเติมได้เลย อ่านสนุกและได้ความรู้กันแน่นอน หรืออยากรู้ด้านไหนเพิ่มเติมก็มาติดตามกันใน Facebook เพจ DataTH ได้เลย จะมีบทความอัพเดทใหม่ให้อ่านกันตลอดทุกสัปดาห์
(ขอบคุณรูปประกอบสวย ๆ ในบทความนี้ จาก Freepik Stories)