สำหรับคนที่ทำงานด้านสาย Data อยู่แล้ว ก็คงคุ้นเคยกันดีกับ Data Analytics หรือการวิเคราะห์ข้อมูลจำนวนมากเพื่อนำมาใช้ต่อยอดในการขาย รวมถึงการพัฒนาสินค้าและบริการให้ดียิ่งขึ้น
วันนี้ DataTH จะพูดถึงความเป็นมาของ Data Analytics ว่าเกิดขึ้นมาได้อย่างไร และยกตัวอย่างเครื่องมือ Data Analytics ที่น่าสนใจมาให้ได้ศึกษากัน
Data Analytics คืออะไร?
Data Analytics คือ การวิเคราะห์ข้อมูลอย่างเป็นระบบ ตั้งแต่การจัดเก็บข้อมูล การตรวจสอบ การส่งต่อข้อมูล ตลอดจนไปถึงการนำข้อมูลมาวิเคราะห์เพื่อให้ได้สิ่งที่ต้องการ และช่วยในการตัดสินใจทางธุรกิจ
โดยที่ระบบ Data Analytics จะช่วยทำให้การสรุปข้อมูลเป็นไปได้อย่างง่ายดายมากยิ่งขึ้น
นอกจากนี้แล้ว Data Analytics สามารถช่วยทำให้เราสามารถเอาข้อมูลที่มีมาใช้ประกอบการตัดสินใจทางธุรกิจได้ เช่น
- ใช้ข้อมูลในการประกอบการตัดสินใจทางธุรกิจ
- การวัดผลทางธุรกิจ
- การทดลองทั้งภายในและภายนอกบริษัท
- ค้นหาข้อผิดพลาดที่เกิดขึ้นบ่อย ๆ ในการทำงานหรือการเก็บข้อมูล
- ค้นหารูปแบบการทุจริตของมิจฉาชีพ
- พัฒนาสินค้าและบริการให้ตรงตามความต้องการของกลุ่มเป้าหมาย
ต่อไปเราจะมาดูกันว่าขั้นตอนของการทำ Data Analytics เป็นอย่างไรบ้าง ก่อนที่เราจะไปดูประวัติความเป็นมาของเครื่องมือเหล่านี้กัน
ขั้นตอนการทำ Data Analytics
ไม่ว่าจะเป็นการทำ Data Analytics ด้วยการใช้เครื่องมือแบบไหน ก็จะมีส่วนประกอบที่เหมือนกัน ตั้งแต่การจัดเก็บข้อมูล ไปจนถึงการแสดงผลข้อมูลตามที่ต้องการ โดยมีส่วนประกอบหลัก ๆ ดังนี้
- กำหนดปัญหา (Define problems) – ทำความเข้าใจเกี่ยวกับธุรกิจก่อนว่าเราจะเก็บข้อมูลไปทำอะไร เพื่อจุดประสงค์ใด เอาไปพัฒนาในด้านไหนบ้าง
- กำหนดข้อมูล (Define datas) กำหนดว่าจะต้องเก็บข้อมูลอะไรบ้าง เพื่อนำมาวิเคราะห์ต่อให้ตรงตคามปัญหาหรือเป้าหมายที่ตั้งไว้
- จัดเก็บข้อมูล (Collection) ไม่ว่าจะเป็นจากการจดบันทึก ข้อมูลจาก Databases ข้อมูลจากชีตการทำงาน เว็บไซต์ แอปพลิเคชันหรือแหล่งข้อมูลอื่น ๆ ซึ่งสามารถขอความช่วยเหลือจาก Data Engineer ได้ในส่วนนี้
- จัดกลุ่มข้อมูล (Grouping) หรือการทำความสะอาดข้อมูล เป็นการนำข้อมูลที่มีอยู่มาจัดให้เป็นระเบียบมากยิ่งขึ้นตามข้อกำหนด ช่วยทำให้สามารถนำข้อมูลไปใช้งานต่อได้ง่ายขึ้น เช่น แบ่งตามเวลาการใช้งาน แบ่งตามอายุ หรือแบ่งตามยอดซื้อสินค้า
- การวิเคราะห์ข้อมูล โดยจะมีการคำนวณข้อมูล (Calculating), เชื่อมโยงข้อมูล (Joining), การเปรียบเทียบข้อมูล (Comparing) และการคัดกรองข้อมูล (Filtering) เป็นการคัดเอาแค่ข้อมูลที่สนใจหรือต้องการใช้ออกมาจากข้อมูลจำนวนมาก ทำให้ได้ข้อมูลที่เกี่ยวข้องอย่างชัดเจน มองเห็นข้อมูลเชิงลึกได้ดีขึ้น
- แสดงผลข้อมูลในรูปแบบของภาพ (Visualization) เป็นการแสดงผลข้อมูลแบบกราฟิกเพื่อช่วยทำให้ผู้อ่านสรุปข้อมูลเข้าใจได้มากขึ้น ไม่ว่าจะเป็นแผนภูมิ กราฟ แผนที่หรือแดชบอร์ด เพื่อแชร์ข้อมูลให้กับคนหรือทีมที่ต้องการ
- ตัดสินใจ (Decision) เมื่อได้ข้อมูลเชิงลึกมาแล้ว ก็สามารถนำไปใช้ในการตัดสินใจทางธุรกิจต่อไปได้
เมื่อรู้ถึงการทำ Data Analytics ไปแล้ว เราจะพาทุกคนมาดูกันว่าเครื่องมือในการทำ Data Analytics มีต้นกำเนิดมาจากอะไร ทำไมถึงกลายเป็นที่นิยมในปัจจุบันนี้
วิวัฒนาการของเครื่องมือ Data Analytics
ถ้าคุณเป็นบริษัทที่มีการเก็บข้อมูลเป็นจำนวนมาก แต่ไม่มีระบบที่ช่วยจัดการข้อมูล สิ่งที่มักจะเกิดขึ้นคือความผิดพลาดในการบันทึกข้อมูล การเสียเวลาในการจัดการข้อมูลด้วยตัวเอง ซึ่งเป็นสิ่งที่เกิดขึ้นในช่วงแรกของยุคแห่งการเก็บข้อมูล ทำให้มีการพัฒนาระบบจัดเก็บและวิเคราะห์ข้อมูลออกมาใช้กันอย่างแพร่หลายมากขึ้น
หากพูดถึงวิวัฒนาการของ Data Analytics และเครื่องมือต่าง ๆ แล้ว เราจะแบ่งออกได้เป็น 4 ช่วงใหญ่ ๆ ด้วยกัน ได้แก่
Analytics 1.0 วิเคราะห์ข้อมูลด้วยการทำมือล้วน ๆ
สำหรับยุค 1.0 นี้จะเป็นช่วงที่ระบบฐานข้อมูลมีความซับซ้อนสูง จะต้องมีโปรแกรมเมอร์คอยดึงข้อมูลให้ และต้องเอาข้อมูลมาวิเคราะห์ต่อในเครื่องมือทำเอกสารเช่นพวก Spreadsheets ต่าง ๆ
ข้อเสียของการวิเคราะห์ข้อมูลในสมัยนั้นคือความยุ่งยากในการสื่อสาร เมื่อมีคนต้องการข้อมูล จะต้องไปขอให้โปรแกรมเมอร์เป็นคนดึงข้อมูลให้ แล้วเอามาวิเคราะห์ มาทำกราฟแสดงผลต่อ ทำให้มีความผิดพลาดสูง ใช้เวลานานในการสื่อสารและการดึงข้อมูล
ทำให้เหล่าโปรแกรมเมอร์หาวิธีทำงานให้น้อยลง จนเข้าสู่ช่วง Analytic 2.0 ที่เริ่มมีการใช้ระบบเข้ามาช่วยทำงานมากขึ้น
ทำไม Analytics 1.0 ถึงไม่ได้ไปต่อ?
- เพราะยุ่งยากในการเก็บและดึงข้อมูล ใช้เวลาเยอะ
- เกิดความผิดพลาดในการสื่อสารกันบ่อยระหว่างคนที่ต้องการข้อมูลกับ Developper ที่ต้องดึงข้อมูลให้
- เสียเวลาในการปรับแก้ไขข้อมูลไปมา เพราะคนดึงข้อมูลก็ไม่รู้ว่าจะต้องดึงอะไรมาบ้าง บางทีก็ดึงมาเยอะแยะไปหมด
Analytics 2.0 จุดเริ่มต้นของระบบ Data Analytics
ต่อมาเป็นช่วงที่มีการใช้ระบบเข้ามาช่วยในการทำงานของการเก็บข้อมูลและประมวลผลข้อมูล ทำให้มีตำแหน่ง Business Intelligence (BI) เกิดขึ้น โดยมีหน้าที่ทำความสะอาดข้อมูล จัดรูปแบบข้อมูล นำเข้า Data wearhouse แล้วก็เอาข้อมูลมาประมวลผล ทำเป็นกราฟ
ทำให้ผู้ที่ต้องการข้อมูลไม่ต้องไปขอข้อมูลจาก Developers แล้ว ให้ไปขอที่ BI แทน ได้ข้อมูลเร็ว ลดการสื่อสารลง แถมยังได้ข้อมูลที่มีคุณภาพมากขึ้น มีความผิดพลาดน้อยลงอีกด้วย
แต่ก็ยังต้องใช้คนทำการเก็บและจัดเก็บข้อมูลอยู่ดี จนทำให้เกิดยุคต่อไป
สรุปข้อดีของยุค Analytics 2.0
- มีตำแหน่ง BI ที่เข้ามาช่วยจัดการข้อมูลให้เป็นระเบียบมากขึ้น
- ดึงข้อมูลออกมาใช้ได้ง่ายขึ้น มีความแม่นยำมากขึ้น
- Developer ไม่ต้องวุ่นวายกับการดึงข้อมูลแล้ว มีเวลาไปทำอย่างอื่น
สรุปข้อเสียของยุค Analytics 2.0
- ยังคงเสียเวลากับการสื่อสารอยู่ เพราะคนที่จะเอาข้อมูลอาจจะกลับมาขอเพิ่มเติม ขอแก้บางส่วน ทำให้ใช้เวลานาน
- เกิดความผิดพลาดในการเก็บและดึงข้อมูล เพราะ BI จะต้องเป็นคนจัดการทั้งหมด
- ใช้เวลานานในการจัดข้อมูล เพราะใช้แรง BI ล้วน ๆ
Analytics 3.0 ยุคทองของ Data Engineer
ถ้าดูจาก Analytics 2.0 จะพบว่างานทางด้านซ้ายมือที่เกี่ยวข้องกับการดูแลข้อมูลนั้น สามารถถูกพัฒนาและรวบรัดได้อีก จนทำให้เข้าสู่ยุครุ่งเรืองของ Data Engineer ที่เข้ามาสร้าง Pipeline ในการทำงานกับข้อมูลให้ง่าย สะดวกและเป็นระบบมากยิ่งขึ้น
ในยุคนี้มีการพัฒนาการทำงานให้ง่ายและสะดวกมากขึ้น ลดการใช้แรงงานคน แล้วใช้ระบบเข้ามาทำงานมากขึ้น
แต่สุดท้ายแล้ว เวลาที่มีพนักงานต้องการข้อมูล ก็จะต้องเสียเวลามาสื่อสารกับทีม Data อีกครั้ง อาจจะต้องการแก้ไขข้อมูลที่ได้ ซึ่งทำให้เสียเวลา จนทำให้เกิดเป็น Analytics 4.0 ในที่สุด
สรุปข้อดีของยุค Analytics 3.0
- มี Data Pipeline ที่เข้ามาช่วยทำให้การจัดการข้อมูลง่ายและสะดวกมากยิ่งขึ้น
- มี DE ที่เข้ามาช่วยดูแลระบบการจัดการข้อมูล ทำให้ใช้ระบบอัตโนมัติในการจัดการมากขึ้น
- ใช้เวลาในการจัดเก็บและประมวลผลข้อมูลน้อยลง
สรุปข้อเสียของยุค Analytics 3.0
- เนื่องจากคนที่ใช้ข้อมูลไม่ใช่คนที่ดึงข้อมูลเอง เลยทำให้เกิดปัญหาเรื่องการสื่อสารเหมือนเดิม
Analytics 4.0 ระบบใช้งานง่าย (Self-Service Data Analytics)
เนื่องจากปัญหาการสื่อสารและการส่งต่อข้อมูลที่ไม่ถูกต้องตามความต้องการ จึงเริ่มมีการพัฒนาเครื่องมือที่ผู้ใช้งานสามารถเข้าไปจัดการข้อมูลได้เอง เน้นใช้งานง่าย บริษัทต่าง ๆ สามารถเข้ามาจัดการข้อมูลเบื้องต้นได้เอง รวมถึงวิเคราะห์ข้อมูลได้เองด้วย
ปัจจุบันนี้มีเครื่องมือหลาย ๆ อย่างที่สามารถเอาเข้ามาช่วยเก็บข้อมูลและวิเคราะห์ข้อมูลได้ง่ายมากขึ้น ไม่ต้องเขียนโค้ดเองก็สามารถจัดการ Data Warehouse ได้อย่างสะดวกสบาย (เช่น Databricks หรือ Snowflake) ไม่ว่าจะทีมการตลาด ทีมพัฒนาธุรกิจ หรือ ทีมขาย ต้องการข้อมูลอะไร ก็สามารถเข้ามาดึงข้อมูลจากระบบได้เองเลย
สรุปข้อดีของยุค Analytics 4.0
- มีระบบที่ช่วยทำงานกับข้อมูลให้เลือกใช้หลากหลายมากขึ้น
- ผู้ที่ต้องการข้อมูลสามารถเข้าไปดึงและจัดการข้อมูลเองได้
- หน้าตาของเครื่องมือมีความใช้งานง่าย
- ลดระยะเวลาในการสื่อสารระหว่างทีม เมื่อต้องการข้อมูล
สรุปข้อเสียของยุค Analytics 4.0
- เครื่องมือบางตัวมีราคาสูง ไม่เหมาะกับบริษัทขนาดเล็ก
- มี Learning Curve ในการใช้งาน
พูดถึงวิวัฒนาการและต้นกำเนิดของระบบ Data Analytics กันไปแล้ว เราจะพาเพื่อน ๆ ไปดูกันว่ามีเครื่องมือตัวไหนที่น่าสนใจในช่วงนี้บ้าง!
เครื่องมือการทำ Data Analytics ตอนนี้มีอะไรน่าสนใจบ้าง?
พูดถึงเครื่องมือเก็บและวิเคราะห์ข้อมูลในยุคนี้ เรียกได้ว่ามีหลากหลายมาก ๆ แต่วันนี้เราจะยกตัวอย่างเป็นเครื่องมือที่น่าสนใจ และมีฟีเจอร์ครบครัน โฟกัสที่การทำ Data Visualization / Report / Dashboard ซึ่งเป็นหัวใจของการทำ Data Analytics มาให้เพื่อน ๆ ได้ลองเลือกศึกษากัน
Tableau
เริ่มกันที่หนึ่งในเครื่องมือที่สายจัดการข้อมูลต้องรู้จักอย่าง Tableau ที่มีฟีเจอร์น่าสนใจมากมาย เช่น
- Dashboards ที่ใช้งานง่ายสุด ๆ ไม่ต้องเขียนโค้ดเป็นก็ใช้งานได้แบบสบาย ๆ
- มีการสรุปข้อมูลเป็นกราฟ ตารางและรูปแบบอื่น ๆ ที่ทำให้วิเคราะห์ข้อมูลได้ง่ายขึ้น แถมยังเปลี่ยนรูปแบบการแสดงผลได้ด้วย
- ระบบจัดการและเตรียมข้อมูลที่ทำงานได้ดี ละเอียด ไม่ต้องทำซ้ำเองให้ปวดหัว
- สามารถปรับเปลี่ยนหน้าตาของ Dashboard ได้ตามความต้องการ
- มีความปลอดภัยสูง
ข้อเสียของ Tableau ก็มีอยู่บ้าง เช่น
- ไม่มีระบบการอัปเดตรีพอร์ตแบบอัตโนมัติ จะต้องเข้าไปทำเองในหลังบ้าน อาจจะใช้เวลามากหน่อยในส่วนนี้
- เวลาปรับเปลี่ยนหน้า Dashboard แล้ว จะไม่สามารถย้อนกลับไปรูปแบบเดิมได้
- ถ้าทำงานกับข้อมูลที่มีความซับซ้อนสูง ผู้ใช้งานควรมีพื้นฐาน SQL ด้วย
Power BI
เครื่องมือสำหรับจัดการข้อมูลต่อมาเป็น Power BI ที่เป็นระบบแบบ Cloud-based ข้อดีของระบบตัวนี้คือมีการอัปเดตอยู่ตลอด มีฟีเจอร์ใหม่ ๆ ที่น่าสนใจให้ได้ลองใช้งานกันเป็นประจำ นอกจากนี้ก็ยังโดดเด่นด้วยสิ่งเหล่านี้
- Dashboard มีความครบถ้วน ปรับใช้ได้ง่ายตามความต้องการ
- สามารถช่วยวิเคราะห์ข้อมูลเชิงลึกได้รวดเร็วและง่าย ด้วยการใช้อัลกอริทึมที่มีประสิทธิภาพ
- รวมเอา Azure Machine Learning และ Azure Stream Analytics มาใช้ในระบบด้วย
ข้อเสียของ Power BI
- ผู้ใช้งานระบบจะต้องมีอีเมลโดเมนเดียวกันเท่านั้น
- ไฟล์ที่อัปโหลดบนระบบจะต้องมีขนาดไม่เกิน 250MB
Qlikview
Qlikview เป็น Self-service Tools ที่เหมาะกับธุรกิจหรือหน่วยงานที่ต้องการความง่ายในการใช้งาน แบ่งออกเป็นแต่ละแผนกได้ และมีข้อดีที่น่าสนใจคือ
- ค้นหาข้อมูลได้รวดเร็ว
- เหมาะกับธุรกิจหลากหลายรูปแบบ
- มีระบบวิเคราะห์อัตโนมัติที่ช่วยทำให้ผู้ใช้งานสามารถทำงานได้ง่ายขึ้น
- แชร์ Dashboards และข้อมูลระหว่างทีมได้ง่าย
ข้อเสียของ Qlikview
- ราคาค่อนข้างสูง เพราะจะต้องใช้หลาย ๆ เครื่องมือรวมกัน อาจจะไม่เหมาะกับบริษัทขนาดเล็กและกลาง
Google Data Studio (ชื่อเก่า Looker Studio)
ปิดท้ายกันที่เครื่องมือจัดการข้อมูลที่ใช้ฟรีได้อย่าง Google Data Studio ที่นอกจากจะใช้งานง่ายแล้ว ก็ยังสามารถใช้ทำงานร่วมกับโปรดักส์อื่น ๆ ของ Google ได้อย่างครบครันอีกด้วย เหมาะกับคนที่ต้องการเข้าถึงข้อมูล Google ของตัวเอง ปรับเปลี่ยน Dashboards ได้ค่อนข้างเยอะ
Google Data Studioมีข้อดีอื่น ๆ อีก เช่น
- เก็บข้อมูลได้จากหลากหลายแหล่งข้อมูล ไม่ว่าจะเป็น TapClicks, Amazon Seller Central, Asana, Jira Cloud และอีกมากมาย
- มี Business Intelligence Engine จากทีม Google Cloud BigQuery ทำให้สามารถเข้าถึงและโหลด Dashboards จากแหล่งข้อมูลมากมายได้รวดเร็ว
- หน้ารีพอร์ตทำงานเร็วมาก สามารถปรับเปลี่ยนได้แทบจะทุกอย่างตามข้อมูลที่ต้องการ
- มีความปลอดภัยสูง
ข้อเสียของ Google Data Studio
- พอเป็นเครื่องมือของ Google ทำให้ต้องแปลงไฟล์ Excel เป็น CSV หรือใส่ Google Sheet ก่อนที่จะเอาข้อมูลเข้ามาในระบบ
- Dashboard ไม่มีระบบการรีเฟรชอัตโนมัติ
นอกจากนี้ก็ยังมีเครื่องมืออีกหลากหลายตัวเลยที่เปิดให้ใช้บริการ เราแนะนำว่าให้เพื่อน ๆ เลือกใช้เครื่องมือที่เหมาะสมกับการจัดเก็บข้อมูล แหล่งข้อมูล และการใช้งานของบริษัทจะดีที่สุด เห็นแบบนี้แล้วก็น่าตื่นเต้นใช่ไหมล่ะว่าในอนาคตจะมีเครื่องมือใหม่ ๆ อะไรออกมาให้เราได้ลองใช้งานกันอีก
ใครที่อ่านบทความนี้แล้วอยากเรียนรู้ต่อเกี่ยวกับเครื่องมือ Self-service ที่ทำให้จัดการ เข้าถึงและวิเคราะห์ข้อมูลได้ง่ายขึ้น แนะนำให้รอติดตามบทความต่อไปกันเลยนะ ใครชอบเนื้อหาแนวนี้ อย่าลืมกดติดตามกันได้ที่ Facebook Page: DataTH และ Youtube Channel: Data Science ชิลชิล ได้เลย!