เวลาเข้าไปทำงาน ไม่ว่าจะเป็นงานอะไรก็ตามเราต้องอ่าน Job Description ก่อน ว่ามีหน้าที่ ความรับผิดชอบอะไรบ้าง มีขอบเขต สามารถทำอะไรได้ การเขียนโปรแกรมก็เหมือนกัน เราต้องดีไซน์โปรแกรมให้มาเพื่อที่จะได้รู้ว่า โปรแกรมนั้นมีความสามารถในการทำงานอะไรได้บ้าง และมีข้อจำกัดอะไร เพื่อให้ทุกคนเข้าใจตรงกัน สามารถโฟกัส ทำงานร่วมกันเพื่อไปถึงจุดมุ่งหมายปลายทางได้
ในการทำงาน Data governance ก็ไม่ต่างกัน จำเป็นต้องมีคำจำกัดความของโปรแกรม และระบุหน้าที่ของคนที่มีอำนาจในการจัดการ ต้องโฟกัสรายละเอียดอะไรบ้าง มีการวางแผนกลยุทธ์หรือการบริหารงานอย่างไร
ถ้าเพื่อนลองไปหาคำจำกัดความของ Data Governance ก็จะรู้ว่ามีหลากหลายจนไม่รู้จะอ่านอันไหน เราเลยทำการรีเสริช และมาสรุปให้เพื่อนๆฟังไปพร้อมๆกัน
Data Governance คืออะไร
คำว่า Data Governance หรือในภาษาไทยเรียกว่า การธรรมาภิบาลข้อมูล มีคำจำกัดความที่เข้าใจง่ายๆ คือ
“Data governance is a set of principles and practices that ensure high quality through the complete lifecycle of your data.”
profisee.com
แปลเป็นไทยสั้นๆ Data Governance คือแนวคิดและกระบวนการสำหรับการจัดการข้อมูลในการทำให้มั่นใจว่าข้อมูลจะมีคุณภาพสูงตลอด Lifecycle
จะระบุว่าใครสามารถ Take Action อะไร ด้วยข้อมูลไหน เมื่อไหร่ ภายใต้สถานการณ์ใด ด้วยวิธีการไหน เพื่อช่วยเป็นแนวทางให้ผู้บริหารในการตัดสินใจ การตั้งนโยบาย การบริหารให้เหมาะสม มีประสิทธิภาพ และปลอดภัย ทำให้องค์กรเป็น Data Driven Organization ในที่สุด
Data Governance Framework คือ
Data Governance ถือว่าเป็นส่วนสำคัญในการบริหารจัดการข้อมูล เพื่อให้เกิดการขับเคลื่อนองค์กรด้วยข้อมูลที่ดี ดังนั้นจะมีขั้นตอนต่างๆที่จะเข้ามาช่วยกำหนดทิศทาง ควบคุมคุณภาพของข้อมูลในองค์กร แต่ทั้งนี้ทั้งนั้นองค์กรต่างๆไม่ได้มีโครงสร้างหรือข้อมูลที่เหมือนกันทั้งหมด เช่น ข้อมูล healthcare และข้อมูล e-commerce ที่แตกต่างกันค่อนข้างมากทำให้การทำ Data Governance ไม่มีรูปแบบที่ตายตัว
เราจะยกตัวอย่าง Framework จาก The Data Governance Institute ให้ฟังกัน
1. ภารกิจและวิสัยทัศน์ (Mission & Vision)
กำหนดว่า Data Governance มีความสำคัญอย่างไรภายในองค์กร ควรจะมีความเกี่ยวข้องกับเป้าหมายทางธุรกิจ ภารกิจและวิสัยทัศน์ขององค์กร โดยมีคนที่เป็น top-management เป็นผู้กำหนด
2. เป้าหมาย Governance Metrics ตัวชี้วัดความสำเร็จ กลยุทธ์ในการระดมทุน (Goals, Governance Metrics / Success Measures, Funding Strategies)
กำหนดเป้าหมาย Short term และ long term สำหรับ Data Governance ตั้งเกณฑ์ความสำเร็จ (success criteria) และตัวชี้วัด (measurement) ซึ่งควรจะบ่งบอกถึง pain points ของธุรกิจในไลน์ต่างๆ ต้องไปในทิศทางเดียวกันกับการระดมทุนและการบริหาร
3. กฎ (Rules – Definitions & Policies)
การตั้งกฎเกณฑ์และคำนิยามของข้อมูลในรูปแบบต่างๆ เช่น นโยบายข้อมูล มาตรฐานข้อมูล คำนิยามข้อมูล เพื่อให้สอดคล้องกับการเปลี่ยนกฎทางธุรกิจมาเป็นกฎของข้อมูล ทั้งนี้ก็ขึ้นอยู่กับเป้าหมายด้วย อาจจะเป็นการตั้งกฎขึ้นมาใหม่ รวบรวมกฎที่มีอยู่แล้ว วิเคราะห์หาช่องว่าง หรือจัดการกฎที่ขัดแย้งกัน
4. อำนาจในการตัดสินใจ (Decision Rights)
ก่อนที่จะมีกฎ มีการตัดสินใจในเรื่องข้อมูล ต้องรู้ก่อนว่า ใครสามารถทำหน้าที่ตัดสินใจได้ ตอนไหน ด้วยวิธีการอะไร Data Governance โปรแกรมควรกำหนดสิทธิในการตัดสินใจ ในระดับ metadata
ไม่ใช่ว่ามีเรื่องของความยาวของคลอลัมข้อมูลเข้ามาใหม่ในระบบ แล้วให้ Data Architect ตัดสินใจ แล้ว stakeholder คนอื่นจะว่าอย่างไร แล้วถ้าความเห็นไม่ตรงกันละจะทำอย่างไร ดังนั้น Data Governance ควรจะกำหนดสิทธิในการตัดสินใจให้ชัดเจนก่อนทำการตัดสินใจ
5. ความรับผิดชอบ (Accountabilities)
เมื่อมีกฎ และคนที่มีอำนาจในการตัดสินใจแล้ว ก็เริ่มแพลนต่อได้ว่าใคร ต้องทำงานอะไร ตอนไหน เป็นการกำหนดความรับผิดชอบ หรือ หน้าที่ ที่จะมอบหมายภายในองค์กรเพื่อให้สอดคล้องกับกระบวนการในองค์กร วงจรของการพัฒนาซอร์ฟแวร์ที่ใช้ไปพร้อมๆกัน
การกำหนดความรับผิดชอบจะสำคัญมาก และซับซ้อนในองค์กรที่เน้นเรื่อง compliance เพราะมีขอบเขตค่อนข้างกว้าง และต้องประสานความร่วมมือระหว่างหลายฝ่าย
6. การควบคุม (Controls)
หลายคนน่าจะเคยได้ยินข่าวเรื่อง Data Breaches อยู่บ่อยๆ และผลกระทบที่ตามมา ซึ่งก็หมายความว่าการมีข้อมูลอยู่ในมือก็ถือเป็นความเสี่ยงอย่างหนึ่ง เราสามารถจัดการโดยป้องกันไม่ให้มันเกิดขึ้น และพยายามตรวจสอบและแก้ไขสิ่งที่อาจจะเกิดขึ้นได้
การควบคุมสามารถทำได้ทั้งป้องกัน ตรวจสอบ และแก้ไข ทำได้ทั้งแบบ automate, manual หรือใช้ technology เข้ามาช่วย โปรเจค Data Governance มักจะมีการควบคุมที่เกี่ยวกับข้อมูลและหลายระดับด้วยกัน ทั้งด้าน network, operating system, database หรือ application เพื่อให้ถึงเป้าหมาย หรือมีการควบคุมทั้วไปในด้าน การจัดการ นโยบาย การอบรม และ project management เป็นต้น
7. ผู้มีส่วนได้ส่วนเสียกับข้อมูล (Data Stakeholders)
stakeholders คือ คือคนๆหนึ่งหรือกลุ่มๆหนึ่งที่ส่งผลกระทบ หรือได้รับผลกระทบจากการตัดสินใจในเรื่องข้อมูล เช่นกลุ่ม business, ทีม IT, Data Architects และ Database Administrator (DBA) ที่มีผลโดยตรงกลุ่มอื่นๆอาจจะไม่ได้มีผลโดยตรง ทีม Data Governance ควรจะรู้และเข้าใจว่าต้องเรียกใครเข้าประชุมเมื่อมีการตัดสินใจและเมื่อไหร่
เพราะฉะนั้น Data Stakeholders ก็คือกลุ่มคนที่สร้างหรือนำข้อมูลเข้ามา กลุ่มที่ใช้ข้อมูล และกลุ่มที่ตั้งกฎหรือ requirement ของข้อมูล ในทุกๆกลุ่มจะมีความคาดหวังแตกต่างกันไป บางกลุ่มอาจอยากมีส่วนร่วมในการตัดสินใจ บางกลุ่มอาจจะอยากให้ปรึกษาก่อนตัดสินใจ หรือบางกลุ่มอาจจะอยากฟังผลการตัดสินใจเฉยๆ
8. สำนักงานธรรมาภิบาลข้อมูล (Data Governance Office)
Governance Office (DGO) อำนวยความสะดวกและสนับสนุนกิจกรรมทางด้าน Data Governance และ Data Stewardship เช่น รันโปรแกรม, ติดตาม Data Stakeholders, ค้นคว้าข้อมูลและทำการวิเคราะห์โปรเจค IT, ประสานงานเรื่องปัญหาในการวิเคราะห์โปรเจค และอื่นๆอีกมากมาย
ทุกๆองค์กรไม่จำเป็นต้องตั้ง Governance Office อย่างเป็นทางการ อาจจะแต่งตั้งคนๆหนึ่งที่ทำหน้าที่นี้ได้ และมักจะเป็นคนที่ทำงานด้าน Data Architects, Data Analyst หรือคนที่ทำงานกับ Metadata และ data definition
ถ้าอยากรู้ว่า Governance Office มีหน้าที่อะไรอีกบ้าง เข้าไปอ่านเพิ่มเติมได้ที่ Data Governance Office
9. บริกรข้อมูล (Data Stewards)
โปรแกรม Data Governance ส่วนมากมีทีมบุคลากรสำหรับการธรรมาภิบาลข้อมูล ซึ่งจะเป็นคนจาก Data Stakeholders มารวมกันเพื่อทำการตัดสินใจที่เกี่ยวข้องกับข้อมูล กำหนดและกำกับนโยบายต่างๆเกี่ยวกับข้อมูล เช่น มาตรฐาน คุณภาพ ความปลอดภัย และการเข้าถึง
บางครั้งทีมบุคลากรทีมเดียว ขั้นเดียวอาจะไม่เพียงพอต่อความต้องการขององค์กรขนาดใหญ่ อาจจะต้องแบ่งเป็นทีมย่อยเพื่อแก้ปัญหาแต่ละจุด เช่น โปรแกรม Data Governance ที่ให้ความสำคัญเรื่อง Data Quality อาจจะมีบริการ Data Quality เข้ามาทำหน้าที่ตรวจสอบชุดข้อมูลตามเกณฑ์ ความสมบูรณ์ครบถ้วน (completeness) ความถูกต้อง (correctness) แก้ไขให้เหมาะสมหรือส่งเรื่องต่อให้ Goverance Office
10. กระบวนการ Data Governance
Framework ตั้งแต่ข้อ 1-6 เป็นเหมือนกับกฎที่ให้ คนในข้อ 7-9 เข้ามาจัดการ ในส่วนของกระบวนการนั้นจะเป็นวิธีที่ใช้ในการดูแลข้อมูล ควรจะเป็นกระบวนการที่ได้มาตรฐาน มี documentation และสามารถทำซ้ำได้ ควรร่างขึ้นมาเพื่อสนับสนุนกฎและการปฏิบัติตามความต้องการด้าน Data Management, Privacy, ความปลอดภัย และการจัดการการเข้าถึงข้อมูลที่มีความสำคัญกับองค์กร
ทุกๆองค์กรสามารถกำหนดโครงสร้างของกระบวนการเองได้โดยกำกับดูแล Framework ตั้งแต่ข้อ 1-9 ด้านบนนี้ รวมถึงการสื่อสารและแก้ปัญหาต่างๆ
ตัวอย่างโปรเจค Data Governance
เราลองหาตัวอย่างที่เป็น Case Study ด้าน Data Governance มาให้เพื่อนๆดูกัน
ตัวอย่าง Data Governance กับ U.S. department of transport
ตัวอย่างนี้เป็นการทำ Data Governance ของ U.S. department of transport ซึ่งมีการลงรายละเอียดปัญหาเกี่ยวกับข้อมูลที่เจอ มี solution ไหนที่สามารถนำมาปรับใช้แก้ไขได้บ้าง แบ่งหน้าที่ของกลุ่มที่ทำหน้าที่ตัดสินใจ ทำงานและขอบเขตของแต่ละตำแหน่งให้เห็นชัดเจน
เพื่อนสามารถเข้าไปดูสไลด์เพิ่มเติมได้ใน Data Governance A FDOT Case Study Presentation
สรุป Data Governance
สรุปให้เข้าใจง่ายๆ Data Governance คือ แนวคิดและกระบวนการสำหรับการจัดการข้อมูลในการทำให้มั่นใจว่าข้อมูลจะมีคุณภาพสูงตลอด Lifecycle ภายในองค์กร โดยกำหนดภารกิจ เป้าหมาย กฎเกณฑ์ คำนิยาม แบ่งความรับผิดชอบ stakeholders, data stewards, governance office และกระบวนการ data governance
หวังว่าบทความนี้จะช่วยให้เพื่อน ๆ รู้จักกับ Data Governance มากขึ้น และหากบทความนี้มีประโยชน์ อยากรบกวนช่วยแชร์ให้คนอื่น ๆ ได้มาอ่านบทความนี้ด้วยค่า
บทความนี้เราตั้งใจเขียนมาก และหวังว่าจะมีคนที่ได้ประโยชน์จากบทความนี้เพิ่มขึ้นไปเรื่อย ๆ นะคะ :)
ถ้าชอบเนื้อหาแนวนี้ ติดตามบทความดี ๆ ด้าน Data และวีดิโอสนุก ๆ ดูชิล ๆ แล้วได้ความรู้กันได้ที่ Facebook Page: DataTH และ Youtube Channel: Data Science ชิลชิล แล้วเจอกันนะคะ