เอกสารสำหรับทำ Data Project ต้องใช้อะไรบ้าง รวมมาให้ครบแล้ว

data project docs 2

แน่นอนว่าการทำ Data Project ให้ประสบความสำเร็จได้ด้วยดีก็คือการวางหน้าที่ให้กับ 5 ตำแหน่งที่สำคัญของโปรเจกต์ Big Data นอกจากนี้แล้ว เรื่องของการจัดทำเอกสารต่าง ๆ ที่เกี่ยวข้องกับการใช้ข้อมูลก็ถือว่าเป็นสิ่งที่มองข้ามไม่ได้เช่นกัน

วันนี้เราจะมาพูดถึงกันว่าการทำ Data Project นั้นควรจะต้องมีเอกสารหรือ Document อะไรบ้าง ที่ช่วยทำให้การทำงานเป็นไปได้ง่ายดายและสะดวกมากยิ่งขึ้น อีกทั้งยังช่วยทำให้คนอื่น ๆ ที่เข้ามาร่วมโปรเจกต์ในภายหลังนั้นสามารถทำความเข้าใจกับชุดข้อมูลต่าง ๆ ได้อย่างรวดเร็ว ทำงานต่อได้อย่างสะดวก 

ซึ่งเราจะแบ่งเอกสารที่ต้องใช้ทั้งหมดไว้ตามขั้นตอนการทำงานที่เราเคยพูดถึงในบทความก่อนหน้าแล้ว เพื่อให้ง่ายต่อการทำความเข้าใจมากยิ่งขึ้น 

หากใครยังไม่ได้อ่านบทความเกี่ยวกับ Work Flow และตำแหน่งหน้าที่ในการทำ Big Data Project ก็สามารถกลับไปอ่านได้เลย แล้วค่อยกลับมาทำความเข้าใจในเรื่องของเอกสารที่ต้องใช้ในแต่ละขั้นตอนการทำงานในบทความนี้ต่อได้

เอกสารที่ต้องใช้ในการทำงานในส่วนของ Business Workflow

อย่างที่พูดคุยกันไปก่อนหน้านี้ว่า Product Owner/ Project Manager จะรับผิดชอบในส่วนนี้ทั้งหมด ซึ่งแน่นอนว่าขั้นตอนการทำงานส่วนนี้นั้นจะมีเอกสารค่อนข้างเยอะ และหลากหลาย เพราะเป็นขั้นตอนแรกเริ่มของการทำโปรเจกต์ต่าง ๆ ซึ่งเอกสารที่สำคัญ ๆ ก็จะมีดังต่อไปนี้

1. Meeting Note

เอกสารที่สำคัญมาก ๆ ที่สามารถช่วยป้องกันการเข้าใจผิดเกี่ยวกับขั้นตอนการทำงานและความต้องการของลูกค้าได้ก็คือ Meeting Note ซึ่งจะต้องเป็นเอกสารที่จดบันทึกการพูดคุยถึงข้อตกลงทุกอย่างในการประชุมทีมกันกับลูกค้า เพื่อจดทุกอย่างที่จำเป็นเอาไว้ในที่เดียว 

data science project meeting minute
ตัวอย่าง MOM (บันทึกการประชุม) เอกสารที่ต้องใช้ในการทำ Data Project

ความสำคัญของบันทึกการประชุมนี้ก็คือสามารถทำให้ทั้งทีมสามารถเข้าใจตรงกันได้มากที่สุด เมื่อเวลาผ่านไปแล้วก็ยังสามารถทำความเข้าใจกับข้อตกลงที่ผ่านมาได้อย่างตรงกัน รวมถึงเราเองก็จะได้รู้ถึงข้อตกลงทุกอย่าง 

สิ่งที่ต้องจดจากการประชุม

data science project meeting
สิ่งที่ต้องจดจากการประชุม

ซึ่งส่วนประกอบที่สำคัญของบันทึกการประชุมก็จะมี

  • วันที่ และเวลาที่ประชุม
  • ผู้ร่วมประชุมทั้งหมด (Participants)
  • สิ่งที่ตกลงกันในที่ประชุม (Agreements)
  • สิ่งที่ต้องทำหลังจบการประชุม (Action Itams)
  • ไฟล์หรือรูปภาพที่จำเป็นจากการประชุม

2. เอกสารเกี่ยวกับ Workflows ในโปรเจกต์

ต่อมาก็จะเป็นเรื่องของเอกสารที่ช่วยแสดงถึงการทำงานของส่วนต่าง ๆ เริ่มต้นที่

  • Gantt Chart ที่มี PM หรือ Project Manager เป็นคนจัดการ เป็นเอกสารที่ต้องสร้างขึ้นมาเพื่อทำให้คนในทีมสามารถทำงานได้อย่างสะดวก รู้ว่าต้องทำอะไรก่อนหลังและสามารถส่งมอบงานที่ตรงตามความต้องการ รวมถึงข้อตกลงด้วยเช่นกัน 
  • เอกสารที่เกี่ยวข้องกับ Workflow ของโปรเจกต์โดยรวมเป็นหน้าที่ของ BA หรือ PO ที่ใช้ในการแสดงถึง Logics ที่ใช้ และขั้นตอนการทำงานสำหรับระบบที่ต้องการพัฒนา
  • ในบางกรณีอาจจะต้องมีการใช้ Story Card ซึ่งเป็นอีกหนึ่งวิธีของการแสดงข้อตกลงหลังการประชุมเกี่ยวกับโปรเจกต์ในรูปแบบที่เข้าใจง่าย เพื่อให้ลูกค้าสามารถทำความเข้าใจได้ง่ายและเห็นภาพมากยิ่งขึ้น

 อีกทั้งยังมี Design Flow ที่ถูกจัดทำขึ้นโดยทีมดีไซน์ เพื่อช่วยให้คนในทีมเข้าใจได้ตรงกันเกี่ยวกับการออกแบบที่ถูกต้องตามที่ลูกค้าต้องการ ซึ่งเอกสารเหล่านี้นั้นจะใช้ในการจดบันทึกเกี่ยวกับขั้นตอนการทำงานของส่วนและทีมต่าง ๆ อย่างละเอียด เพื่อให้ทั้งทีมมีความเข้าใจตรงกันเกี่ยวกับการทำงานในแต่ละโปรเจกต์ และยังสามารถช่วยให้ผู้ที่เพิ่งเข้ามาทำงานในภายหลังทำความเข้าใจกับกระบวนการการทำงานได้ดีมากยิ่งขึ้นอีกด้วย 

3. เอกสารอื่น ๆ ที่เกี่ยวข้องกับ Data หรือข้อมูล

สุดท้ายนี้จะเป็นเรื่องของเอกสารต่าง ๆ ที่ถูกใช้เพื่อจัดเก็บข้อมูลให้อยู่ในรูปแบบที่นำไปใช้งานต่อได้ง่าย และเป็นระเบียบ ซึ่งมีทั้งหมด 6 สิ่งด้วยกัน ดังต่อไปนี้

data science journey lineage doc
เอกสารอื่น ๆ ที่เกี่ยวข้องกับ Data หรือข้อมูล
  1. เส้นการไหลของข้อมูล (Data Journey) ผู้รับผิดชอบคือ Data Engineer เอกสารนี้มีความสำคัญคือเป็นเอกสารที่แสดงถึงการเดินทางของข้อมูล ว่าจะต้องถูกนำไปใช้งานที่ใดบ้าง เพื่อให้ Data Engineer สามารถวางแผนนำข้อมูลเหล่านี้ไปใช้ได้ง่าย
  • สถาปัตยกรรมของระบบเก็บข้อมูล (Database Architecture) ผู้รับผิดชอบคือ DevOps เอกสารนี้จะช่วยทำให้การทำงานของ Developers และ PM ให้ง่ายมากยิ่งขึ้น เพราะเป็นเอกสารที่แสดงถึงระบบที่โปรเจกต์ดังกล่าวใช้อยู่ เราใช้ Tools ตัวไหนอยู่ ใช้ส่วนเสริมใดบ้าง และการเชื่อมต่อต่าง ๆ 
data project access
สิทธิ์ของข้อมูล (Data access) เอกสารสำคัญที่ต้องใช้ในโปรเจค Data

สิทธิ์ของข้อมูล (Data access)

  • สิทธิ์ของข้อมูล (Data access) ผู้รับผิดชอบคือ Data Engineer เอกสารนี้จะเป็นเอกสารที่ใช้บันทึกข้อมูลกำหนดว่าใครสามารถเข้าถึงข้อมูลใดได้บ้าง ใครสามารถแก้ไขอะไรได้บ้าง เพื่อทำให้มั่นใจว่าข้อมูลทุกอย่างจะถูกจัดเก็บได้อย่างปลอดภัย มีผู้เข้าถึงได้ตามที่กำหนดอย่างเหมาะสมเท่านั้น
  • ความสัมพันธ์ของข้อมูล (Data Relationship) รับผิดชอบโดย BI Developer และ/หรือ Data Engineer เป็นเอกสารที่ช่วยให้ทุก ๆ ทีมสามารถเข้าใจได้ง่ายขึ้นว่า Data ทั้งหมดนั้นถูกจัดเก็บไว้อย่างไรและมีความสัมพันธ์กันอย่างไร เพื่อให้สามารถค้นหาข้อมูลที่เกี่ยวข้องกันได้ง่ายและสะดวกมากยิ่งขึ้น

พจนานุกรมข้อมูล (Data Dictionary)

data dictionary
ตัวอย่าง พจนานุกรมข้อมูล (Data Dictionary)
  • พจนานุกรมข้อมูล (Data Dictionary) รับผิดชอบโดย Data Engineer และ PO เป็นเอกสารที่ช่วยทำให้ทีมและผู้ที่ทำงานด้วยกันในโปรเจกต์นั้นสามารถเข้าใจกับข้อมูลที่ถูกจัดเก็บใน Database ได้อย่างง่ายดาย ช่วยประหยัดเวลาในการทำงานได้มากยิ่งขึ้น แนะนำว่าควรมีเอกสารนี้ให้กับทุก ๆ ตารางข้อมูลเลย เพื่อให้ทำงานได้ง่ายที่สุด ไม่ลืม 
  • แผนงานของทีมดูแลข้อมูล (Data Roadmap) รับผิดชอบโดย PM หรือ PO เอกสารนี้จะใช้เพื่อทำให้ทีมเข้าใจว่าแผนงานจะต้องเป็นอย่างไร เพื่อให้ทั้ง Data Team และ Business Team สามารถพัฒนาโปรเจกต์โดยรวมได้ดีมากยิ่งขึ้น และยังช่วยให้การทำงานด้าน Data ที่มากขึ้นอีกด้วยว่าจะต้องทำการพัฒนา Database อย่างไรบ้าง ต้องใช้เวลาเท่าไหร่  

เอกสารที่ต้องใช้ในการทำงานในส่วนของ Engineering Workflow

ขั้นตอนการทำงานในส่วนของ Engineering Workflow ซึ่งรับผิดชอบโดย Software Engineer และ Data Engineer จะมีการใช้เอกสารอยู่ไม่เยอะมาก ส่วนใหญ่จะเน้นไปที่เอกสารเพื่อการอธิบายข้อมูลที่ถูกจัดเก็บไว้ใน Storage และ Warehouse

โดยเอกสารเหล่านี้นั้นจะต้องอธิบายเอาไว้อย่างละเอียดว่าในขั้นตอนของ Engineering Workflow นั้น Software Engineer และ Data Engineer ได้ทำอะไรไปแล้วบ้าง จัดเก็บข้อมูลอย่างไร แยกข้อมูลไว้อย่างไร

เพื่อให้ทีมงานฝั่ง Data ทั้ง Data Analyst และ Data Scientist สามารถนำข้อมูลเหล่านี้ไปใช้งานต่อได้อย่างมีประสิทธิภาพมากที่สุด ไม่ต้องเสียเวลาสอบถามเกี่ยวกับการจัดเก็บข้อมูล สามารถเริ่มงานได้เลย

เอกสารที่ต้องใช้ในการทำงานในส่วนของ Data Analytics Workflow

สุดท้ายก็คือเอกสารที่จะต้องถูกสร้างขึ้นโดยทีมงานฝั่ง Data ซึ่งมีผู้รับผิดชอบได้แก่ Data Analyst และ Data Scientist แน่นอนว่าเอกสารในขั้นตอนการทำงานนี้ก็จะต้องมี Report ซึ่งเป็นเอกสารสรุปผลวิเคราะห์ข้อมูลที่ได้มา สามารถเป็นได้ทั้งรูปแบบบกระดาษ ไฟล์ต่าง ๆ และเป็น Dashboard ก็ได้ 

หรือจะเลือกใช้เครื่องมืออย่าง Metabase, PowerBI หรือ Tableau ในการแสดงผลสรุปก็ได้เช่นกัน นอกจากนี้แล้วก็จะมีเอกสารที่เรียกว่า Model Manual ซึ่งอยู่ในความรับผิดชอบของ Data Scientist ที่ใช้ในการอธิบายว่า Data Model ที่สร้างไว้นั้นทำงานอย่างไร เพื่อให้คนภายในทีมเข้าใจได้อย่างง่ายดาย

สรุป เอกสารที่ต้องใช้สำหรับโปรเจค Data Science

เป็นอย่างไรกันบ้างกับข้อมูลเกี่ยวกับเอกสารทั้งหมดที่ควรถูกสร้างและใช้งานในการทำ Big Data Project จะเห็นได้ว่าเอกสารแต่ละอันนั้นมีความสำคัญที่แตกต่างกันออกไป 

แต่สิ่งหนึ่งที่มีความเหมือนกันก็คือ เอกสารทุกอย่างจะมุ่งเน้นไปที่การจดบันทึกและอธิบายถึงการจัดเก็บข้อมูลและการทำงาน เพื่อให้ทั้งทีมสามารถทำงานร่วมกันได้ง่ายมากยิ่งขึ้น สร้างความเข้าใจที่ตรงกันภายในทีม และระหว่างลูกค้าด้วยเช่นกัน 

โดยไม่จำเป็นว่าจะต้องใช้เอกสารทุกอย่างที่เรากล่าวถึงในบทความนี้ สามารถเลือกใช้เอกสารบางส่วนก็ได้เช่นกัน เพื่อช่วยเพิ่มความสะดวกรวดเร็วในการทำงานให้มากยิ่งขึ้น

ถ้าเพื่อนๆคิดว่าบทความนี้มีประโยชน์ อยากฝากให้ช่วยแชร์ให้เพื่อน ๆ หน่อยนะคะ และถ้าอยากติดตามบทความดี ๆ ด้าน Data กันบน Facebook หรืออยากมาพูดคุย ติชมกัน เชิญได้ที่ Facebook Page: DataTH – Data Science ชิลชิล เลยนะค้าา

แล้วพบกันใหม่บทความหน้าค่ะ

Leave a Reply

Your email address will not be published.

This site uses Akismet to reduce spam. Learn how your comment data is processed.

บทความที่เกี่ยวข้อง

เราใช้คุกกี้เพื่อพัฒนาประสิทธิภาพ และประสบการณ์ที่ดีในการใช้เว็บไซต์ของคุณ คุณสามารถศึกษารายละเอียดได้ที่ นโยบายความเป็นส่วนตัว และสามารถจัดการความเป็นส่วนตัวเองได้ของคุณได้เองโดยคลิกที่ ตั้งค่า

Privacy Preferences

คุณสามารถเลือกการตั้งค่าคุกกี้โดยเปิด/ปิด คุกกี้ในแต่ละประเภทได้ตามความต้องการ ยกเว้น คุกกี้ที่จำเป็น

Allow All
Manage Consent Preferences
  • Always Active

Save