[Free Download] หนังสือที่ต้องอ่าน สำหรับสาย Data Engineer ความรู้ครบทุกด้าน

free-download-data-engineering-book

หลังจาก Data Science กลายเป็นคำฮอตฮิตตอนต้นปี 2012 วงการ Data Engineering / Data Engineer ก็กลายเป็นวงการที่เติบโตไวมาก เพราะทุกบริษัทค้นพบว่าพอจะทำ Data Science ก็จะเจอว่าต้องมีการเตรียมตัวด้าน Data Engineering ที่ดี เพื่อให้ข้อมูลมีคุณภาพ นำมาใช้ต่อได้

อย่างไรก็ตาม ข้อเสียของฝั่ง Data Engineering คือ หา Resource ในการเรียนได้ยากมากกกกกกก คนที่ทำงานด้านนี้ก็ไม่ค่อยออกมาสอน และเทคโนโลยีเปลี่ยนไปเร็วมาก ถ้าไม่ได้เข้าใจถึงคอนเซ็ปต์ของระบบต่าง ๆ ความรู้ก็จะอยู่ได้ไม่นาน

นี่เลยเป็นสาเหตุที่ DataTH เปิดคอร์ส Road to Data Engineer เพราะเราอยากสอนคอนเซ็ปต์สำคัญด้าน Data Engineer ให้กับคนไทย เพื่อให้คนเรียนเข้ามาทำในตลาดงานได้จริง ซึ่งสายนี้หาเรียนได้ยากแม้กระทั่งในต่างประเทศ ผมกับแอดฝนจึงดีไซน์คอร์สจากศูนย์ จากประสบการณ์ในการทำงาน

ข่าวดี คือ สำหรับคนที่อยากศึกษาด้าน Data Engineering ในรูปแบบหนังสือ และชอบการอ่านภาษาอังกฤษ เมื่อต้นปีผมได้อ่านหนังสือเล่มหนึ่ง ชื่อ Fundamentals of Data Engineering เขียนโดยคุณ Joe Reis และ Matt Housley

พออ่านไปก็ชอบหนังสือเล่มนี้มาก เพราะครอบคลุมคอนเซ็ปต์ด้าน Data Engineer ได้ครบ โดยไม่มีการแทรกโค้ดแม้แต่ตัวเดียว ถือเป็นหนังสือที่อ่านได้ง่าย ห้ามพลาดเลยสำหรับผู้สนใจเริ่มต้นด้าน DE

และที่สำคัญ ก่อนหน้านี้หนังสือเล่มนี้ขายอย่างเดียว แต่ตอนนี้มีบริษัทใจดีที่เปิดให้ดาวน์โหลดหนังสือเล่มนี้ได้ฟรี เลยอยากมาแนะนำกันครับ

คนเขียนหนังสือเล่มนี้เป็นใคร

joel reis matt hosley book fundamental of data engineering
ผู้เขียนเล่าถึงหนังสือ Fundamentals of Data Engineering ในงาน Data Driven NYC [รูปจาก https://www.youtube.com/watch?v=mPSzL8Lurs0]

คุณ Joe Reis และ Matt Hosley เป็นผู้เชี่ยวชาญในวงการ Data Science และ Data Engineering มาอย่างยาวนาน ทำให้มี Connection ในวงการเต็มไปหมด และทั้งสองคนเคยเป็น Data Scientist มาก่อน ก่อนจะพบว่าบริษัทต้องแก้ปัญหาด้าน Data Engineering ก่อน ทำให้สนใจในสายนี้

จากในงาน Data Driven NYC คนเขียนเล่าว่า “คนมักจะเข้าใจว่า Data Engineering คือเทคโนโลยี เช่น Data Engineering = Hadoop หรือ Data Engineering = Kafka แต่จริง ๆ คุณต้องเข้าใจคอนเซ็ปต์ของมันก่อน”

จึงเกิดมาเป็นหนังสือเล่มนี้นั่นเอง

หนังสือเล่มนี้ได้รับคำนิยมมากมายจากคนดังในวงการ Data เช่น Bill Inmon คนคิดค้นคอนเซ็ปต์ Data Warehouse, Jordan Tigani ผู้สร้างระบบ Google BigQuery, Bruno Aziza – Head of Data Analytics ของ Google Cloud

นอกจากนั้น หนังสือเล่มนี้ก็ถูกตีพิมพ์โดยสำนักพิมพ์ O’Reilly ซึ่งตีพิมพ์หนังสือฝั่ง Tech มาแล้วมากมาย เป็นการการันตีคุณภาพ

หนังสือ Fundamentals of Data Engineering เกี่ยวกับอะไร

หนังสือเล่มนี้เล่าถึง Data Engineering Lifecycle แล้วค่อย ๆ อธิบายส่วนต่าง ๆ ในแต่ละบท

data engineering lifecycle

รูป Data engineer lifecycle จากหนังสือ Fundamentals of Data Engineering

รูปนี้ทำให้เห็นภาพใหญ่ที่ครบมากว่า Data Engineering ประกอบด้วยอะไรบ้าง ซึ่งส่วนที่อยู่ด้านบนเส้น (Ingestion, Transformation, Serving, Storage) เป็นสิ่งที่คนมักจะมองเห็นกัน

ส่วน Undercurrents ในรูป (Security, Data Management, DataOps, Data Architecture, Orchestration, Software Engineering) เป็นสิ่งที่คนมักจะมองไม่เห็น แต่สำคัญมากสำหรับงานสาย Data Engineering

ด้านล่างนี้จะสรุปเนื้อหาแบบคร่าว ๆ ให้สำหรับแต่ละ Part ของหนังสือเล่มนี้ครับ แนะนำว่าถ้าอยากได้ความรู้แบบเต็ม ๆ ลองดาวน์โหลดฉบับเต็มมาอ่านครับ

Part 1: พื้นฐาน และส่วนประกอบต่าง ๆ ของงาน Data Engineering

Data Engineering ประกอบไปด้วยส่วนต่าง ๆ มากมายจากที่เราเห็นในรูป Data Engineering Lifecycle ก่อนหน้านี้

ในส่วนแรกของหนังสือ ผู้เขียนเปิดเรื่องด้วยการอธิบายความแตกต่างของงานฝั่ง Data Science vs Data Engineering

data science hierachy of need
รูป Data Science Hierarchy of Needs จาก Hackernoon ซึ่งจะแอบเห็นงาน Data Engineering อยู่ในชั้นล่าง ๆ [Collect, Move/Store, Explore นิดหน่อย]

จากนั้นจึงอธิบายถึง Data Engineering Lifecycle ว่าแต่ละส่วนคืออะไรบ้าง แบบยังไม่เจาะลึก

ส่วนตัวที่ชอบมาก คือ ในพาร์ทแรกนี้มีการลงลึกไปถึงการเลือกเทคโนโลยีในมุมของทีมแต่ละขนาด ว่าจะเลือกซื้อหรือเลือกสร้างดี, Cloud ดีมั้ย, Serverless ดีมั้ย ฯลฯ ซึ่งเป็นหัวข้อที่เรามักจะมองข้ามไป

Part 2: เจาะลึก Data Engineering Lifecycle

สำหรับคนที่อ่าน Part 1 แล้วชอบ อยากรู้รายละเอียดในส่วนต่าง ๆ มากกว่านี้ Part 2 จัดให้

data engineering storage api warehouse lake
ข้อมูลจาก Notebook เอาไปทำอะไรต่อได้บ้าง [รูปจากหนังสือ Fundamentals of Data Engineering]

จากรูป Data Engineering Lifecycle ข้างต้น ก็จะมีการลงลึกไปในส่วนต่าง ๆ และพูดถึงเทคโนโลยีแต่ละประเภทของส่วนนั้นเลย เช่น

  • Storage มีแบบไหนบ้าง: SSD คืออะไร, File Storage กับ Object Storage ต่างกันยังไง​
  • Data Warehouse vs Data Lake ต่างกันยังไง (ถ้าอยากอ่านแบบภาษาไทย มีในบล็อกนี้ Big Data เก็บที่ไหน? Data Warehouse vs Data Lake vs Database)
  • Ingestion การดึงข้อมูลมีเรื่องสำคัญอะไรที่ต้องรู้บ้าง: TTL (Time to live), Message Size คืออะไรบ้าง
  • Serving: Business Analytics vs Operational Analytics vs Embedded Analytics, การทำ Reverse ETL คืออะไร

ฯลฯ

มีหัวข้ออีกเยอะมาก เรียกได้ว่าอ่านจบแล้วจะเข้าใจแทบทุกคอนเซ็ปต์ของสาย Data Engineering เลย

Part 3: Security / Privacy และอนาคตของโลก Data Engineering

data engineering real time
อนาคตของโลก Data Engineering ที่ผู้เขียนทำนายไว้ ว่าข้อมูลจะไหลไปทุกระบบแบบ Real-time [รูปจากหนังสือ Fundamentals of Data Engineering]

ในพาร์ทสุดท้ายนี้ จะพูดถึงฝั่ง Security / Privacy ก่อน ซึ่งเป็นเรื่องที่ Data Engineer หลาย ๆ คนมองข้ามไป และบริษัทเล็ก ๆ อาจจะไม่ได้สนใจมากนัก เพราะยังไม่เห็นคุณค่าจากงานด้านนี้

พาร์ท Security / Privacy พูดถึงคอนเซ็ปต์การทำให้ระบบปลอดภัย รวมไปถึงด้านเทคโนโลยี เช่น การ Encryption (เข้ารหัส) ข้อมูล, การ Log / Monitor / Alerting ฯลฯ

และท้ายที่สุด จะเป็นส่วนของอนาคตในโลก Data Engineering ซึ่งผู้เขียนเองก็บอกว่าเค้าทำนายอนาคตได้จากเฉพาะสิ่งที่เค้าเห็นตอนนี้ ซึ่งอนาคตอาจจะเปลี่ยนไปจากนี้อีกก็ได้ โลก Data Engineering เดินทางมาไกลมากจากยุคที่ Hadoop เกิดขึ้นมาในปี 2012

จากปัจจุบันที่ Modern Data Stack กำลังได้รับความนิยมมาก ผู้เขียนบอกว่าในอนาคตจะกลายเป็น Live Data Stack ที่ข้อมูลไหลไปทุกระบบแบบ Real-time

อนาคตของโลก Data Engineering จริง ๆ จะเป็นยังไงก็อยู่ในมือพวกเราทุกคนด้วย ว่าจะผลักดันไปทางไหน

ดาวน์โหลดหนังสือ Fundamental of Data Engineering ฟรี ได้ที่ไหน

ถ้าเสิร์ชชื่อหนังสือตรง ๆ อาจจะเจอว่ามีขายในเว็บไซต์ของ O’Reilly

ซึ่งเมื่อไม่นานมานี้ มีผู้ใหญ่ใจดี Redpanda พาร์ทเนอร์กับ O’Reilly เอาหนังสือเล่มนี้มาปล่อยให้ดาวน์โหลดฟรี แลกกับการกรอกข้อมูลส่วนตัวเล็กน้อยเท่านั้น

ดาวน์โหลดหนังสือ Fundamental of Data Engineering ฟรี จากบนเว็บไซต์ Redpanda กันเลย:

https://go.redpanda.com/fundamentals-of-data-engineering

ส่วนใครยังไม่อยากโหลด อันนี้เป็นวีดิโอแนะนำหนังสือ โดยผู้เขียนมาเล่าเองเลย

บทสรุป สำหรับคนที่หาแหล่งเรียนรู้ฟรีเพิ่มเติม

ถ้าสนใจแหล่งเรียนฟรีสำหรับสาย Data ทั้งคอร์ส, หนังสือ ฯลฯ สามารถดูทั้งหมดได้ที่หมวดหมู่ Free Course & Books บนเว็บไซต์เราเลยครับ

และถ้าชอบเนื้อหาแนวนี้ ติดตามบทความดี ๆ ด้าน Data และวีดิโอสนุก ๆ ดูชิล ๆ และได้ความรู้กันได้ที่บนบล็อกนี้, Facebook Page: DataTH (ทักมาคุยกันได้นะว่าสนใจด้านไหน เผื่อทีมงานจะหามาให้ครับ) และ Youtube Channel: Data Science ชิลชิล แล้วเจอกันในบทความหน้าคร้าบ

บทความอื่น ๆ ที่เกี่ยวข้อง

เราใช้คุกกี้เพื่อพัฒนาประสิทธิภาพ และประสบการณ์ที่ดีในการใช้เว็บไซต์ของคุณ คุณสามารถศึกษารายละเอียดได้ที่ นโยบายความเป็นส่วนตัว และสามารถจัดการความเป็นส่วนตัวเองได้ของคุณได้เองโดยคลิกที่ ตั้งค่า

Privacy Preferences

คุณสามารถเลือกการตั้งค่าคุกกี้โดยเปิด/ปิด คุกกี้ในแต่ละประเภทได้ตามความต้องการ ยกเว้น คุกกี้ที่จำเป็น

Allow All
Manage Consent Preferences
  • Always Active

Save