สำหรับใครอยากเข้าสู่โลกของ Big Data ห้ามพลาดสไลด์อันนี้เลยครับ คุณดรีมจาก True Analytics แจกสไลด์จากงาน Data Council Meetup ที่เพิ่งผ่านมานี้เอง
สไลด์นี้จะพูดถึงว่า Apache Spark ดีกว่า Hadoop MapReduce ยังไงบ้าง และเราสามารถนำมาใช้ประโยชน์อะไรได้บ้างครับ
เกริ่นคร่าว ๆ คือ Spark เป็น Tool สำหรับประมวลผลข้อมูลแบบ In Memory ทำให้เร็วมาก ๆ ๆ ๆ ๆ ๆ ๆ ๆ ๆ ๆ (เทียบกับ Hadoop นะครับ แต่ไม่ได้เร็วแบบกดปุ๊บมาปั๊บ) ซึ่งตัว Spark เป็นโปรเจคของ Apache แจกให้เรานำมาใช้ได้ฟรีเลย
บริษัทใหญ่ต่าง ๆ เลือกใช้ Spark กันเยอะ เพราะทำงานได้เร็วมากกับ Big Data และความโด่งดังนี้ก็ทำให้เกิด Databricks เป็นบริการ Spark แบบมีคนดูแลให้ ซึ่งบริษัทต่าง ๆ ที่แอดเห็นมาก็ใช้กันเยอะเหมือนกันครับ
วีดิโอจากงาน Data Council Meetup เจาะลึกเรื่อง Data Engineer ที่ True Analytics
วีดิโอจากงาน Data Council Meetup อยู่ด้านล่างนี้เลยนะครับ ขอขอบคุณ คุณ Thohirah Husaini ที่อัพโหลดวีดิโอมาให้เราได้ชมกันด้วยครับ และขอขอบคุณ ดร. กานต์ ที่จัดงานนี้นะคร้าบ
[ลิงค์ลบไปแล้ว] แจกสไลด์ภาษาไทย Simplify Data Analytics with Spark
โหลดสไลด์คุณดรีม เพื่อเรียนเพิ่มเติมเกี่ยวกับ Spark ได้ที่นี่เลย Apache Spark >> (ลิงค์ลบไปแล้ว)
สรุปจาก Session เรื่อง Spark อันนี้
- Hadoop มีส่วนประกอบเป็นอะไรบ้าง
- MapReduce คืออะไร ทำงานอย่างไร
- Spark คืออะไร ดีกว่า MR ยังไง
- การนำ Spark มาสร้าง Ingestion Framework สำหรับข้อมูล Batch และ Streaming
- Internal Tool สำหรับ Encrypt / Decrypt Data ชื่อ Mockingjay
แจกสไลด์ภาษาไทย Crushing Big Data by Data Modelling
สไลด์นี้โดยคุณ Rewat Trangansri แนะนำเรื่องการทำ Data Modelling เพื่อให้ข้อมูลเป็นระเบียบ และสะดวกในการนำไปใช้ต่อมากขึ้นครับ >> ดาวน์โหลดสไลด์ Data Modelling
สรุปจาก Session เรื่อง Data Modelling อันนี้
- Data Model คืออะไร
- ข้อดีของการทำ Data Model คืออะไร
- วิธีการตัดสินใจว่าควรสร้าง Data Model หรือไม่
- Layer ต่าง ๆ ในการทำ Data Model
ขอขอบคุณทั้งคุณ Rewat และคุณดรีม ที่มาแชร์ความรู้ดี ๆ ด้าน Data Engineer ที่หาได้ไม่ง่ายในไทยครับ และขอขอบคุณพี่กานต์แห่ง Data Council.ai ที่จัดงานดี ๆ แบบนี้ด้วยครับ
ป.ล. ใครที่มาสาย Data Science ยังไม่ค่อยเข้าใจ Data Engineer อาจจะงงนิดหน่อย ก็ไม่เป็นไรครับ ค่อย ๆ เก็บความรู้ไป เริ่มจากอ่าน บทความอธิบาย Data Engineer ก็ได้ เดี๋ยวแอดจะค่อย ๆ เอามาแชร์ให้เรียนรู้กันไปทีละนิดครับ