No-code Data Pipeline คืออะไร? ทำไมโปรเจค Data สมัยใหม่ถึงใช้กันเยอะ

หากใครเคยทำงานกับ Data Engineer หรือเคยเป็น Data Engineer เองมาก่อน ก็จะพบว่างานที่เป็นหัวใจสำคัญของสาย Data Engineering ก็หนีไม่พ้นการสร้าง Data Pipeline

การทำ Data Pipeline ในแต่ละครั้ง ก็ต้องมานั่งเขียนโค้ดกันทีละ Pipeline ซึ่งถ้าเป็นบริษัทที่ข้อมูลมาจากหลายที่ก็จะมี Data Pipeline เยอะแยะไปหมด เขียนกันไม่หวาดไม่ไหว

และงานของสาย Data Engineer ยังไม่หมดแค่นั้น พอมี Data Pipeline เยอะแล้ว ต้องมาคิดถึงการจัดการตรวจเช็ค (Monitor) ว่า Data Pipeline ทำงานตามที่ต้องการ ในเวลาที่ต้องการหรือไม่ บางบริษัทอาจสร้างระบบใหม่ขึ้นมาเพื่อใช้ Monitor เลย

ในบทความนี้ ผม (แอดเพิร์ธ) เลยอยากมาแนะนำให้รู้จักกับ No-code Data Pipeline คอนเซ็ปต์หนึ่งใน Modern Data Stack ที่ช่วยให้ชีวิต Data Engineer ดีขึ้นแบบมาก ๆๆๆๆๆๆๆๆ

No-code Data Pipeline คืออะไร ดียังไง ใช้เครื่องมือตัวไหนดี มาอ่านในบทความนี้ได้เลย

ข้อมูลในบทความนี้มาจากคอร์ส Road to Analytics Engineer: Advanced Data Engineering หากต้องการเจาะลึก ลองใช้งาน No-code data pipeline และเรียนคอนเซปต์ใหม่ด้าน Data Engineering ใหม่ ๆ ที่ใช้ในบริษัทระดับโลกอีกหลายหัวข้อ ดูรายละเอียด & ลงทะเบียนได้ที่ https://go.datath.com/r2ae [เริ่มเรียนได้ทันที]

สารบัญเนื้อหา hide

1 Data Pipeline คืออะไร

2 การสร้าง Data Pipeline ทำอย่างไร

3 No-code Data Pipeline เข้ามาช่วยให้ชีวิต Data Engineer สบายขึ้น

3.1 คอนเซ็ปต์ No-code Data Pipeline ไม่ใช่เรื่องใหม่

3.2 ข้อดี – ข้อเสีย ของ No-code Data Pipeline

4 เครื่องมือ No-code Data Pipeline ใช้ตัวไหนดี

4.1 Fivetran บริการ Managed Data Pipeline as a Service

4.2 Airbyte ระบบสร้าง Data Pipeline แค่คลิก ๆ แบบ Open Source

5 สรุป เครื่องมือ No-code Data Pipeline ดีกว่าการเขียนโค้ดเองมั้ย

Data Pipeline คืออะไร

data pipeline etl process — *กระบวนการ ETL*

Data Pipeline เป็นคำที่ใช้เรียกโปรแกรมที่ใช้ดึงข้อมูลจากระบบที่ต้องการ และนำไปใส่ในระบบที่ต้องการ

เช่น Data Pipeline สำหรับดึงข้อมูลจากฐานข้อมูล MySQL ไปเก็บไว้ใน Snowflake ซึ่งเป็น Data Warehouse ชื่อดัง

ในการสร้าง Data Pipeline จะมี 3 องค์ประกอบพื้นฐานที่คนอยากเป็น Data Engineer ต้องรู้ นั่นคือ

E – Extract
T – Transform
L – Load

หากต้องการศึกษาเพิ่มเติมว่า ETL คืออะไร เราเคยเขียนบทความเล่าเรื่องนี้ รวมถึงเล่าเรื่อง Data Pipeline ยุคใหม่ที่เป็นแบบ ETL -> ELT ด้วย สามารถอ่านได้ที่บทความ ETL vs ELT ทำไม Data Warehouse สมัยใหม่นิยมใช้ ELT

การสร้าง Data Pipeline ทำอย่างไร

data-pipeline-code-example-python — *ตัวอย่างโค้ด Data Pipeline ด้วย Python จาก https://airflow.apache.org/docs/apache-airflow/stable/tutorial/pipeline.html*

การพัฒนา Data Pipeline ขึ้นมาตัวหนึ่ง จะต้องทำทั้งการดึงข้อมูล และการส่งข้อมูลไปที่เป้าหมาย

แปลว่า คนที่เป็น Data Engineer (หรือบางบริษัทก็ใช้ Software Engineer) จะต้องเข้าไปศึกษาว่าระบบที่เราต้องการดึงข้อมูล สามารถดึงข้อมูลได้อย่างไรบ้าง ต้องเขียนโปรแกรมแบบไหนเข้าไปเชื่อมต่อ

และทำเหมือนกันระบบเป้าหมายที่เราต้องการเก็บข้อมูล ว่าส่งข้อมูลไปเก็บได้อย่างไรบ้าง เขียนโปรแกรมแบบไหน

จากนั้นจึงนำมาเขียนโค้ด เทส วนไป จนเกิดมาเป็น Data Pipeline 1 ชิ้น เย้

ตัวอย่างการทำ Data Pipeline แบบเขียนโค้ดเอง

ขอยกตัวอย่างจากข้างต้น ในการทำ Data Pipeline สำหรับดึงข้อมูลจากฐานข้อมูล MySQL ไปเก็บไว้ใน Snowflake Data Warehouse
Data Engineer จะต้องทำงานประมาณนี้

1. ศึกษาระบบ MySQL ว่าสามารถเขียนโค้ดเชื่อมต่อเข้าไปดึงข้อมูลได้อย่างไร
2. ศึกษาระบบ Snowflake ว่าสามารถเขียนโค้ดส่งข้อมูลเข้าไปได้อย่างไร
3. เริ่มเขียนโปรแกรมขึ้นมาเพื่อส่งข้อมูลจากระบบ MySQL ไป Snowflake
4. แก้ไขปัญหาต่าง ๆ เช่น ถ้าโค้ดใช้ไม่ได้ ต้องเขียนโค้ดดัก ไม่ให้ข้อมูลที่ผิดถูกส่งไปเก็บใน Snowflake
5. ทดลองใช้งานจริง ว่าระบบทำงานได้ถูกต้องมั้ย ถ้าไม่ถูกก็แก้ไขต่อ
6. บางบริษัทอาจจะมีการทำระบบมาช่วยตรวจเช็คการทำงานของ Data Pipeline (Monitoring) ก็จะต้องเอามาเชื่อมกับ Data Pipeline อันใหม่นี้ และเทสเพิ่มอีกหน่อย

Process ตั้งแต่ต้น – จบนี้ อาจจะใช้เวลาเป็นหลักสัปดาห์ หรือหลักเดือน

ความน่าปวดหัวเล็กน้อย ในการทำ Data Pipeline คือ

1. ถ้าอยู่ในบริษัทที่มีข้อมูลหลากหลายช่องทาง จะพบว่า Data Pipeline แต่ละตัวก็มักจะต้องการดึงข้อมูลจากระบบที่แตกต่างกัน ทำให้คนเป็น Data Engineer ต้องศึกษาระบบใหม่ทุกครั้งที่ทำ Data Pipeline ใหม่

2. สร้าง Data Pipeline เสร็จแล้วยังไม่จบแบบ Happy Ending เพราะในอนาคตข้างหน้าอาจจะเกิดปัญหาขึ้นอีก เช่น ระบบต้นทางเปลี่ยนหน้าตาข้อมูล ทำให้ Data Engineer ต้องมาแก้โค้ดอีกรอบ

และนี่เป็นสาเหตุที่ทำให้การสร้าง Data Pipeline 1 ชิ้น ใช้เวลานาน หรืออาจจะต้องแก้ไขไปมา ไม่มีวันจบสิ้น

จนมาถึงยุคของ…

No-code Data Pipeline เข้ามาช่วยให้ชีวิต Data Engineer สบายขึ้น

No-code Data Pipeline เป็นคอนเซ็ปต์ในการสร้าง Data Pipeline แบบไม่ต้องเขียนโค้ดแม้แต่ตัวเดียว คนเป็น Data Engineer แค่ใช้เม้าส์ลาก ๆ วาง ๆ คลิก ๆ ก็ได้เป็น Data Pipeline ที่ทำงานได้จริงแล้ว

และคอนเซ็ปต์ No-code Data Pipeline ในเครื่องมือที่เราจะแนะนำในบทความนี้หลาย ๆ ตัว ก็ไม่ได้หมายความว่าเราเขียนโค้ดไม่ได้เลย หากพบปัญหาที่การทำงานด้วย No-code ไม่ตอบโจทย์การใช้งาน เราก็สามารถเขียนโค้ดเข้าไปเสริมได้ (บางคนอาจจะเรียกคอนเซ็ปต์แนวนี้ว่า Low-code แทน)

ก่อนที่เราจะมาดูถึงข้อดี – ข้อเสียของคอนเซ็ปต์นี้ และเครื่องมือที่น่าใช้ในสายนี้ ขอเล่าถึงประวัติของคอนเซ็ปต์ No-code Data Pipeline กันก่อนครับ

คอนเซ็ปต์ No-code Data Pipeline ไม่ใช่เรื่องใหม่

data pipeline azure data factory — Azure Data Factory เป็นเครื่องมือที่ให้ผู้ใช้ลากวาง Logic มาต่อกัน เป็น Data Pipeline [ขอบคุณรูปจาก Microsoft Learn]

สำหรับคนที่ทำงานในวงการ Data มาระยะหนึ่งแล้ว (5+ ปี) อาจจะพบว่า เครื่องมือ No-code Data Pipeline มีมาสักพักแล้ว เช่น SSIS (SQL Server Integration Service), Azure Data Factory, Talend

แต่ในยุคก่อนหน้านี้ เครื่องมือ No-code Data Pipeline จะเน้นการช่วยให้ Data Engineer สามารถลาก ๆ วาง ๆ Logic เอามาต่อกัน [ดูจากตัวอย่างในรูป Azure Data Factory ด้านบน] ทำให้การสร้าง Data Pipeline แต่ละครั้งก็ต้องมาคอยลากวางทีละขั้นตอน

และถ้า Data Pipeline ไหนต้องทำงานซับซ้อนมาก ต้องลาก ๆ เทส ๆ กันอยู่นาน ดีไม่ดีจะต้องเขียนโค้ดเพิ่มขึ้นมาเองอีก กลายเป็นว่า No-code Data Pipeline อาจจะทำให้งานยากกว่าเดิมอีก

แต่พอมาถึงยุคนี้ เครื่องมือ No-code Data Pipeline ทำให้ Data Engineer ทำงานง่ายขึ้นเยอะมาก แทนที่จะต้องมาคอยลากวาง เราก็เลือกระบบต้นทาง กับระบบปลายทาง แล้วได้ Data Pipeline มาใช้งานเลย เช่น Fivetran ในรูปตัวอย่างด้านล่างนี้

fivetran no code data pipeline setup — เครื่องมือ Fivetran ท่ีเราแค่เลือกเป้าหมาย (Destination) เลือกต้นทาง (Source) ก็ได้ Data Pipeline มาใช้เลย

จะเห็นว่าเครื่องมือ No-code Data Pipeline ในยุคก่อน ก็มีข้อดีในเรื่องของความยืดหยุ่น แต่แลกมากับการที่ต้องใช้เวลาหน่อยในการทำแต่ละ Data Pipeline

ส่วนเครื่องมือ No-code Data Pipeline ยุคใหม่ ก็มีข้อดีที่สามารถจบงานได้ไว ไม่ปวดหัวมาก คลิก ๆ เลือกก็เสร็จแล้ว

ตัวอย่างการทำ Data Pipeline แบบใช้เครื่องมือ No-code Data Pipeline ยุคใหม่

เพื่อให้เข้าใจง่าย ขอยกตัวอย่างจากข้างต้น ในการทำ Data Pipeline สำหรับดึงข้อมูลจากฐานข้อมูล MySQL ไปเก็บไว้ใน Snowflake เหมือนเดิม
Data Engineer จะต้องทำงานประมาณนี้

1. เข้าไปดูในระบบที่ใช้ ถ้าระบบรองรับ MySQL และ Snowflake อยู่แล้ว ก็คลิกเลือกต้นทางกับปลายทางได้เลย ใส่ข้อมูลเพื่อ Setup ระบบพวกนี้เล็กน้อย
2. ทดลองใช้งานจริง ว่าระบบทำงานได้ถูกต้องมั้ย ถ้าไม่ถูกก็แก้ไขต่อ หรือทักทีมผู้พัฒนาเครื่องมือ (กรณีใช้ระบบที่มีคนดูแลให้เราด้วย เช่น Fivetran ซึ่งเดี๋ยวจะพูดถึงด้านล่างนี้)
3. เครื่องมือทีใช้ อาจจะมีระบบมาช่วยตรวจเช็คการทำงานของ Data Pipeline (Monitoring) อยู่แล้ว เราไม่ต้องทำอะไรเพิ่มเลย

Process ตั้งแต่ต้น – จบ จึงอาจจะเหลือแค่ไม่กี่วันก็เสร็จ

ข้อดี – ข้อเสีย ของ No-code Data Pipeline

Pros

เรียนรู้ได้ง่าย:
คนที่สร้าง Data Pipeline โดยใช้เครื่องมือเหล่านี้ ไม่ต้องเขียนโค้ดเป็นก็สามารถสร้าง Data Pipeline เองได้
ใช้เวลาทำงานอย่างคุ้มค่า ลดค่าใช้จ่าย:
บางคนเขียนโค้ดเป็นอยู่แล้ว ยิ่งมาใช้เครื่องมือ No-code Data Pipeline ก็สามารถพัฒนาได้ไวขึ้น มีเวลาไปทำอย่างอื่นต่อ
ไม่ต้องดูแลเยอะ:
เครื่องมือ No-code Data Pipeline โดยเฉพาะรุ่นใหม่ ๆ เราไม่ต้องโฟกัสที่การเขียนและเทสโค้ด ซึ่งใช้เวลาเยอะมาก นอกจากนั้น ถ้าระบบต้นทางมีการเปลี่ยนแปลง เรามักจะไม่ต้องแก้โค้ดใด ๆ เลย เพราะเครื่องมือพวกนี้อัปเดตให้อัตโนมัติ
มีทีมคอยดูแล 24 ชั่วโมง:
สำหรับเครื่องมือที่เราต้องจ่ายเงินค่าบริการ ก็จะมีทีมที่ดูแลด้าน Data Pipeline ให้เรา หากเจอปัญหา ก็สามารถส่งข้อความไปถามได้ตลอดเวลา ทำให้ทีมเราไม่ต้องใช้คนเยอะในการจัดการดูแล

Cons

การปรับแต่งที่จำกัด:
เครื่องมือ No-code Data Pipeline จะมีประโยชน์มาก ถ้าใช้ดึงข้อมูลจากระบบที่เครื่องมือรองรับ ไปยังระบบปลายทางที่เครื่องมือรองรับ เพราะไม่ต้องเขียนโค้ดเองเลย
แต่หากต้องการดึงข้อมูลจากระบบใหม่ หรือต้องการทำงานกับข้อมูลแบบแปลก ๆ เราจะต้องเขียนโค้ดเอง ซึ่งอาจจะใช้เวลาพอ ๆ กับการเขียนโค้ด Data Pipeline ใหม่ หรืออาจจะมากกว่าอีกเพราะต้อง Debug
พลังประมวลผลที่จำกัด:
เครื่องมือ No-code Data Pipeline หลายตัวต้องการออกแบบมาให้คนใช้งานง่ายที่สุด จึงไม่มีตัวเลือกว่า Data Pipeline ไหนต้องการพลังประมวลผลสูงกว่า Data Pipeline อื่นหรือไม่
ทำให้เราไม่สามารถรัน Data Pipeline ที่สำคัญ หรือต้องใช้พลังประมวลผลเยอะกว่าชาวบ้าน ได้เร็วเท่าที่เราต้องการ
ย้ายเครื่องมือได้ยาก (Vendor Lock-in):
ในระยะยาว การใช้เครื่องมือ No-code Data Pipeline ตัวใดตัวหนึ่ง แปลว่าเราจะย้ายไปใช้ระบบอื่นได้ยาก แปลว่าเราต้องพึ่งระบบนี้ไปตลอดเพื่อให้ระบบทำงานได้
ค่าใช้จ่ายที่อาจจะสูงกว่าปกติ:
สิ่งที่แลกมากับความสะดวกสบายของทีม Data Engineer ในการใช้เครื่องมือประเภทนี้ คือ ค่าใช้จ่ายที่อาจจะสูงกว่าการเขียน Data Pipeline แล้วเอาไปใช้งานเอง
อย่างไรก็ตาม การแลกเปลี่ยนเรื่องค่าใช้จ่าย vs เวลาที่ประหยัดไป อาจจะคุ้มค่าสำหรับในบางองค์กร / บางโปรเจค

เครื่องมือ No-code Data Pipeline ใช้ตัวไหนดี

นอกจากเครื่องมือ No-code Data Pipeline ในยุคก่อนที่ได้แนะนำไปในช่วงต้นบทความแล้ว เช่น SSIS (SQL Server Integration Service), Azure Data Factory, Talend ฯลฯ

สำหรับเครื่องมือยุคใหม่ ที่ทำให้ชีวิต Data Engineer ง่ายมาก ๆ กว่าเดิม เพราะคลิก ๆ เอาได้เลย ก็จะขอแนะนำ 2 ตัวที่ค่อนข้างมีชื่อเสียง ในต่างประเทศมีการใช้งานอย่างแพร่หลาย

Fivetran บริการ Managed Data Pipeline as a Service

fivetran managed data pipeline service — หน้าหลักของระบบ Fivetran ดูได้ง่ายว่า Data Pipeline ไหน ดึงข้อมูลจากระบบไหน ไปเก็บที่ไหนบ้าง [รูปจากสไลด์ของคอร์ส Road to Analytics Engineer]

fivetran nocode data pipeline — ตัวอย่างข้อมูลของแต่ละ Data Pipeline แสดงทั้ง Timeline การทำงาน และ User Action ที่เปลี่ยนแปลงอย่างละเอียด [รูปจากสไลด์ของคอร์ส Road to Analytics Engineer]

Fivetran เป็นบริการ No-code Data Pipeline ยุคใหม่ ที่ออกมาในปี 2012 และเติบโตจนกลายเป็น Startup แบบ Unicorn (มูลค่ามากกว่า 1,000 ล้าน USD) ในปี 2020 และในปัจจุบัน ก็มีมูลค่ามากกว่า 5,000 ล้าน USD

Fivetran ทำให้ตลาดโลกได้เห็นว่าเครื่องมือสร้าง Data Pipeline แบบคลิก ๆ เสร็จ ช่วยให้การทำ Data Pipeline ที่เป็นงานหนัก ใช้เวลาเยอะ ง่ายกว่าเดิมมาก

ลูกค้าคนหนึ่งของ Fivetran บอกว่า จากเดิมที่เขียน Data Pipeline เอง 1 ตัว ต้องพัฒนา เทส กันหลายสัปดาห์ พอมาใช้ Fivetran ก็เสร็จในไม่กี่วัน

จุดเด่นของ Fivetran คือ

หน้าตาสวยงาม ใช้งานง่าย
รองรับการทำ Data Pipeline เชื่อมต่อกับระบบหลากหลาย เสร็จในไม่กี่คลิก
Fivetran ดูแลตัวเชื่อมต่อระบบให้ทั้งหมด หากเกิดปัญหา
ระบบอยู่บนออนไลน์ทั้งหมด มั่นใจได้ว่าข้อมูลไม่หาย
เหมาะกับการใช้งานบนองค์กรที่ไม่อยากดูแลระบบเอง มี 99.9% Service Level Agreement (SLA หรือ สัญญาในการให้บริการ) เพื่อการันตีว่าระบบโอกาสล่มน้อยมาก
มีทีมของ Fivetran ดูแลระบบหลักให้ 24 ชั่วโมง หากพบปัญหาก็แจ้งได้ทันที
ทำ Data Transformation ได้ในตัว
มีระบบ Data Pipeline Monitoring มาให้ สามารถดูข้อมูลการทำงานแบบละเอียดได้ หรือหากพบปัญหา ให้ส่งข้อความเข้า Email, Slack, Microsoft Teams ก็ยังได้
รองรับข้อกฏหมายทั่วโลก เช่น GDPR, HIPAA, ISO 27001 (อ่านเพิ่มเติมได้ใน https://www.fivetran.com/security)

Airbyte ระบบสร้าง Data Pipeline แค่คลิก ๆ แบบ Open Source

airbyte no code data pipeline — *หน้าตาระบบ Airbyte ทันสมัย ใช้งานง่าย [รูปจากสไลด์ของคอร์ส Road to Analytics Engineer]*

หลังจากที่ Fivetran ทำให้ตลาดโลกเห็นแล้วว่าการทำ Data Pipeline แบบ No-code ดีแค่ไหน ก็มีคนสร้างระบบที่เป็น Open Source (ใช้งานได้ฟรี แก้ไขโค้ดได้อิสระ) ออกมา ชื่อว่า Airbyte

Airbyte เป็นเครื่องมือ No-code Data Pipeline แบบ Open Source ที่รองรับการสร้าง Data Pipeline ในไม่กี่คลิกเหมือนกับ Fivetran และเชื่อมกับระบบต่าง ๆ มากมาย

ในช่วงที่เขียนบทความนี้ Airbyte สามารถเชื่อมต่อได้กับ 300+ ระบบ

สิ่งที่ทำให้ Airbyte แตกต่างกับ Fivetran อย่างชัดเจน คือ ความที่ Airbyte เป็น Open Source ทั้งหมด ทำให้ใครก็ตามสามารถนำ Airbyte ไปติดตั้งบนเซิร์ฟเวอร์ของตัวเอง แล้วใช้งานได้ฟรีเลย

แต่การนำระบบไปติดตั้งเอง ก็แปลว่าต้องหาเซิร์ฟเวอร์มาประมวลผล Data Pipeline เอง และถ้าเกิดปัญหาก็ต้องดูแลเองนะ ซึ่งบางองค์กรอาจจะไม่ถนัด ถ้าทีม Data ไม่มีเวลาเพียงพอ

นอกจากนั้น Airbyte ยังมีบริการ Airbyte Cloud ที่เป็นระบบเสียเงิน แลกกับการที่เราไม่ต้องดูแลระบบเองด้วย ซึ่งถือเป็นทางเลือกที่น่าสนใจมาก

จุดเด่นของ Airbyte คือ:

หน้าตาสวยงาม ใช้งานง่าย
รองรับการทำ Data Pipeline เชื่อมต่อกับระบบหลากหลาย เสร็จในไม่กี่คลิก
ไม่มีค่าใช้จ่าย สำหรับดาวน์โหลดไปติดตั้งในเซิร์ฟเวอร์ตัวเอง แต่ก็ต้องดูแลเอง คอยอัปเดตเอง
ถ้าต้องการจ่ายเงินเพื่อให้ทีมสบายขึ้น ก็ใช้บริการ Airbyte Cloud ได้ หรือจะเริ่มจาก Airbyte Cloud ก่อน แล้วค่อยย้ายมาลงเซิร์ฟเวอร์ตัวเองก็ยังได้
ปรับแต่งได้ตามสบาย เพราะเป็น Open Source ดูโค้ดได้ทั้งหมด

สรุป เครื่องมือ No-code Data Pipeline ดีกว่าการเขียนโค้ดเองมั้ย

จากที่เราได้รู้จักกับเครื่องมือแบบ No-code Data Pipeline กันไปแล้ว จะพบว่าเป็นเครื่องมือที่ช่วยประหยัดเวลาของคนสาย Data ไปได้เยอะมาก

ในการสร้าง Data Pipeline ที่เครื่องมือเหล่านี้รองรับอยู่แล้ว อาจจะไม่จำเป็นต้องใช้ Data Engineer เลยก็ได้ เพราะทีมไหนก็สามารถเข้ามาคลิก ๆ เองได้เลย

เครื่องมือ No-code Data Pipeline จึงเหมาะกับ

บริษัทที่อยากประหยัดเวลาการทำ Data Pipeline นอกจากเหมาะกับบริษัทที่มีข้อจำกัดเรื่องเวลาแล้ว ยังเหมาะมากกับการทดสอบดึงข้อมูลต่าง ๆ มาลองใช้งานอีกด้วย
บริษัทที่อยากทำ Data Pipeline สำหรับดึงข้อมูล และส่งไประบบที่คนใช้เยอะอยู่แล้ว เช่น S3, Snowflake, MySQL ฯลฯ เพราะ Fivetran / Airbyte จะได้รองรับ (ถ้าเป็นระบบที่ค่อนข้าง Niche มาก เราอาจจะต้องเขียนโค้ดเชื่อมต่อเอง)
บริษัทที่อยากสร้างและดูแล Data Pipeline โดยประหยัดแรงทีม Data ให้มากที่สุด
บริษัทที่อยากมี UI (User Interface) ในการจัดการ Data Pipeline ที่ใช้งานง่าย

อย่างไรก็ตาม หากเพื่อน ๆ อ่านแล้วสนใจใช้ No-code Data Pipeline อยากให้ย้อนกลับไปดูตาราง “ข้อดี – ข้อเสีย” ด้านบนด้วยครับ เพราะจะได้เข้าใจว่าการเลือกระหว่าง Data Pipeline แบบเขียนโค้ดเอง กับแบบ No-code แตกต่างกันอย่างไรครับ

เราอยากให้คนอ่านบทความนี้แล้ว สามารถเลือกเครื่องมือที่เหมาะสมมาใช้ในงาน / องค์กรของคุณ

หวังว่าบทความนี้จะช่วยให้เพื่อน ๆ รู้จักกับการทำ Data Pipeline แบบเขียนโค้ดเอง และเครื่องมือ No-code Data Pipeline และหากบทความนี้มีประโยชน์ อยากรบกวนช่วยแชร์ เพื่อส่งต่อความรู้นี้ให้เพื่อน ๆ ด้วย

และถ้าชอบเนื้อหาแนวนี้ ติดตามบทความดี ๆ ด้าน Data และวีดิโอสนุก ๆ ดูชิล ๆ แล้วได้ความรู้กันได้ที่ Facebook Page: DataTH และ Youtube Channel: Data Science ชิลชิล นะครับ แล้วเจอกันคร้าบ

หมวดหมู่: Data Engineer, Home - Modern data knowledge
แท็ก: Data Driven, Data Enginer, Data for Business, Data Pipeline

No-code Data Pipeline คืออะไร? ทำไมโปรเจค Data สมัยใหม่ถึงใช้กันเยอะ

Data Pipeline คืออะไร

การสร้าง Data Pipeline ทำอย่างไร

No-code Data Pipeline เข้ามาช่วยให้ชีวิต Data Engineer สบายขึ้น

คอนเซ็ปต์ No-code Data Pipeline ไม่ใช่เรื่องใหม่

ข้อดี – ข้อเสีย ของ No-code Data Pipeline

เครื่องมือ No-code Data Pipeline ใช้ตัวไหนดี

Fivetran บริการ Managed Data Pipeline as a Service

Airbyte ระบบสร้าง Data Pipeline แค่คลิก ๆ แบบ Open Source

สรุป เครื่องมือ No-code Data Pipeline ดีกว่าการเขียนโค้ดเองมั้ย

บทความอื่น ๆ ที่เกี่ยวข้อง

7 เทคโนโลยีที่ Data Engineer ต้องรู้จัก พร้อมแนะนำแหล่งเรียน

อาชีพนี้ทำอะไร: คุยกับเกิ้ล นักวิเคราะห์ข้อมูล (Data Analyst) จาก Sertis

ทำไม Data Scientist ต้องเรียน Unix ?

คนไทยเด็ด! เจาะ Google reCAPTCHA ด้วย Machine Learning

Hadoop คืออะไร เครื่องมือ Big Data ที่ทั่วโลกใช้ มีส่วนประกอบอะไรบ้าง

AlphaStar: AI สุดเทพที่เอาชนะเกมเมอร์ StarCraft II ระดับโลก 10 เกมรวด

Perth Ngarmtrakulchol