Cloud Computing คืออะไร ? ทำไมงาน Data Science / Machine Learning ควรต้องใช้ Cloud ?

Share on facebook
Share on twitter
Share on linkedin

เมื่ออาทิตย์ที่ผ่านมา แอดเริ่มงานแรกที่ออสเตรเลียครับ ซึ่งเป็นบริษัท Consult ด้าน Data Science และได้ไปเข้าร่วมงาน Hackathon ที่จัดขึ้นในบริษัทมา ทำให้ได้เรียนรู้เกี่ยวกับเรื่อง Cloud เยอะมาก ก็เลยเอามาสรุปเป็นบทความเล่าสู่กันฟังครับ

บทความนี้จะเล่าให้ฟังว่า Cloud Computing คืออะไร และทำไมถึงเหมาะกับงานด้าน Data Science และ Machine Learning แบบเรามาก ๆ ครับ

Cloud Computing คืออะไร

Cloud Computing คืออะไร ? ทำไมงาน Data Science / Machine Learning ควรต้องใช้ Cloud ? 1
หลาย ๆ คนอาจจะใช้ระบบ Cloud อยู่แล้วสำหรับเก็บไฟล์ เช่น Dropbox, iCloud แต่จริง ๆ Cloud สามารถทำได้มากกว่านั้นเยอะมาก

Cloud Computing แบบเข้าใจง่าย ๆ คือ การที่มีคนเอาคอมพิวเตอร์ไปต่ออินเตอร์เน็ตไว้ แล้วให้เราสามารถจ่ายเงินเพื่อเช่าใช้งานได้ผ่านออนไลน์นั่นเองครับ นึกถึงร้านอินเตอร์เน็ตน่าจะเข้าใจง่ายขึ้น

หรือถ้าใครมีความรู้ด้านการทำเว็บไซต์มาก่อน ก็นึกถึงเวลาเราเช่าโฮสติ้งเว็บไซต์ก็ได้ครับ คอนเซปต์ของ Cloud Computing เหมือนกันเลย

สิ่งที่แตกต่างจากการเช่าโฮสต์ทำเว็บไซต์ทั่วไป ก็คือ Cloud Computing เจ้าดัง ๆ เค้าจะมีบริการหลากหลายรูปแบบ เช่น มีระบบ API ที่สามารถอ่านตัวหนังสือจากรูปได้ (Text Recognition) หรือสามารถหาหน้าคนได้ (Facial Recognition)

สาเหตุที่เค้าเรียกว่า Cloud (ก้อนเมฆ) ก็คือ คอมพิวเตอร์ที่เราใช้งานไม่ได้อยู่ใกล้เรา แต่ไปอยู่ในที่ที่อาจจะห่างไกลออกไปคนละมุมโลกก็ได้ เหมือนอยู่บนกลุ่มก้อนเมฆนั่นเอง

ปัจจุบันบริษัทใหญ่ ๆ ทั่วโลกก็เลือกรันระบบบน Cloud กันทั้งนั้นครับ เช่น Google, Microsoft, Amazon, Netflix เดี๋ยวเรามาดูกันว่าทำไม Cloud ถึงน่าใช้

Cloud Computing มีไว้ทำไม แก้ปัญหาอะไร

Cloud Computing คืออะไร ? ทำไมงาน Data Science / Machine Learning ควรต้องใช้ Cloud ? 2
5 เหตุผล ทำไมเราถึงควรใช้ Cloud Computing

สิ่งที่สำคัญกว่าการรู้ว่า Cloud Computing คืออะไร ก็คือ เราควรรู้ว่า” Cloud Computing เกิดมาแก้ปัญหาอะไร” นั่นเองครับ เราจะได้เลือกมาใช้ได้ถูกสถานการณ์

ในสมัยก่อน ถ้าบริษัทหนึ่งต้องการคอมพิวเตอร์แรง ๆ ในการประมวลผลต่าง ๆ หรือแม้แต่ต้องการเก็บข้อมูลที่เพิ่มขึ้นจำนวนมากในทุก ๆ วัน เค้าก็ต้องวางเครื่อง Server เอง และจ้างผู้ดูแลระบบ (หรือที่เราเรียกว่า System Admin) มาดูแลเซิร์ฟเวอร์ของเรา

ทีนี้พอบริษัทขยายขึ้นไปเรื่อย ๆ เราก็ต้องจ่ายเงินซื้อเซิร์ฟเวอร์ที่แรงขึ้น และ Hardware ที่ความสามารถสูงขึ้น ราคาก็แพง แถมยังเจอปัญหาว่าเซิร์ฟเวอร์เก่าที่ซื้อมาแล้วไม่รู้เอาไปทำอะไรดี กลายเป็นต้นทุนจมไปอีก

ทางออกของปัญหาเหล่านี้ก็คือ… Cloud Computing !

Cloud Computing เกิดมาจากว่า บริษัทยักษ์ใหญ่ระดับโลกมีเครื่องเซิร์ฟเวอร์อยู่เยอะมาก ๆ เพื่อรองรับลูกค้าทั่วโลก ก็เลยพัฒนามาเป็นบริการที่ให้บริษัทอื่น ๆ สามารถจ่ายเงินเพื่อมาแชร์กันใช้ทรัพยากรเหล่านี้ได้ โดยที่บริษัทอื่น ๆ จ่ายแค่ค่าบริการรายชั่วโมง ไม่ต้องจ่ายค่า System Admin เพื่อดูแลระบบใด ๆ ทั้งสิ้น

พอบริษัทไหนต้องการอะไร ก็มาเช่าใช้งานเซิร์ฟเวอร์ได้ตามรายชั่วโมง อยากได้เซิร์ฟเวอร์แรงขนาดไหนก็เลือกเองได้ หรือจะเปลี่ยนไปใช้เครื่องแรง ๆ ตอนคนเข้าเยอะ ๆ เช่น โปรโมชั่นปลายปี แล้วช่วงตลาดเงียบ ๆ ก็ใช้เครื่องถูก ๆ ก็ไม่มีใครว่า ถือเป็นการประหยัดค่าใช้จ่ายที่ดีมาก ๆ

Cloud Computing คืออะไร ? ทำไมงาน Data Science / Machine Learning ควรต้องใช้ Cloud ? 3
เอาราคาของ AWS EC2 มาให้ดูกันครับ จะเห็นว่าถูกสุดอยู่ที่ ชม ละ 24 สตางค์เท่านั้น ตกเดือนละ 172 บาท บางคนกินข้าวมื้อเดียวอาจจะแพงกว่าค่าเซิร์ฟเวอร์ทั้งเดือน

นอกจากนั้นค่าใช้จ่ายก็ถือว่าถูกมาก ๆ ถ้าเป็นนักเรียน อยากทำโปรเจคเล่น ๆ ก็ใช้ Free Tier (สามารถใช้ทรัพยากรจำนวนหนึ่งได้ฟรี) หรือถ้าใช้ทรัพยากรเยอะมากจ่ายเป็นชั่วโมง ซึ่งเริ่มต้นที่ชั่วโมงละไม่ถึงบาท (1 vCPU + แรม 512 MB) ไปถึงแพงสุดประมาณ 180 บาทต่อชั่วโมง (96 vCPU + แรม 256 GB)

นอกจากนั้นตัวระบบ Cloud ก็เชื่อถือได้ เพราะส่วนใหญ่จะมีการรับประกันว่าจะมีโอกาสล่มน้อยมาก (ซึ่งบางครั้งผู้ให้บริการโฮสต์ติ้งเว็บไซต์ไม่มีในส่วนนี้ให้ เว็บก็ล่มกันไปเพลิน ๆ) และตัวระบบ Cloud ก็เชื่อมต่อกับ Data Center ในหลายประเทศทั่วโลก ทำให้ข้อมูลของเราหายยากมาก ๆ ถ้าจะหายได้คือ Data Center ของเค้าทั้งหมดต้องล่มพร้อมกันเท่านั้น ซึ่งโอกาสน้อยมาก ๆ ครับ

Cloud Computing ช่วยให้งาน Data Science / Machine Learning ง่ายขึ้นอย่างไร

Cloud Computing คืออะไร ? ทำไมงาน Data Science / Machine Learning ควรต้องใช้ Cloud ? 4
หน้าตาห้องเซิร์ฟเวอร์ ซึ่งที่บริษัทของหลาย ๆ ท่านอาจจะมีเหมือนกัน

ถ้าใครอ่านหัวข้อที่แล้วอาจจะพอนึกออกแล้วครับ เพราะงานของสาย Data Science อย่างเรานี่เหมือนเกิดมาเพื่อใช้ Cloud เลย:

  • งาน Data Science: ใช้พื้นที่เก็บข้อมูลเยอะมหาศาล (กระแส Big Data ที่กำลังมาแรงนั่นเอง) ซึ่งถ้าจะเก็บข้อมูลไว้เองต้องซื้อ Hardware ราคาแพง แถมต้องดูแลเอง ถ้าล่มก็ไม่รู้จะหันไปหาใคร (จริง ๆ เราใช้ Cloud ก็ต้องมีจ้างคนดูแลระบบอยู่ดีครับ เพราะระบบของบริษัทส่วนใหญ่มีความซับซ้อน แต่คนดูแลระบบก็จะทำงานได้ง่ายขึ้นกว่าเวลาตั้งเซิร์ฟเวอร์เองในตึก หรือที่เราเรียกว่า On-premise)
  • งาน Machine Learning: ใช้คอมพิวเตอร์ที่มีพลังประมวลผลสูง (โดยเฉพาะสาย Deep learning, Tensorflow, Keras ฯลฯ ทั้งหลาย) และไม่ได้รันหนักตลอดเวลาด้วย เราใช้เยอะ ๆ แค่ตอนเทรนด์โมเดลเท่านั้น ซึ่งถ้าเอาเงินไปซื้อคอมพิวเตอร์แรง ๆ มาตั้งที่บริษัท แล้วไม่ได้ใช้ตลอด ก็ถือเป็นต้นทุนจม

ตัวอย่างหนึ่งที่แอดเห็นประโยชน์ของ Cloud ชัดเจนเลยก็คือ ประมาณ 2 ปีที่แล้ว แอดได้ไปฝึกงานที่แล็บของมหาวิทยาลัย ได้เจอกับนักศึกษาที่ทำโปรเจคปริญญาเอกโดยใช้ Tensorflow สร้างโมเดล ซึ่งเค้าใช้วิธีซื้อคอมพิวเตอร์แรง ๆ มาตั้งไว้ในแล็บ ลงการ์ดจอ GPU สำหรับเทรนด์โมเดลโดยเฉพาะ และเสียบเปิดไว้ที่แล็บ 24 ชั่วโมง พอจะใช้สั่งรันก็เอาโน้ตบุ๊ก Remote เข้าไปใช้งาน

ถ้านักศึกษาคนนี้เลือกใช้ Cloud เค้าก็จะสามารถเลือกคอมพิวเตอร์แรงแค่ไหนก็ได้ และเปิดเฉพาะช่วงที่ใช้งานก็พอ จ่ายแค่เท่าที่รันจริง ๆ ไม่ต้องไปซื้อคอมพิวเตอร์มาตั้งไว้ และเสียเวลาเซ็ตอัพระบบเองทั้งหมด ซึ่งประหยัดทั้งเงินและเวลา

ถ้าสนใจอยากใช้ Cloud มีตัวเลือกอะไรบ้าง

บริษัทใหญ่ ๆ เช่น Amazon, Google, Microsoft, IBM ต่างก็มีให้บริการระบบ Cloud Computing ทั้งนั้นครับ ซึ่งจริง ๆ ใช้เจ้าไหนก็ได้ตามความชอบ แต่หลัก ๆ ที่แอดมินเห็นว่าได้รับความนิยมมาก คือ:

ถ้าไม่รู้จะเรียนตัวไหนดี แอดแนะนำว่าเรียน AWS ไปก่อน เพราะเค้าถือเป็น Cloud เจ้าแรก ๆ ของเราโลกเลย เปิดมาตั้งแต่ปี 2002 ซึ่งก็ครอง Market Share เยอะที่สุดด้วยครับ เราต้องดูกันต่อไปว่า Google กับ Microsoft จะเข้ามากินส่วนแบ่งได้ขนาดไหน

Cloud Computing คืออะไร ? ทำไมงาน Data Science / Machine Learning ควรต้องใช้ Cloud ? 5
Market Share ของผู้ให้บริการ Cloud ครับ จะเห็นว่า AWS นำแบบทิ้งห่างเลย (รูปจาก CNBC)

เมื่อก่อนแอดก็ไม่เข้าใจว่าทำไมเว็บไซต์ขายของออนไลน์แบบ Amazon.com ถึงมาให้บริการพวกนี้ครับ แต่พอได้เรียนรู้การใช้ AWS และได้ลองใช้บริการต่าง ๆ ของ AWS แล้วต้องบอกเลยว่าเค้าทำมาดีมากจริง ๆ

และสำหรับใครอยากเรียนรู้การใช้งาน AWS แอดมีของมาฝากครับ เพราะอาทิตย์แรกที่เริ่มงาน (คืออาทิตย์ที่ผ่านมานี่แหละ) บริษัทส่งไปเทรนด์การใช้งาน AWS มาครับ

ซึ่งการเทรนด์ก็คือ… ให้นั่งดูคอร์สใน Udemy ชื่อ AWS Certified Developer – Associate 2018

เพราะฉะนั้น ทุกคนท่านอยู่ที่บ้านสามารถซื้อคอร์สนี้มานั่งดูกันเองได้ครับ ถ้ามีโปรก็จะเหลือประมาณ 300 บาทเท่านั้นเอง แต่เนื้อหาคอร์สสอนละเอียดและดีมาก ๆ เกินคุ้มครับ

งาน AWS re:Invent 2018 ที่ลาสเวกัส

Cloud Computing คืออะไร ? ทำไมงาน Data Science / Machine Learning ควรต้องใช้ Cloud ? 6
ปีนี้บริษัทส่งไปงาน AWS re:Invent ครับ

AWS re:Invent เป็นงานประจำปีของ Amazon เกี่ยวกับ AWS โดยเฉพาะ ซึ่งในงานก็จะมี Session ให้เข้าไปฟัง, Workshop, Hackathon, Bootcamp, และ Expo รวมถึงปาร์ตี้ตอนดึก งานจัด 5 วันยาว ๆ บัตรเข้างาน $1,799 หรือประมาณ 59,900 บาท ครับ

เมื่ออาทิตย์ที่ผ่านมาที่เห็นเพจเงียบ ๆ คือแอดไปซุ่มทำโปรเจคแข่งงาน Hackathon ที่บริษัทอยู่ครับ ซึ่งมีธีมเป็น AWS เลยได้เริ่มเรียนรู้การใช้งาน และเรียนรู้ Product ต่าง ๆ ใน AWS

จากที่แอดเคยลองเรียนมาหลายวิธี ไม่ว่าจะเป็นการอ่านหนังสือ การดูวีดิโอ แอดค้นพบว่าการเรียนรู้สิ่งต่าง ๆ ไม่มีอะไรที่ได้ผลไปกว่า “การลงมือทำ” แล้วครับ เราต้องลองทำจริง ลองแก้ปัญหาจริง ความรู้ถึงจะซึมเข้าสมอง

ก่อนแข่ง Hackathon รอบนี้ไม่เคยได้เรียนมาก่อนเลยครับ ก็เหมือนถูกบังคับให้เรียนด้วยตัวเองในระยะเวลาจำกัด เพราะรางวัลต้องยอมรับว่าล่อตาล่อใจมาก ๆ (ที่ 1 ได้ตั๋วไปลาสเวกัส, ที่ 2 ได้ตั๋วไปซิดนีย์)

และจากการเตรียมตัวทั้งก่อนเริ่มแข่ง และก่อนพรีเซ้นท์ นอนตี 1 ตี 2 ติดกันเป็นอาทิตย์ (งานนี้ให้ Hack 2 วัน แล้วเตรียมตัวพรีเซ้นท์อีก 4 วัน) ก็ได้ตั๋วไปลาสเวกัส กับบัตรเข้างาน AWS re:Invent 2018 มาครองครับ ถือว่าคุ้มเหนื่อยอยู่เหมือนกัน

แน่นอนว่าเดี๋ยวเก็บความรู้เด็ด ๆ มาฝากเพื่อน ๆ กันเหมือนเคยครับ หรือใครไปงานก็ทักมากันหลังไมค์ได้เผื่อจะนัดเจอกันครับ ใครไม่ได้ไปก็ไม่ต้องเสียใจ ติดตามอ่านได้เลยในเพจ Data Science ชิลชิล ช่วงเดือนธันวาคมครับผม

Join the Conversation

2 Comments

  1. สอบถามครับแอด
    Cloud Computing ของฝั่งจีนมีเจ้าไหนแนะนำบ้างครับ? เพราะเท่าที่รู้มาจีนเค้าใช้ Google ไม่ได้ (ปกติผมใช้แต่Google)

    #ขอบคุณครับ 🙂

    1. ใช่คร้าบ ตอนนี้ที่จีนยังไม่มี Google Cloud ครับ แต่มี Baidu Cloud น่าจะพอถูไถไปได้ครับ (แต่พวก Service จะไม่เหมือนกัน แอดไม่เคยใช้เหมือนกันว่า Baidu Cloud มีอะไรบ้างครับ)

Leave a comment

อ่านจบแล้วอยากพูดคุยต่อ? พิมพ์ไว้ตรงนี้ได้เลย แอดมาอ่านทุกอันครับ