แนะนำ AutoML: เครื่องมือจาก Google ที่ทำให้ทุกคนสร้าง Model ML ใช้เองได้

Share on facebook
Share on twitter
Share on linkedin

ปกติในการสร้างโมเดล Machine Learning สักอันหนึ่ง เราจำเป็นต้องใช้ผู้เชี่ยวชาญเขียนโค้ดด้วยภาษา R หรือ Python เป็นพันเป็นหมื่นบรรทัด แล้วยังต้องมาคิดเรื่องของการ Deploy โมเดล และการ Serve โมเดลอีก

มารู้จักกับ… Cloud AutoML จาก Google กันดีกว่าครับ

เมื่อวันก่อนแอดได้มีโอกาสไปงาน Google DevFest Melbourne ซึ่งตอนแรกไม่ได้กะจะไป (เพราะบัตรเค้าขายหมดแล้ว) แต่จู่ ๆ ตอนเช้าเพื่อนส่งข้อความมาบอกว่ามีบัตรฟรี ก็เลยรีบอาบน้ำ เรียก Uber ไปงานเลย #ลงทุนขนาดไหน

ในงานเค้ามี 3 ห้องให้เลือกฟัง คือ Mobile, Web, และ Machine Learning โดยแต่ละห้องก็จะมี Session ให้ฟังได้ทั้งวัน แถมมีข้าวเที่ยงฟรีด้วยครับ ประหยัดค่าข้าวแถมได้ความรู้

หนึ่งใน Session ในงานนี้ เค้าพูดถึง Cloud AutoML ซึ่งเป็นบริการที่น่าสนใจมาก และมีประโยชน์มาก เลยหยิบมาเล่าให้ฟังกันครับ

Cloud AutoML คืออะไร ?

google automl deep learning
สร้างโมเดล Machine Learning ได้ง่าย ๆ แค่คลิก ๆ แล้วนอนรอ

Cloud AutoML เป็นบริการจาก Google Cloud Platform ที่ทำให้ใครก็สร้าง Model Machine Learning ของตัวเองได้ แค่โยนข้อมูลเข้าไป ระบบจะทำการเทรนด้วยเทคโนโลยีสุดเทพของ Google ให้ออกมาเป็นโมเดลที่ใช้งานได้ทันที มี REST API ให้เรียกใช้ได้เลย

ข้อดีของ Cloud AutoML คืออะไร

automl table process
AutoML เป็นบริการที่ทำทุกอย่างตั้งแต่ Feature Engineer, Model Selection, Hyperparameter Tuning, Deploy model

✅ สร้างโมเดลง่าย ไม่ต้องใช้ความรู้เรื่อง Machine Learning เยอะ

✅ ได้ใช้เทคโนโลยีของ Google ทำให้เทรนโมเดลได้เร็วและอาจจะแม่นกว่าเทรนกันเอง เพราะ Google ได้ไปลองเทสใน Kaggle มาแล้ว ปรากฏว่าในบางโจทย์ AutoML ทำได้ดีกว่า 90% ของเทพ ML จากทั่วโลก!

✅ ตอนนี้ Google เปิดตัว 5 บริการที่ครอบคลุมการใช้งานหลัก ๆ ครบหมด คือ

  1. AutoML Vision สำหรับใช้ทำ Image Recognition / Classification
  2. AutoML Video Intelligence (ใหม่) สำหรับทำ Object Detection / Classification บนวีดิโอ
  3. AutoML Natural Language สำหรับทำ Text Classification
  4. AutoML Translation สำหรับทำระบบแปลภาษา
  5. AutoML Table (ใหม่) สำหรับทำโมเดลทำนายผลกับข้อมูลที่เป็นตาราง

✅ เทรนโมเดลเสร็จแล้วมี REST API ให้เอามาเชื่อมกับโปรแกรมภาษาใด ๆ ก็ได้ของเรา ไม่ต้องเสียเวลาทำส่วนนี้เอง

Cloud AutoML เหมาะกับใคร

แอดมองว่า AutoML เหมาะกับทีมที่มีข้อมูลอยู่ในมือ แล้วต้องการทำ ML จากข้อมูลชุดที่มีอยู่ แต่ไม่มี Data Scientist อยู่ในทีม ตัวอย่างคนที่ได้ประโยชน์ก็เช่น

  • Developer ที่ต้องการพัฒนาโมเดล ML ใช้เอง
  • ทีม Researcher ที่ต้องการโมเดล ML มาใช้งาน
  • บริษัท Startup / Enterprise ที่อยากเห็นศักยภาพของ ML ก่อนลงทุนสร้างทีม Data
  • ฯลฯ

ส่วนคนที่มีทีม Data อยู่แล้ว สามารถนำ Cloud AutoML มาใช้ประโยชน์ เช่น สร้าง Proof of Concept เสนอลูกค้าแบบเร็ว ๆ หรือใช้ AutoML สร้างโมเดลมา Benchmark เปรียบเทียบกับโมเดลที่ทีมเราสร้างขึ้นมาก็ได้ (แต่เอามา Benchmark ต้องระวังว่า AutoML จะทำออกมาได้ดีกว่าเรา ซวยเลย 🤣)

ข้อเสียของ Cloud AutoML

automl model machine learning
อันนี้เป็นผลลัพธ์จากโมเดลใน AutoML Table จะเห็นว่าเค้าพยายามให้ Metric ต่าง ๆ เรามาเพื่อให้เราเข้าใจโมเดลมากขึ้น

⚠️ ค่าใช้จ่ายไม่เบา – เทรนโมเดล 6 ชั่วโมงแรกฟรี ชั่วโมงถัดไป $20 / Hr และเก็บค่าเรียกโมเดลมาใช้งานอีก อย่าง AutoML Vision API คิด $3 / 1,000 รูป แต่ยังไงรวมแล้วก็ถูกกว่าจ้าง Data Scientist มาสร้างโมเดล และจ้าง Data Engineer มาดูแลระบบแน่นอนครับ

⚠️ ไม่สามารถเอาโมเดลออกมารันเองได้ – โมเดล ML ที่เราสร้างจะติดอยู่กับ Google ตลอด ต้องจ่ายเงินใน Google เพื่อใช้ไปเรื่อย ๆ

⚠️ โมเดลเป็น Blackbox – ต่อจากข้อที่แล้วว่าเราเอาโมเดลออกมารันเองไม่ได้ ก็ยิ่งยากที่จะทำความเข้าใจโมเดลนั้นครับ บางทีโมเดล AutoML อาจจะแม่นมากก็จริง แต่การที่อธิบายไม่ได้ก็อาจจะทำให้ใช้ไม่ได้ในหลายสถานการณ์ครับ เช่น เรื่องของการแพทย์ ที่คุณหมออาจจะไม่เชื่อผลของโมเดล ถ้าเราอธิบายไม่ได้ว่าผลมาจากไหน

⚠️ อาจติดปัญหา Privacy ของข้อมูล – สำหรับบริษัทใหญ่ ๆ ที่มี Policy เรื่องการควบคุม Data ที่ค่อนข้างแน่นหนา การจะอัพข้อมูลเข้าไปในบริการ AutoML เป็นเรื่องที่ต้องสู้รบกับทีม Security พอสมควรเลยครับ (หมายถึงทีม Cloud Security ไม่ใช่ รปภ. นะ 🤔)

สรุปบริการ Cloud AutoML: แล้ว Data Scientist ยุคใหม่จะอยู่รอดได้ยังไง

อันนี้เป็นความเห็นของแอดต่อบริการ Cloud AutoML ฮะ คิดว่าเป็นประโยชน์มาก และลด Cost ในการพัฒนาในระยะสั้นพอสมควร เพราะถ้าต้องจ้าง Data Scientist / Data Engineer มาทำให้ จะใช้เงินและเวลามากกว่าแน่นอนครับ

ขอทิ้งท้ายเล็กน้อยว่าหลายคนอาจจะเริ่มคิดว่าในเมื่อ AutoML มันเก่งขนาดนี้แล้ว มีเหตุผลอะไรที่บริษัทจะต้องจ้าง Data Scientist อีก จะตกงานกันมั้ย?

อย่าเป็น Data Scientist ที่วัน ๆ สร้างโมเดลเป็นอย่างเดียว แต่ต้องเป็น Data Scientist ที่สร้างความสัมพันธ์กับคนในบริษัท สร้างความเชื่อเรื่อง Data ให้กับพนักงานคนอื่น ขยันหาความรู้รอบด้าน ให้เรากลายเป็นคนควบคุมเครื่องมือเหล่านั้นแทน

แอดเพิร์ธ @ Data Science ชิลชิล

สำหรับใครมีคำถาม ข้อสงสัย อยากรู้อะไรเพิ่มเติม หรือเหงาอยากคุยเล่นเฉย ๆ ก็ทักแอดมาได้ในเพจ Data Science ชิลชิล นะครับ

Leave a comment

อ่านจบแล้วอยากพูดคุยต่อ? พิมพ์ไว้ตรงนี้ได้เลย แอดมาอ่านทุกอันครับ