รีวิวสอบ AWS Certified Machine Learning – Specialty แนะนำแนวข้อสอบ และเทคนิคสอบผ่านในเวลาสั้น ๆ

aws machine learning cert
AWS ML Certificate
หน้าตา AWS ML Certificate

AWS Certified Machine Learning – Specialty เป็น Certificate ที่วัดความเชี่ยวชาญในการออกแบบ การสร้าง การเทรน การ optimize การทำ tuning การ deploy รวมถึงการ maintain โมเดล Machine Learning และ Artificial Intelligence บน Cloud Platform อย่าง AWS ให้ตอบโจทย์ของภาคธุรกิจนั้นๆ

วันนี้จะมาเล่าให้ฟังถึงประสบการณ์ที่สอบ และหัวข้อต่าง ๆ ที่ออกสอบ เพื่อช่วยให้เพื่อน ๆ สอบผ่าน Certificate ใบนี้จาก Amazon Web Services กัันค่ะ

ทำไมถึงอยากสอบ AWS Certified ML Specialty

หลังจากที่ได้เรียนรู้เกี่ยวกับ Machine Learning และ AWS Cloud มาสักพักก็อยากรู้ว่าการสร้างโมเดล Machine Learning บน Cloud Platform นั้นทำได้อย่างไรบ้าง มีอะไรที่แตกต่างออกไปจากการสร้าง Machine Learning ที่เราทำบนเครื่องตัวเองหรือเปล่า

เลยเริ่มมาศึกษา และเห็นว่า AWS Certified Machine Learning Certificate สามารถช่วยคุณได้ เพราะวัดความรู้ ความสามารถในการสร้างโมเดลบน Cloud แบบ End To End วัดความรู้ตั้งแต่เรื่องการใช้งานโมเดลแต่ละ model ว่าสมควรใช้ในเคสไหนบ้าง มี service ไหนที่สามารถจับคู่ไปใช้งานด้วยกันได้ หรือการอัพเดทโมเดลที่ใช้งานอยู่ เพื่อเพิ่มประสิทธิภาพ ประหยัด Cost ลดระยะเวลาในการทำงาน

นอกจาก ML Specialty แล้ว AWS ก็ยังมี Certification อันอื่นอีกไหม

Pathway ของ AWS Certification

ในบทความก่อนๆ เราได้รีวิวการสอบ AWS Cloud Practitioner และ AWS Solutions Architect เอาไว้ แต่เพื่อนๆอาจจะสงสัยว่าจริงๆแล้ว AWS มี Certificate อะไรบ้าง ควรเริ่มจากอันไหน แล้วต่อด้วยอันไหน AWS แบ่ง Certificate ออกเป็น 4 ระดับ ดังนี้

AWS Fundamental
AWS Fundamental

ระดับ Fundamental

Certificate พื้นฐานแรกสำหรับคนที่เริ่มมาศึกษา AWS Cloud คือ AWS Cloud Practitioner – Fundamental

AWS Associate
AWS Associate

ระดับ Associate

Certificate ระดับ Associate เป็นระดับที่เหมาะกับคนมีประสบการณ์ขึ้นมาหน่อย และเข้าใจพื้นฐานบ้างแล้ว มีด้วยกัน 3 อัน คือ AWS Solutions Architect, AWS Developer และ AWS SysOps Administrator

AWS Professional
AWS Professional

ระดับ Professional

Certificate ระดับ Professional เป็นระดับสูงสุดเหมาะสำหรับคนที่เชี่ยวชาญการแก้ปัญหาด้วย AWS Cloud มีด้วยกัน 2 Certificate คือ AWS Solutions Architect – Professional และ AWS DevOps Engineer – Professional

นอกจากนี้ยังมี Certificate ทางเทคนิคในแต่ละโดเมนระดับ Specialty

AWS Specialty
AWS Specialty

ระดับ Specialty

Certificate ในระดับ Specialty มีด้วยกันหลายอันแบ่งออกไปตามเทคนิค ทั้งด้าน Advanced Networking, Data Analytics, Database, Machine Learning, Security และ SAP on AWS

ใครอยากได้ Badge สวยๆมาไว้ในกำมือ ไปอ่านต่อกันเลยว่าเนื้อหาการสอบ ML Specialty นั้นมีอะไรบ้าง

เนื้อหาการสอบ AWS Machine Learning Specialty Certificate

มาเริ่มที่เนื้อหาการสอบกันก่อน ข้อสอบ AWS Certified ML Specialty นั้น จะเน้นการทดสอบเนื้อหา 4 ด้านเป็นหลัก โดยแบ่งเป็น

เนื้อหาภาพรวมเปอร์เซ็น
Data Engineeringการสร้าง repository เก็บข้อมูล การเลือกวิธีการ Ingestion และทำ ETL ข้อมูลที่เหมาะสม เตรียมพร้อมสำหรับ Machine Learning20%
Exploratory Data Analysisการคลีนข้อมูล การทำ feature engineering การวิเคราะห์ และ visualize ข้อมูล24%
Modellingการเลือกโมเดลให้เหมาะสม รวมถึงการเทรน การทำ hyperparameter tuning และการประเมินโมเดลสามารถใช้งานได้ดีขนาดไหน36%
Machine Learning Implementation and Operationsวิธีการสร้างโมเดลให้เสถียน ยืดหยุ่น ทนทานต่อการเกิดปัญหา และปลอดภัย สามารถแนะนำบริการ Machine Learning ที่เหมาะสม รวมถึง deploy 20%

เห็นได้ว่าด้าน Modelling มีน้ำหนักมากที่สุด กว่าหนึ่งในสามถึง 36% เนื่องจาก Certificate ต้องการวัดแก่นของ Machine Learning เน้นๆ ว่ามีความเข้าใจเกี่ยวกับการเลือกโมเดลให้เข้ามาข้อมูลหรือโจทย์ที่ได้มามากแค่ไหน ระหว่าง Xgboost, logistic regression, K-means, หรือ decision trees เป็นต้น รู้ความแตกต่างระหว่าง Supervised และ Unsupervised learning รู้วิธีการเทรนและทดสอบโมเดล รวมถึงเรื่อง loss function เทรนโมเดลอีกรอบยังไงเมื่อโมเดลเริ่มให้ผลไม่ตรงแล้ว รู้เรื่องการทำ hyperparameter tuning เช่น Regularization, Cross validation, Learning rate และอื่นๆ สุดท้ายการประเมิน accuracy ของโมเดล ต้องเข้าใจเรื่อง overfitting/underfitting และจำวิธีคำนวณ metrics อย่าง AUC-ROC, accuracy, precision, recall, RMSE และ F1 score จาก Confusion matrix ได้

ส่วนอื่นๆนั้นก็จะมีเปอร์เซ็นที่ใกล้เคียงกัน เป็นส่วนที่ทำให้เราเข้าใจตั้งแต่การเตรียมข้อมูล นำข้อมูลเข้ามา ในส่วน Data Engineer 20% ส่วน EDA คลีนข้อมูลและให้ทำความเข้าใจกับข้อมูลอีก 24% และส่วนสุดท้ายเป็นการนำโมเดลขึ้น production ทำ A/B testing การ maintain pipeline และเข้าใจ AWS Machine Learning Service ที่มีอยู่

ข้อสอบมีทั้งหมด 65 ข้อ โดยมี 50 ข้อที่เก็บคะแนน อีก 15 ข้อที่ไม่เก็บคะแนน แต่เป็นการเก็บข้อมูลเพื่อใช้ในประเมินข้อสอบในภายภาคหน้า โดยให้เวลาทำ 180 นาที คำตอบจะมีสองแบบ ทั้ง Multiple choice คือ แบบหลายตัวเลือกโดยที่จะมีคำตอบที่ถูกต้องคำตอบเดียว และ Multiple response คือแบบหลายคำตอบจะมีคำตอบที่ถูกสองคำตอบขึ้นไป โดยที่เราทำเครื่องหมายไว้ได้ว่าข้อไหนไม่มั่นใจ และสามารถกลับไปตรวจสอบหรือเปลื่ยนคำตอบได้ทุกข้อขณะที่ยังมีเวลาอยู่

สามารถเข้าไปดูรายละเอียดของเนื้อหาเพิ่มเติมได้ตามเอกสาร Exam Guide ได้เลยค่ะ

วิธีการเตรียมตัวสอบ AWS Certified ML Specialty

เราสามารถเริ่มเตรียมตัวได้หลายทางมาก

  • Exam Readiness AWS Certified Machine Learning – Specialty: เป็นคอร์สฟรีสั้นๆของ AWS เพียงแค่ 4 ชั่วโมง เพื่อช่วยให้เราเข้าใจแนวคิดและเทคนิคในการทำข้อสอบ แนะแนวบริการหลัก และคอนเซ็ปสำคัญ ในเนื้อหาแต่ละส่วน เหมาะสำหรับคนที่กำลังเตรียมตัวสอบ อยากเข้าใจภาพรวมว่าจะเจอกับอะไรบ้าง พร้อมควิซทบทวนสั้นๆ ทั้งหมดเป็นภาษาอังกฤษ สามารถเข้าไปเรียนตอนไหนก็ได้
  • A Cloud Guru เป็นแหล่งรวมคอร์สเรียนเพื่ออัพสกิล ภายในระยะเวลาสั้นๆ ให้ได้ลงมือเล่นทำจริงๆ จากผู้เชี่ยวชาญหลายค่าย ทั้ง AWS, Azure, Google Cloud และอื่นๆ มาสอน แค่พิมพ์ AWS Certified Machine Learning แล้วเลือกอันที่เป็นคอร์สเรียน ในคอร์สมีเนื้อหา สรุปตอนจบ และแบบทดสอบให้สามารถทำกี่ครั้งก็ได้ โดยคนสอนนั้นจะสอนแบบตรงประเด็น และเน้นส่วนสำคัญที่เราควรรู้
  • Udemy เป็นอีกแหล่งรวมคอร์สอีกอันหนึ่งที่มีคอร์สเยอะมาก แนะนำคอร์ส AWS Certified Machine Learning Specialty 2022 ของคุณ Stephane Maarek ซึ่งเป็นคนสอนที่มีประสบการณ์และมี Certificate หลายใบมากถึง 9 ใบและคุณ Frank Kane ซึ่งมีประสบการณ์กว่า 9 ปีที่ Amazon และ IMDb คอร์สนี้จะมีเนื้อหาที่แน่น จุใจถึง 11 ชั่วโมงครึ่ง พร้อมข้อสอบหนึ่งชุดมาให้ลองทำ
  • คำถามตัวอย่าง AWS Certified Machine Learning – Specialty คือ ชุดข้อสอบตัวอย่างสั้นๆพร้อมเฉลย 10 ข้อ ที่ AWS จัดทำขึ้นมาเพื่อให้เราได้พอเห็นแนวทางว่าข้อสอบจะเป็นไปประมาณไหน ที่สำคัญฟรีค่ะ ใครอยากเห็นตัวอย่างข้อสอบลองเข้าไปดูได้เลยค่ะ
  • Udemy Practice Exam คือสิ่งสุดท้ายที่เราคิดว่าเพื่อนๆต้องทำ และแนะนำให้ลองทำเยอะๆ จะได้สามารถจับแนะทาง และจำสิ่งที่ใช้ในการสอบได้ แนะนำ Practice Exam ของคุณ Jon Bonso และ Practice Exam ของคุณ Abhishek Singh ในคอร์สจะมีข้อสอบ 2 -3 ชุด ความยากง่ายจะแตกต่างกันออกไป โดยมีเฉลยที่ละเอียดมากช่วยอธิบายให้เราเข้าใจในส่วนที่ไม่มั่นใจได้ อยากให้ลองทำหลายๆรอบ และเก็บรายละเอียดให้ครบ แล้วเพื่อนๆจะทำได้แน่นอน

ไปดูตัวอย่างข้อสอบให้ใจชื้นกันเลย

ตัวอย่างข้อสอบ AWS ML Certified Specialty

คำถามส่วนมากจะเป็นการให้ scenario มาวิเคราะห์ ว่าทำอย่างไรเหมาะสมกับสถานการณ์และเงื่อนไขที่มีอยู่มากที่สุด ซึ่งต้องอาศัยความจำ บวกความเข้าใจ เกี่ยวกับบริการที่มีอยู่ ทริคข้อหนึ่งคือ ถ้าไม่รู้คำตอบให้ทำไปเรื่อยๆ ไม่ต้องตกใจ อ่านคำถามและทำความเข้าใจต่อไป อาจจะมีบางข้อที่ตอบคำถามที่เราสงสัยได้

1. A company is interested in building a fraud detection model. Currently, the data scientist does not have a sufficient amount of information due to the low number of fraud cases.
Which method is MOST likely to detect the GREATEST number of valid fraud cases?

A) Oversampling using bootstrapping
B) Undersampling
C) Oversampling using SMOTE
D) Class weight adjustment

คำตอบ

ข้อที่ถูกคือ C)

จากคำถามบริษัทสนใจที่จะสร้างโมเดลสำหรับจับ Fraud ซึ่งในตอนนี้ยังมีข้อมูลไม่เพียงพอ เนื่องจากมีจำนวนเคสที่เป็น Fraud น้อยจะเห็นได้ว่า ต้องการจะรู้ว่าทำอย่างไรถึงจะช่วยเพิ่มจำนวนเคสได้ เราสามารถทำการ Oversampling ได้โดยวิธี SMOTE หรือ Synthetic Minority Over-sampling Technique ซึ่งเป็นการเพิ่มจำนวนข้อมูลโดยการสังเคราะห์ Data Point ที่เป็น Fraud เคส หรือ minority class อย่างมีประสิทธิภาพนั่นเอง

เพื่อนสามารถอ่่านเพิ่มเติมเกี่ยวกับเทคนิคนี้ได้ใน SMOTE: Synthetic Minority Over-sampling Technique

2. A machine learning team has several large CSV datasets in Amazon S3. Historically, models built with
the Amazon SageMaker Linear Learner algorithm have taken hours to train on similar-sized datasets. The
team’s leaders need to accelerate the training process.
What can a machine learning specialist do to address this concern?

A) Use Amazon SageMaker Pipe mode.
B) Use Amazon Machine Learning to train the models.
C) Use Amazon Kinesis to stream the data to Amazon SageMaker.
D) Use AWS Glue to transform the CSV dataset to the JSON format.

คำตอบ

ข้อที่ถูกคือ A)

จากคำถามจะเห็นได้ว่า Team Lead ต้องการย่นระยะเวลาในการเทรนโมเดล โดยที่ผ่านๆมามีการใช้ Amazon SageMaker พร้อมกับ Build-in Algorithm อย่าง Linear Learner ซึ่งใช้เวลานานเป็นชั่วโมงในการเทรนข้อมูล csv ขนาดใหญ่ที่เก็บใน S3 Bucket

ถ้าเราต้องการจะลดระยะเวลาก็สามารถทำได้โดยใช้ Pipe mode ซึ่งสามารถ stream ข้อมูลจาก S3 Bucket เข้ามาใน training instance แทนการโหลดข้อมูลเข้ามาได้เลย ทำให้เริ่มเทรนได้เร็วขึ้น มี throughput ที่ดีขึ้น ใช้พื้นที่ disk น้อยลง และข้อ A) ก็เป็นคำตอบที่ตรงตัวที่สุด ใน choice ข้ออื่นๆนั้นดูจะใช้ไม่ได้กับสถานการณ์ที่ให้มาเท่าไหร่ และการเปลื่ยนจาก CSV เป็น JSON นั้นก็ไม่ได้ช่วยอะไร

อ่านเพิ่มเติมเกี่ยวกับการใช้ Pipe mode ได้ที่ Now use Pipe mode with CSV datasets for faster training on Amazon SageMaker built-in algorithms

พอสอบเสร็จ เวลาหมดแล้ว หน้า Result ก็จะขึ้นมาให้เรารู้ผลทันทีว่าผ่านหรือไม่ผ่าน โดยเกณฑ์การผ่านจะอยู่ที่ 750 คะแนนขึ้นไป เต็ม 1000 หลังจากนั้นเค้าก็มีรายงานมาให้ว่าเราผ่านพาร์ทไหนทำได้เท่าไร หรือมีพาร์ทไหนที่ต้องเรียนรู้เพิ่มบ้างถ้ายังไม่ผ่าน

สรุปแล้ว AWS ML Certified Specialty เหมาะกับใคร

AWS ML Certified Specialty เหมาะสำหรับคนที่มีทำงานด้าน Data Science มีความรู้พื้นฐานด้าน Cloud Computing และการรัน Machine Learning มาบ้าง AWS แนะนำว่าควรมี

  • ประสบการณ์อย่างน้อย 2 ปี ในการพัฒนา สร้างและรัน Machine Learning หรือ Deep Learning บน AWS Cloud
  • ความเข้าใจเบื้องต้นเกี่ยวกับ ML algorithms
  • ประสบการณ์ในการทำ hyperparameter optimization
  • รู้ Best Practice ในการเทรนโมเดล deploy โมเดล

สำหรับใครที่อยากรู้เพิ่มเติมเกี่ยวกับเทคโนโลยีสาย Data Engineer สามารถเข้าไปเรียนรู้เพิ่มเติมได้ที่บทความ 7 เทคโนโลยีที่ Data Engineer ต้องรู้จัก พร้อมแนะนำแหล่งเรียน

ถ้าเพื่อนๆคิดว่าบทความนี้มีประโยชน์ อยากฝากให้ช่วยแชร์ให้เพื่อน ๆ หน่อยนะคะ และถ้าอยากติดตามบทความดี ๆ ด้าน Data กันบน Facebook หรืออยากมาพูดคุย ติชมกัน เชิญได้ที่ Facebook Page: DataTH – Data Science ชิลชิล เลยนะค้าา

แล้วพบกันใหม่บทความหน้าค่ะ

บทความอื่น ๆ ที่เกี่ยวข้อง

เราใช้คุกกี้เพื่อพัฒนาประสิทธิภาพ และประสบการณ์ที่ดีในการใช้เว็บไซต์ของคุณ คุณสามารถศึกษารายละเอียดได้ที่ นโยบายความเป็นส่วนตัว และสามารถจัดการความเป็นส่วนตัวเองได้ของคุณได้เองโดยคลิกที่ ตั้งค่า

Privacy Preferences

คุณสามารถเลือกการตั้งค่าคุกกี้โดยเปิด/ปิด คุกกี้ในแต่ละประเภทได้ตามความต้องการ ยกเว้น คุกกี้ที่จำเป็น

Allow All
Manage Consent Preferences
  • Always Active

Save