อยากเป็น Data Scientist คุณเองก็เริ่มได้! คุยกับคนไทยที่เรียนคอร์สออนไลน์จบแล้วกว่า 50 คอร์ส

Share on facebook
Share on twitter
Share on linkedin

คอร์สออนไลน์ด้าน Data Science มีมากขึ้นเรื่อย ๆ จากหลากหลายมหาวิทยาลัยค่ะ ซึ่งมหาวิทยาลัยดัง ๆ และโปรเฟสเซอร์ดัง ๆ ก็ทำคอร์สน่าสนใจออกมาเต็มไปหมด ตัวอย่างเช่น คอร์ส Deep Learning ของท่านเทพ Andrew Ng คำถามที่ทุกคนน่าจะสงสัยคือ… แล้วคอร์สไหนล่ะดีที่สุด?

หลังจากคอนเท้นท์ Python พอแจนได้คุยกับคุณอาร์มไปเรื่อยๆ ก็พบว่า คุณอาร์มเรียนคอร์สต่างๆ ทั้งออนไลน์และออฟไลน์จนเก็บ Achievement ใบประกาศนียบัตรได้ถึง 50 ใบเข้าไปแล้ว ขุ่นพระ ทั้งหมดนี่เกิดขึ้นในระยะเวลาแค่ 2 ปี !! นี่มันมิติควอนตัมหรือเปล่า

สายโหดมาเองค่ะงานนี้ แจนเลยขอสัมภาษณ์คุณอาร์มเพิ่มเติมว่าที่เรียนมาทั้งหมดเนี่ย เรียนอะไรมาบ้าง ในบทความนี้คุณอาร์มมีแนะนำคอร์สให้ผู้ที่เริ่มต้นสนใจคอร์สด้าน Data Science รวมถึงคนที่อยากเรียนระดับสูงด้วย

คอร์สไหนดี คอร์สไหนเด็ด จะเริ่มต้นเรียน Data Science ยังไง บทความนี้มีคำตอบค่ะ

สัมภาษณ์คุณอาร์ม คนไทยสุดขยันที่ได้ใบ Certificate ออนไลน์กว่า 50 ใบ

arm data science course
คุณอาร์ม ผู้พิชิต 50+ Certificate ในระยะเวลาเพียง 2 ปี

แอดแจน : แนะนำตัวอีกรอบหน่อยค่ะ ว่าเป็นใคร มาจากไหน

คุณอาร์ม : สวัสดีครับ ชื่อ อาร์ม ครับ ตำแหน่งปัจจุบันเป็น System analyst และ Application consultant อยู่ที่บริษัท P&O Global Technologies Thailand ซึ่งเกี่ยวกับ IT Software

แอดแจน : จุดเริ่มต้นที่ทำให้คุณอาร์มเริ่มเรียนคอร์สออนไลน์

คุณอาร์ม : จริงๆ เมื่อก่อนผมเป็นเด็กไม่ค่อยตั้งใจเรียน ทำให้พื้นฐานผมไม่ค่อยดีเท่าไหร่ เลยจนมาถึงจุดนึงความรู้กับมุมมองเริ่มจะตันๆ เจอ Data เข้าไปก็จะมึนๆหน่อย ไปต่อไม่ถูก เลยลองเสริชวิธีต่างๆ จากอาจารย์ Google

แล้วก็เจอพวกคลิป + คอร์สเรียนออนไลน์ เยอะมาก จุดนี้เองที่มัน ‘เปิดโลก’ การเรียนของผมไปอีกขึ้น ยิ่งสมัยนี้เป็นยุคที่เราเรียนจากที่ไหน เมื่อไหร่ก็ได้ ความรู้ทุกอย่างอยู่บนอากาศเลยก็ว่าได้ ทำให้สะดวกมากๆครับ

แอดแจน : เริ่มเรียนมานานยัง และเรียนจบไปกี่คอร์สแล้วคะ

คุณอาร์ม : ผมใช้เวลาไปปีกว่าๆ รวมๆใบเซอ ที่มีก็ 50 กว่าใบแล้วครับ

Online Certificate MOOC
Certificate ส่วนหนึ่งของคุณอาร์ม มาจากหลากหลายที่มาก ๆ ค่ะ

แอดแจน : โอ้โห สุดยอดไปเลย ช่วยเล่าหน่อยว่าใน 50 ใบนี้มีเกี่ยวกับเรื่องอะไรบ้างคะ

คุณอาร์ม : ในตอนแรกที่เรียนคือเรียนเกือบทุกอย่างจริงๆ มีจิตวิทยา การตลาด พลังงานทดแทน การถ่ายภาพ

จนหลังจากที่ได้รู้จักกับ Data Science เราก็เริ่มก็เริ่มเรียนรู้เรื่อง Data Science โดยตรงจากเว็บไซต์ Coursera และมีการเรียน Coding เพิ่มเติมในหลาย ๆ ภาษา เช่น จาก Datacamp และ Sololearn

แอดแจน : เริ่มเรียนคอร์สด้านโปรแกรมมิ่ง คอร์สแรก คอร์สอะไร ?

คุณอาร์ม : คอร์สแรกที่เริ่มเรียนเกี่ยวกับ Data คือ Python 3 Tutorial

เป็นคอร์สสอนเขียนโปรแกรม Python เบื่องต้น โดยปูพื้นฐานความเข้าใจในภาษา Python ตั้งแต่เริ่ม มีแบบฝึกหัดให้ทำเล็กน้อย โดยส่วนใหญ่เป็นการฝึกความจำมากกว่า เรียนคอร์สนี้จบอาจจะไม่ได้ทำ Python เป็นเลย แต่เราจะเข้าใจโครงสร้างของมันมากขึ้น

แอดแจน :  ในความเห็นคุณอาร์ม คนที่อยากเริ่มต้นในสาย Data Science ต้องเรียนรู้ในส่วนไหนบ้างคะ

คุณอาร์ม : Data Science มันเป็นอะไรที่สุดยอดมากๆนะ เป็นการรวม 3 ศาสตร์มาวิเคราะห์ข้อมูล ทั้งพื้นฐานของคณิตศาสตร์สถิติ / โปรแกรมมิ่ง  / ความเข้าใจในข้อมูลเชิงธุรกิจ ซึ่งถ้าเข้าใจตัวพื้นฐานแล้ว เราก็สามารถนำไปต่อยอดอื่นๆเพิ่มเติมได้

อยากเป็น Data Scientist คุณเองก็เริ่มได้! คุยกับคนไทยที่เรียนคอร์สออนไลน์จบแล้วกว่า 50 คอร์ส 1
วงกลม 3 วงที่ประกอบกันเป็น Data Science ขอขอบคุณรูปจาก Toward Data Science

สำหรับการเริ่มต้นเป็น Data Science อยากแนะนำเป็นสองส่วนละกัน

ส่วนแรกเป็นส่วนที่ผมกำลังศึกษาอยู่ตอนนี้คือ Math และ Statistic เพราะเป็นส่วนสำคัญมาก ในการสร้างและปรับปรุง Algorithm เพื่อแก้โจทย์  ถามว่ายากไหม ยากนะด้วยคนที่ไม่ได้เรียนคณิตศาสตร์มาตอนมหาลัย แต่เราจะทำได้วันนึงเราจะเข้าใจถ้าหากสนใจมากพอ โดยผมแนะนำแหล่งศึกษาเพิ่มเติมสำหรับเพื่อนๆที่ Khan Academy

ในส่วนที่สองผมแนะนำเป็นคอร์สเรียนเขียนโปรแกรมเบื้องต้น คือ Intro to Python for Data Science ของ Data Camp เป็นการเรียนพื้นฐานการเขียนโปรแกรมแบบลงมือทำ โดยจะมีการสอนพร้อมโจทย์ให้ลองทำอยู่ในหน้าเพจเดียวกัน ทำให้เกิดการปฏิบัติจริง ตอนผมเรียนเป็นคอร์สฟรีที่จะเปิดให้ลองแค่ไม่กี่คอร์ส โดยที่ Data Camp ก็มีคอร์สอื่นๆ อีกมากมายให้เลือก ถือว่าเป็นเว็บที่ครบนะถ้าหากต้องการศึกษาการเขียน Python เพื่อปรับใช้ในงานของ Data Science

อยากเป็น Data Scientist คุณเองก็เริ่มได้! คุยกับคนไทยที่เรียนคอร์สออนไลน์จบแล้วกว่า 50 คอร์ส 2

ตัวอย่างเนื้อหาจากคอร์ส Intro to Python for Data Science ของ Datacamp เค้าสอนเรื่องยากให้เข้าใจได้ง่ายมาก ๆ

แอดแจน : จากบรรดาคอร์สเกี่ยวกับ Data Science ที่เรียนมาทั้งหมด คุณอาร์มจะแนะนำคอร์สไหนสำหรับคนที่อยากเริ่มเรียนรู้เรื่องนี้

คุณอาร์ม :  สำหรับคนที่เริ่มต้น ผมแนะนำ Data Science Pathway ของ CHULA MOOC Achieve เพราะเป็นคอร์สที่เข้าใจง่าย ไม่ซับซ้อน เป็นการปูพื้นฐานและนำไปต่อยอดได้ดี นอกจากนี้ยังมี Pathway Assistant คอยตอบสิ่งที่สงสัย และมีกิจกรรมต่างๆให้ผู้เรียนมาแลกเปลี่ยนความรู้ และมุมมองใหม่ๆกับอยู่ตลอดครับ

โดยเนื่อหาจะมีด้วยกัน 4 บท บทแรกจะเป็นการทำความเข้าใจเกี่ยวกับข้อมูลว่าคืออะไร การนำไปประยุกต์ใช้ ส่วนบทที่สองกับบทที่สามจะเป็นการรู้จักและใช้งานเครื่องมือ Rapidminer ซึ่งไม่จำเป็นต้องเขียนโค้ดเลย ส่วนบทสุดท้ายเป็นการสอนการจัดการข้อมูลด้วย Python เบื้องต้น

โดยรวมแล้วเป็นการเริ่มต้นที่ดีในการเข้าใจ Data Science ทำให้รู้ว่าเราควรจะไปในทิศทางไหนต่อ  อ่อแล้ว Data Science Pathway ของ CHULA MOOC Achieve ยังเป็น Blended Learning คือจะมีกิจกรรมให้ผู้เรียนมาพบปะแลกเปลี่ยนความรู้กันด้วย

แอดแจน : แล้วถ้าคนที่มีพื้นฐานมาบ้างแล้ว คุณอาร์มมีคอร์สไหนแนะนำบ้างคะ

คุณอาร์ม : ถ้าเป็นขั้นสูงขึ้นมาหน่อยผมแนะนำในพาร์ทที่สำคัญสุดของ Data Science คือการ “เตรียมข้อมูล”

ผมแนะนำคอร์ส Data analysis with Python ของ Coursera

เป็นคอร์สที่สอนตั้งแต่การนำเข้าข้อมูล ตรวจสอบและทำความเข้าใจข้อมูล และทำความสะอาดข้อมูลด้วย Pandas เพื่อเตรียมใช้ในขั้นตอนการสร้างโมเดลต่อไป จะเน้นทำความเข้าใจและมีการบ้านให้ทำในแต่ละบท ซึ่งผมแนะนำให้ทำเพราะเค้าทำไว้ดีมาก เราต้องคิดและทำเองจากที่เรียนมา อารมณ์เดียวกับตอนเราเรียนในโรงเรียนหรือมหาลัย ที่อาจารย์สอนอย่างนึงและออกข้อสอบยากกว่าที่สอนมากๆ แต่ต่างกันตรงที่เราสามารถหาข้อมูลเพิ่มเติมรวมถึง สามารถกลับไปศึกษาจากบทเรียนก่อนหน้าเพื่อทำความเข้าใจได้ ซึ่งถ้าทำการบ้านเสร็จ ก็จะเข้าใจในหลักสูตรมากขึ้นมากๆ

พวกภาษาโปรแกรมมิ่งมาแรงอย่าง Python คอร์สที่รู้สึกว่าดีมากๆ คือ Python for Data Science ของ IBM จาก Coursera เป็นคอร์สที่ค่อนข้างดีสำหรับคนที่อยากเริ่มต้นนะ

คอร์สนี้จะปูสอนพื้นฐานด้าน Python ทั้งส่วนของ Fundamental และ Data Structure ทั้งหมด โดยมีการบ้านแต่ละบทให้ทำด้วย จึงสามารถนำไปความรู้ที่ได้ไปลองประยุกต์ใช้ตอนนั้นเลยก็เป็นอะไรที่สนุกและเครียดปนกัน เพราะทุกอย่างมันจะต้องมีตรรกะในการคิดตามลำดับ แต่พอทำได้ก็จะเข้าใจทุกอย่างที่เค้าสอนมาเลย

ผมแนะนำหากเรียนพื้นฐานมาแล้วให้เรียนคอร์สที่ยากๆ ทำการบ้านที่เขาให้ และฝึกฝนลองทำบ่อยๆ เพราะถ้าผ่านมาได้เราจะรู้สึกมั่นใจมากขึ้นครับ

แอดแจน : สุดยอดมากเลยค่ะ แล้วนอกจากการเรียนเรื่อง Data Science แล้ว คุณอาร์มเรียนในหมวดหมู่ไหนเพิ่มเติมไหมคะ

คุณอาร์ม : จริงๆแล้วผมชอบเรียนด้านจิตวิทยานะ เพราะเป็นเรื่องที่สามารถช่วยเราในชีวิตประจำวันและการทำงานที่ต้องพบปะผู้คนอยู่ตลอด ที่เรียนแล้วชอบคงเป็น จิตวิทยากับชีวิตประจำวัน ของ CMU Thai MOOC ซึ่งผู้สอน มีวิธีการสอนที่น่ารักและเข้าใจง่าย

Key takeaways หลักๆคือแนวคิดจิตวิทยาว่าเป็นอย่างไร , การเข้าใจในตนเองมากยิ่งขึ้น และการเรียนรู้ที่จะเข้าใจผู้อื่น

คอร์สนี้ไม่ได้ลงลึกมาก จะช่วยให้เราเข้าใจตัวเอง เข้าใจผู้อื่น และเป็นดำเนินชีวิตประจำวันแบบแฮปปี้ขึ้นครับ

แอดแจน : คุณอาร์มเรียนเยอะขนาดนี้ มีวิธีคิดในการเลือกลงคอร์สแต่ละคอร์สยังไงบ้างคะ

คุณอาร์ม : ผมใช้แนวคิดการเรียนรู้รูปตัว T โดยเน้นเรียนพื้นฐานหลายๆศาสตร์เพื่อเก็บความรู้แบบแผ่ออกด้านข้างให้มีมุมมองที่กว้างขึ้น จนเจอเรื่องที่สนใจ ก็จะศึกษาลงลึกเพิ่มในเรื่องนั้นๆ ให้มีความรู้เชิงลึกในเรื่องที่สนใจ

t-shaped learning
T-Shaped Learning คือการเรียนทั้งแบบรู้กว้าง และรู้ลึก

จนวันนีงเราติดนิสัยว่าต้องพัฒนาตนเองตลอดเวลา เพราะหากหยุดวันนึงคือพอขี้เกียจแล้วมันจะไหลยาวไปหลายวันนะ ฮ่าๆๆ รู้ตัวอีกที่เหมือนต้องกลับมาเริ่มใหม่สร้างนิสัยกันใหม่เลย ก็เลยเป็นที่มาของการเรียนเพื่อเอาใบ Certificate เอาจริงๆมันเป็น Achievement อย่างนึงในการเรียนรู้นะ มันทำให้เราชื่นใจเวลาที่เรียนจบแล้ว

ยิ่งคอร์สที่ยากๆการบ้านโหดๆก็จะยิ่งรู้สึกดี ตอนแรกๆที่ได้มายังไม่ค่อยเห็นประโยชน์เท่าไหร่ แต่พอหลังๆ เริ่มเห็นว่าเรานำความรู้ที่ได้มามาปรับใช้กับการทำงานและเห็นผลชัดเจน ของแถมคือการสร้างนิสัยในการเรียนรู้ตลอดชีวิต

แอดแจน : การที่เราศึกษาในหลากหลายแขนง มันช่วยส่งเสริมกันยังไงบ้าง

คุณอาร์ม : สิ่งที่เราทุกคนรู้หลังจากรู้จัก Data Science คือมันไม่ใช่การเขียนโปรแกรมขึ้นมาแล้วผลออกมาเลย แต่เป็นการตีโจทย์ การตั้งปัญหา ในงานที่กำลังทำและวิเคราะห์หาวิธีแก้ไขหรือปรับปรุงโจทย์ที่เราตั้งไว้

ทำไมต้องศึกษาเรื่องอื่นๆ? เพราะงานที่เราทำบางครั้งมันไม่ใช่เรื่องที่เราถนัดหรือมีความรู้มาก่อน

ขอยกตัวอย่างด้วยชุดข้อมูลการวิเคราะห์ไวน์แดง (Red Wine Quality) จาก Kaggle ชุดข้อมูลนี้มีความคลีนมากในระดับนึง คือแทบไม่ต้องเตรียมอะไรมากเลย แค่จับโยนเข้า Machine Learning เลือกโมเดลมาสักอันก็จะได้ผลลัพธ์ที่น่าพอใจ คอมพิวเตอร์สามารถตอบเราได้ว่าคุณภาพของไวน์ตัวนี้ดีตัวนี้ไม่ดี

Red wine Kaggle
ชุดข้อมูล Red Wine Quality บน Kaggle

ประเด็นสำหรับผมมันคือ แล้วเราจะเอามันไปทำอะไรต่อ ทำไมไวน์ถึงคุณภาพดี? เราจึงต้องย้อนกลับไปตั้งแต่แรก การทำงาน Data Science ไม่ใช่การเขียนโปรแกรมแล้วจับโยนใส่ Tool แต่เป็นการ “เข้าใจข้อมูล” ที่มาของข้อมูล ตัว parameter ต่างๆ ว่าในชุดข้อมูลนี้ประกอบด้วยอะไรบ้าง

red wine
ตัวอย่างที่คุณอาร์มแสดงผลจากชุดข้อมูล red wine

อย่าง Dataset ตัวอย่างมีสารประกอบต่างๆ เช่น alcohol , residual sugar ทำไมถึงต้องเป็นสารตัวนี้? เพราะมันเป็นขั้นตอนการหมักไวน์ แล้วสารตัวนี้ส่งผลอย่างไรกับคุณภาพไวน์? อาจจะทำให้มีรสหวานรสเค็ม การทำความเข้าใจชุดข้อมูลทั้งหมดนี้จะเป็นการนำไปสู่การตั้งคำถามและสมมติฐานในขั้นตอนต่อไปเราจะเข้าใจถ่องแท้ว่าข้อมูลนี้เกิดจากกระบวนการใด แล้วนำไปทำอะไรได้บ้าง เพื่อขยายขอบเขตความรู้และความเข้าใจเราจึงต้องศึกษาเรื่องต่างๆรอบตัวไปพร้อมๆกับการเรียน Data Science

สำหรับใครที่อยากลองทำชุดข้อมูลไวน์แดง จริงๆทางแล้ว uci เขามีชุดข้อมูลตัวเต็ม ซึ่งเกี่ยวกับไวน์ขาวและไวน์แดงที่ลิ้งนี้

แอดแจน : คุณอาร์มเรียนมาหลากหลายหลักสูตรถามจริงว่าจำได้มั้ย

คุณอาร์ม : ตอบได้เลยครับว่าไม่ ฮ่าๆ คือที่เรียนมาจะให้จำทั้งหมดมันยากนะเอาจริงๆ แต่ถามว่าวันนึงถ้าเราต้องนำไปประยุกต์ใช้ ก็สามารถที่จะกลับไปฟื้นความจำจากสิ่งที่เรียนมาได้เร็วกว่าการที่เราไม่เคยเรียนมา ผมมองตรงนั้นมากกว่าเพราะถ้าเราผ่านเรื่องนั้นมาแบบเข้าใจจริงๆ การจะทำความเข้าใจอีกครั้งมันย่อมดีกว่าเริ่มจาก 0 นะ ผมมั่นใจแบบนั้นเลยคิดว่าการเรียนรู้จะไม่เสียเปล่า ความรู้จะยังคงอยู่ใน database ในสมองเรารอวันที่เค้าจะได้ออกมาช่วยเราแน่นอน

แอดแจน : ทั้งทำงานประจำ ทั้งเรียยนออนไลน์ ไหนจะกิจกรรมอื่นๆ คุณอาร์มมีวิธีการแบ่งเวลายังไงคะ

คุณอาร์ม : สำหรับผมเวลาของคนเราไม่เท่ากันนะ ทุกคนมีเวลาเป็นของตัวเอง การบริหารเวลาก็ต้องขึ้นอยู่กับของแต่ละคน ทุกคนรู้ดีว่าเวลาว่างของตัวเองคือตอนไหน ตอนไหนที่เราจะเรียนรู้ได้ เพราะงั้นการแบ่งเวลาไม่มีวิธีตายตัว สิ่งที่ยากที่สุดคือ “ข้ออ้าง” ทั้งหลายที่เอาเวลาไปจากเรา

แอดแจน : Next Step จะเรียนอะไร ไปทางไหนต่อ

คุณอาร์ม : ที่วางแผนไว้คือจะไปศึกษาเกี่ยวกับ statistic และ math เพิ่มครับเพราะผมขาดส่วนนี้มากๆ จากพื้นฐานการเรียนในอดีต แล้วทั้งสองอย่างผมคิดว่าเป็นสิ่งสำคัญมากๆในการเข้าใจข้อมูลและนำไปใช้ของ data science โดยเฉพาะในส่วนของการเลือก Model ในการทำ Machine learning

แอดแจน : สุดท้ายแล้ว คุณอาร์มอยากฝากอะไรให้ผู้อ่านมั้ยคะ ? 😀

คุณอาร์ม : เรากำลังเข้าสู่ยุคที่เทคโนโลยีก้าวหน้าอย่างรวดเร็ว ทุกคนสามารถหาแหล่งเรียนรู้ตลอดเวลา หากเราหยุดอยู่กับที่ ในที่สุดเราก็จะโดนทั้งคนและหุ่นยนต์แซงโดยไม่รู้ตัว  

ผมจะไม่พูดถึงแรงกดดันของการพัฒนาตัวเอง แต่อยากพูดถึงสิ่งที่เรารักมากกว่า อยากให้ทุกคนหาสิ่งนั้นให้เจอและลงมือทำ การเรียนรู้ในสิ่งที่เรารักมันจะทำได้ดีกว่า และติดเป็นนิสัยในการเรียนรู้ได้ง่ายกว่า ขอให้จำไว้ว่าถ้าเราทำถึงที่สุดแล้วมันไม่สำเร็จ อย่างน้อยเราก็ได้ลงมือทำในสิ่งที่เรารักแล้ว“สม่ำเสมอ” ยังคงใช้ได้กับทุกสิ่งอย่างนะ ถ้าเราทำอะไรซ้ำๆ จนวันนึงเรารู้สึกว่านี่คือส่วนนึงของชีวิตเรา ไม่ใช่สิ่งที่เราต้องพยายามหรืออดทนทำ วันนั้นเราจะเรียนรู้ได้ด้วยความสุขจริงๆ

“สม่ำเสมอ” ยังคงใช้ได้กับทุกสิ่งอย่างนะ ถ้าเราทำอะไรซ้ำๆ จนวันนึงเรารู้สึกว่านี่คือส่วนนึงของชีวิตเรา ไม่ใช่สิ่งที่เราต้องพยายามหรืออดทนทำ วันนั้นเราจะเรียนรู้ได้ด้วยความสุขจริงๆ

ใครที่อยากเริ่มต้นงานสาย Data Science เชื่อว่าทุกคนสามารถเริ่มได้ง่ายๆ เพียงหมั่นหาความรู้ และฝึกฝนบ่อยๆ เผลอแปปเดียว อาจจะมีใบ Cert เยอะกว่าคุณอาร์มก็ได้นะ คะ 😀 ใครที่มีข้อสงสัยอะไร หรืออยากให้เขียนถึงเรื่องอะไร สามารถส่งข้อความมาในเพจ Data Science ชิลชิล ได้เลยค่า

Leave a comment

อ่านจบแล้วอยากพูดคุยต่อ? พิมพ์ไว้ตรงนี้ได้เลย แอดมาอ่านทุกอันครับ