คอร์สออนไลน์ด้าน Data Science มีมากขึ้นเรื่อย ๆ จากหลากหลายมหาวิทยาลัยค่ะ ซึ่งมหาวิทยาลัยดัง ๆ และโปรเฟสเซอร์ดัง ๆ ก็ทำคอร์สน่าสนใจออกมาเต็มไปหมด ตัวอย่างเช่น คอร์ส Deep Learning ของท่านเทพ Andrew Ng คำถามที่ทุกคนน่าจะสงสัยคือ… แล้วคอร์สไหนล่ะดีที่สุด?
หลังจากคอนเท้นท์ Python พอแจนได้คุยกับคุณอาร์มไปเรื่อยๆ ก็พบว่า คุณอาร์มเรียนคอร์สต่างๆ ทั้งออนไลน์และออฟไลน์จนเก็บ Achievement ใบประกาศนียบัตรได้ถึง 50 ใบเข้าไปแล้ว ขุ่นพระ ทั้งหมดนี่เกิดขึ้นในระยะเวลาแค่ 2 ปี !! นี่มันมิติควอนตัมหรือเปล่า
สายโหดมาเองค่ะงานนี้ แจนเลยขอสัมภาษณ์คุณอาร์มเพิ่มเติมว่าที่เรียนมาทั้งหมดเนี่ย เรียนอะไรมาบ้าง ในบทความนี้คุณอาร์มมีแนะนำคอร์สให้ผู้ที่เริ่มต้นสนใจคอร์สด้าน Data Science รวมถึงคนที่อยากเรียนระดับสูงด้วย
คอร์สไหนดี คอร์สไหนเด็ด จะเริ่มต้นเรียน Data Science ยังไง บทความนี้มีคำตอบค่ะ
สัมภาษณ์คุณอาร์ม คนไทยสุดขยันที่ได้ใบ Certificate ออนไลน์กว่า 50 ใบ
แอดแจน : แนะนำตัวอีกรอบหน่อยค่ะ ว่าเป็นใคร มาจากไหน
คุณอาร์ม : สวัสดีครับ ชื่อ อาร์ม ครับ ตำแหน่งปัจจุบันเป็น System analyst และ Application consultant อยู่ที่บริษัท P&O Global Technologies Thailand ซึ่งเกี่ยวกับ IT Software
แอดแจน : จุดเริ่มต้นที่ทำให้คุณอาร์มเริ่มเรียนคอร์สออนไลน์
คุณอาร์ม : จริงๆ เมื่อก่อนผมเป็นเด็กไม่ค่อยตั้งใจเรียน ทำให้พื้นฐานผมไม่ค่อยดีเท่าไหร่ เลยจนมาถึงจุดนึงความรู้กับมุมมองเริ่มจะตันๆ เจอ Data เข้าไปก็จะมึนๆหน่อย ไปต่อไม่ถูก เลยลองเสริชวิธีต่างๆ จากอาจารย์ Google
แล้วก็เจอพวกคลิป + คอร์สเรียนออนไลน์ เยอะมาก จุดนี้เองที่มัน ‘เปิดโลก’ การเรียนของผมไปอีกขึ้น ยิ่งสมัยนี้เป็นยุคที่เราเรียนจากที่ไหน เมื่อไหร่ก็ได้ ความรู้ทุกอย่างอยู่บนอากาศเลยก็ว่าได้ ทำให้สะดวกมากๆครับ
แอดแจน : เริ่มเรียนมานานยัง และเรียนจบไปกี่คอร์สแล้วคะ
คุณอาร์ม : ผมใช้เวลาไปปีกว่าๆ รวมๆใบเซอ ที่มีก็ 50 กว่าใบแล้วครับ
แอดแจน : โอ้โห สุดยอดไปเลย ช่วยเล่าหน่อยว่าใน 50 ใบนี้มีเกี่ยวกับเรื่องอะไรบ้างคะ
คุณอาร์ม : ในตอนแรกที่เรียนคือเรียนเกือบทุกอย่างจริงๆ มีจิตวิทยา การตลาด พลังงานทดแทน การถ่ายภาพ
จนหลังจากที่ได้รู้จักกับ Data Science เราก็เริ่มก็เริ่มเรียนรู้เรื่อง Data Science โดยตรงจากเว็บไซต์ Coursera และมีการเรียน Coding เพิ่มเติมในหลาย ๆ ภาษา เช่น จาก Datacamp และ Sololearn
แอดแจน : เริ่มเรียนคอร์สด้านโปรแกรมมิ่ง คอร์สแรก คอร์สอะไร ?
คุณอาร์ม : คอร์สแรกที่เริ่มเรียนเกี่ยวกับ Data คือ Python 3 Tutorial
เป็นคอร์สสอนเขียนโปรแกรม Python เบื่องต้น โดยปูพื้นฐานความเข้าใจในภาษา Python ตั้งแต่เริ่ม มีแบบฝึกหัดให้ทำเล็กน้อย โดยส่วนใหญ่เป็นการฝึกความจำมากกว่า เรียนคอร์สนี้จบอาจจะไม่ได้ทำ Python เป็นเลย แต่เราจะเข้าใจโครงสร้างของมันมากขึ้น
แอดแจน : ในความเห็นคุณอาร์ม คนที่อยากเริ่มต้นในสาย Data Science ต้องเรียนรู้ในส่วนไหนบ้างคะ
คุณอาร์ม : Data Science มันเป็นอะไรที่สุดยอดมากๆนะ เป็นการรวม 3 ศาสตร์มาวิเคราะห์ข้อมูล ทั้งพื้นฐานของคณิตศาสตร์สถิติ / โปรแกรมมิ่ง / ความเข้าใจในข้อมูลเชิงธุรกิจ ซึ่งถ้าเข้าใจตัวพื้นฐานแล้ว เราก็สามารถนำไปต่อยอดอื่นๆเพิ่มเติมได้
สำหรับการเริ่มต้นเป็น Data Science อยากแนะนำเป็นสองส่วนละกัน
ส่วนแรกเป็นส่วนที่ผมกำลังศึกษาอยู่ตอนนี้คือ Math และ Statistic เพราะเป็นส่วนสำคัญมาก ในการสร้างและปรับปรุง Algorithm เพื่อแก้โจทย์ ถามว่ายากไหม ยากนะด้วยคนที่ไม่ได้เรียนคณิตศาสตร์มาตอนมหาลัย แต่เราจะทำได้วันนึงเราจะเข้าใจถ้าหากสนใจมากพอ โดยผมแนะนำแหล่งศึกษาเพิ่มเติมสำหรับเพื่อนๆที่ Khan Academy
ในส่วนที่สองผมแนะนำเป็นคอร์สเรียนเขียนโปรแกรมเบื้องต้น คือ Intro to Python for Data Science ของ Data Camp เป็นการเรียนพื้นฐานการเขียนโปรแกรมแบบลงมือทำ โดยจะมีการสอนพร้อมโจทย์ให้ลองทำอยู่ในหน้าเพจเดียวกัน ทำให้เกิดการปฏิบัติจริง ตอนผมเรียนเป็นคอร์สฟรีที่จะเปิดให้ลองแค่ไม่กี่คอร์ส โดยที่ Data Camp ก็มีคอร์สอื่นๆ อีกมากมายให้เลือก ถือว่าเป็นเว็บที่ครบนะถ้าหากต้องการศึกษาการเขียน Python เพื่อปรับใช้ในงานของ Data Science
ตัวอย่างเนื้อหาจากคอร์ส Intro to Python for Data Science ของ Datacamp เค้าสอนเรื่องยากให้เข้าใจได้ง่ายมาก ๆ
แอดแจน : จากบรรดาคอร์สเกี่ยวกับ Data Science ที่เรียนมาทั้งหมด คุณอาร์มจะแนะนำคอร์สไหนสำหรับคนที่อยากเริ่มเรียนรู้เรื่องนี้
คุณอาร์ม : สำหรับคนที่เริ่มต้น ผมแนะนำ Data Science Pathway ของ CHULA MOOC Achieve เพราะเป็นคอร์สที่เข้าใจง่าย ไม่ซับซ้อน เป็นการปูพื้นฐานและนำไปต่อยอดได้ดี นอกจากนี้ยังมี Pathway Assistant คอยตอบสิ่งที่สงสัย และมีกิจกรรมต่างๆให้ผู้เรียนมาแลกเปลี่ยนความรู้ และมุมมองใหม่ๆกับอยู่ตลอดครับ
โดยเนื่อหาจะมีด้วยกัน 4 บท บทแรกจะเป็นการทำความเข้าใจเกี่ยวกับข้อมูลว่าคืออะไร การนำไปประยุกต์ใช้ ส่วนบทที่สองกับบทที่สามจะเป็นการรู้จักและใช้งานเครื่องมือ Rapidminer ซึ่งไม่จำเป็นต้องเขียนโค้ดเลย ส่วนบทสุดท้ายเป็นการสอนการจัดการข้อมูลด้วย Python เบื้องต้น
โดยรวมแล้วเป็นการเริ่มต้นที่ดีในการเข้าใจ Data Science ทำให้รู้ว่าเราควรจะไปในทิศทางไหนต่อ อ่อแล้ว Data Science Pathway ของ CHULA MOOC Achieve ยังเป็น Blended Learning คือจะมีกิจกรรมให้ผู้เรียนมาพบปะแลกเปลี่ยนความรู้กันด้วย
แอดแจน : แล้วถ้าคนที่มีพื้นฐานมาบ้างแล้ว คุณอาร์มมีคอร์สไหนแนะนำบ้างคะ
คุณอาร์ม : ถ้าเป็นขั้นสูงขึ้นมาหน่อยผมแนะนำในพาร์ทที่สำคัญสุดของ Data Science คือการ “เตรียมข้อมูล”
ผมแนะนำคอร์ส Data analysis with Python ของ Coursera
เป็นคอร์สที่สอนตั้งแต่การนำเข้าข้อมูล ตรวจสอบและทำความเข้าใจข้อมูล และทำความสะอาดข้อมูลด้วย Pandas เพื่อเตรียมใช้ในขั้นตอนการสร้างโมเดลต่อไป จะเน้นทำความเข้าใจและมีการบ้านให้ทำในแต่ละบท ซึ่งผมแนะนำให้ทำเพราะเค้าทำไว้ดีมาก เราต้องคิดและทำเองจากที่เรียนมา อารมณ์เดียวกับตอนเราเรียนในโรงเรียนหรือมหาลัย ที่อาจารย์สอนอย่างนึงและออกข้อสอบยากกว่าที่สอนมากๆ แต่ต่างกันตรงที่เราสามารถหาข้อมูลเพิ่มเติมรวมถึง สามารถกลับไปศึกษาจากบทเรียนก่อนหน้าเพื่อทำความเข้าใจได้ ซึ่งถ้าทำการบ้านเสร็จ ก็จะเข้าใจในหลักสูตรมากขึ้นมากๆ
พวกภาษาโปรแกรมมิ่งมาแรงอย่าง Python คอร์สที่รู้สึกว่าดีมากๆ คือ Python for Data Science ของ IBM จาก Coursera เป็นคอร์สที่ค่อนข้างดีสำหรับคนที่อยากเริ่มต้นนะ
คอร์สนี้จะปูสอนพื้นฐานด้าน Python ทั้งส่วนของ Fundamental และ Data Structure ทั้งหมด โดยมีการบ้านแต่ละบทให้ทำด้วย จึงสามารถนำไปความรู้ที่ได้ไปลองประยุกต์ใช้ตอนนั้นเลยก็เป็นอะไรที่สนุกและเครียดปนกัน เพราะทุกอย่างมันจะต้องมีตรรกะในการคิดตามลำดับ แต่พอทำได้ก็จะเข้าใจทุกอย่างที่เค้าสอนมาเลย
ผมแนะนำหากเรียนพื้นฐานมาแล้วให้เรียนคอร์สที่ยากๆ ทำการบ้านที่เขาให้ และฝึกฝนลองทำบ่อยๆ เพราะถ้าผ่านมาได้เราจะรู้สึกมั่นใจมากขึ้นครับ
แอดแจน : สุดยอดมากเลยค่ะ แล้วนอกจากการเรียนเรื่อง Data Science แล้ว คุณอาร์มเรียนในหมวดหมู่ไหนเพิ่มเติมไหมคะ
คุณอาร์ม : จริงๆแล้วผมชอบเรียนด้านจิตวิทยานะ เพราะเป็นเรื่องที่สามารถช่วยเราในชีวิตประจำวันและการทำงานที่ต้องพบปะผู้คนอยู่ตลอด ที่เรียนแล้วชอบคงเป็น จิตวิทยากับชีวิตประจำวัน ของ CMU Thai MOOC ซึ่งผู้สอน มีวิธีการสอนที่น่ารักและเข้าใจง่าย
Key takeaways หลักๆคือแนวคิดจิตวิทยาว่าเป็นอย่างไร , การเข้าใจในตนเองมากยิ่งขึ้น และการเรียนรู้ที่จะเข้าใจผู้อื่น
คอร์สนี้ไม่ได้ลงลึกมาก จะช่วยให้เราเข้าใจตัวเอง เข้าใจผู้อื่น และเป็นดำเนินชีวิตประจำวันแบบแฮปปี้ขึ้นครับ
แอดแจน : คุณอาร์มเรียนเยอะขนาดนี้ มีวิธีคิดในการเลือกลงคอร์สแต่ละคอร์สยังไงบ้างคะ
คุณอาร์ม : ผมใช้แนวคิดการเรียนรู้รูปตัว T โดยเน้นเรียนพื้นฐานหลายๆศาสตร์เพื่อเก็บความรู้แบบแผ่ออกด้านข้างให้มีมุมมองที่กว้างขึ้น จนเจอเรื่องที่สนใจ ก็จะศึกษาลงลึกเพิ่มในเรื่องนั้นๆ ให้มีความรู้เชิงลึกในเรื่องที่สนใจ
จนวันนีงเราติดนิสัยว่าต้องพัฒนาตนเองตลอดเวลา เพราะหากหยุดวันนึงคือพอขี้เกียจแล้วมันจะไหลยาวไปหลายวันนะ ฮ่าๆๆ รู้ตัวอีกที่เหมือนต้องกลับมาเริ่มใหม่สร้างนิสัยกันใหม่เลย ก็เลยเป็นที่มาของการเรียนเพื่อเอาใบ Certificate เอาจริงๆมันเป็น Achievement อย่างนึงในการเรียนรู้นะ มันทำให้เราชื่นใจเวลาที่เรียนจบแล้ว
ยิ่งคอร์สที่ยากๆการบ้านโหดๆก็จะยิ่งรู้สึกดี ตอนแรกๆที่ได้มายังไม่ค่อยเห็นประโยชน์เท่าไหร่ แต่พอหลังๆ เริ่มเห็นว่าเรานำความรู้ที่ได้มามาปรับใช้กับการทำงานและเห็นผลชัดเจน ของแถมคือการสร้างนิสัยในการเรียนรู้ตลอดชีวิต
แอดแจน : การที่เราศึกษาในหลากหลายแขนง มันช่วยส่งเสริมกันยังไงบ้าง
คุณอาร์ม : สิ่งที่เราทุกคนรู้หลังจากรู้จัก Data Science คือมันไม่ใช่การเขียนโปรแกรมขึ้นมาแล้วผลออกมาเลย แต่เป็นการตีโจทย์ การตั้งปัญหา ในงานที่กำลังทำและวิเคราะห์หาวิธีแก้ไขหรือปรับปรุงโจทย์ที่เราตั้งไว้
ทำไมต้องศึกษาเรื่องอื่นๆ? เพราะงานที่เราทำบางครั้งมันไม่ใช่เรื่องที่เราถนัดหรือมีความรู้มาก่อน
ขอยกตัวอย่างด้วยชุดข้อมูลการวิเคราะห์ไวน์แดง (Red Wine Quality) จาก Kaggle ชุดข้อมูลนี้มีความคลีนมากในระดับนึง คือแทบไม่ต้องเตรียมอะไรมากเลย แค่จับโยนเข้า Machine Learning เลือกโมเดลมาสักอันก็จะได้ผลลัพธ์ที่น่าพอใจ คอมพิวเตอร์สามารถตอบเราได้ว่าคุณภาพของไวน์ตัวนี้ดีตัวนี้ไม่ดี
ประเด็นสำหรับผมมันคือ แล้วเราจะเอามันไปทำอะไรต่อ ทำไมไวน์ถึงคุณภาพดี? เราจึงต้องย้อนกลับไปตั้งแต่แรก การทำงาน Data Science ไม่ใช่การเขียนโปรแกรมแล้วจับโยนใส่ Tool แต่เป็นการ “เข้าใจข้อมูล” ที่มาของข้อมูล ตัว parameter ต่างๆ ว่าในชุดข้อมูลนี้ประกอบด้วยอะไรบ้าง
อย่าง Dataset ตัวอย่างมีสารประกอบต่างๆ เช่น alcohol , residual sugar ทำไมถึงต้องเป็นสารตัวนี้? เพราะมันเป็นขั้นตอนการหมักไวน์ แล้วสารตัวนี้ส่งผลอย่างไรกับคุณภาพไวน์? อาจจะทำให้มีรสหวานรสเค็ม การทำความเข้าใจชุดข้อมูลทั้งหมดนี้จะเป็นการนำไปสู่การตั้งคำถามและสมมติฐานในขั้นตอนต่อไปเราจะเข้าใจถ่องแท้ว่าข้อมูลนี้เกิดจากกระบวนการใด แล้วนำไปทำอะไรได้บ้าง เพื่อขยายขอบเขตความรู้และความเข้าใจเราจึงต้องศึกษาเรื่องต่างๆรอบตัวไปพร้อมๆกับการเรียน Data Science
สำหรับใครที่อยากลองทำชุดข้อมูลไวน์แดง จริงๆทางแล้ว uci เขามีชุดข้อมูลตัวเต็ม ซึ่งเกี่ยวกับไวน์ขาวและไวน์แดงที่ลิ้งนี้
แอดแจน : คุณอาร์มเรียนมาหลากหลายหลักสูตรถามจริงว่าจำได้มั้ย
คุณอาร์ม : ตอบได้เลยครับว่าไม่ ฮ่าๆ คือที่เรียนมาจะให้จำทั้งหมดมันยากนะเอาจริงๆ แต่ถามว่าวันนึงถ้าเราต้องนำไปประยุกต์ใช้ ก็สามารถที่จะกลับไปฟื้นความจำจากสิ่งที่เรียนมาได้เร็วกว่าการที่เราไม่เคยเรียนมา ผมมองตรงนั้นมากกว่าเพราะถ้าเราผ่านเรื่องนั้นมาแบบเข้าใจจริงๆ การจะทำความเข้าใจอีกครั้งมันย่อมดีกว่าเริ่มจาก 0 นะ ผมมั่นใจแบบนั้นเลยคิดว่าการเรียนรู้จะไม่เสียเปล่า ความรู้จะยังคงอยู่ใน database ในสมองเรารอวันที่เค้าจะได้ออกมาช่วยเราแน่นอน
แอดแจน : ทั้งทำงานประจำ ทั้งเรียยนออนไลน์ ไหนจะกิจกรรมอื่นๆ คุณอาร์มมีวิธีการแบ่งเวลายังไงคะ
คุณอาร์ม : สำหรับผมเวลาของคนเราไม่เท่ากันนะ ทุกคนมีเวลาเป็นของตัวเอง การบริหารเวลาก็ต้องขึ้นอยู่กับของแต่ละคน ทุกคนรู้ดีว่าเวลาว่างของตัวเองคือตอนไหน ตอนไหนที่เราจะเรียนรู้ได้ เพราะงั้นการแบ่งเวลาไม่มีวิธีตายตัว สิ่งที่ยากที่สุดคือ “ข้ออ้าง” ทั้งหลายที่เอาเวลาไปจากเรา
แอดแจน : Next Step จะเรียนอะไร ไปทางไหนต่อ
คุณอาร์ม : ที่วางแผนไว้คือจะไปศึกษาเกี่ยวกับ statistic และ math เพิ่มครับเพราะผมขาดส่วนนี้มากๆ จากพื้นฐานการเรียนในอดีต แล้วทั้งสองอย่างผมคิดว่าเป็นสิ่งสำคัญมากๆในการเข้าใจข้อมูลและนำไปใช้ของ data science โดยเฉพาะในส่วนของการเลือก Model ในการทำ Machine learning
แอดแจน : สุดท้ายแล้ว คุณอาร์มอยากฝากอะไรให้ผู้อ่านมั้ยคะ ? :D
คุณอาร์ม : เรากำลังเข้าสู่ยุคที่เทคโนโลยีก้าวหน้าอย่างรวดเร็ว ทุกคนสามารถหาแหล่งเรียนรู้ตลอดเวลา หากเราหยุดอยู่กับที่ ในที่สุดเราก็จะโดนทั้งคนและหุ่นยนต์แซงโดยไม่รู้ตัว
ผมจะไม่พูดถึงแรงกดดันของการพัฒนาตัวเอง แต่อยากพูดถึงสิ่งที่เรารักมากกว่า อยากให้ทุกคนหาสิ่งนั้นให้เจอและลงมือทำ การเรียนรู้ในสิ่งที่เรารักมันจะทำได้ดีกว่า และติดเป็นนิสัยในการเรียนรู้ได้ง่ายกว่า ขอให้จำไว้ว่าถ้าเราทำถึงที่สุดแล้วมันไม่สำเร็จ อย่างน้อยเราก็ได้ลงมือทำในสิ่งที่เรารักแล้ว“สม่ำเสมอ” ยังคงใช้ได้กับทุกสิ่งอย่างนะ ถ้าเราทำอะไรซ้ำๆ จนวันนึงเรารู้สึกว่านี่คือส่วนนึงของชีวิตเรา ไม่ใช่สิ่งที่เราต้องพยายามหรืออดทนทำ วันนั้นเราจะเรียนรู้ได้ด้วยความสุขจริงๆ
“สม่ำเสมอ” ยังคงใช้ได้กับทุกสิ่งอย่างนะ ถ้าเราทำอะไรซ้ำๆ จนวันนึงเรารู้สึกว่านี่คือส่วนนึงของชีวิตเรา ไม่ใช่สิ่งที่เราต้องพยายามหรืออดทนทำ วันนั้นเราจะเรียนรู้ได้ด้วยความสุขจริงๆ
ใครที่อยากเริ่มต้นงานสาย Data Science เชื่อว่าทุกคนสามารถเริ่มได้ง่ายๆ เพียงหมั่นหาความรู้ และฝึกฝนบ่อยๆ เผลอแปปเดียว อาจจะมีใบ Cert เยอะกว่าคุณอาร์มก็ได้นะ คะ :D ใครที่มีข้อสงสัยอะไร หรืออยากให้เขียนถึงเรื่องอะไร สามารถส่งข้อความมาในเพจ Data Science ชิลชิล ได้เลยค่า