Data Cleansing / Wrangling คืออะไร? วิธีเช็คคุณภาพข้อมูล + ตัวอย่างการทำความสะอาดข้อมูล
Data Wrangling เรียกได้ว่าเป็นส่วนใช้เวลานานของงานด้าน Data Science แต่เป็นส่วนที่มีความสำคัญอย่างมากเพื่อที่จะได้ข้อมูลคุณภาพ (Data Quality) ในการนำไปใช้งาน
Data Wrangling เรียกได้ว่าเป็นส่วนใช้เวลานานของงานด้าน Data Science แต่เป็นส่วนที่มีความสำคัญอย่างมากเพื่อที่จะได้ข้อมูลคุณภาพ (Data Quality) ในการนำไปใช้งาน
Data Scientist นักวิทยาศาสตร์ข้อมูล กับ Data Analyst นักวิเคราะห์ข้อมูล มีชื่อที่คล้ายกันก็จริง แต่ 2 อาชีพนี้ทำงานคนละด้านกัน ใช้ทักษะแตกต่างกัน
เนื่องจากว่า Pandas ถือเป็นเครื่องมือหลักในการทำ Data Wrangling บน Python และสามารถนำไปใช้ประโยชน์คู่กับ Package อื่น เช่น เอาไปเตรียมข้อมูลก่อนทำ Model ใน SKLearn ได้ด้วย วันนี้เลยจะมาสรุปโค้ดสำคัญ ๆ ของ Pandas ให้เพื่อน ๆ นำไปใช้งานกันครับ
© Copyright 2023 - DATATH. All rights reserverd.
เราใช้คุกกี้เพื่อพัฒนาประสิทธิภาพ และประสบการณ์ที่ดีในการใช้เว็บไซต์ของคุณ คุณสามารถศึกษารายละเอียดได้ที่ นโยบายความเป็นส่วนตัว และสามารถจัดการความเป็นส่วนตัวเองได้ของคุณได้เองโดยคลิกที่ ตั้งค่า