Big Data คืออะไร? เข้าใจง่าย ๆ ใน 2 นาที

what is big data

ถ้าหากถามว่า คุณเคยได้ยินเรื่อง Big Data ไหม หลายคนประมาณสามในสี่ก็คงจะตอบว่า ‘เคยสิ’ แต่เมื่อเราคุยกันต่อว่า ‘แล้ว Big Data คืออะไร’ ความเงียบก็ได้เกิดขึ้น ถ้าคุณรู้สึกแบบเดียวกับเรา คุณมาถูกที่แล้ว เพราะเราก็เป็นคนหนึ่งที่เคยรู้สึกแบบนั้น และหลังจากอ่านบทความนี้ คุฌก็อาจจะเข้าใจ Big Data มากขึ้น เริ่มกันเลยค่ะ

Big Data คืออะไร

Big Data คือ การที่เรามีข้อมูลในขนาดใหญ่, ปริมาณมาก และ ความซับซ้อนสูง มาอยู่รวมกัน โดยที่เครื่องมือในการจัดการข้อมูลทั่วไป (traditional processing software) ไม่สามารถประมวลผลได้

Big Data มาจากไหน

Big Data จริงๆแล้วเกิดมาจากเรานี่แหละ

  • Big Data จริงๆแล้วเกิดมาจากเรานี่แหละ ยกตัวอย่างเช่น ทุกการกดคลิก กด Like หรือคอมเมนท์ บน Facebook จะถูกบันทึกไว้แล้วเก็บเป็นข้อมูล ถ้าคนไม่กี่คนใช้งาน Facebook ข้อมูลที่เก็บไว้ก็จะมีไม่มาก แต่ถ้าคนหลายล้านใช้งานพร้อมกัน ทั้งยังถล่ม คอมเมนท์ Like แบบ real-time และเล่นกันเกือบทั้งวัน คุณลองคิดเล่นๆดูว่าปริมาณข้อมูลที่เก็บได้จะมากขนาดไหน 
  • นอกจากพวกเราที่ขยันช่วยกันสร้างข้อมูลแล้ว อุปกรณ์ดิจิตอลอย่างพวก IoT (Internet of Thing) ก็เป็นอีกหนึ่งผู้ท้าชิงในการผลิตข้อมูลจากการใช้งานของลูกค้า แล้วนำไปสร้างโมเดล หรือ Machine Learning ทำให้เกิดข้อมูลขึ้นมาอีก 

Big Data ใหญ่ขนาดไหนกัน

ถึงแม้ว่าจะไม่ได้มีการกำหนดว่า Big Data ต้องมีขนาดเท่าไหร่ แต่การใช้งานส่วนมากมักจะอยู่ในขนาด เทราไบต์ (Terabyte: TB = 1,000 GB), เพตะไบต์ (Petabyte: PB = 1,000 TB) หรืออาจจะใหญ่ขนาด เอ็กซาไบต์ (Exabyte: EB = 1,000,000 TB) เลยก็เป็นได้ ยกตัวอย่างให้เห็นภาพ

how big is big data1
ดาต้าถูกสร้างขึ้นเท่าไรในแต่ละนาทีต่อวัน [ขอบคุณรูปจาก Domo.com]

จากสถิติด้าน Social media, Facebook สร้างข้อมูล 4 PB ต่อวัน ซึ่งก็คือประมาณ 4 ล้าน GB นั่นเอง ดูจากรูปจะเห็นได้ว่า

  • ทุกๆนาทีจะมี 147,000 รูป ถูกอัพโหลดขึ้นบน Facebook ในหนึ่งวัน
  • 150,000 ข้อความ ถูกแชร์บน Facebook ทุกๆนาทีในหนึ่งวัน

นอกจากนั้นจะเห็นได้ว่า Social media อื่นๆ ทั้ง Instagram, Twitters, TikTok หรือ WhatsApp ก็มีการสร้างข้อมูลในปริมาณมากไม่แพ้กัน

คุณสมบัติ 4 อย่างของ Big Data

4 Vs of big data
คุณสมบัติ 4 วี ของ บิ้กดาต้า IBM [ขอบคุณรูปจาก IBM]

คุณสมบัติของ Big Data นั้น ไม่ได้มีแค่ปริมาณอย่างเดียว แต่ประกอบไปด้วยคุณสมบัติต่างๆดังต่อไปนี้ เรียกสั้นๆว่า 4 Vs

  • Volume: คือปริมาณที่มากของข้อมูล 
  • Velocity: คือความเร็วที่ข้อมูลถูกสร้างขึ้น อาจจะเป็นแบบ real-time หรือ เกือบ real-time ก็ได้
  • Variety: คือความหลากหลายของข้อมูล เช่น structured, semi-structured unstructured data เป็นได้ทั้ง ข้อความสั้น, ข้อความเสียง หรือแม้แต่วิดีโอ
  • Veracity: คือความถูกต้อง น่าเชื่อถือ ของข้อมูล

Big Data สำคัญอย่างไร

บริษัทสามารถใช้ Big Data หรือข้อมูลขนาดใหญ่ที่เก็บไว้มาพัฒนาระบบ, กระบวนการ บริการลูกค้าให้ดียิ่งขึ้น, สร้างแคมเปญการตลาดเฉพาะบุคคลจากความชอบของลูกค้า และเพิ่มกำไรได้ในที่สุด

เมื่อธุรกิจสามารถใช้  Big Data ให้เกิดประโยชน์ได้ ก็จะมีความสามารถในการแข่งขันสูงมากกว่าคนอื่น เพราะว่าใช้ในการตัดสินใจได้อย่างรวดเร็ว และเห็นข้อมูลเชิงลึกได้มากกว่า 

ยกตัวอย่าง Big Data ของลูกค้า มาดูกันว่าเราสามารถเอาไปทำอะไรได้บ้าง

  • Comparative analysis: ตรวจสอบพฤติกรรมของผู้ใช้งาน, ความผูกพันของลูกค้า (engagement) แบบ real-time เพื่อให้เราสามารถเปรียบเทียบ สินค้า, บริการ หรือ ความสำคัญของแบรนด์ brand authority ได้ 
  • Social media listening: ดูว่าผู้คนพูดถึงแบรนด์หรือสินค้าอย่างไรบ้าง เพื่อที่จะหาลูกค้ากลุ่มเป้าหมายแล้วสร้างแคมเปญดึงดูด
  • Marketing analysis: สร้างโปรโมชั่นของสินค้า หรือบริการใหม่ๆที่ตรงต่อความต้องการของลูกค้า
  • Customer satisfaction and sentimental analysis: จับตาดูว่าลูกค้ารู้สึกอย่างไรเกี่ยวกับแบรนด์หรือสินค้า เพื่อที่ว่าถ้ามีปัญหาอะไรเกิดขึ้นจะได้รักษาลูกค้า และทำบริการให้ดีขึ้นทันการ

เครื่องมือที่ใช้ในการจัดการ Big Data

Hadoop logo 3
โลโก้ Hadoop
Apache Spark logo.svg 2
โลโก้ Apache Spark

ปกติแล้วเซิร์ฟเวอร์อันเดียว หรือแม้แต่หลายอันก็ไม่สามารถจัดการกับความใหญ่ของ Big Data ได้. ดังนั้นจึงต้องใช้เทคโนโลยีอย่าง Hadoop และ Apache Spark มาช่วยซึ่งสามารถประมวลผลข้อมูลขนาดใหญ่ และแบ่งออกไปให้อีกหลายๆเครื่องประมวลด้วย ใครสนใจเรื่อง Apache Spark ติดตามได้ในบทความถัดไปเลยค่ะ Apache Spark คืออะไร เครื่องมือ Big Data ที่ไม่รู้จักไม่ได้

อยากรู้วิธีการจัดการ Big Data โดยใช้ Pyspark ใน Apache Spark ลองเข้าไปดูได้ที่นี่เลย

สุดท้ายนี้ถ้าใครมีคำถามหรือข้อสงสัย แนะนำให้ลองอ่านบทความอื่นๆในเว็บ DataTH ของเราเพิ่มเติม หรือเข้ามาคุยกันในเพจ Facebook เพจ DataTH ได้เลยค่า เรามีบทความอัพเดทให้เสมอๆ แล้วเจอกันนะคะ

บทความอื่น ๆ ที่เกี่ยวข้อง

PDPA Icon

เราใช้คุกกี้เพื่อพัฒนาประสิทธิภาพ และประสบการณ์ที่ดีในการใช้เว็บไซต์ของคุณ คุณสามารถศึกษารายละเอียดได้ที่ นโยบายความเป็นส่วนตัว และสามารถจัดการความเป็นส่วนตัวเองได้ของคุณได้เองโดยคลิกที่ ตั้งค่า

Privacy Preferences

คุณสามารถเลือกการตั้งค่าคุกกี้โดยเปิด/ปิด คุกกี้ในแต่ละประเภทได้ตามความต้องการ ยกเว้น คุกกี้ที่จำเป็น

Allow All
Manage Consent Preferences
  • Always Active

Save