What is Big Data ?

เคยสงสัยหรือมั้ย ? ว่าBig Dataซึ่งเป็นเทคโนโลยีที่กำลังเป็นที่นิยมในไม่กี่ปีที่ผ่านมานี้ ตกลงมันคืออะไร ? กันแน่ มีสมบัติอย่างไร และเกี่ยวข้องอะไรในแวดวงธุรกิจยุคใหม่ ซึ่งเป็นข้อมูลทุกอย่างที่มีอยู่ในองค์กรนั้นเอง ถ้าจะพูดว่า Big Data is all around ก็ไม่ผิดเพราะไม่ว่าจะเป็น Database รูปแบบใด หรือมาจากไหนก็ตาม

โดยในบทความนี้จะนำเสนอคุณสมบัติ (4 Vs) และสรุปการนำข้อมูลที่มีไปใช้ในภาคธุรกิจได้อย่างไร

คุณสมบัติของ Big Data (4Vs)

1. Volume

Big Dataเป็นศูนย์รวมของข้อมูลที่มีขนาดใหญ่ โดยพัฒนาจากข้อมูลที่มีโครงสร้าง กึ่งโครงสร้าง และไม่มีโครงสร้างที่มีปริมาณมาก ๆ ซึ่งมีศักยภาพสูงในการค้นหาข้อมูล ทำงานร่วมกับระบบ Machine Learning และเครื่องมือวิเคราะห์ข้อมูลอื่น ๆ (Log Analytic Tool)

เพราะฉะนั้นจึงเป็นศูนย์รวม Database ขนาดใหญ่ที่เต็มไปด้วยข้อมูลต่าง ๆ มากมาย โดยที่จะไม่มีการรวมกันจะเป็นการแบ่งแยกข้อมูลกันอย่างชัดเจน

ยกตัวอย่างเช่น การใช้การวิเคราะห์ข้อมูลโดยมีเป้าหมายในการวัดจากยอดขายที่จะเกิดขึ้นในอนาคต ซึ่งสามารถประมาณการได้จากยอดขายที่ขายได้ในอดีต ข้อมูลการส่งคืนสินค้า และข้อมูลที่ลูกค้าซื้อสินค้าออนไลน์

2. Variety

ปริมาณข้อมูลที่เก็บสะสมอยู่นั้นมีความหลากหลาย และมาจากหลาย ๆ ที่ ยกตัวอย่างเช่น ระบบธุรกรรมทางธุรกิจ ฐานข้อมูลลูกค้า ข้อมูลการใช้งานอินเตอร์เน็ต แอพพลิเคชั้น Social Network ผลการทดลองทางวิทยาศาสตร์ ข้อมูลที่เกิดจากการทำงานของเครื่องจักร และข้อมูลที่ Real Time ซึ่งก่อนที่จะซอฟแวร์จะนำ Log มาวิเคราะห์จะต้องใช้เครื่องในการขุด (data mining) และแปรสภาพ Raw Log ให้สามารถใช้งานได้

3. Velocity

Big Dataมีความสามารถในการนำข้อมูลมาวิเคราะห์ และการดำเนินงานได้อย่างรวดเร็ว ได้แก่

การอัพเดทข้อมูลแบบ Real Time และการเปรียบเทียบข้อมูลที่เก็บไว้แบบรายวันเดือน หรือปี

ซึ่งเป็นการนำข้อมูลที่มีอยู่มาวิเคราะห์นั้นเอง นอกจากนี้ยังสามารถหาคำตอบหรือผลลัพท์ที่ได้ขึ้นอยู่การประมวลผลที่ครอบคลุมโดยนักวิเคราห์ข้อมูลจะต้องทำความเข้าใจข้อมูลที่มีอยู่ และแน่ใจว่าข้อมูลที่มีอยู่มีความถูกต้อง และอัพเดทล่าสุด

ดังนั้นความรวดเร็วในการวิเคราะห์ข้อมูลเป็นหนึ่งใน Capabilty ที่สามารถต่อยอดเรื่องการทำ Machine Learning และ ปัญญาประดิษฐ์ (AI) ซึ่งเป็นการสร้างกระบวนการวิเคราะห์ และจัดรูปแบบของข้อมูลอย่างอัตโนมัติ

4. Veracity

ความถูกต้องของข้อมูล นั่นหมายถึงระดับความมั่นใจของชุดข้อมูล Raw Log ที่มาจากหลาย ๆ ที่ เช่น

  • Social Media
  • เว็บไซน์
  • อุปกรณ์ไอทีต่าง ๆ ในองค์กร

โดยคำนึงถึงคุณภาพของข้อมูลเป็นสำคัญ ยกตัวอย่างเช่น บริษัทหนึ่งเก็บ log จากร้อย ๆ ที่ซึ่งอาจจะระบุที่มาของข้อมูลได้ไม่ถูกต้อง แต่นักวิเคราะห์ข้อมูลต้องการติดตามข้อมูลว่ามาจากไหนเพื่อที่จะจัดรูปแบบของข้อมูลได้อย่างถูกต้อง

ข้อมูลไม่รู้ที่มา (ไม่มีความถูกต้อง) จะนำพาไปสู่การวิเคราะห์ที่ผิดพลาดได้ ส่งผลให้คุณค่าของ Bussines Analytices ลดทอนลงเพราะ ผู้บริหารจะหมดความเชื่อใจข้อมูล โดยข้อมูลที่ไม่รู้ที่มานั้นจะถูกนับก่อนที่จะเข้าสู่ Log Centralization

ดังนั้น ทีมไอที และนักวิเคราะห์มีความต้องการที่จะแน่ใจได้ว่าข้อมูลที่เก็บได้มีความถูกต้องเพื่อนนำสู่ผลลัพท์ที่มีประสิทธิภาพ

การนำ Big Data ไปใช้ในองค์กร

องค์กรส่วนใหญ่นำไปใช้เพื่อสร้างความได้เปรียบทางการแข่งขัน โดยนำข้อมูลที่มีอยู่มากำหนดกลยุทธ์ วิเคราะห์สภาพตลาด พัฒนานวัตกรรมใหม่ ๆ เพื่อสนองต่อผู้ใช้งานในอนาคต

ช่วยให้องค์กรค้นพบโอกาสในการเติบโตทางธุรกิจใหม่ ๆ และนวัตกรรมใหม่ที่น่าสนใจที่สามารถวิเคราะห์ได้จากข้อมูลที่มี ในหลาย ๆ บริษัทมีข้อมูลมากพอเกี่ยวกับสินค้า และบริการ ผู้ใช้งาน – ลูกค้า ซัพพลายเออร์ รวมถึงความต้องการของผู้บริโภคที่สามารถเข้าถึง และวิเคราะห์ได้

นอกจากนี้ยังช่วยให้เข้าใจสภาพตลาดในปัจจุบัน โดยการวิเคราะห์พฤติกรรมการซื้อสินค้าของลูกค้าซึ่งสามารถหาได้จากสินค้าที่มียอดขามมากที่สุด และทำการผลิตสินค้าตามเทรนนั้น

เพราะฉะนั้นจะสรุปได้ว่า บริษัทใช้ประโยชน์จากข้อมูลที่มีในการปรับปรุงระบบการดำเนินงาน ปรับปรุงการบริการลูกค้าให้ดีขึ้น คิดค้นแผนการตลาดที่สามารถไปถึงกลุ่มลูกแบบเจาะจงมากขึ้นเพื่อสร้างกำไรให้กับองค์กร อีกทั้งยังไปใช้ในหาสาเหตุของความเสี่ยงเพื่อหาทางแก้ไข และป้องกัน สร้างคุณค่า (Value) ให้แก่องค์กรด้วย Log file ที่เก็บไว้เป็นอีกหนึ่งแนวทางในการจัดสรรค์ข้อมูลที่มีขนาดใหญ่ได้นั้นเอง (Variability)