เทคโนโลยีบิ๊กดาต้าและตัวอย่างการประยุกต์ใช้ Alexey Ryvkin เกี่ยวกับทิศทางหลักในด้านข้อมูลขนาดใหญ่ การสื่อสารกับลูกค้า และโลกแห่งตัวเลข เทคโนโลยีข้อมูลขนาดใหญ่

ครั้งหนึ่งฉันได้ยินคำว่า "ข้อมูลขนาดใหญ่" จาก Gref ชาวเยอรมัน (หัวหน้า Sberbank) เช่นเดียวกับที่พวกเขากำลังดำเนินการอย่างแข็งขันเพราะสิ่งนี้จะช่วยลดเวลาในการทำงานกับลูกค้าแต่ละราย

ครั้งที่สองที่ฉันพบแนวคิดนี้เกิดขึ้นที่ร้านค้าออนไลน์ของลูกค้า ซึ่งเราทำงานและเพิ่มการจัดประเภทสินค้าโภคภัณฑ์จากสองพันเป็นสองหมื่น

ครั้งที่สามที่ฉันเห็นว่า Yandex ต้องการนักวิเคราะห์ข้อมูลขนาดใหญ่ จากนั้นฉันตัดสินใจที่จะเจาะลึกในหัวข้อนี้และในขณะเดียวกันก็เขียนบทความที่จะบอกคุณว่าคำศัพท์ประเภทใดที่ทำให้จิตใจของผู้จัดการระดับสูงและพื้นที่อินเทอร์เน็ตตื่นเต้น

VVV หรือ VVVVV

ฉันมักจะเริ่มบทความของฉันด้วยคำอธิบายว่าเป็นคำศัพท์ประเภทใด บทความนี้จะไม่มีข้อยกเว้น

อย่างไรก็ตาม นี่ไม่ใช่เพราะความปรารถนาที่จะแสดงให้เห็นว่าฉันฉลาดเพียงใด แต่เนื่องจากหัวข้อนี้ซับซ้อนมากและต้องการคำอธิบายอย่างระมัดระวัง

ตัวอย่างเช่น คุณสามารถอ่านข้อมูลขนาดใหญ่ในวิกิพีเดีย ไม่เข้าใจอะไรเลย แล้วกลับมาที่บทความนี้เพื่อทำความเข้าใจคำจำกัดความและการบังคับใช้สำหรับธุรกิจ เรามาเริ่มกันที่คำอธิบาย จากนั้นไปที่ตัวอย่างธุรกิจ

ข้อมูลขนาดใหญ่คือข้อมูลขนาดใหญ่ น่าทึ่งใช่มั้ย จริงๆแล้วจากภาษาอังกฤษแปลว่า "ข้อมูลขนาดใหญ่" แต่คำนิยามนี้อาจกล่าวได้ว่าสำหรับหุ่น

สำคัญ. เทคโนโลยีบิ๊กดาต้าเป็นแนวทาง/วิธีการในการประมวลผลข้อมูลเพิ่มเติมเพื่อให้ได้ข้อมูลใหม่ที่ยากต่อการประมวลผลด้วยวิธีปกติ

ข้อมูลสามารถถูกประมวลผล (มีโครงสร้าง) และแยกส่วนได้ (เช่น ไม่มีโครงสร้าง)

คำนี้ปรากฏค่อนข้างเร็ว ในปี พ.ศ. 2551 วารสารวิทยาศาสตร์ฉบับหนึ่งคาดการณ์ว่าวิธีการนี้เป็นสิ่งที่จำเป็นในการจัดการกับข้อมูลจำนวนมากที่เพิ่มขึ้นอย่างทวีคูณ

ตัวอย่างเช่น ทุกๆ ปี ข้อมูลบนอินเทอร์เน็ตที่ต้องจัดเก็บและแน่นอนว่าต้องประมวลผลนั้นเพิ่มขึ้น 40% อีกครั้ง. +40% ทุกปี ข้อมูลใหม่จะปรากฏบนอินเทอร์เน็ต

หากเข้าใจเอกสารที่พิมพ์ได้และวิธีการประมวลผลก็เข้าใจได้เช่นกัน (โอนไปยังแบบฟอร์มอิเล็กทรอนิกส์ เย็บต่อเป็นโฟลเดอร์เดียว ใส่หมายเลข) จะทำอย่างไรกับข้อมูลที่แสดงใน "พาหะ" และวอลุ่มอื่นๆ ที่แตกต่างกันโดยสิ้นเชิง:

  • เอกสารทางอินเทอร์เน็ต
  • บล็อกและโซเชียลเน็ตเวิร์ก
  • แหล่งที่มาของเสียง/วิดีโอ
  • อุปกรณ์วัด

มีลักษณะที่ทำให้สามารถจำแนกข้อมูลและข้อมูลเป็นข้อมูลขนาดใหญ่ได้

นั่นคือ ข้อมูลทั้งหมดอาจไม่เหมาะสำหรับการวิเคราะห์ ลักษณะเหล่านี้ประกอบด้วยแนวคิดหลักของข้อมูลขนาดใหญ่ พวกเขาทั้งหมดพอดีกับสาม V.

  1. Volume (จากเล่มภาษาอังกฤษ). ข้อมูลถูกวัดในแง่ของปริมาณทางกายภาพของ "เอกสาร" ที่จะวิเคราะห์
  2. ความเร็ว (จากความเร็วภาษาอังกฤษ). ข้อมูลไม่ได้อยู่ในการพัฒนา แต่เติบโตอย่างต่อเนื่อง ซึ่งเป็นเหตุผลว่าทำไมจึงต้องประมวลผลอย่างรวดเร็วเพื่อให้ได้ผลลัพธ์
  3. วาไรตี้ (จากวาไรตี้ภาษาอังกฤษ) ข้อมูลอาจไม่สม่ำเสมอ กล่าวคือสามารถแยกส่วน มีโครงสร้าง หรือมีโครงสร้างบางส่วนได้

อย่างไรก็ตาม ในบางครั้ง V ที่สี่ (ความจริง - ความน่าเชื่อถือ / ความน่าเชื่อถือของข้อมูล) และแม้กระทั่ง V ที่ห้าจะถูกเพิ่มลงใน VVV (ในบางกรณีคือความมีชีวิต - ความมีชีวิต ในบางกรณีคือมูลค่า)

ที่ไหนสักแห่งที่ฉันเห็นแม้กระทั่ง 7V ซึ่งแสดงลักษณะข้อมูลที่เกี่ยวข้องกับข้อมูลขนาดใหญ่ แต่ในความคิดของฉันนี่มาจากซีรีส์ (โดยที่ Ps ถูกเพิ่มเป็นระยะแม้ว่า 4 เริ่มต้นก็เพียงพอสำหรับการทำความเข้าใจ)

ใครต้องการมัน?

เกิดคำถามเชิงตรรกะว่า ข้อมูลจะถูกนำมาใช้ได้อย่างไร (ถ้ามี ข้อมูลขนาดใหญ่จะมีขนาดเป็นแสนๆ เทราไบต์) ไม่ได้เป็นเช่นนั้น

นี่คือข้อมูล แล้วทำไมพวกเขาถึงคิดข้อมูลขนาดใหญ่ขึ้นมาได้? การใช้ข้อมูลขนาดใหญ่ในด้านการตลาดและธุรกิจคืออะไร?

  1. ฐานข้อมูลทั่วไปไม่สามารถจัดเก็บและประมวลผล (ตอนนี้ฉันไม่ได้พูดถึงการวิเคราะห์ แต่เพียงแค่จัดเก็บและประมวลผล) ข้อมูลจำนวนมาก

    ข้อมูลขนาดใหญ่ช่วยแก้ปัญหาหลักนี้ได้ จัดเก็บและจัดการข้อมูลที่มีปริมาณมากได้สำเร็จ

  2. จัดโครงสร้างข้อมูลที่มาจากแหล่งต่างๆ (เอกสารวิดีโอ ภาพ เสียง และข้อความ) ให้เป็นรูปแบบเดียว เข้าใจและย่อยได้
  3. การก่อตัวของการวิเคราะห์และการสร้างการคาดการณ์ที่ถูกต้องตามข้อมูลที่มีโครงสร้างและประมวลผล

มันซับซ้อน. พูดง่ายๆ คือ นักการตลาดที่เข้าใจว่าหากคุณศึกษาข้อมูลจำนวนมาก (เกี่ยวกับคุณ บริษัทของคุณ คู่แข่งของคุณ อุตสาหกรรมของคุณ) คุณจะได้รับผลลัพธ์ที่ดี:

  • ความเข้าใจอย่างถ่องแท้เกี่ยวกับบริษัทและธุรกิจของคุณจากด้านตัวเลข
  • ศึกษาคู่แข่งของคุณ และสิ่งนี้จะทำให้สามารถก้าวไปข้างหน้าได้ด้วยการครอบงำพวกเขา
  • เรียนรู้ข้อมูลใหม่เกี่ยวกับลูกค้าของคุณ

และเนื่องจากเทคโนโลยีบิ๊กดาต้าให้ผลลัพธ์ดังต่อไปนี้ ทุกคนจึงเร่งรีบไปกับมัน

พวกเขาพยายามทำให้ธุรกิจนี้กลายเป็นบริษัทของตนเพื่อเพิ่มยอดขายและลดต้นทุน และเฉพาะเจาะจงแล้ว:

  1. การเพิ่มการขายต่อเนื่องและการขายต่อยอดผ่านความรู้ที่ดีขึ้นเกี่ยวกับความชอบของลูกค้า
  2. ค้นหาผลิตภัณฑ์ยอดนิยมและเหตุผลที่ซื้อ (และในทางกลับกัน)
  3. การปรับปรุงผลิตภัณฑ์หรือบริการ
  4. การปรับปรุงระดับการบริการ
  5. การเพิ่มความภักดีและการให้ความสำคัญกับลูกค้า
  6. การป้องกันการฉ้อโกง (เกี่ยวข้องกับภาคการธนาคารมากขึ้น);
  7. ลดต้นทุนส่วนเกิน

ตัวอย่างที่พบบ่อยที่สุดในทุกแหล่งคือ Apple ซึ่งรวบรวมข้อมูลเกี่ยวกับผู้ใช้ (โทรศัพท์ นาฬิกา คอมพิวเตอร์)

เป็นเพราะการมีอยู่ของระบบนิเวศที่บริษัทรู้มากเกี่ยวกับผู้ใช้ และในอนาคตจะใช้สิ่งนี้เพื่อผลกำไร

คุณสามารถอ่านสิ่งเหล่านี้และตัวอย่างการใช้งานอื่นๆ ได้ในบทความอื่นๆ ยกเว้นบทความนี้

ไปสู่อนาคตกันเถอะ

ฉันจะบอกคุณเกี่ยวกับโครงการอื่น หรือค่อนข้างเกี่ยวกับบุคคลที่สร้างอนาคตโดยใช้โซลูชันข้อมูลขนาดใหญ่

นี่คือ Elon Musk และบริษัทของเขา Tesla ความฝันหลักของเขาคือการทำให้รถยนต์เป็นอิสระนั่นคือคุณอยู่หลังพวงมาลัยเปิดระบบขับเคลื่อนอัตโนมัติจากมอสโกวไปยังวลาดิวอสต็อกและ ... หลับไปเพราะคุณไม่จำเป็นต้องขับรถเลยเพราะเขาจะทำ ตัวเองทุกอย่าง

มันจะดูยอดเยี่ยม? แต่ไม่มี! Elon ทำตัวฉลาดกว่า Google ซึ่งควบคุมรถยนต์โดยใช้ดาวเทียมหลายสิบดวง และไปทางอื่น:

  1. รถที่ขายแต่ละคันมีคอมพิวเตอร์ที่รวบรวมข้อมูลทั้งหมด

    ทั้งหมดหมายถึงทุกสิ่ง เกี่ยวกับคนขับ ลักษณะการขับขี่ ถนนรอบๆ การเคลื่อนที่ของรถคันอื่น ปริมาณข้อมูลดังกล่าวสูงถึง 20-30 GB ต่อชั่วโมง

  2. นอกจากนี้ ข้อมูลนี้จะถูกส่งผ่านดาวเทียมไปยังคอมพิวเตอร์ส่วนกลางซึ่งประมวลผลข้อมูลนี้
  3. จากข้อมูลขนาดใหญ่ที่คอมพิวเตอร์ประมวลผล แบบจำลองของยานพาหนะไร้คนขับจึงถูกสร้างขึ้น

อย่างไรก็ตาม หาก Google ทำผลงานได้ค่อนข้างแย่และรถของพวกเขาประสบอุบัติเหตุตลอดเวลา Musk ซึ่งทำงานกับข้อมูลขนาดใหญ่จะทำได้ดีกว่ามากเนื่องจากโมเดลทดสอบแสดงผลลัพธ์ที่ดีมาก

https://youtu.be/lc2ZVUZ6kno

แต่... มันเป็นเรื่องของเศรษฐกิจ เราทุกคนเกี่ยวกับกำไรใช่เกี่ยวกับกำไรหรือไม่? ข้อมูลจำนวนมากที่สามารถแก้ไขได้นั้นไม่เกี่ยวข้องกับรายได้และเงินโดยสิ้นเชิง

สถิติของ Google ซึ่งอิงจากข้อมูลขนาดใหญ่แสดงให้เห็นสิ่งที่น่าสนใจ

ก่อนที่แพทย์จะประกาศการระบาดของโรคในภูมิภาคหนึ่ง จำนวนคำค้นหาสำหรับการรักษาโรคนี้เพิ่มขึ้นอย่างมากในภูมิภาคนี้

ดังนั้นการศึกษาข้อมูลและการวิเคราะห์ที่ถูกต้องสามารถสร้างการคาดการณ์และคาดการณ์การโจมตีของโรคระบาด (และตามด้วยการป้องกัน) ได้เร็วกว่าความเห็นของเจ้าหน้าที่และการกระทำของพวกเขา

ใบสมัครในรัสเซีย

อย่างไรก็ตามรัสเซียช้าลงเล็กน้อยเช่นเคย ดังนั้นคำจำกัดความของข้อมูลขนาดใหญ่ในรัสเซียจึงปรากฏขึ้นเมื่อไม่เกิน 5 ปีที่แล้ว (ตอนนี้ฉันกำลังพูดถึง บริษัท ทั่วไป)

และนี่คือความจริงที่ว่านี่เป็นหนึ่งในตลาดที่เติบโตเร็วที่สุดในโลก (ยาเสพติดและอาวุธกำลังสูบบุหรี่อย่างประหม่า) เพราะทุก ๆ ปีตลาดซอฟต์แวร์สำหรับการรวบรวมและวิเคราะห์ข้อมูลขนาดใหญ่เติบโตขึ้น 32%

ในการระบุลักษณะของตลาดบิ๊กดาต้าในรัสเซีย ฉันนึกถึงเรื่องตลกเก่าๆ เดทใหญ่ก็เหมือนเซ็กส์ก่อนอายุ 18

ทุกคนกำลังพูดถึงเรื่องนี้ มีโฆษณามากมายรอบตัวและการกระทำจริงเพียงเล็กน้อย และทุกคนรู้สึกละอายใจที่จะยอมรับว่าพวกเขาไม่ได้ทำสิ่งนี้ แท้จริงแล้วมีโฆษณามากมายเกี่ยวกับเรื่องนี้ แต่มีการกระทำจริงเพียงเล็กน้อย

แม้ว่า Gartner บริษัทวิจัยที่มีชื่อเสียงได้ประกาศไปแล้วในปี 2558 ว่าข้อมูลขนาดใหญ่ไม่ได้มีแนวโน้มเพิ่มขึ้นอีกต่อไป (เช่น ปัญญาประดิษฐ์ เป็นต้น) แต่เป็นเครื่องมือที่เป็นอิสระอย่างสมบูรณ์สำหรับการวิเคราะห์และพัฒนาเทคโนโลยีขั้นสูง

ช่องที่มีการใช้งานมากที่สุดซึ่งมีการใช้ข้อมูลขนาดใหญ่ในรัสเซียคือธนาคาร / ประกันภัย (ไม่มีเหตุผลที่ฉันเริ่มบทความกับหัวหน้า Sberbank), โทรคมนาคม, ค้าปลีก, อสังหาริมทรัพย์และ ... ภาครัฐ

ตัวอย่างเช่น ฉันจะบอกคุณในรายละเอียดเพิ่มเติมเกี่ยวกับสองภาคส่วนของเศรษฐกิจที่ใช้อัลกอริทึมข้อมูลขนาดใหญ่

ธนาคาร

เริ่มจากธนาคารและข้อมูลที่พวกเขารวบรวมเกี่ยวกับเราและการกระทำของเรา ตัวอย่างเช่น ฉันเลือกธนาคารรัสเซีย 5 อันดับแรกที่ลงทุนในข้อมูลขนาดใหญ่อย่างจริงจัง:

  1. Sberbank;
  2. แก๊ซพรอมแบงก์;
  3. วีทีบี 24;
  4. ธนาคารอัลฟ่า;
  5. ธนาคาร Tinkoff

เป็นเรื่องน่ายินดีเป็นอย่างยิ่งที่ได้เห็น Alfa Bank ในหมู่ผู้นำรัสเซีย อย่างน้อยที่สุด เป็นเรื่องน่ายินดีที่ธนาคารซึ่งมีคุณเป็นพันธมิตรอย่างเป็นทางการ เข้าใจถึงความจำเป็นในการแนะนำเครื่องมือทางการตลาดใหม่ๆ ในบริษัทของคุณ

แต่ฉันต้องการแสดงตัวอย่างการใช้งานและการนำข้อมูลขนาดใหญ่ไปใช้อย่างประสบความสำเร็จในธนาคาร ซึ่งฉันชอบรูปลักษณ์และการกระทำที่ไม่ได้มาตรฐานของผู้ก่อตั้ง

ฉันกำลังพูดถึงธนาคาร Tinkoff งานหลักของพวกเขาคือการพัฒนาระบบสำหรับการวิเคราะห์ข้อมูลขนาดใหญ่แบบเรียลไทม์เนื่องจากฐานลูกค้าที่มากเกินไป

ผลลัพธ์: เวลาของกระบวนการภายในลดลงอย่างน้อย 10 เท่าและบางครั้ง - มากกว่า 100 เท่า

สิ่งที่ทำให้ไขว้เขวเล็กน้อย คุณรู้หรือไม่ว่าทำไมฉันถึงเริ่มพูดถึงการแสดงตลกและการกระทำที่ไม่ได้มาตรฐานของ Oleg Tinkov

ในความคิดของฉันคือพวกเขาที่ช่วยให้เขาเปลี่ยนจากนักธุรกิจชนชั้นกลางซึ่งมีอยู่หลายพันคนในรัสเซียเป็นผู้ประกอบการที่มีชื่อเสียงและเป็นที่รู้จักมากที่สุดคนหนึ่ง เพื่อพิสูจน์ ดูวิดีโอที่แปลกและน่าสนใจนี้:

https://youtu.be/XHMaD5HAvfk

อสังหาริมทรัพย์

ในธุรกิจอสังหาริมทรัพย์นั้นซับซ้อนกว่ามาก และนี่คือตัวอย่างที่ผมต้องการจะให้คุณเข้าใจถึงวันสำคัญในธุรกิจปกติ ข้อมูลเริ่มต้น:

  1. เอกสารข้อความจำนวนมาก
  2. โอเพ่นซอร์ส (ดาวเทียมส่วนตัวที่ส่งข้อมูลการเปลี่ยนแปลงของโลก);
  3. ข้อมูลที่ไม่มีการควบคุมจำนวนมหาศาลบนอินเทอร์เน็ต
  4. การเปลี่ยนแปลงแหล่งที่มาและข้อมูลอย่างต่อเนื่อง

และบนพื้นฐานนี้จำเป็นต้องเตรียมและประเมินต้นทุนของที่ดินเช่นภายใต้หมู่บ้านอูราล จะใช้เวลาหนึ่งสัปดาห์สำหรับมืออาชีพ

Russian Society of Appraisers & ROSEKO ซึ่งใช้งานจริงในการวิเคราะห์ข้อมูลขนาดใหญ่ด้วยความช่วยเหลือของซอฟต์แวร์ จะใช้เวลาไม่เกิน 30 นาทีในการทำงานสบายๆ เปรียบเทียบ หนึ่งสัปดาห์และ 30 นาที ความแตกต่างมหาศาล

สำหรับอาหารว่าง

แน่นอนว่าข้อมูลจำนวนมากไม่สามารถจัดเก็บและประมวลผลบนฮาร์ดไดรฟ์ทั่วไปได้

และซอฟต์แวร์ที่จัดโครงสร้างและวิเคราะห์ข้อมูลมักเป็นทรัพย์สินทางปัญญา และทุกครั้งที่เป็นการพัฒนาของผู้เขียน อย่างไรก็ตามมีเครื่องมือที่ใช้สร้างเสน่ห์ทั้งหมดนี้:

  • Hadoop & MapReduce;
  • ฐานข้อมูล NoSQL;
  • เครื่องมือของคลาส Data Discovery

พูดตามตรง ฉันไม่สามารถอธิบายให้คุณฟังได้ชัดเจนว่าพวกเขาแตกต่างกันอย่างไร เนื่องจากความคุ้นเคยและการทำงานกับสิ่งเหล่านี้ได้รับการสอนในสถาบันทางฟิสิกส์และคณิตศาสตร์

ทำไมฉันถึงเริ่มพูดถึงเรื่องนี้ถ้าฉันไม่สามารถอธิบายได้? จำได้ไหมว่าในภาพยนตร์ทุกเรื่องที่โจรเข้าไปในธนาคารและเห็นชิ้นส่วนเหล็กจำนวนมากที่เชื่อมต่อกับสายไฟ?

เช่นเดียวกับข้อมูลขนาดใหญ่ ตัวอย่างเช่น นี่คือโมเดลที่ปัจจุบันเป็นหนึ่งในผู้นำส่วนใหญ่ในตลาด

เครื่องมือวันที่ขนาดใหญ่

ค่าใช้จ่ายในการกำหนดค่าสูงสุดถึง 27 ล้านรูเบิลต่อแร็ค แน่นอนว่านี่เป็นรุ่นดีลักซ์ ฉันหมายถึงให้คุณลองสร้างข้อมูลขนาดใหญ่ในธุรกิจของคุณล่วงหน้า

สั้น ๆ เกี่ยวกับหลัก

คุณอาจถามว่าทำไมคุณซึ่งเป็นธุรกิจขนาดเล็กและขนาดกลางถึงทำงานกับข้อมูลขนาดใหญ่

ฉันจะตอบคุณด้วยคำพูดจากคนๆ หนึ่ง: "ในอนาคตอันใกล้นี้ ลูกค้าจะเป็นที่ต้องการของบริษัทที่เข้าใจพฤติกรรม นิสัย และสอดคล้องกับพวกเขามากที่สุดเท่าที่จะเป็นไปได้"

แต่มาเผชิญหน้ากัน ในการนำข้อมูลขนาดใหญ่ไปใช้ในธุรกิจขนาดเล็ก ไม่เพียงแต่จำเป็นต้องมีงบประมาณจำนวนมากสำหรับการพัฒนาและใช้งานซอฟต์แวร์เท่านั้น แต่ยังต้องมีผู้เชี่ยวชาญในการบำรุงรักษาด้วย อย่างน้อยที่สุด เช่น นักวิเคราะห์ข้อมูลขนาดใหญ่และผู้ดูแลระบบ

และตอนนี้ฉันเงียบเกี่ยวกับความจริงที่ว่าคุณควรมีข้อมูลดังกล่าวสำหรับการประมวลผล

ตกลง. สำหรับธุรกิจขนาดเล็ก หัวข้อนี้แทบจะใช้ไม่ได้ แต่นี่ไม่ได้หมายความว่าคุณต้องลืมทุกสิ่งที่คุณได้อ่านข้างต้น

เพียงแค่ศึกษาไม่ใช่ข้อมูลของคุณเอง แต่เป็นผลการวิเคราะห์ข้อมูลจาก บริษัท ต่างประเทศและรัสเซียที่มีชื่อเสียง

ตัวอย่างเช่น เครือข่ายร้านค้าปลีก Target ซึ่งใช้การวิเคราะห์ข้อมูลขนาดใหญ่ พบว่าหญิงตั้งครรภ์ก่อนไตรมาสที่ 2 ของการตั้งครรภ์ (ตั้งแต่สัปดาห์ที่ 1 ถึงสัปดาห์ที่ 12 ของการตั้งครรภ์) กำลังซื้อผลิตภัณฑ์ที่ไม่ปรุงแต่ง

ด้วยข้อมูลนี้ พวกเขาจะส่งคูปองส่วนลดสำหรับผลิตภัณฑ์ที่ไม่มีกลิ่นซึ่งมีวันหมดอายุที่จำกัด

และถ้าคุณเป็นเพียงร้านกาแฟเล็ก ๆ เช่น? ใช่ง่ายมาก ใช้แอปความภักดี

และหลังจากผ่านไประยะหนึ่งและด้วยข้อมูลที่สะสม คุณจะไม่เพียงแต่สามารถนำเสนออาหารที่เกี่ยวข้องกับความต้องการของลูกค้าได้เท่านั้น แต่ยังสามารถดูอาหารที่ขายไม่ออกและเหลือน้อยที่สุดได้ด้วยการคลิกเมาส์เพียงไม่กี่ครั้ง

ดังนั้นข้อสรุป การใช้ข้อมูลขนาดใหญ่สำหรับธุรกิจขนาดเล็กแทบจะไม่คุ้มค่า แต่การใช้ผลลัพธ์และการพัฒนาของบริษัทอื่นเป็นสิ่งที่จำเป็น

ข้อมูลขนาดใหญ่หรือข้อมูลขนาดใหญ่เป็นแนวคิดที่ใช้ในเทคโนโลยีสารสนเทศและการตลาด คำว่า "ข้อมูลขนาดใหญ่" ใช้เพื่อกำหนดการวิเคราะห์และการจัดการชุดข้อมูลขนาดใหญ่ ดังนั้น ข้อมูลขนาดใหญ่จึงเป็นข้อมูลที่ไม่สามารถประมวลผลด้วยวิธีดั้งเดิม เนื่องจากมีปริมาณมาก

ชีวิตสมัยใหม่ไม่สามารถจินตนาการได้หากไม่มีเทคโนโลยีดิจิทัล การจัดเก็บข้อมูลทั่วโลกมีการเติมเต็มอย่างต่อเนื่อง ดังนั้นจึงจำเป็นต้องเปลี่ยนแปลงทั้งเงื่อนไขในการจัดเก็บข้อมูลและมองหาวิธีใหม่ ๆ ในการเพิ่มปริมาณผู้ให้บริการอย่างต่อเนื่อง ตามความเห็นของผู้เชี่ยวชาญที่เพิ่มขึ้น ข้อมูลใหญ่และเพิ่มอัตราการเติบโตเป็นความจริงในปัจจุบัน ดังที่ได้กล่าวไปแล้ว ข้อมูลปรากฏขึ้นไม่หยุด ปริมาณมหาศาลถูกสร้างขึ้นโดยไซต์ข้อมูล บริการแชร์ไฟล์ต่างๆ และโซเชียลเน็ตเวิร์ก แต่นี่เป็นเพียงส่วนเล็กๆ ของปริมาณทั้งหมดที่สร้างขึ้น

หลังจากทำการศึกษา IDC Digital Universe ระบุว่าภายใน 5 ปี ปริมาณข้อมูลโดยทั่วไปบนโลกทั้งหมดจะสูงถึงสี่สิบเซ็ตตะไบต์ ซึ่งหมายความว่าสำหรับทุกคนบนโลกจะมีข้อมูล 5200 GB

บทความที่ดีที่สุดของเดือน

ครึ่งแรกของปี 2018 กำลังจะสิ้นสุดลง ถึงเวลาสรุปผลระหว่างกาล แม้ว่าผลการดำเนินงานเชิงพาณิชย์ของบริษัทจะเติบโตขึ้นเมื่อเทียบกับช่วงเวลาก่อนหน้านี้ ตรวจสอบให้แน่ใจว่าไม่มีปัญหาแอบแฝงในการดำเนินงานของบริษัทที่อาจทำให้เกิดปัญหาได้

ในการวินิจฉัยปัญหา ให้กรอกรายการตรวจสอบจากบทความของเรา และค้นหาว่าธุรกิจด้านใดที่ควรให้ความสนใจ

เป็นที่ทราบกันดีว่าผู้คนไม่ใช่ผู้ผลิตข้อมูลหลัก แหล่งหลักที่นำข้อมูลมาคือหุ่นยนต์ที่โต้ตอบอย่างต่อเนื่อง ซึ่งรวมถึงระบบปฏิบัติการของคอมพิวเตอร์ แท็บเล็ต และโทรศัพท์มือถือ ระบบอัจฉริยะ เครื่องมือตรวจสอบ ระบบเฝ้าระวัง และอื่นๆ พวกเขาร่วมกันกำหนดอัตราการเพิ่มขึ้นของปริมาณข้อมูลอย่างรวดเร็ว ซึ่งหมายความว่าความต้องการสร้างเซิร์ฟเวอร์ทั้งจริงและเสมือนเพิ่มมากขึ้น สิ่งนี้นำไปสู่การขยายและการใช้งานศูนย์ข้อมูลใหม่

บ่อยครั้งที่ข้อมูลขนาดใหญ่ถูกกำหนดให้เป็นข้อมูลที่มีขนาดใหญ่กว่าฮาร์ดไดรฟ์ของพีซี และยังไม่สามารถประมวลผลด้วยวิธีการแบบดั้งเดิมที่ใช้ในการประมวลผลและวิเคราะห์ข้อมูลที่มีปริมาณน้อยกว่า

โดยสรุปแล้ว เทคโนโลยีการประมวลผลข้อมูลขนาดใหญ่จะแบ่งส่วนหลักออกเป็น 3 ด้าน ซึ่งจะช่วยแก้ปัญหา 3 ประเภท ได้แก่

  1. การจัดเก็บและจัดการข้อมูลจำนวนมหาศาล - ขนาดหลายร้อยเทราไบต์และเพตะไบต์ - ซึ่งฐานข้อมูลเชิงสัมพันธ์ไม่สามารถใช้งานได้อย่างมีประสิทธิภาพ
  2. การจัดระเบียบข้อมูลที่ไม่มีโครงสร้าง - ข้อความ รูปภาพ วิดีโอ และข้อมูลประเภทอื่นๆ
  3. การวิเคราะห์ข้อมูลขนาดใหญ่ (การวิเคราะห์ข้อมูลขนาดใหญ่) - ที่นี่เราจะพิจารณาวิธีการทำงานกับข้อมูลที่ไม่มีโครงสร้าง และสร้างรายงานข้อมูลเชิงวิเคราะห์ และการแนะนำแบบจำลองการคาดการณ์

ตลาดนัดโครงการใหญ่ข้อมูลมีความเชื่อมโยงอย่างใกล้ชิดกับตลาด VA - ระบบธุรกิจอัจฉริยะ ซึ่งในปี 2555 มีมูลค่าประมาณ 100 พันล้านดอลลาร์ และรวมถึงเทคโนโลยีเครือข่าย ซอฟต์แวร์ บริการทางเทคนิค และเซิร์ฟเวอร์

ระบบอัตโนมัติของกิจกรรมของบริษัท โดยเฉพาะอย่างยิ่ง โซลูชันระดับการรับประกันรายได้ (RA) ยังเชื่อมโยงอย่างแยกไม่ออกกับการใช้เทคโนโลยีข้อมูลขนาดใหญ่ ปัจจุบัน ระบบในพื้นที่นี้มีเครื่องมือที่ใช้ในการตรวจจับความไม่สอดคล้องกันและสำหรับการวิเคราะห์ข้อมูลเชิงลึก ตลอดจนระบุความสูญเสียหรือความไม่ถูกต้องที่อาจเกิดขึ้นในข้อมูลที่อาจนำไปสู่การลดลงของผลลัพธ์ของภาคส่วน

บริษัท รัสเซียยืนยันว่ามีความต้องการเทคโนโลยีข้อมูลขนาดใหญ่ พวกเขาทราบแยกต่างหากว่าปัจจัยหลักที่มีอิทธิพลต่อการพัฒนาข้อมูลขนาดใหญ่ในรัสเซียคือปริมาณข้อมูลที่เพิ่มขึ้น การตัดสินใจด้านการจัดการที่รวดเร็ว และคุณภาพที่เพิ่มขึ้น

ข้อมูลขนาดใหญ่มีบทบาทอย่างไรในด้านการตลาด?

ไม่มีความลับใดที่ข้อมูลเป็นหนึ่งในองค์ประกอบหลักของการคาดการณ์และการพัฒนากลยุทธ์ทางการตลาดที่ประสบความสำเร็จ หากคุณรู้วิธีใช้งาน

การวิเคราะห์ข้อมูลขนาดใหญ่เป็นสิ่งที่ขาดไม่ได้ในการกำหนดกลุ่มเป้าหมาย ความสนใจและกิจกรรม กล่าวอีกนัยหนึ่ง การใช้ข้อมูลขนาดใหญ่อย่างชำนาญช่วยให้คุณสามารถคาดการณ์การพัฒนาของบริษัทได้อย่างแม่นยำ

ตัวอย่างเช่น การใช้โมเดลการประมูล RTB ที่รู้จักกันดีด้วยความช่วยเหลือของการวิเคราะห์ข้อมูลขนาดใหญ่ ทำให้ง่ายต่อการสร้างเพื่อให้โฆษณาแสดงเฉพาะสำหรับผู้ซื้อที่มีศักยภาพซึ่งสนใจซื้อบริการหรือผลิตภัณฑ์

แอปพลิเคชันข้อมูลขนาดใหญ่ในการตลาด:

  1. ช่วยให้คุณรู้จักผู้ซื้อที่มีศักยภาพและดึงดูดผู้ชมที่เหมาะสมบนอินเทอร์เน็ต
  2. มีส่วนช่วยในการประเมินระดับความพึงพอใจ
  3. ช่วยจับคู่บริการที่นำเสนอให้ตรงกับความต้องการของผู้ซื้อ
  4. อำนวยความสะดวกในการค้นหาและดำเนินการตามวิธีการใหม่ๆ เพื่อเพิ่มความภักดีของลูกค้า
  5. ลดความซับซ้อนในการสร้างโครงการที่จะเป็นที่ต้องการในภายหลัง

ตัวอย่างเฉพาะคือบริการ Google.trends ด้วยความช่วยเหลือของมัน นักการตลาดจะสามารถระบุการคาดการณ์สำหรับฤดูกาลเกี่ยวกับผลิตภัณฑ์เฉพาะ ภูมิศาสตร์ของการคลิก และความผันผวน ดังนั้นเมื่อเปรียบเทียบข้อมูลที่ได้รับกับสถิติของไซต์ของคุณเอง การสร้างงบประมาณโฆษณาที่ระบุภูมิภาคและเดือนจึงค่อนข้างง่าย

  • การกระจายงบประมาณโฆษณา: สิ่งที่ควรค่าแก่การใช้จ่ายเงิน
  • ล>

    จะเก็บข้อมูลขนาดใหญ่ได้อย่างไรและที่ไหน

    ระบบไฟล์- นี่คือที่ที่จัดระเบียบและจัดเก็บข้อมูลขนาดใหญ่ ข้อมูลทั้งหมดอยู่ในฮาร์ดไดรฟ์จำนวนมากบนพีซี

    "แผนที่"- แผนที่ - ติดตามตำแหน่งที่เก็บข้อมูลแต่ละชิ้นโดยตรง

    เพื่อป้องกันสถานการณ์ที่ไม่คาดฝันเป็นเรื่องปกติที่จะต้องบันทึกข้อมูลแต่ละชิ้นหลาย ๆ ครั้ง - ขอแนะนำให้ทำเช่นนี้ สามครั้ง.

    ตัวอย่างเช่น หลังจากรวบรวมธุรกรรมแต่ละรายการในเครือข่ายค้าปลีก ข้อมูลทั้งหมดเกี่ยวกับธุรกรรมแต่ละรายการจะถูกจัดเก็บไว้ในเซิร์ฟเวอร์และฮาร์ดไดรฟ์หลายตัว และ "แผนที่" จะทำดัชนีตำแหน่งของไฟล์สำหรับธุรกรรมเฉพาะแต่ละรายการ

    ในการจัดระเบียบการจัดเก็บข้อมูลในปริมาณมาก คุณสามารถใช้ฮาร์ดแวร์และซอฟต์แวร์มาตรฐานที่เป็นสาธารณสมบัติ (เช่น Hadoop)

    ข้อมูลขนาดใหญ่และระบบธุรกิจอัจฉริยะ: ความแตกต่างระหว่างแนวคิด

    ปัจจุบัน การวิเคราะห์ธุรกิจเป็นกระบวนการอธิบายผลลัพธ์ที่ได้รับในช่วงเวลาหนึ่งๆ ความเร็วในการประมวลผลข้อมูลขนาดใหญ่ทำให้การวิเคราะห์สามารถคาดการณ์ได้ คำแนะนำของเขาสามารถพึ่งพาได้ในอนาคต เทคโนโลยีข้อมูลขนาดใหญ่ทำให้สามารถวิเคราะห์ข้อมูลประเภทต่างๆ ได้มากขึ้น เมื่อเทียบกับเครื่องมือและเครื่องมือที่ใช้ในระบบธุรกิจอัจฉริยะ ซึ่งช่วยให้ไม่เพียงแต่มุ่งเน้นไปที่การจัดเก็บข้อมูลที่มีโครงสร้างข้อมูลเท่านั้น แต่ยังสามารถใช้ทรัพยากรที่กว้างขึ้นได้อีกด้วย

    ข่าวกรองธุรกิจและข้อมูลขนาดใหญ่มีความคล้ายคลึงกันหลายประการ แต่มีความแตกต่างดังต่อไปนี้:

    • ข้อมูลขนาดใหญ่ถูกใช้เพื่อประมวลผลข้อมูลจำนวนที่มากกว่าระบบธุรกิจอัจฉริยะ ซึ่งกำหนดแนวคิดของข้อมูลขนาดใหญ่
    • ด้วยความช่วยเหลือของข้อมูลขนาดใหญ่ คุณสามารถประมวลผลข้อมูลที่ได้รับและเปลี่ยนแปลงได้อย่างรวดเร็ว ซึ่งนำไปสู่การโต้ตอบ เช่น ในกรณีส่วนใหญ่ ความเร็วในการโหลดหน้าเว็บจะน้อยกว่าความเร็วในการสร้างผลลัพธ์
    • ข้อมูลขนาดใหญ่สามารถใช้ในการประมวลผลข้อมูลที่ไม่มีโครงสร้าง ซึ่งควรเริ่มทำงานด้วยหลังจากตรวจสอบการจัดเก็บและรวบรวมแล้วเท่านั้น นอกจากนี้ยังจำเป็นต้องใช้อัลกอริทึมที่สามารถระบุรูปแบบหลักในอาร์เรย์ที่สร้างขึ้น

    กระบวนการวิเคราะห์ธุรกิจมีความคล้ายคลึงกับการทำงานของข้อมูลขนาดใหญ่เพียงเล็กน้อย ตามกฎแล้ว เป็นเรื่องปกติที่นักวิเคราะห์ธุรกิจจะได้รับผลลัพธ์โดยการเพิ่มค่าเฉพาะ ตัวอย่างเช่น ปริมาณการขายประจำปี ซึ่งคำนวณเป็นผลรวมของใบแจ้งหนี้ที่ชำระเงินทั้งหมด ในกระบวนการทำงานกับข้อมูลขนาดใหญ่ การคำนวณจะเกิดขึ้นโดยการสร้างแบบจำลองเป็นขั้นตอน:

    • ตั้งสมมติฐาน;
    • การสร้างแบบจำลองคงที่ ภาพ และความหมาย;
    • การทดสอบความถูกต้องของสมมติฐานตามแบบจำลองเหล่านี้
    • เสนอสมมติฐานต่อไปนี้

    ในการดำเนินการวิจัยอย่างเต็มรูปแบบจำเป็นต้องตีความค่าภาพ (การสืบค้นตามความรู้เชิงโต้ตอบ) นอกจากนี้ยังสามารถพัฒนาอัลกอริทึมแมชชีนเลิร์นนิงที่ปรับเปลี่ยนได้

    ความคิดเห็นของผู้เชี่ยวชาญ

    อย่าพึ่งพาความคิดเห็นของนักวิเคราะห์อย่างสุ่มสี่สุ่มห้า

    เวียเชสลาฟ นาซารอฟ,

    ผู้อำนวยการทั่วไปของสำนักงานตัวแทนรัสเซียของ Archos กรุงมอสโก

    ประมาณหนึ่งปีที่ผ่านมาโดยอาศัยความคิดเห็นของผู้เชี่ยวชาญ เราได้เปิดตัวแท็บเล็ตเกมคอนโซลตัวใหม่ในตลาด ความกะทัดรัดและพลังทางเทคนิคที่เพียงพอได้รับการยอมรับในหมู่แฟน ๆ ของเกมคอมพิวเตอร์ ควรสังเกตว่ากลุ่มนี้แม้จะมี "ความคับแคบ" แต่ก็มีกำลังซื้อค่อนข้างสูง ในตอนแรก ความแปลกใหม่นี้ได้รวบรวมบทวิจารณ์เชิงบวกมากมายในสื่อต่างๆ และได้รับการประเมินจากพันธมิตรของเรา อย่างไรก็ตามในไม่ช้าก็เห็นได้ชัดว่ายอดขายแท็บเล็ตค่อนข้างต่ำ โซลูชันนี้ไม่เคยได้รับความนิยมอย่างมาก

    ข้อผิดพลาด. ข้อบกพร่องของเราคือไม่ได้ศึกษาความสนใจของกลุ่มเป้าหมายจนจบ ผู้ใช้ที่ต้องการเล่นบนแท็บเล็ตไม่จำเป็นต้องใช้กราฟิกขั้นสูง เนื่องจากพวกเขาเล่นเกมง่ายๆ เป็นส่วนใหญ่ นักเล่นเกมที่จริงจังคุ้นเคยกับการเล่นบนคอมพิวเตอร์บนแพลตฟอร์มขั้นสูงอยู่แล้ว ไม่มีโฆษณาจำนวนมากเกี่ยวกับผลิตภัณฑ์ของเรา แคมเปญการตลาดก็อ่อนแอเช่นกัน และท้ายที่สุด แท็บเล็ตก็ไม่พบผู้ซื้อในกลุ่มใด ๆ ที่ระบุ

    ผลที่ตามมา. การผลิตสินค้าต้องลดลงเกือบ 40% เมื่อเทียบกับปริมาณที่วางแผนไว้เดิม แน่นอนว่าไม่มีการสูญเสียครั้งใหญ่ เช่นเดียวกับกำไรที่วางแผนไว้ อย่างไรก็ตาม สิ่งนี้ทำให้เราต้องปรับวัตถุประสงค์เชิงกลยุทธ์บางอย่าง สิ่งที่มีค่าที่สุดที่เราสูญเสียไปอย่างไม่มีวันกลับคือเวลาของเรา

    คำแนะนำ. คุณต้องคิดล่วงหน้า สายผลิตภัณฑ์ต้องคำนวณล่วงหน้าสองหรือสามขั้นตอน มันหมายความว่าอะไร? เมื่อเปิดตัวรุ่นต่างๆ ในวันนี้ ขอแนะนำให้เข้าใจชะตากรรมของมันในวันพรุ่งนี้ และอย่างน้อยต้องมีภาพคร่าวๆ ว่าจะเกิดอะไรขึ้นกับมันในหนึ่งปีครึ่ง แน่นอนว่ารายละเอียดทั้งหมดไม่น่าเป็นไปได้ แต่แผนพื้นฐานยังคงต้องมีการร่างขึ้น

    แต่คุณไม่ควรไว้วางใจนักวิเคราะห์อย่างสมบูรณ์และสมบูรณ์ การประเมินของผู้เชี่ยวชาญควรสอดคล้องกับข้อมูลทางสถิติของตนเอง เช่นเดียวกับสถานการณ์การดำเนินงานในตลาด หากผลิตภัณฑ์ของคุณไม่ได้รับการพัฒนาอย่างเต็มที่ คุณก็ไม่ควรปล่อยออกสู่ตลาด เพราะสำหรับผู้ซื้อแล้ว ความประทับใจแรกเป็นสิ่งสำคัญที่สุด และจากนั้นจะเป็นการยากที่จะโน้มน้าวใจเขาเป็นอย่างอื่น

    เคล็ดลับที่สำคัญมากในกรณีที่ล้มเหลวคือความเร็วในการตัดสินใจ คุณไม่สามารถเพียงแค่ดูและรอ การแก้ปัญหาในการแสวงหาที่ร้อนแรงนั้นง่ายกว่าและถูกกว่าการแก้ไขปัญหาที่กำลังดำเนินอยู่

    ระบบบิ๊กดาต้าสร้างปัญหาอะไรบ้าง?

    ปัญหาของระบบบิ๊กดาต้ามีสามกลุ่มหลักซึ่งในวรรณคดีต่างประเทศรวมกันเป็น 3V - Volume, Velocity และ Variety นั่นคือ:

  1. ปริมาณ.
  2. ความเร็วในการประมวลผล
  3. ไม่มีโครงสร้าง

ปัญหาของการจัดเก็บข้อมูลจำนวนมากเกี่ยวข้องกับความจำเป็นในการจัดระเบียบเงื่อนไขบางประการ นั่นคือ การสร้างพื้นที่และโอกาส สำหรับความเร็วนั้นไม่เกี่ยวข้องกับการชะลอตัวและการเบรกมากนักเมื่อใช้วิธีการประมวลผลที่ล้าสมัย แต่ด้วยการโต้ตอบ: ผลลัพธ์ที่ได้จะมีประสิทธิผลมากขึ้น การประมวลผลข้อมูลก็ยิ่งเร็วขึ้นเท่านั้น

  1. ปัญหาของการไม่มีโครงสร้างมาจากการแยกแหล่งที่มา รูปแบบ และคุณภาพของแหล่งที่มา การรวมและประมวลผลข้อมูลขนาดใหญ่ให้ประสบความสำเร็จนั้นต้องการทั้งการเตรียมงานและเครื่องมือหรือระบบการวิเคราะห์
  2. ขีดจำกัดของ "มูลค่า" ของข้อมูลก็มีอิทธิพลอย่างมากเช่นกัน ค่อนข้างยากที่จะระบุมูลค่า และบนพื้นฐานนี้ การคำนวณเงินลงทุนที่จำเป็นและเทคโนโลยีที่จำเป็นจะต้องใช้บนพื้นฐานนี้จึงเป็นปัญหา อย่างไรก็ตาม สำหรับปริมาณบางอย่าง เช่น เทราไบต์ ทุกวันนี้ใช้วิธีการประมวลผลใหม่ได้สำเร็จ ซึ่งได้รับการปรับปรุงอย่างต่อเนื่อง
  3. การขาดหลักการที่ยอมรับกันโดยทั่วไปสำหรับการทำงานกับข้อมูลขนาดใหญ่เป็นอีกปัญหาหนึ่งที่ซับซ้อนจากความแตกต่างของโฟลว์ที่กล่าวมาข้างต้น เพื่อแก้ปัญหานี้ จึงมีการสร้างวิธีการใหม่ในการวิเคราะห์ข้อมูลขนาดใหญ่ จากคำกล่าวของตัวแทนของมหาวิทยาลัยในนิวยอร์ก วอชิงตัน และแคลิฟอร์เนีย การสร้างระเบียบวินัยที่แยกจากกันและแม้แต่วิทยาศาสตร์ข้อมูลขนาดใหญ่ก็ไม่ใช่เรื่องไกลตัว นี่คือเหตุผลหลักที่บริษัทต่าง ๆ ไม่รีบร้อนที่จะแนะนำโครงการที่เกี่ยวข้องกับข้อมูลขนาดใหญ่ อีกปัจจัยหนึ่งคือค่าใช้จ่ายที่สูง
  4. ความยากลำบากยังทำให้เกิดการเลือกข้อมูลสำหรับการวิเคราะห์และอัลกอริทึมของการกระทำ จนถึงปัจจุบัน ยังไม่มีความเข้าใจว่าข้อมูลใดนำข้อมูลที่มีค่าและต้องการการวิเคราะห์ข้อมูลขนาดใหญ่ และสิ่งใดสามารถเพิกเฉยได้ ในสถานการณ์เช่นนี้ มีอีกสิ่งหนึ่งที่ชัดเจน - มีผู้เชี่ยวชาญในอุตสาหกรรมไม่เพียงพอในตลาดที่สามารถรับมือกับการวิเคราะห์เชิงลึก ทำรายงานเกี่ยวกับการแก้ปัญหา และด้วยเหตุนี้จึงนำมาซึ่งผลกำไร
  5. นอกจากนี้ยังมีคำถามด้านศีลธรรม: การรวบรวมข้อมูลโดยที่ผู้ใช้ไม่ทราบนั้นแตกต่างจากการบุกรุกความเป็นส่วนตัวอย่างร้ายแรงหรือไม่? เป็นที่น่าสังเกตว่าการรวบรวมข้อมูลช่วยปรับปรุงคุณภาพชีวิต ตัวอย่างเช่น การรวบรวมข้อมูลอย่างต่อเนื่องในระบบ Google และ Yandex ช่วยให้บริษัทต่างๆ ปรับปรุงบริการของตนโดยขึ้นอยู่กับความต้องการของผู้บริโภค ระบบของบริการเหล่านี้บันทึกทุกการคลิกของผู้ใช้ ตำแหน่งที่ตั้งและไซต์ที่เข้าชม ข้อความและการซื้อทั้งหมด ทั้งหมดนี้ทำให้สามารถแสดงโฆษณาตามพฤติกรรมของผู้ใช้ได้ ผู้ใช้ไม่ได้ให้ความยินยอมในการรวบรวมข้อมูล: ไม่มีตัวเลือกดังกล่าว สิ่งนี้นำไปสู่ปัญหาต่อไป: ข้อมูลถูกเก็บไว้อย่างปลอดภัยแค่ไหน? ตัวอย่างเช่น ข้อมูลเกี่ยวกับผู้ซื้อที่มีศักยภาพ ประวัติการซื้อของพวกเขา และการเปลี่ยนไปยังไซต์ต่างๆ สามารถช่วยแก้ปัญหาทางธุรกิจมากมาย แต่แพลตฟอร์มที่ผู้ซื้อใช้นั้นปลอดภัยหรือไม่นั้นเป็นประเด็นที่ถกเถียงกันมาก หลายคนสนใจความจริงที่ว่าทุกวันนี้ไม่มีที่จัดเก็บข้อมูล - แม้แต่เซิร์ฟเวอร์ของกองทัพ - ก็ไม่ได้รับการปกป้องอย่างเพียงพอจากการโจมตีของแฮ็กเกอร์
  • ความลับทางการค้า: การคุ้มครองและบทลงโทษสำหรับการเปิดเผย

การใช้ข้อมูลขนาดใหญ่แบบค่อยเป็นค่อยไป

ขั้นตอนที่ 1 การนำเทคโนโลยีของบริษัทไปใช้ในโครงการเชิงกลยุทธ์

งานของผู้เชี่ยวชาญด้านเทคนิครวมถึงการศึกษาเบื้องต้นเกี่ยวกับแนวคิดการพัฒนา: การวิเคราะห์เส้นทางการพัฒนาสำหรับพื้นที่ที่ต้องการมากที่สุด

ในการกำหนดองค์ประกอบและงาน จะมีการสนทนากับลูกค้า ซึ่งเป็นผลมาจากการวิเคราะห์ทรัพยากรที่จำเป็น ในขณะเดียวกัน องค์กรตัดสินใจจ้างงานทั้งหมดจากภายนอกทั้งหมดหรือสร้างทีมแบบผสมผสานซึ่งประกอบด้วยผู้เชี่ยวชาญจากองค์กรนี้และองค์กรอื่นๆ

ตามสถิติ บริษัท จำนวนมากใช้รูปแบบดังกล่าว: การปรากฏตัวของทีมผู้เชี่ยวชาญภายในการควบคุมคุณภาพของงานและการก่อตัวของการเคลื่อนไหวและภายนอกโดยตระหนักถึงการทดสอบสมมติฐานโดยตรงเกี่ยวกับการพัฒนาใด ๆ ทิศทาง.

ขั้นตอนที่ 2 ค้นหาวิศวกรข้อมูล

หัวหน้ารวบรวมพนักงานของคนงานร่วมกัน เขายังรับผิดชอบในการพัฒนาโครงการ พนักงานฝ่ายทรัพยากรบุคคลมีบทบาทโดยตรงในการสร้างทีมภายใน

ก่อนอื่น ทีมดังกล่าวต้องการนักวิเคราะห์ข้อมูล เขาคือ นักวิทยาศาสตร์ข้อมูลซึ่งจะทำหน้าที่ในการตั้งสมมติฐานและวิเคราะห์อาร์เรย์ของข้อมูล ความสัมพันธ์ที่เขาร่างไว้จะใช้ในอนาคตเพื่อเป็นฐานของผลิตภัณฑ์และบริการใหม่

เป็นสิ่งสำคัญอย่างยิ่งในระยะแรก งานของแผนกทรัพยากรบุคคล. พนักงานของบริษัทเป็นผู้ตัดสินใจว่าใครจะทำงานที่มีเป้าหมายเพื่อพัฒนาโครงการ จะได้รับจากที่ใดและจะสร้างแรงจูงใจอย่างไร นักวิเคราะห์ข้อมูลหาได้ไม่ง่ายนัก ดังนั้นนี่คือ "ผลิตภัณฑ์ชิ้นเดียว"

บริษัทที่จริงจังทุกแห่งต้องมีผู้เชี่ยวชาญในโปรไฟล์นี้ มิฉะนั้น โฟกัสของโครงการจะหายไป รวมวิศวกรวิเคราะห์: นักพัฒนา นักวิเคราะห์ และนักวิเคราะห์ธุรกิจ นอกจากนี้เขาต้องมีทักษะในการสื่อสารเพื่อแสดงผลกิจกรรมและคลังความรู้และทักษะสำหรับคำอธิบายโดยละเอียดเกี่ยวกับความคิดของเขา

  • 24 ข้อคิดที่เริ่มต้นการเปลี่ยนแปลงครั้งยิ่งใหญ่ในชีวิต

ตัวอย่างการค้นหา

1. บริษัท แท็กซี่ "บิ๊กดาต้า" จัดขึ้นในมอสโก ตลอดเส้นทาง ผู้โดยสารตอบรับงานจากสาขาการวิเคราะห์มืออาชีพ ในกรณีที่ผู้โดยสารตอบคำถามส่วนใหญ่ได้ถูกต้อง บริษัทจึงเสนองานให้ ข้อเสียเปรียบหลักของเทคนิคการสรรหานี้คือความไม่เต็มใจของคนส่วนใหญ่ที่จะเข้าร่วมในโครงการดังกล่าว มีเพียงไม่กี่คนที่เห็นด้วยกับการสัมภาษณ์

2. จัดการแข่งขันข่าวกรองธุรกิจพิเศษพร้อมรางวัลบางประเภท ธนาคารขนาดใหญ่ของรัสเซียใช้วิธีนี้ เป็นผลให้มีผู้เข้าร่วมมากกว่า 1,000 คนในการแข่งขัน Hackathon ผู้ที่ประสบความสำเร็จสูงสุดในการแข่งขันได้รับการเสนองาน น่าเสียดายที่ผู้ชนะส่วนใหญ่ไม่ได้แสดงความปรารถนาที่จะได้รับตำแหน่ง เนื่องจากแรงจูงใจเพียงอย่างเดียวของพวกเขาคือรางวัล แต่ก็ยังมีบางคนตกลงที่จะทำงานเป็นทีม

3. ค้นหาในสภาพแวดล้อมของผู้เชี่ยวชาญด้านข้อมูลที่เข้าใจการวิเคราะห์ธุรกิจและสามารถจัดลำดับโดยสร้างอัลกอริทึมการดำเนินการที่ถูกต้อง ทักษะที่จำเป็นของนักวิเคราะห์ผู้เชี่ยวชาญประกอบด้วย: การเขียนโปรแกรม ความรู้เกี่ยวกับ Python, R, Statistica, Rapidminer และความรู้อื่น ๆ ที่สำคัญไม่แพ้กันสำหรับนักวิเคราะห์ธุรกิจ

ขั้นตอนที่ 3 การสร้างทีมเพื่อพัฒนา

จำเป็นต้องมีทีมประสานงาน เมื่อพิจารณาการวิเคราะห์ขั้นสูง เช่น การพัฒนานวัตกรรมของบริษัท ผู้จัดการจะต้องสร้างและพัฒนาข่าวกรองธุรกิจ

วิศวกรวิจัยเกี่ยวข้องกับการสร้างและทดสอบสมมติฐานเพื่อพัฒนาเวกเตอร์ที่เลือกให้ประสบความสำเร็จ

ศีรษะมีความจำเป็นต้องจัดระเบียบการพัฒนาพื้นที่ธุรกิจที่เลือกสร้างผลิตภัณฑ์ใหม่และประสานงานกับลูกค้า นอกจากนี้หน้าที่ของเขายังรวมถึงการคำนวณกรณีธุรกิจ

ผู้จัดการฝ่ายพัฒนาต้องทำงานใกล้ชิดกับทุกคน วิศวกรวิเคราะห์และผู้จัดการฝ่ายพัฒนาธุรกิจค้นหาความต้องการและโอกาสในการวิเคราะห์ข้อมูลขนาดใหญ่ผ่านการประชุมกับพนักงานที่รับผิดชอบด้านต่างๆ ของโครงการ หลังจากวิเคราะห์สถานการณ์แล้ว ผู้จัดการจะสร้างกรณีต่างๆ ซึ่งบริษัทจะตัดสินใจเกี่ยวกับการพัฒนาทิศทาง บริการ หรือผลิตภัณฑ์ต่อไป

  • ผู้จัดการฝ่ายพัฒนา: ข้อกำหนดและรายละเอียดงาน

3 หลักการทำงานกับขไอจีอะตะ

เราสามารถแยกแยะวิธีการหลักในการทำงานกับข้อมูลขนาดใหญ่ได้:

  1. ความสามารถในการปรับขนาดในแนวนอนเนื่องจากต้องมีข้อมูลจำนวนมาก ระบบใดๆ ที่ประมวลผลข้อมูลจำนวนมากจะสามารถขยายได้ ตัวอย่างเช่น หากจำนวนข้อมูลเพิ่มขึ้นหลายเท่า จำนวนฮาร์ดแวร์ในคลัสเตอร์ก็เพิ่มขึ้นตามจำนวนที่เท่ากัน
  2. ความอดทนต่อความผิดพลาดตามหลักการของความสามารถในการปรับขนาดในแนวนอน เราสามารถสรุปได้ว่ามีเครื่องจำนวนมากในคลัสเตอร์ ตัวอย่างเช่น คลัสเตอร์ Hadoop ของ Yahoo มีมากกว่า 42,000 รายการ วิธีการทำงานกับข้อมูลขนาดใหญ่ทั้งหมดต้องคำนึงถึงความล้มเหลวที่อาจเกิดขึ้นและมองหาวิธีจัดการกับปัญหาโดยไม่มีผลกระทบ
  3. พื้นที่ข้อมูลข้อมูลที่จัดเก็บไว้ในระบบขนาดใหญ่จะกระจายไปตามเครื่องจำนวนมากพอสมควร ดังนั้น ในสถานการณ์ที่ข้อมูลถูกจัดเก็บบนเซิร์ฟเวอร์หมายเลข 1 และประมวลผลบนเซิร์ฟเวอร์หมายเลข 2 จึงไม่สามารถตัดความเป็นไปได้ที่การส่งข้อมูลจะมีราคาสูงกว่าการประมวลผล นั่นเป็นเหตุผลว่าทำไมเมื่อออกแบบ จึงให้ความสนใจอย่างมากเพื่อให้แน่ใจว่าข้อมูลถูกจัดเก็บและประมวลผลในคอมพิวเตอร์เครื่องเดียว

วิธีการทั้งหมดในการทำงานกับข้อมูลขนาดใหญ่ไม่ทางใดก็ทางหนึ่งเป็นไปตามหลักการทั้งสามนี้

วิธีการใช้ระบบบิ๊กดาต้า

โซลูชันข้อมูลขนาดใหญ่ที่ทรงพลังสำหรับธุรกิจหลากหลายประเภทได้รับการเปิดใช้งานโดยการรวมกันของซอฟต์แวร์และฮาร์ดแวร์ที่มีอยู่มากมายในปัจจุบัน

ศักดิ์ศรีสำคัญใหญ่ข้อมูล- ความสามารถในการใช้เครื่องมือใหม่กับเครื่องมือที่ใช้แล้วในพื้นที่นี้ สิ่งนี้มีบทบาทสำคัญอย่างยิ่งในสถานการณ์ที่มีโครงการข้ามสาขาวิชา ตัวอย่าง ได้แก่ การขายแบบหลายช่องทางและการสนับสนุนผู้บริโภค

ในการทำงานกับข้อมูลขนาดใหญ่ ลำดับบางอย่างมีความสำคัญ:

  • ข้อมูลจะถูกรวบรวมก่อน
  • จากนั้นข้อมูลจะถูกจัดโครงสร้าง เพื่อจุดประสงค์นี้ แดชบอร์ดจึงถูกใช้ ( แดชบอร์ด -เครื่องมือสร้างโครงสร้าง
  • ในขั้นตอนต่อไป ข้อมูลเชิงลึกและบริบทจะถูกสร้างขึ้นตามคำแนะนำสำหรับการตัดสินใจ เนื่องจากการรวบรวมข้อมูลมีค่าใช้จ่ายสูง ภารกิจหลักคือการกำหนดวัตถุประสงค์ของการใช้ข้อมูลที่ได้รับ

ตัวอย่าง.เอเจนซี่โฆษณาอาจใช้ข้อมูลตำแหน่งที่รวบรวมโดย telco วิธีนี้จะให้การโฆษณาที่ตรงเป้าหมาย ข้อมูลเดียวกันนี้ใช้กับพื้นที่อื่นๆ ที่เกี่ยวข้องกับการจัดหาและการขายบริการและสินค้า

ข้อมูลที่ได้รับในลักษณะนี้สามารถเป็นกุญแจสำคัญในการตัดสินใจว่าจะเปิดร้านในพื้นที่ใดพื้นที่หนึ่ง

หากเราพิจารณากรณีของการใช้ป้ายโฆษณากลางแจ้งในลอนดอน ไม่ต้องสงสัยเลยว่าทุกวันนี้ประสบการณ์ดังกล่าวจะเกิดขึ้นได้ก็ต่อเมื่อวางอุปกรณ์วัดพิเศษไว้ใกล้กับป้ายโฆษณาแต่ละป้าย ในขณะเดียวกัน ผู้ให้บริการโทรศัพท์เคลื่อนที่มักจะทราบข้อมูลพื้นฐานเกี่ยวกับสมาชิกของตนเสมอ เช่น ตำแหน่งที่ตั้ง สถานภาพการสมรส และอื่นๆ

พื้นที่ที่มีศักยภาพอีกประการหนึ่งของการประยุกต์ใช้ข้อมูลขนาดใหญ่คือการรวบรวมข้อมูลเกี่ยวกับจำนวนผู้เข้าชมงานต่างๆ

ตัวอย่าง.การจัดการแข่งขันฟุตบอลไม่สามารถทราบจำนวนผู้ที่เข้ามาแข่งขันล่วงหน้าได้อย่างแน่นอน อย่างไรก็ตาม พวกเขาจะได้รับข้อมูลดังกล่าวหากใช้ข้อมูลจากผู้ให้บริการโทรศัพท์เคลื่อนที่: ผู้เข้าชมที่มีโอกาสเป็นลูกค้าอยู่ที่ไหนในช่วงระยะเวลาหนึ่ง - หนึ่งเดือน หนึ่งสัปดาห์ หนึ่งวัน - ก่อนการแข่งขัน ปรากฎว่าผู้จัดงานมีโอกาสที่จะวางแผนสถานที่ของงานขึ้นอยู่กับความชอบของกลุ่มเป้าหมาย

ข้อมูลขนาดใหญ่ยังให้ข้อได้เปรียบที่ไม่มีใครเทียบได้สำหรับภาคการธนาคาร ซึ่งสามารถใช้ข้อมูลที่ประมวลผลเพื่อระบุผู้ถือบัตรที่ไร้ยางอาย

ตัวอย่าง.เมื่อผู้ถือบัตรอ้างว่าบัตรสูญหายหรือถูกขโมย ธนาคารสามารถติดตามตำแหน่งของบัตรที่ใช้ชำระบัญชีและโทรศัพท์มือถือของผู้ถือบัตรเพื่อตรวจสอบความถูกต้องของข้อมูลได้ ดังนั้นตัวแทนธนาคารมีโอกาสที่จะเห็นว่าบัตรชำระเงินและโทรศัพท์มือถือของผู้ถืออยู่ในโซนเดียวกัน ดังนั้น - เจ้าของใช้การ์ด

ด้วยประโยชน์ของประเภทนี้ การใช้ข้อมูลทำให้บริษัทต่างๆ มีโอกาสใหม่ๆ มากมาย และตลาดบิ๊กดาต้ายังคงพัฒนาต่อไป

ปัญหาหลักในการใช้ข้อมูลขนาดใหญ่คือความซับซ้อนของการคำนวณกรณี กระบวนการนี้ซับซ้อนเนื่องจากมีสิ่งที่ไม่รู้จักจำนวนมาก

ค่อนข้างยากที่จะคาดการณ์อนาคต ในขณะที่ข้อมูลเกี่ยวกับอดีตไม่ได้อยู่ในโซนการเข้าถึงเสมอไป ในสถานการณ์นี้ที่สำคัญที่สุด วางแผนการดำเนินการเริ่มต้นของคุณ:

  1. คำจำกัดความของปัญหาเฉพาะในโซลูชันที่จะใช้เทคโนโลยีการประมวลผลข้อมูลขนาดใหญ่จะช่วยกำหนดแนวคิดและกำหนดเวกเตอร์สำหรับการดำเนินการต่อไป เมื่อมุ่งเน้นไปที่การรวบรวมข้อมูลเกี่ยวกับประเด็นนี้แล้ว การใช้เครื่องมือและวิธีการที่มีอยู่ทั้งหมดก็คุ้มค่าเช่นกันเพื่อให้ได้ภาพที่ชัดเจนขึ้น ยิ่งไปกว่านั้น วิธีการนี้จะช่วยอำนวยความสะดวกในกระบวนการตัดสินใจในอนาคตอย่างมาก
  2. โอกาสที่โครงการข้อมูลขนาดใหญ่จะดำเนินการโดยทีมงานที่ไม่มีทักษะและประสบการณ์บางอย่างนั้นน้อยมาก ความรู้ที่ต้องใช้ในการศึกษาที่ซับซ้อนเช่นนี้มักได้มาจากการทำงานที่ยาวนาน ซึ่งเป็นเหตุผลว่าทำไมประสบการณ์ก่อนหน้านี้จึงมีความสำคัญในด้านนี้ เป็นการยากที่จะประเมินผลกระทบของวัฒนธรรมการใช้ข้อมูลที่ได้รับจากการวิจัยดังกล่าวสูงเกินไป พวกเขาให้โอกาสต่าง ๆ รวมถึงเนื้อหาที่ได้รับในทางที่ผิด หากต้องการใช้ข้อมูลในทางที่ดี คุณควรปฏิบัติตามกฎพื้นฐานของการประมวลผลข้อมูลที่ถูกต้อง
  3. ข้อมูลเชิงลึกเป็นคุณค่าหลักของเทคโนโลยี ตลาดยังคงประสบปัญหาการขาดแคลนผู้เชี่ยวชาญที่แข็งแกร่งอย่างเฉียบพลัน - ผู้ที่เข้าใจกฎหมายของการทำธุรกิจ ความสำคัญของข้อมูล และขอบเขตของการประยุกต์ใช้ เป็นไปไม่ได้ที่จะไม่คำนึงถึงข้อเท็จจริงที่ว่าการวิเคราะห์ข้อมูลเป็นวิธีหลักในการบรรลุเป้าหมายและพัฒนาธุรกิจของคุณ คุณต้องพยายามพัฒนารูปแบบพฤติกรรมและการรับรู้ที่เฉพาะเจาะจง ในกรณีนี้ ข้อมูลขนาดใหญ่จะเป็นประโยชน์และมีบทบาทเชิงบวกในการแก้ปัญหาทางธุรกิจ

กรณีที่ประสบความสำเร็จของการนำข้อมูลขนาดใหญ่ไปใช้

บางกรณีที่ระบุไว้ด้านล่างนี้ประสบความสำเร็จมากกว่าในการรวบรวมข้อมูล บางกรณีดีกว่าในการวิเคราะห์ข้อมูลขนาดใหญ่และวิธีนำข้อมูลที่ได้รับระหว่างการศึกษาไปใช้

  1. « ระบบเครดิต Tinkoff» ใช้แพลตฟอร์ม EMC2 Greenplum สำหรับการประมวลผลแบบขนานจำนวนมาก เนื่องจากการไหลของผู้ใช้บัตรในธนาคารเพิ่มขึ้นอย่างต่อเนื่องจึงจำเป็นต้องทำให้การประมวลผลข้อมูลเร็วขึ้น มีการตัดสินใจที่จะใช้ข้อมูลขนาดใหญ่และทำงานกับข้อมูลที่ไม่มีโครงสร้าง รวมถึงข้อมูลองค์กรที่ได้รับจากแหล่งข้อมูลที่แตกต่างกัน ข้อเท็จจริงที่ว่ามีการใช้เลเยอร์การวิเคราะห์ของคลังข้อมูลของรัฐบาลกลางบนเว็บไซต์ของ Russian Federal Tax Service ไม่ได้หลบหนีจากความสนใจของผู้เชี่ยวชาญ ต่อจากนั้นมีการวางแผนที่จะจัดระเบียบพื้นที่ที่ให้การเข้าถึงข้อมูลระบบภาษีสำหรับการประมวลผลเพิ่มเติมและรับข้อมูลสถิติ
  2. แยกกันควรพิจารณาการเริ่มต้นของรัสเซีย ซินเคอรา,เกี่ยวข้องกับการวิเคราะห์ข้อมูลขนาดใหญ่ออนไลน์และพัฒนาแพลตฟอร์ม Simplate สิ่งที่สำคัญที่สุดคือการประมวลผลข้อมูลจำนวนมาก ข้อมูลเกี่ยวกับผู้บริโภค การซื้อของพวกเขา อายุ อารมณ์ และสภาวะจิตใจจะได้รับการวิเคราะห์ เครือข่ายร้านเครื่องสำอางได้ติดตั้งเซ็นเซอร์ที่จุดชำระเงินซึ่งสามารถจดจำอารมณ์ของผู้ซื้อได้ หลังจากกำหนดอารมณ์ ข้อมูลเกี่ยวกับผู้ซื้อ เวลาของการซื้อจะถูกวิเคราะห์ หลังจากนั้นผู้ซื้อจะได้รับข้อมูลเกี่ยวกับส่วนลดและโปรโมชันโดยเจตนา การตัดสินใจครั้งนี้เพิ่มความภักดีของผู้บริโภคและสามารถเพิ่มรายได้ของผู้ขาย
  3. แยกกัน ควรพูดถึงกรณีเกี่ยวกับการใช้เทคโนโลยีข้อมูลขนาดใหญ่ในบริษัท ดังกิ้นโดนัท,ผู้ที่ใช้การวิเคราะห์ออนไลน์เพื่อเพิ่มผลกำไรโดยการเปรียบเทียบกับตัวอย่างก่อนหน้านี้ ดังนั้นในร้านค้าปลีกจะแสดงข้อเสนอพิเศษซึ่งเนื้อหามีการเปลี่ยนแปลงทุกนาที พื้นฐานสำหรับการแทนที่ในข้อความคือทั้งช่วงเวลาของวันและสินค้าในสต็อก จากการรับเงินสด บริษัทได้รับข้อมูลเกี่ยวกับรายการที่เป็นที่ต้องการมากที่สุด วิธีนี้ทำให้สามารถเพิ่มรายได้และการหมุนเวียนของคลังสินค้า

ดังนั้นการประมวลผลข้อมูลขนาดใหญ่จึงมีผลดีต่อการแก้ปัญหาทางธุรกิจ แน่นอนว่าปัจจัยสำคัญคือการเลือกกลยุทธ์และการใช้การพัฒนาล่าสุดในด้านข้อมูลขนาดใหญ่

ข้อมูลเกี่ยวกับบริษัท

อาร์คอสประเภทธุรกิจ: การผลิตและการขายอุปกรณ์อิเล็กทรอนิกส์ อาณาเขต: สำนักงานขายเปิดในเก้าประเทศ (สเปน จีน รัสเซีย สหรัฐอเมริกา ฝรั่งเศส ฯลฯ) จำนวนพนักงานของสาขา: 5 (ในสำนักงานตัวแทนของรัสเซีย)

การเร่งการเติบโตของข้อมูลอย่างต่อเนื่องเป็นส่วนสำคัญของความเป็นจริงในปัจจุบัน โซเชียลเน็ตเวิร์ก อุปกรณ์เคลื่อนที่ ข้อมูลจากอุปกรณ์ตรวจวัด ข้อมูลทางธุรกิจเป็นแหล่งข้อมูลเพียงไม่กี่ประเภทที่สามารถสร้างข้อมูลจำนวนมหาศาลได้

ปัจจุบัน คำว่า Big Data (ข้อมูลขนาดใหญ่) ได้กลายเป็นเรื่องธรรมดาไปแล้ว ห่างไกลจากทุกคนยังคงตระหนักว่าเทคโนโลยีที่รวดเร็วและล้ำลึกสำหรับการประมวลผลข้อมูลจำนวนมากกำลังเปลี่ยนแปลงแง่มุมที่หลากหลายที่สุดของสังคม การเปลี่ยนแปลงกำลังเกิดขึ้นในด้านต่างๆ ก่อให้เกิดปัญหาและความท้าทายใหม่ๆ รวมถึงในด้านความปลอดภัยของข้อมูล ซึ่งประเด็นสำคัญ เช่น การรักษาความลับ ความสมบูรณ์ ความพร้อมใช้งาน ฯลฯ ควรอยู่เบื้องหน้า

น่าเสียดายที่บริษัทสมัยใหม่หลายแห่งหันไปใช้เทคโนโลยี Big Data โดยไม่ได้สร้างโครงสร้างพื้นฐานที่เหมาะสมสำหรับสิ่งนี้ ซึ่งสามารถรับประกันการจัดเก็บข้อมูลจำนวนมหาศาลที่พวกเขารวบรวมและจัดเก็บได้อย่างน่าเชื่อถือ ในทางกลับกัน เทคโนโลยีบล็อกเชนกำลังพัฒนาอย่างรวดเร็ว ซึ่งออกแบบมาเพื่อแก้ปัญหานี้และปัญหาอื่นๆ อีกมากมาย

บิ๊กดาต้าคืออะไร?

ในความเป็นจริง คำจำกัดความของคำนี้อยู่เพียงผิวเผิน: "ข้อมูลขนาดใหญ่" หมายถึงการจัดการข้อมูลจำนวนมาก เช่นเดียวกับการวิเคราะห์ข้อมูลเหล่านั้น หากคุณมองให้กว้างกว่านี้ ข้อมูลนี้เป็นข้อมูลที่ไม่สามารถประมวลผลด้วยวิธีดั้งเดิมได้เนื่องจากข้อมูลมีปริมาณมาก

คำว่า Big Data เอง (ข้อมูลขนาดใหญ่) ปรากฏขึ้นเมื่อไม่นานมานี้ ตามบริการของ Google Trends ความนิยมที่เพิ่มขึ้นอย่างแข็งขันของคำศัพท์นั้นลดลงเมื่อสิ้นปี 2554:

ในปี 2010 ผลิตภัณฑ์และโซลูชันแรกที่เกี่ยวข้องโดยตรงกับการประมวลผลข้อมูลขนาดใหญ่เริ่มปรากฏขึ้น ภายในปี 2554 บริษัทไอทีที่ใหญ่ที่สุดส่วนใหญ่ ได้แก่ IBM, Oracle, Microsoft และ Hewlett-Packard กำลังใช้คำว่า Big Data ในกลยุทธ์ทางธุรกิจของตนอย่างจริงจัง นักวิเคราะห์ตลาดเทคโนโลยีสารสนเทศค่อยๆ เริ่มทำการวิจัยเชิงรุกเกี่ยวกับแนวคิดนี้

ปัจจุบันคำนี้ได้รับความนิยมอย่างมากและถูกใช้อย่างแข็งขันในหลากหลายสาขา อย่างไรก็ตาม ไม่สามารถพูดได้อย่างแน่นอนว่า Big Data เป็นปรากฏการณ์ใหม่โดยพื้นฐาน ในทางกลับกัน แหล่งข้อมูลขนาดใหญ่มีอยู่หลายปีแล้ว ในด้านการตลาดพวกเขาสามารถเป็นฐานข้อมูลการซื้อของลูกค้า, ประวัติเครดิต, ไลฟ์สไตล์และอื่น ๆ ในช่วงหลายปีที่ผ่านมานักวิเคราะห์ได้ใช้ข้อมูลนี้เพื่อช่วยให้บริษัทสามารถคาดการณ์ความต้องการของลูกค้าในอนาคต, ประเมินความเสี่ยง, กำหนดรูปแบบของผู้บริโภคและอื่น ๆ

ปัจจุบันสถานการณ์เปลี่ยนไปใน 2 ด้านคือ

— มีเครื่องมือและวิธีการที่ซับซ้อนมากขึ้นในการวิเคราะห์และเปรียบเทียบชุดข้อมูลต่างๆ
— เครื่องมือวิเคราะห์ได้รับการเสริมด้วยแหล่งข้อมูลใหม่ๆ มากมาย ซึ่งได้แรงหนุนจากการแปลงเป็นดิจิทัลอย่างกว้างขวาง เช่นเดียวกับวิธีการรวบรวมและวัดข้อมูลแบบใหม่

นักวิจัยคาดการณ์ว่าเทคโนโลยี Big Data จะถูกนำไปใช้อย่างแข็งขันที่สุดในด้านการผลิต การดูแลสุขภาพ การค้า การบริหารราชการ และในพื้นที่และอุตสาหกรรมอื่นๆ ที่มีความหลากหลายมาก

Big Data ไม่ใช่อาร์เรย์ของข้อมูลเฉพาะ แต่เป็นชุดของวิธีการประมวลผล คุณลักษณะที่กำหนดสำหรับข้อมูลขนาดใหญ่ไม่ได้เป็นเพียงปริมาณเท่านั้น แต่ยังรวมถึงหมวดหมู่อื่น ๆ ที่กำหนดลักษณะของกระบวนการประมวลผลและวิเคราะห์ข้อมูลที่ต้องใช้แรงงานมาก

ข้อมูลเริ่มต้นสำหรับการประมวลผลสามารถเป็นได้ เช่น:

— บันทึกพฤติกรรมผู้ใช้อินเทอร์เน็ต
— อินเทอร์เน็ตของสิ่งต่าง ๆ
- สื่อสังคม;
— ข้อมูลอุตุนิยมวิทยา
— หนังสือดิจิทัลของห้องสมุดที่ใหญ่ที่สุด
– สัญญาณ GPS จากยานพาหนะ
— ข้อมูลเกี่ยวกับธุรกรรมของลูกค้าธนาคาร
— ข้อมูลเกี่ยวกับตำแหน่งของสมาชิกเครือข่ายมือถือ
— ข้อมูลเกี่ยวกับการซื้อในเครือข่ายค้าปลีกขนาดใหญ่ ฯลฯ

เมื่อเวลาผ่านไป จำนวนข้อมูลและจำนวนแหล่งที่มาเพิ่มขึ้นอย่างต่อเนื่อง เมื่อเทียบกับพื้นหลังนี้ วิธีการประมวลผลข้อมูลแบบใหม่จะปรากฏขึ้น และวิธีการประมวลผลข้อมูลที่มีอยู่จะได้รับการปรับปรุงให้ดีขึ้น

หลักการพื้นฐานของข้อมูลขนาดใหญ่:

- ความสามารถในการปรับขนาดในแนวนอน - อาร์เรย์ข้อมูลสามารถมีขนาดใหญ่ได้ ซึ่งหมายความว่าระบบประมวลผลข้อมูลขนาดใหญ่จะต้องขยายแบบไดนามิกเมื่อปริมาณเพิ่มขึ้น
- ความทนทานต่อความผิดพลาด - แม้ว่าอุปกรณ์บางชิ้นจะล้มเหลว ระบบทั้งหมดจะต้องยังคงใช้งานได้
— พื้นที่ข้อมูล ในระบบกระจายขนาดใหญ่ ข้อมูลมักจะถูกกระจายไปยังเครื่องจำนวนมาก อย่างไรก็ตาม เมื่อใดก็ตามที่เป็นไปได้และเพื่อประหยัดทรัพยากร ข้อมูลมักจะถูกประมวลผลบนเซิร์ฟเวอร์เดียวกับที่จัดเก็บ

เพื่อการทำงานที่มั่นคงของหลักการทั้งสาม และด้วยเหตุนี้ การจัดเก็บและประมวลผลข้อมูลขนาดใหญ่จึงมีประสิทธิภาพสูง จึงจำเป็นต้องมีเทคโนโลยีที่ก้าวล้ำใหม่ เช่น บล็อกเชน เป็นต้น

ข้อมูลขนาดใหญ่มีไว้เพื่ออะไร?

ขอบเขตของ Big Data กำลังขยายตัวอย่างต่อเนื่อง:

— ข้อมูลขนาดใหญ่สามารถนำมาใช้ในทางการแพทย์ ดังนั้นจึงเป็นไปได้ที่จะสร้างการวินิจฉัยสำหรับผู้ป่วยไม่เพียง แต่ขึ้นอยู่กับข้อมูลของการวิเคราะห์ประวัติทางการแพทย์ แต่ยังคำนึงถึงประสบการณ์ของแพทย์คนอื่น ๆ ข้อมูลเกี่ยวกับสถานการณ์ทางนิเวศวิทยาของพื้นที่ที่อยู่อาศัยของผู้ป่วย และปัจจัยอื่นๆ อีกมากมาย
— เทคโนโลยี Big Data สามารถใช้เพื่อจัดระเบียบการเคลื่อนที่ของยานพาหนะไร้คนขับ
— ด้วยการประมวลผลข้อมูลจำนวนมาก ทำให้สามารถจดจำใบหน้าในสื่อภาพถ่ายและวิดีโอได้
- ผู้ค้าปลีกสามารถใช้เทคโนโลยี Big Data ได้ บริษัทการค้าสามารถใช้อาร์เรย์ข้อมูลจากโซเชียลเน็ตเวิร์กอย่างแข็งขันเพื่อตั้งค่าแคมเปญโฆษณาของตนได้อย่างมีประสิทธิภาพ ซึ่งสามารถเน้นไปที่ผู้บริโภคกลุ่มใดกลุ่มหนึ่งได้สูงสุด
— เทคโนโลยีนี้ใช้อย่างแข็งขันในการจัดแคมเปญเลือกตั้ง รวมถึงการวิเคราะห์ความชอบทางการเมืองในสังคม
— การใช้เทคโนโลยี Big Data มีความเกี่ยวข้องกับโซลูชันระดับประกันรายได้ (RA) ซึ่งรวมถึงเครื่องมือในการตรวจจับความไม่สอดคล้องกันและการวิเคราะห์ข้อมูลเชิงลึกที่ช่วยให้สามารถระบุความสูญเสียหรือการบิดเบือนข้อมูลที่อาจเกิดขึ้นได้ทันท่วงที ซึ่งอาจทำให้ผลลัพธ์ทางการเงินลดลง .
— ผู้ให้บริการโทรคมนาคมสามารถรวบรวมข้อมูลขนาดใหญ่ รวมถึงข้อมูลตำแหน่งทางภูมิศาสตร์ ในทางกลับกัน ข้อมูลนี้อาจเป็นประโยชน์ทางการค้าแก่บริษัทตัวแทนโฆษณา ซึ่งอาจใช้ข้อมูลนี้เพื่อแสดงโฆษณาที่ตรงเป้าหมายและในท้องถิ่น ตลอดจนผู้ค้าปลีกและธนาคาร
“บิ๊กดาต้าสามารถมีบทบาทสำคัญในการตัดสินใจว่าจะเปิดร้านค้าปลีกในสถานที่ใดสถานที่หนึ่งหรือไม่ โดยพิจารณาจากข้อมูลเกี่ยวกับการมีอยู่ของกระแสผู้คนเป้าหมายที่ทรงพลัง

ดังนั้นการประยุกต์ใช้เทคโนโลยี Big Data ในทางปฏิบัติที่ชัดเจนที่สุดจึงอยู่ในสาขาการตลาด ต้องขอบคุณการพัฒนาของอินเทอร์เน็ตและการเพิ่มจำนวนของอุปกรณ์สื่อสารทุกชนิด ข้อมูลพฤติกรรม (เช่น จำนวนการโทร พฤติกรรมการจับจ่าย และการซื้อ) จึงพร้อมใช้งานแบบเรียลไทม์

เทคโนโลยีข้อมูลขนาดใหญ่ยังสามารถนำมาใช้อย่างมีประสิทธิภาพในด้านการเงิน การวิจัยทางสังคมวิทยา และด้านอื่นๆ อีกมากมาย ผู้เชี่ยวชาญยืนยันว่าความเป็นไปได้ทั้งหมดของการใช้ข้อมูลขนาดใหญ่เป็นเพียงส่วนที่มองเห็นได้ของภูเขาน้ำแข็ง เนื่องจากเทคโนโลยีเหล่านี้ถูกนำมาใช้ในปริมาณที่มากขึ้นในด้านข่าวกรองและการต่อต้านการข่าวกรอง ในกิจการทางทหาร เช่นเดียวกับทุกสิ่งที่เรียกกันทั่วไปว่าสงครามข้อมูล

โดยทั่วไปแล้ว ลำดับการทำงานกับ Big Data ประกอบด้วยการรวบรวมข้อมูล จัดโครงสร้างข้อมูลที่ได้รับโดยใช้รายงานและแดชบอร์ด จากนั้นกำหนดคำแนะนำสำหรับการดำเนินการ

ให้เราพิจารณาโดยสังเขปถึงความเป็นไปได้ของการใช้เทคโนโลยี Big Data ในด้านการตลาด อย่างที่คุณทราบ สำหรับนักการตลาดแล้ว ข้อมูลคือเครื่องมือหลักในการคาดการณ์และวางกลยุทธ์ การวิเคราะห์ข้อมูลขนาดใหญ่ประสบความสำเร็จในการระบุกลุ่มเป้าหมาย ความสนใจ ความต้องการ และกิจกรรมของผู้บริโภคมาอย่างยาวนาน โดยเฉพาะอย่างยิ่งการวิเคราะห์ข้อมูลขนาดใหญ่ทำให้สามารถแสดงโฆษณา (ตามรูปแบบการประมูล RTB - การเสนอราคาแบบเรียลไทม์) เฉพาะกับผู้บริโภคที่สนใจผลิตภัณฑ์หรือบริการเท่านั้น

การใช้ Big Data ในด้านการตลาดช่วยให้นักธุรกิจสามารถ:

- รู้จักผู้บริโภคของคุณได้ดีขึ้น ดึงดูดผู้ชมที่คล้ายกันบนอินเทอร์เน็ต
- ประเมินระดับความพึงพอใจของลูกค้า
— เพื่อทำความเข้าใจว่าบริการที่เสนอนั้นตรงตามความคาดหวังและความต้องการหรือไม่
- ค้นหาและปรับใช้วิธีการใหม่ ๆ เพื่อเพิ่มความมั่นใจให้กับลูกค้า
— สร้างโครงการที่ต้องการ ฯลฯ

ตัวอย่างเช่น บริการ Google.trends สามารถบอกนักการตลาดเกี่ยวกับการคาดการณ์กิจกรรมความต้องการตามฤดูกาลสำหรับผลิตภัณฑ์เฉพาะ ความผันผวน และภูมิศาสตร์ของการคลิก หากคุณเปรียบเทียบข้อมูลนี้กับสถิติที่รวบรวมโดยปลั๊กอินที่เกี่ยวข้องบนไซต์ของคุณเอง คุณสามารถวางแผนสำหรับการกระจายงบประมาณการโฆษณา โดยระบุเดือน ภูมิภาค และพารามิเตอร์อื่นๆ

นักวิจัยหลายคนกล่าวว่าการแบ่งส่วนและการใช้ข้อมูลขนาดใหญ่คือความสำเร็จของแคมเปญทรัมป์ ทีมของประธานาธิบดีสหรัฐในอนาคตสามารถแบ่งกลุ่มผู้ฟังได้อย่างถูกต้อง เข้าใจความต้องการ และแสดงข้อความที่ผู้มีสิทธิเลือกตั้งต้องการเห็นและได้ยิน ดังนั้น จากข้อมูลของ Irina Belysheva จาก Data-Centric Alliance ชัยชนะของทรัมป์ส่วนใหญ่มาจากแนวทางที่ไม่ได้มาตรฐานสำหรับการตลาดทางอินเทอร์เน็ต ซึ่งอาศัยข้อมูลขนาดใหญ่ การวิเคราะห์พฤติกรรมทางจิตวิทยา และการโฆษณาที่ปรับให้เหมาะกับแต่ละบุคคล

นักเทคโนโลยีและนักการตลาดทางการเมืองของทรัมป์ใช้แบบจำลองทางคณิตศาสตร์ที่พัฒนาขึ้นเป็นพิเศษ ซึ่งทำให้พวกเขาวิเคราะห์ข้อมูลของผู้มีสิทธิเลือกตั้งในสหรัฐฯ ทั้งหมดอย่างลึกซึ้งและจัดระบบข้อมูลเหล่านั้น ทำให้การกำหนดเป้าหมายแม่นยำเป็นพิเศษไม่เพียงแต่ตามลักษณะทางภูมิศาสตร์เท่านั้น แต่ยังรวมถึงความตั้งใจ ความสนใจของผู้มีสิทธิเลือกตั้งด้วย ลักษณะทางจิตลักษณะทางพฤติกรรม ฯลฯ หลังจากนี้ นักการตลาดได้จัดการสื่อสารส่วนบุคคลกับแต่ละกลุ่มของประชาชนตามความต้องการ อารมณ์ มุมมองทางการเมือง ลักษณะทางจิตวิทยา และแม้แต่สีผิว โดยใช้ข้อความของตนเองสำหรับเกือบทุกคน ผู้มีสิทธิเลือกตั้ง

สำหรับฮิลลารี คลินตัน เธอใช้วิธี "ทดสอบตามเวลา" โดยอิงตามข้อมูลทางสังคมวิทยาและการตลาดมาตรฐานในการหาเสียงของเธอ โดยแบ่งผู้มีสิทธิเลือกตั้งออกเป็นกลุ่มที่เป็นเนื้อเดียวกันอย่างเป็นทางการเท่านั้น (ชาย หญิง แอฟริกันอเมริกัน ฮิสแปนิก คนจน คนรวย ฯลฯ)

เป็นผลให้ผู้ชนะคือผู้ที่ชื่นชมศักยภาพของเทคโนโลยีใหม่และวิธีการวิเคราะห์ โดยเฉพาะอย่างยิ่งการใช้จ่ายในการหาเสียงของฮิลลารีคลินตันเป็นสองเท่าของฝ่ายตรงข้าม:

ข้อมูล: การวิจัยของพิว

ปัญหาหลักของการใช้ Big Data

นอกจากค่าใช้จ่ายที่สูงแล้ว ปัจจัยหลักประการหนึ่งที่ขัดขวางการนำ Big Data มาใช้ในด้านต่างๆ คือ ปัญหาในการเลือกข้อมูลที่จะประมวลผล นั่นคือ การพิจารณาว่าข้อมูลใดจำเป็นต้องดึง จัดเก็บ และวิเคราะห์ ข้อมูลใดบ้าง ไม่ควรนำมาพิจารณา

ปัญหาอีกประการหนึ่งของ Big Data คือจริยธรรม กล่าวอีกนัยหนึ่งคือคำถามทั่วไปเกิดขึ้น: การรวบรวมข้อมูลดังกล่าว (โดยเฉพาะอย่างยิ่งโดยที่ผู้ใช้ไม่ทราบ) จะถือเป็นการละเมิดขอบเขตความเป็นส่วนตัวได้หรือไม่?

ไม่มีความลับใดที่ข้อมูลที่จัดเก็บไว้ในเครื่องมือค้นหาของ Google และ Yandex ช่วยให้ยักษ์ใหญ่ด้านไอทีสามารถปรับปรุงบริการของตนได้อย่างต่อเนื่อง ทำให้เป็นมิตรกับผู้ใช้ และสร้างแอปพลิเคชันเชิงโต้ตอบใหม่ๆ ในการทำเช่นนี้ เครื่องมือค้นหาจะรวบรวมข้อมูลผู้ใช้เกี่ยวกับกิจกรรมของผู้ใช้บนอินเทอร์เน็ต ที่อยู่ IP ข้อมูลตำแหน่งทางภูมิศาสตร์ ความสนใจและการซื้อออนไลน์ ข้อมูลส่วนบุคคล ข้อความอีเมล ฯลฯ ทั้งหมดนี้ทำให้สามารถแสดงโฆษณาตามบริบทตามพฤติกรรมของผู้ใช้บนอินเทอร์เน็ต ในเวลาเดียวกัน มักจะไม่ขอความยินยอมจากผู้ใช้ และไม่ได้เลือกว่าจะให้ข้อมูลใดเกี่ยวกับตนเอง นั่นคือตามค่าเริ่มต้น ทุกอย่างจะถูกรวบรวมใน Big Data ซึ่งจะถูกจัดเก็บไว้ในเซิร์ฟเวอร์ข้อมูลของไซต์

จากนี้จะเป็นประเด็นสำคัญต่อไปเกี่ยวกับความปลอดภัยของการจัดเก็บและการใช้ข้อมูล ตัวอย่างเช่น เป็นแพลตฟอร์มการวิเคราะห์ที่ผู้บริโภคแบ่งปันข้อมูลโดยอัตโนมัติอย่างปลอดภัยหรือไม่ นอกจากนี้ ตัวแทนธุรกิจจำนวนมากยังสังเกตเห็นการขาดแคลนนักวิเคราะห์และนักการตลาดที่มีคุณสมบัติสูง ซึ่งสามารถดำเนินการกับข้อมูลจำนวนมากได้อย่างมีประสิทธิภาพและแก้ปัญหาทางธุรกิจเฉพาะด้วยความช่วยเหลือของพวกเขา

แม้จะมีความยากลำบากในการนำ Big Data ไปใช้ แต่ธุรกิจก็ตั้งใจที่จะเพิ่มการลงทุนในด้านนี้ จากการศึกษาของ Gartner ผู้นำในอุตสาหกรรมที่ลงทุนใน Big Data ได้แก่ บริษัทสื่อ การค้าปลีก โทรคมนาคม การธนาคาร และบริการ

โอกาสในการโต้ตอบระหว่างเทคโนโลยีบล็อกเชนกับข้อมูลขนาดใหญ่

การผสานรวมกับ Big Data มีผลร่วมกันและเปิดโอกาสใหม่ ๆ มากมายสำหรับธุรกิจ รวมถึงการอนุญาต:

— เข้าถึงข้อมูลโดยละเอียดเกี่ยวกับความชอบของผู้บริโภค ซึ่งคุณสามารถสร้างโปรไฟล์การวิเคราะห์โดยละเอียดสำหรับซัพพลายเออร์ ผลิตภัณฑ์ และส่วนประกอบของผลิตภัณฑ์เฉพาะได้
- รวมข้อมูลโดยละเอียดเกี่ยวกับการทำธุรกรรมและสถิติเกี่ยวกับการบริโภคสินค้าบางกลุ่มตามประเภทต่างๆ ของผู้ใช้
- รับข้อมูลการวิเคราะห์โดยละเอียดเกี่ยวกับห่วงโซ่อุปทานและการบริโภค ควบคุมการสูญเสียของผลิตภัณฑ์ระหว่างการขนส่ง (เช่น การลดน้ำหนักเนื่องจากการหดตัวและการระเหยของสินค้าบางประเภท)
– ต่อต้านสินค้าลอกเลียนแบบ เพิ่มประสิทธิภาพในการต่อสู้กับการฟอกเงินและการฉ้อโกง ฯลฯ

การเข้าถึงข้อมูลโดยละเอียดเกี่ยวกับการใช้และการบริโภคสินค้าจะช่วยปลดล็อกศักยภาพของเทคโนโลยี Big Data เพื่อเพิ่มประสิทธิภาพกระบวนการทางธุรกิจที่สำคัญ ลดความเสี่ยงด้านกฎระเบียบ และเปิดโอกาสใหม่สำหรับการสร้างรายได้และสร้างผลิตภัณฑ์ที่ตอบสนองความต้องการของผู้บริโภคในปัจจุบันได้ดีที่สุด

ดังที่คุณทราบ ตัวแทนของสถาบันการเงินที่ใหญ่ที่สุดได้แสดงความสนใจอย่างมากในเทคโนโลยีบล็อกเชน ซึ่งรวมถึง และอื่นๆ ตามที่ Oliver Bussmann ผู้จัดการฝ่ายไอทีของ UBS ทางการเงินของสวิส เทคโนโลยีบล็อกเชนสามารถ “ลดเวลาการประมวลผลธุรกรรมจากหลายวันเป็นหลายวัน นาที” .

ศักยภาพในการวิเคราะห์จากบล็อกเชนโดยใช้เทคโนโลยีบิ๊กดาต้านั้นมีอยู่มาก เทคโนโลยีการลงทะเบียนแบบกระจายทำให้มั่นใจได้ถึงความสมบูรณ์ของข้อมูล เช่นเดียวกับการจัดเก็บที่เชื่อถือได้และโปร่งใสของประวัติการทำธุรกรรมทั้งหมด ในทางกลับกัน Big Data มอบเครื่องมือใหม่สำหรับการวิเคราะห์ที่มีประสิทธิภาพ การพยากรณ์ การสร้างแบบจำลองทางเศรษฐกิจ และด้วยเหตุนี้จึงเปิดโอกาสใหม่สำหรับการตัดสินใจด้านการจัดการที่มีข้อมูลมากขึ้น

สามารถใช้บล็อกเชนและข้อมูลขนาดใหญ่ควบคู่กันไปในการดูแลสุขภาพได้สำเร็จ อย่างที่คุณทราบ ข้อมูลสุขภาพของผู้ป่วยที่ไม่สมบูรณ์และไม่สมบูรณ์ในบางครั้งจะเพิ่มความเสี่ยงในการวินิจฉัยที่ไม่ถูกต้องและการรักษาที่ไม่ถูกต้อง ข้อมูลที่สำคัญเกี่ยวกับสุขภาพของลูกค้าของสถาบันการแพทย์ควรมีความปลอดภัยมากที่สุดเท่าที่จะเป็นไปได้ มีคุณสมบัติไม่เปลี่ยนแปลง ตรวจสอบได้ และไม่ถูกดัดแปลงใดๆ

ข้อมูลในบล็อกเชนเป็นไปตามข้อกำหนดทั้งหมดข้างต้น และสามารถใช้เป็นแหล่งข้อมูลคุณภาพสูงและเชื่อถือได้สำหรับการวิเคราะห์เชิงลึกโดยใช้เทคโนโลยี Big Data ใหม่ นอกจากนี้ ด้วยความช่วยเหลือของบล็อคเชน สถาบันการแพทย์สามารถแลกเปลี่ยนข้อมูลที่เชื่อถือได้กับบริษัทประกัน หน่วยงานยุติธรรม นายจ้าง สถาบันวิทยาศาสตร์ และองค์กรอื่นๆ ที่ต้องการข้อมูลทางการแพทย์

ข้อมูลขนาดใหญ่และความปลอดภัยของข้อมูล

ในแง่กว้าง การรักษาความปลอดภัยข้อมูลคือการปกป้องข้อมูลและโครงสร้างพื้นฐานที่สนับสนุนจากผลกระทบเชิงลบโดยบังเอิญหรือโดยเจตนาของธรรมชาติหรือเทียม

ในด้านความปลอดภัยของข้อมูล Big Data เผชิญกับความท้าทายดังต่อไปนี้:

— ปัญหาของการปกป้องข้อมูลและการรับรองความสมบูรณ์;
— ความเสี่ยงจากการแทรกแซงจากภายนอกและการรั่วไหลของข้อมูลที่เป็นความลับ
— การจัดเก็บข้อมูลที่เป็นความลับอย่างไม่เหมาะสม;
- ความเสี่ยงของการสูญหายของข้อมูล เช่น เนื่องจากการกระทำที่มุ่งร้ายของใครบางคน
— ความเสี่ยงจากการใช้ข้อมูลส่วนบุคคลในทางที่ผิดโดยบุคคลที่สาม ฯลฯ

หนึ่งในปัญหาหลักของข้อมูลขนาดใหญ่ที่ blockchain ออกแบบมาเพื่อแก้ไขนั้นอยู่ในด้านความปลอดภัยของข้อมูล เพื่อให้แน่ใจว่าสอดคล้องกับหลักการพื้นฐานทั้งหมด เทคโนโลยีบัญชีแยกประเภทแบบกระจายสามารถรับประกันความสมบูรณ์และความน่าเชื่อถือของข้อมูล และเนื่องจากไม่มีข้อผิดพลาดจุดเดียว บล็อกเชนทำให้ระบบข้อมูลมีเสถียรภาพ เทคโนโลยีบัญชีแยกประเภทแบบกระจายสามารถช่วยแก้ปัญหาความเชื่อถือในข้อมูล รวมทั้งให้ความเป็นไปได้ในการแลกเปลี่ยนข้อมูลแบบสากล

ข้อมูลเป็นทรัพย์สินที่มีค่า ซึ่งหมายความว่าประเด็นหลักของความปลอดภัยของข้อมูลควรอยู่ในระดับแนวหน้า เพื่อความอยู่รอดในการแข่งขัน บริษัทต้องตามให้ทัน ซึ่งหมายความว่าพวกเขาไม่สามารถเพิกเฉยต่อโอกาสและข้อได้เปรียบที่อาจเกิดขึ้นจากเทคโนโลยีบล็อกเชนและเครื่องมือบิ๊กดาต้า

เกิดอะไรขึ้น ข้อมูลใหญ่(อย่างแท้จริง - ข้อมูลใหญ่)? ลองดูพจนานุกรมของอ็อกซ์ฟอร์ดก่อน:

ข้อมูล- ปริมาณ อักขระ หรือสัญลักษณ์ที่ควบคุมโดยคอมพิวเตอร์ ซึ่งสามารถจัดเก็บและส่งสัญญาณในรูปของสัญญาณไฟฟ้า บันทึกลงในสื่อแม่เหล็ก แสง หรือสื่อทางกล

ภาคเรียน ข้อมูลใหญ่ใช้เพื่ออธิบายชุดข้อมูลขนาดใหญ่และเพิ่มขึ้นอย่างทวีคูณ ในการประมวลผลข้อมูลจำนวนนี้ เราไม่สามารถทำได้หากไม่มี

ประโยชน์ที่ได้รับจาก Big Data:

  1. การรวบรวมข้อมูลจากแหล่งต่างๆ
  2. ปรับปรุงกระบวนการทางธุรกิจผ่านการวิเคราะห์ตามเวลาจริง
  3. การจัดเก็บข้อมูลจำนวนมาก
  4. ข้อมูลเชิงลึก Big Data เป็นข้อมูลเชิงลึกที่ลึกซึ้งยิ่งขึ้นผ่านข้อมูลที่มีโครงสร้างและกึ่งโครงสร้าง
  5. ข้อมูลขนาดใหญ่ช่วยลดความเสี่ยงและตัดสินใจอย่างชาญฉลาดด้วยการวิเคราะห์ความเสี่ยงที่เหมาะสม

ตัวอย่างของข้อมูลขนาดใหญ่

ตลาดหลักทรัพย์นิวยอร์กสร้างทุกวัน 1 เทราไบต์ข้อมูลการซื้อขายสำหรับช่วงก่อนหน้า

สื่อสังคม: สถิติแสดงให้เห็นว่าฐานข้อมูลของ Facebook ถูกอัพโหลดทุกวัน 500 เทราไบต์ข้อมูลใหม่ถูกสร้างขึ้นเนื่องจากการอัปโหลดรูปภาพและวิดีโอไปยังเซิร์ฟเวอร์เครือข่ายสังคม การส่งข้อความ ความคิดเห็นใต้โพสต์ และอื่นๆ

เครื่องยนต์ไอพ่นสร้าง 10 เทราไบต์ข้อมูลทุก 30 นาทีระหว่างการบิน เนื่องจากมีเที่ยวบินหลายพันเที่ยวบินทุกวัน ปริมาณข้อมูลจึงสูงถึงเพตะไบต์

การจำแนกข้อมูลขนาดใหญ่

แบบฟอร์มข้อมูลขนาดใหญ่:

  • มีโครงสร้าง
  • ไม่มีโครงสร้าง
  • กึ่งโครงสร้าง

รูปแบบที่มีโครงสร้าง

ข้อมูลที่สามารถจัดเก็บ เข้าถึง และประมวลผลในรูปแบบคงที่เรียกว่า ข้อมูลที่มีโครงสร้าง เป็นเวลานานแล้วที่วิทยาการคอมพิวเตอร์มีความก้าวหน้าอย่างมากในการปรับปรุงเทคนิคสำหรับการทำงานกับข้อมูลประเภทนี้ (ซึ่งทราบรูปแบบล่วงหน้า) และเรียนรู้ที่จะเก็บเกี่ยวผลประโยชน์ อย่างไรก็ตาม ทุกวันนี้มีปัญหาที่เกี่ยวข้องกับการเติบโตของปริมาตรเป็นขนาดที่วัดได้ในช่วงหลายเซ็ตตะไบต์

1 เซ็ตตะไบต์ เท่ากับ หนึ่งพันล้านเทราไบต์

เมื่อพิจารณาจากตัวเลขเหล่านี้ เป็นเรื่องง่ายที่จะเชื่อในความจริงของคำว่า Big Data และความยุ่งยากที่เกี่ยวข้องกับการประมวลผลและการจัดเก็บข้อมูลดังกล่าว

ข้อมูลที่จัดเก็บไว้ในฐานข้อมูลเชิงสัมพันธ์มีโครงสร้างและมีลักษณะเช่น ตารางของพนักงานบริษัท

รูปแบบไม่มีโครงสร้าง

ข้อมูลของโครงสร้างที่ไม่รู้จักจัดอยู่ในประเภทไม่มีโครงสร้าง นอกจากขนาดที่ใหญ่แล้ว แบบฟอร์มนี้ยังมีความยากลำบากในการประมวลผลและดึงข้อมูลที่เป็นประโยชน์อีกด้วย ตัวอย่างทั่วไปของข้อมูลที่ไม่มีโครงสร้างคือแหล่งข้อมูลที่แตกต่างกันซึ่งมีไฟล์ข้อความ รูปภาพ และวิดีโอแบบธรรมดารวมกัน ทุกวันนี้ องค์กรต่างๆ สามารถเข้าถึงข้อมูลดิบหรือข้อมูลที่ไม่มีโครงสร้างจำนวนมาก แต่ไม่รู้ว่าจะใช้ประโยชน์จากมันอย่างไร

แบบกึ่งโครงสร้าง

หมวดหมู่นี้มีทั้งสองอย่างข้างต้น ดังนั้นข้อมูลกึ่งโครงสร้างจึงมีรูปแบบบางอย่าง แต่จริงๆ แล้วไม่ได้ถูกกำหนดโดยตารางในฐานข้อมูลเชิงสัมพันธ์ ตัวอย่างของหมวดหมู่นี้คือข้อมูลส่วนบุคคลที่แสดงในไฟล์ XML

ประชัน ราวชาย35 ซีมา อาร์หญิง41 แผงคอ satishชาย29 ซูบราโต้ รอยชาย26 เยเรมีย์ เจชาย35

ลักษณะของข้อมูลขนาดใหญ่

การเติบโตของข้อมูลขนาดใหญ่เมื่อเวลาผ่านไป:

สีฟ้าแสดงถึงข้อมูลที่มีโครงสร้าง (ข้อมูลองค์กร) ซึ่งจัดเก็บไว้ในฐานข้อมูลเชิงสัมพันธ์ ในสีอื่น - ข้อมูลที่ไม่มีโครงสร้างจากแหล่งต่าง ๆ (โทรศัพท์ IP, อุปกรณ์และเซ็นเซอร์, โซเชียลเน็ตเวิร์กและเว็บแอปพลิเคชัน)

จากข้อมูลของ Gartner ข้อมูลขนาดใหญ่จะแตกต่างกันไปตามขนาด อัตราการสร้าง ความหลากหลาย และความผันผวน ลองพิจารณาลักษณะเหล่านี้โดยละเอียด

  1. ปริมาณ. ด้วยตัวของมันเอง คำว่า Big Data นั้นเกี่ยวข้องกับขนาดใหญ่ ขนาดของข้อมูลเป็นตัวบ่งชี้ที่สำคัญที่สุดในการพิจารณามูลค่าที่สามารถกู้คืนได้ ทุกๆ วัน ผู้คน 6 ล้านคนใช้สื่อดิจิทัล ซึ่งสร้างข้อมูลประมาณ 2.5 quintillion bytes ดังนั้น ปริมาตรจึงเป็นคุณลักษณะแรกที่ต้องพิจารณา
  2. ความหลากหลายเป็นลักษณะต่อไป. เขาหมายถึงแหล่งที่มาที่แตกต่างกันและลักษณะของข้อมูล ซึ่งอาจมีทั้งแบบที่มีโครงสร้างและไม่มีโครงสร้าง ก่อนหน้านี้ สเปรดชีตและฐานข้อมูลเป็นแหล่งข้อมูลเดียวที่พิจารณาในแอปพลิเคชันส่วนใหญ่ ทุกวันนี้ ข้อมูลในรูปแบบของอีเมล ภาพถ่าย วิดีโอ ไฟล์ PDF และเสียงยังได้รับการพิจารณาในแอปพลิเคชันการวิเคราะห์อีกด้วย ข้อมูลที่ไม่มีโครงสร้างที่หลากหลายนี้นำไปสู่ปัญหาในการจัดเก็บ การขุด และการวิเคราะห์: 27% ของบริษัทไม่แน่ใจว่ากำลังทำงานกับข้อมูลที่ถูกต้อง
  3. อัตราการสร้าง. ความเร็วในการสะสมและประมวลผลข้อมูลเพื่อตอบสนองความต้องการจะเป็นตัวกำหนดศักยภาพ ความเร็วกำหนดความเร็วของการไหลของข้อมูลจากแหล่งที่มา - กระบวนการทางธุรกิจ, บันทึกแอปพลิเคชัน, เครือข่ายสังคมออนไลน์และเว็บไซต์สื่อ, เซ็นเซอร์, อุปกรณ์มือถือ การไหลของข้อมูลเป็นจำนวนมากและต่อเนื่องในเวลา
  4. ความแปรปรวนอธิบายความแปรปรวนของข้อมูลในบางช่วงเวลา ซึ่งทำให้การประมวลผลและการจัดการยุ่งยาก ตัวอย่างเช่น ข้อมูลส่วนใหญ่มีลักษณะที่ไม่มีโครงสร้าง

การวิเคราะห์ข้อมูลขนาดใหญ่: การใช้ข้อมูลขนาดใหญ่คืออะไร

ส่งเสริมการขายสินค้าและบริการ: การเข้าถึงข้อมูลจากเสิร์ชเอ็นจิ้นและไซต์ต่างๆ เช่น Facebook และ Twitter ช่วยให้ธุรกิจสามารถพัฒนากลยุทธ์ทางการตลาดได้แม่นยำยิ่งขึ้น

การปรับปรุงการบริการลูกค้า: ระบบความคิดเห็นของลูกค้าแบบดั้งเดิมจะถูกแทนที่ด้วยระบบใหม่ที่ใช้ Big Data และการประมวลผลภาษาธรรมชาติเพื่ออ่านและประเมินความคิดเห็นของลูกค้า

การคำนวณความเสี่ยงเกี่ยวข้องกับการออกผลิตภัณฑ์หรือบริการใหม่

ประสิทธิภาพการดำเนินงาน: ข้อมูลขนาดใหญ่มีโครงสร้างเพื่อดึงข้อมูลที่ถูกต้องเร็วขึ้นและให้ผลลัพธ์ที่แม่นยำอย่างรวดเร็ว การผสมผสานระหว่างเทคโนโลยี Big Data และการจัดเก็บข้อมูลนี้ช่วยให้องค์กรเพิ่มประสิทธิภาพการทำงานด้วยข้อมูลที่ไม่ค่อยได้ใช้

คุณรู้จักเรื่องตลกที่มีชื่อเสียงนี้หรือไม่? Big Data ก็เหมือนเซ็กส์ก่อนอายุ 18:

  • ทุกคนคิดเกี่ยวกับมัน
  • ทุกคนพูดถึงมัน
  • ทุกคนคิดว่าเพื่อนของพวกเขากำลังทำอยู่
  • แทบไม่มีใครทำ
  • ใครก็ตามที่ทำมันไม่ดี;
  • ทุกคนคิดว่ามันจะดีกว่าในครั้งต่อไป
  • ไม่มีใครใช้มาตรการรักษาความปลอดภัย
  • ทุกคนอายที่จะยอมรับว่าเขาไม่รู้อะไรเลย
  • หากมีคนทำสำเร็จจะมีเสียงอื้ออึงอยู่เสมอ

แต่ขอบอกตามตรงว่าไม่ว่าจะมีโฆษณาเกินจริง ความอยากรู้อยากเห็นตามปกติมักจะเกิดขึ้นเสมอ: มีเรื่องเอะอะอะไรเกิดขึ้นและมีบางสิ่งที่สำคัญจริงๆ หรือไม่? ในระยะสั้นใช่มี รายละเอียดอยู่ด้านล่าง เราได้เลือกแอปพลิเคชั่นเทคโนโลยี Big Data ที่น่าทึ่งและน่าสนใจที่สุดมาให้คุณแล้ว การศึกษาตลาดเล็ก ๆ ด้วยตัวอย่างที่ชัดเจนนี้เผชิญหน้ากับข้อเท็จจริงง่าย ๆ : อนาคตไม่ได้มา คุณไม่จำเป็นต้อง "รออีก n ปี แล้วเวทมนตร์จะกลายเป็นความจริง" ไม่ มันมาถึงแล้ว แต่ก็ยังมองไม่เห็นด้วยตา ดังนั้นการเผาไหม้ของภาวะเอกฐานจึงยังไม่เผาไหม้จุดหนึ่งในตลาดแรงงานมากนัก ไป.

1 การนำเทคโนโลยี Big Data มาใช้ในที่ที่มีต้นกำเนิดอย่างไร

บริษัทไอทีขนาดใหญ่เป็นแหล่งกำเนิดของวิทยาการข้อมูล ดังนั้นการทำงานภายในของพวกเขาในด้านนี้จึงน่าสนใจที่สุด แคมเปญของ Google ซึ่งเป็นจุดกำเนิดของกระบวนทัศน์ลดขนาดแผนที่ ซึ่งมีวัตถุประสงค์เพียงเพื่อให้ความรู้แก่โปรแกรมเมอร์เกี่ยวกับเทคนิคการเรียนรู้ของเครื่อง และความได้เปรียบทางการแข่งขันอยู่ในนั้น: หลังจากได้รับความรู้ใหม่แล้ว พนักงานจะนำวิธีการใหม่ๆ ไปใช้ในโครงการของ Google ที่พวกเขาทำงานอย่างต่อเนื่อง ลองนึกภาพว่ารายการพื้นที่ที่แคมเปญสามารถสร้างการปฏิวัติได้นั้นยิ่งใหญ่เพียงใด ตัวอย่างหนึ่ง: ใช้โครงข่ายประสาทเทียม

บริษัทกำลังนำแมชชีนเลิร์นนิงไปใช้กับผลิตภัณฑ์ทั้งหมดของบริษัท ข้อดีของมันคือการมีระบบนิเวศขนาดใหญ่ซึ่งรวมถึงอุปกรณ์ดิจิทัลทั้งหมดที่ใช้ในชีวิตประจำวัน สิ่งนี้ทำให้ Apple ไปถึงระดับที่เป็นไปไม่ได้: แคมเปญมีข้อมูลผู้ใช้มากกว่าที่อื่น ในขณะเดียวกัน นโยบายความเป็นส่วนตัวก็เข้มงวดมาก บริษัทมักจะโอ้อวดอยู่เสมอว่าไม่ได้ใช้ข้อมูลลูกค้าเพื่อวัตถุประสงค์ในการโฆษณา ข้อมูลผู้ใช้จะถูกเข้ารหัสเพื่อให้ทนายความของ Apple หรือแม้แต่ FBI ที่มีหมายจับไม่สามารถอ่านได้ คุณจะพบภาพรวมที่ดีเกี่ยวกับการพัฒนา AI ของ Apple ที่นี่

2 ข้อมูลขนาดใหญ่บน 4 ล้อ

รถยนต์สมัยใหม่เป็นที่เก็บข้อมูล: มันรวบรวมข้อมูลทั้งหมดเกี่ยวกับคนขับ สภาพแวดล้อม อุปกรณ์ที่เชื่อมต่อ และเกี่ยวกับตัวมันเอง ในไม่ช้า ยานพาหนะหนึ่งคันที่เชื่อมต่อกับเครือข่ายเช่นนี้จะสร้างข้อมูลได้มากถึง 25 GB ต่อชั่วโมง

ผู้ผลิตรถยนต์ใช้เทเลเมติกส์ของยานพาหนะมาเป็นเวลาหลายปีแล้ว แต่ตอนนี้วิธีการรวบรวมข้อมูลที่ซับซ้อนมากขึ้นกำลังถูกโน้มน้าวให้ใช้ประโยชน์จากข้อมูลขนาดใหญ่อย่างเต็มที่ ซึ่งหมายความว่าเทคโนโลยีสามารถแจ้งเตือนผู้ขับขี่ถึงสภาพถนนที่เลวร้ายได้โดยการเปิดใช้งานระบบเบรกป้องกันล้อล็อกและระบบควบคุมการยึดเกาะถนนโดยอัตโนมัติ

ข้อกังวลอื่น ๆ รวมถึง BMW กำลังใช้เทคโนโลยี Big Data รวมกับข้อมูลเชิงลึกจากต้นแบบการทดสอบ ระบบ "หน่วยความจำข้อผิดพลาด" ในตัว และข้อร้องเรียนของลูกค้า เพื่อระบุจุดอ่อนของโมเดลในช่วงต้นของการผลิต ตอนนี้ แทนที่จะประเมินข้อมูลด้วยตนเองซึ่งใช้เวลาหลายเดือน ระบบจะใช้อัลกอริทึมที่ทันสมัย ข้อผิดพลาดและค่าใช้จ่ายในการแก้ไขปัญหาลดลง ทำให้เวิร์กโฟลว์การวิเคราะห์ข้อมูลที่ BMW เร็วขึ้น

จากการประมาณการของผู้เชี่ยวชาญ ภายในปี 2562 มูลค่าการซื้อขายของตลาดที่เชื่อมต่อกับเครือข่ายรถยนต์เครือข่ายเดียวจะสูงถึง 130,000 ล้านดอลลาร์ ซึ่งไม่น่าแปลกใจเมื่อพิจารณาจากการผสานรวมเทคโนโลยีที่เป็นส่วนสำคัญของรถยนต์โดยผู้ผลิตรถยนต์

การใช้ข้อมูลขนาดใหญ่ช่วยให้เครื่องจักรปลอดภัยและทำงานได้มากขึ้น ดังนั้น Toyota โดยการฝัง Information Communication Modules (DCM) เครื่องมือนี้ใช้สำหรับ Big Data ประมวลผลและวิเคราะห์ข้อมูลที่รวบรวมโดย DCM เพื่อให้ได้รับประโยชน์เพิ่มเติมจากข้อมูลดังกล่าว

3 การประยุกต์ใช้ข้อมูลขนาดใหญ่ในทางการแพทย์


การนำเทคโนโลยี Big Data มาใช้ในด้านการแพทย์ช่วยให้แพทย์สามารถศึกษาโรคได้ละเอียดยิ่งขึ้น และเลือกแนวทางการรักษาที่มีประสิทธิภาพสำหรับกรณีเฉพาะได้ ด้วยการวิเคราะห์ข้อมูล เจ้าหน้าที่สาธารณสุขสามารถคาดการณ์การกำเริบของโรคและใช้มาตรการป้องกันได้ง่ายขึ้น ผลลัพธ์ที่ได้คือการวินิจฉัยที่แม่นยำยิ่งขึ้นและการรักษาที่ดีขึ้น

เทคนิคใหม่นี้ทำให้สามารถมองปัญหาของผู้ป่วยจากมุมที่แตกต่างกัน ซึ่งนำไปสู่การค้นพบแหล่งที่มาของปัญหาที่ไม่รู้จักมาก่อน ตัวอย่างเช่น บางเชื้อชาติมีแนวโน้มที่จะเป็นโรคหัวใจมากกว่าสมาชิกในกลุ่มชาติพันธุ์อื่นๆ ตอนนี้ เมื่อผู้ป่วยบ่นถึงโรคบางอย่าง แพทย์จะพิจารณาข้อมูลเกี่ยวกับสมาชิกในเผ่าพันธุ์ของเขาที่บ่นเกี่ยวกับปัญหาเดียวกัน การรวบรวมและการวิเคราะห์ข้อมูลช่วยให้คุณเรียนรู้มากขึ้นเกี่ยวกับผู้ป่วย ตั้งแต่ความชอบด้านอาหารและรูปแบบการใช้ชีวิตไปจนถึงโครงสร้างทางพันธุกรรมของ DNA และสารเมแทบอไลต์ของเซลล์ เนื้อเยื่อ อวัยวะต่างๆ ตัวอย่างเช่น ศูนย์ Pediatric Genomic Medicine ใน Kansas City ใช้ผู้ป่วยและวิเคราะห์การกลายพันธุ์ในรหัสพันธุกรรมที่ก่อให้เกิดมะเร็ง วิธีการแบบรายบุคคลสำหรับผู้ป่วยแต่ละราย โดยคำนึงถึง DNA ของเขา จะยกระดับประสิทธิผลของการรักษาไปสู่ระดับใหม่เชิงคุณภาพ

ด้วยความเข้าใจเกี่ยวกับวิธีการใช้ Big Data การเปลี่ยนแปลงครั้งแรกและสำคัญมากในด้านการแพทย์จึงตามมา เมื่อผู้ป่วยเข้ารับการรักษา โรงพยาบาลหรือสถานพยาบาลอื่น ๆ สามารถรับข้อมูลที่มีค่ามากมายเกี่ยวกับบุคคลนั้นได้ ข้อมูลที่รวบรวมได้จะใช้ในการทำนายการเกิดซ้ำของโรคด้วยความแม่นยำในระดับหนึ่ง ตัวอย่างเช่น หากผู้ป่วยเป็นโรคหลอดเลือดสมอง แพทย์จะศึกษาข้อมูลเกี่ยวกับช่วงเวลาของอุบัติเหตุหลอดเลือดสมอง วิเคราะห์ช่วงเวลาชั่วคราวระหว่างเหตุการณ์ก่อนหน้า (ถ้ามี) ให้ความสนใจเป็นพิเศษต่อสถานการณ์ที่ตึงเครียดและการออกแรงอย่างหนักในชีวิตของผู้ป่วย จากข้อมูลนี้ โรงพยาบาลจะจัดทำแผนปฏิบัติการที่ชัดเจนให้กับผู้ป่วยเพื่อป้องกันความเป็นไปได้ที่จะเป็นโรคหลอดเลือดสมองในอนาคต

อุปกรณ์สวมใส่ยังมีบทบาทในการช่วยระบุปัญหาสุขภาพ แม้ว่าบุคคลนั้นจะไม่มีอาการที่ชัดเจนของโรคใดโรคหนึ่งก็ตาม แทนที่จะประเมินสภาพของผู้ป่วยผ่านการตรวจร่างกายเป็นเวลานาน แพทย์สามารถสรุปผลตามข้อมูลที่รวบรวมโดยอุปกรณ์ติดตามการออกกำลังกายหรือสมาร์ทวอทช์

หนึ่งในตัวอย่างล่าสุดคือ ในขณะที่ผู้ป่วยกำลังได้รับการตรวจหาอาการชักครั้งใหม่ที่เกิดจากการกินยาที่ไม่ได้รับ แพทย์พบว่าชายคนนี้มีปัญหาสุขภาพที่ร้ายแรงกว่านั้นมาก ปัญหากลายเป็นภาวะหัวใจห้องบน การวินิจฉัยเกิดขึ้นเนื่องจากเจ้าหน้าที่ของแผนกสามารถเข้าถึงโทรศัพท์ของผู้ป่วยซึ่งก็คือแอปพลิเคชันที่เกี่ยวข้องกับตัวติดตามฟิตเนสของเขา ข้อมูลจากแอปพลิเคชันกลายเป็นปัจจัยสำคัญในการวินิจฉัย เนื่องจากในขณะที่ทำการตรวจไม่พบความผิดปกติของหัวใจในชายคนนี้

นี่เป็นเพียงหนึ่งในไม่กี่กรณีที่แสดงให้เห็น ทำไมต้องใช้ข้อมูลขนาดใหญ่ในวงการแพทย์ปัจจุบันมีบทบาทสำคัญเช่นนี้

4 การวิเคราะห์ข้อมูลเป็นหัวใจสำคัญของการค้าปลีกอยู่แล้ว

การทำความเข้าใจข้อความค้นหาและการกำหนดเป้าหมายของผู้ใช้เป็นหนึ่งในขอบเขตที่ใหญ่ที่สุดและเผยแพร่อย่างกว้างขวางที่สุดของการประยุกต์ใช้เครื่องมือ Big Data Big Data ช่วยวิเคราะห์พฤติกรรมของลูกค้าเพื่อให้เข้าใจความต้องการของผู้บริโภคในอนาคตได้ดียิ่งขึ้น บริษัทต่างๆ กำลังมองหาที่จะขยายชุดข้อมูลแบบดั้งเดิมด้วยข้อมูลโซเชียลมีเดียและประวัติการค้นหาเบราว์เซอร์ เพื่อสร้างภาพลูกค้าที่สมบูรณ์ที่สุดเท่าที่จะเป็นไปได้ บางครั้งองค์กรขนาดใหญ่เลือกที่จะสร้างแบบจำลองการคาดการณ์ของตนเองเพื่อเป็นเป้าหมายระดับโลก

ตัวอย่างเช่น ห่วงโซ่ร้านค้าเป้าหมายที่ใช้การวิเคราะห์ข้อมูลเชิงลึกและระบบการคาดการณ์ของตนเอง สามารถระบุได้ด้วยความแม่นยำสูง - ลูกค้าแต่ละรายจะได้รับ ID ซึ่งจะเชื่อมโยงกับบัตรเครดิต ชื่อ หรืออีเมล ตัวระบุทำหน้าที่เป็นตะกร้าสินค้าประเภทหนึ่งที่เก็บข้อมูลเกี่ยวกับทุกสิ่งที่บุคคลเคยซื้อ ผู้เชี่ยวชาญของเครือข่ายพบว่าผู้หญิงในตำแหน่งนี้ซื้อผลิตภัณฑ์ที่ไม่มีรสชาติอย่างแข็งขันก่อนช่วงไตรมาสที่ 2 ของการตั้งครรภ์ และในช่วง 20 สัปดาห์แรกต้องพึ่งอาหารเสริมแคลเซียม สังกะสี และแมกนีเซียม จากข้อมูลที่ได้รับ Target จะส่งคูปองสำหรับผลิตภัณฑ์สำหรับเด็กให้กับลูกค้า ส่วนลดสำหรับสินค้าสำหรับเด็กนั้น "เจือจาง" ด้วยคูปองสำหรับสินค้าอื่น ๆ เพื่อให้ข้อเสนอซื้อเปลหรือผ้าอ้อมไม่ดูเป็นการรบกวนเกินไป

แม้แต่หน่วยงานของรัฐก็ยังพบวิธีใช้เทคโนโลยี Big Data เพื่อเพิ่มประสิทธิภาพการหาเสียงเลือกตั้ง บางคนเชื่อว่าชัยชนะของ B. Obama ในการเลือกตั้งประธานาธิบดีสหรัฐฯ ในปี 2555 เกิดจากการทำงานที่ยอดเยี่ยมของทีมนักวิเคราะห์ ซึ่งประมวลผลข้อมูลจำนวนมหาศาลด้วยวิธีที่ถูกต้อง

5 ข้อมูลขนาดใหญ่ในการปกป้องกฎหมายและความสงบเรียบร้อย


ในช่วงไม่กี่ปีที่ผ่านมา หน่วยงานบังคับใช้กฎหมายได้ค้นพบว่าควรใช้ Big Data อย่างไรและเมื่อใด เป็นที่ทราบกันดีว่าสำนักงานความมั่นคงแห่งชาติใช้เทคโนโลยีข้อมูลขนาดใหญ่เพื่อป้องกันการโจมตีของผู้ก่อการร้าย แผนกอื่นๆ กำลังใช้วิธีการที่ก้าวหน้าเพื่อป้องกันอาชญากรรมขนาดเล็ก

กรมตำรวจลอสแองเจลิสใช้. มันทำในสิ่งที่เรียกว่าการบังคับใช้กฎหมายเชิงรุก การใช้รายงานอาชญากรรมในช่วงระยะเวลาหนึ่ง อัลกอริทึมจะกำหนดพื้นที่ที่อาชญากรรมมักจะเกิดขึ้น ระบบจะทำเครื่องหมายพื้นที่ดังกล่าวบนแผนที่เมืองด้วยสี่เหลี่ยมสีแดงเล็กๆ และข้อมูลนี้จะถูกส่งไปยังรถสายตรวจทันที

ตำรวจชิคาโก ใช้เทคโนโลยีข้อมูลขนาดใหญ่ด้วยวิธีที่แตกต่างกันเล็กน้อย เจ้าหน้าที่บังคับใช้กฎหมายจาก Windy City ก็มีเช่นกัน แต่มีวัตถุประสงค์เพื่อสรุป "วงกลมแห่งความเสี่ยง" ซึ่งประกอบด้วยบุคคลที่อาจตกเป็นเหยื่อหรือมีส่วนร่วมในการโจมตีด้วยอาวุธ จากข้อมูลของ The New York Times อัลกอริทึมนี้ให้คะแนนความเปราะบางแก่บุคคลตามประวัติอาชญากร (การจับกุมและการมีส่วนร่วมในการกราดยิงซึ่งเป็นของแก๊งอาชญากร) ผู้พัฒนาระบบอ้างว่าแม้ว่าระบบจะศึกษาประวัติอาชญากรในอดีตของบุคคล แต่ก็ไม่ได้คำนึงถึงปัจจัยรอง เช่น เชื้อชาติ เพศ ชาติพันธุ์ และตำแหน่งที่ตั้งของบุคคลนั้น

6 เทคโนโลยี Big Data ช่วยพัฒนาเมืองได้อย่างไร


João Barros ซีอีโอของ Veniam สาธิตแผนที่ติดตามเราเตอร์ Wi-Fi บนรถประจำทางในเมืองปอร์โต

การวิเคราะห์ข้อมูลยังใช้เพื่อปรับปรุงแง่มุมต่างๆ ของชีวิตในเมืองและประเทศต่างๆ ตัวอย่างเช่น การรู้ว่าจะใช้เทคโนโลยี Big Data อย่างไรและเมื่อใดสามารถเพิ่มประสิทธิภาพโฟลว์การขนส่งได้ สำหรับสิ่งนี้ การเคลื่อนไหวทางออนไลน์ของรถยนต์ถูกนำมาพิจารณา สื่อสังคมออนไลน์และข้อมูลอุตุนิยมวิทยาได้รับการวิเคราะห์ ปัจจุบัน หลายเมืองเป็นผู้นำในการใช้การวิเคราะห์ข้อมูลเพื่อรวมโครงสร้างพื้นฐานด้านการขนส่งเข้ากับบริการสาธารณะประเภทอื่นๆ ให้เป็นหนึ่งเดียว นี่คือแนวคิดของเมืองอัจฉริยะที่รถเมล์รอรถไฟสาย และสัญญาณไฟจราจรสามารถคาดการณ์การจราจรติดขัดเพื่อลดปัญหารถติด

โดยอาศัยเทคโนโลยีบิ๊กดาต้า เมืองลองบีชดำเนินการมาตรวัดน้ำ "อัจฉริยะ" ที่ใช้ในการควบคุมการรดน้ำที่ผิดกฎหมาย ก่อนหน้านี้ใช้เพื่อลดการใช้น้ำในครัวเรือนส่วนตัว (ผลสูงสุดคือลดลง 80%) การประหยัดน้ำจืดเป็นประเด็นสำคัญเสมอ โดยเฉพาะอย่างยิ่งเมื่อรัฐประสบปัญหาภัยแล้งครั้งเลวร้ายที่สุดที่เคยบันทึกไว้

ผู้แทนกรมการขนส่งแห่งนครลอสแองเจลิสเข้าร่วมรายชื่อผู้ที่ใช้บิ๊กดาต้า จากข้อมูลที่ได้รับจากเซ็นเซอร์กล้องจราจร เจ้าหน้าที่จะควบคุมการทำงานของสัญญาณไฟจราจร ซึ่งจะทำให้สามารถควบคุมการจราจรได้ ระบบคอมพิวเตอร์ควบคุมไฟจราจรประมาณ 4,500,000 ดวงทั่วเมือง ตามข้อมูลอย่างเป็นทางการ อัลกอริทึมใหม่ช่วยลดความแออัดได้ถึง 16%

7 เครื่องมือแห่งความก้าวหน้าในด้านการตลาดและการขาย


ในด้านการตลาด เครื่องมือ Big Data ช่วยให้คุณระบุได้ว่าแนวคิดใดมีประสิทธิภาพมากที่สุดในการส่งเสริมในขั้นตอนใดขั้นตอนหนึ่งของวงจรการขาย การวิเคราะห์ข้อมูลกำหนดว่าการลงทุนสามารถปรับปรุงการจัดการความสัมพันธ์กับลูกค้าได้อย่างไร ควรเลือกกลยุทธ์ใดเพื่อเพิ่มอัตราการแปลง และวิธีเพิ่มประสิทธิภาพวงจรชีวิตของลูกค้า ในธุรกิจคลาวด์ อัลกอริทึมของ Big Data ถูกนำมาใช้เพื่อหาวิธีลดต้นทุนในการหาลูกค้าและเพิ่มวงจรชีวิตของลูกค้า

ความแตกต่างของกลยุทธ์การกำหนดราคาขึ้นอยู่กับระดับภายในระบบของลูกค้า บางทีสิ่งสำคัญสำหรับการใช้ Big Data ในด้านการตลาด McKinsey พบว่าประมาณ 75% ของรายได้ของบริษัทโดยเฉลี่ยมาจากผลิตภัณฑ์พื้นฐาน โดย 30% เป็นราคาที่ไม่ถูกต้อง การเพิ่มขึ้นของราคา 1% ส่งผลให้กำไรจากการดำเนินงานเพิ่มขึ้น 8.7%

ทีมวิจัยของ Forrester สามารถระบุได้ว่าการวิเคราะห์ข้อมูลช่วยให้นักการตลาดมุ่งเน้นไปที่วิธีสร้างความสัมพันธ์กับลูกค้าให้ประสบความสำเร็จมากขึ้น ด้วยการสำรวจทิศทางของการพัฒนาลูกค้า ผู้เชี่ยวชาญสามารถประเมินระดับความภักดีของพวกเขา ตลอดจนขยายวงจรชีวิตในบริบทของบริษัทใดบริษัทหนึ่ง

การปรับกลยุทธ์การขายให้เหมาะสมและขั้นตอนการเข้าสู่ตลาดใหม่โดยใช้การวิเคราะห์ทางภูมิศาสตร์นั้นสะท้อนให้เห็นในอุตสาหกรรมชีวเวชภัณฑ์ จากข้อมูลของ McKinsey บริษัทยาใช้จ่ายเฉลี่ย 20 ถึง 30% ของกำไรในการบริหารและการขาย หากองค์กรมีความตื่นตัวมากขึ้น ใช้ข้อมูลขนาดใหญ่เพื่อระบุตลาดที่คุ้มค่าที่สุดและเติบโตเร็วที่สุด ต้นทุนจะถูกตัดทันที

การวิเคราะห์ข้อมูลเป็นวิธีที่ทำให้บริษัทต่างๆ มองเห็นภาพรวมของประเด็นสำคัญในธุรกิจของตนได้อย่างสมบูรณ์ การเพิ่มรายได้ ลดต้นทุน และลดเงินทุนหมุนเวียนเป็นสามภารกิจที่ธุรกิจสมัยใหม่พยายามแก้ไขด้วยความช่วยเหลือของเครื่องมือวิเคราะห์

สุดท้ายนี้ 58% ของผู้อำนวยการฝ่ายการตลาดกล่าวว่าการนำเทคโนโลยี Big Data ไปใช้นั้นสามารถตรวจสอบได้ในการเพิ่มประสิทธิภาพเครื่องมือค้นหา (SEO) อีเมล และการตลาดบนมือถือ ซึ่งการวิเคราะห์ข้อมูลมีบทบาทสำคัญที่สุดในการกำหนดโปรแกรมการตลาด และผู้ตอบแบบสอบถามเพียง 4% เท่านั้นที่มั่นใจว่า Big Data จะมีบทบาทสำคัญในกลยุทธ์ทางการตลาดทั้งหมดในอีกหลายปีข้างหน้า

8 การวิเคราะห์ข้อมูลทั่วโลก

ไม่น้อยที่อยากรู้ก็คือว่า เป็นไปได้ว่าในที่สุดการเรียนรู้ของเครื่องจะเป็นพลังเดียวที่สามารถรักษาสมดุลที่ละเอียดอ่อนได้ หัวข้อของอิทธิพลของมนุษย์ที่มีต่อภาวะโลกร้อนยังคงเป็นสาเหตุของความขัดแย้ง ดังนั้น มีเพียงแบบจำลองการคาดการณ์ที่เชื่อถือได้ซึ่งอิงจากการวิเคราะห์ข้อมูลจำนวนมากเท่านั้นที่สามารถให้คำตอบที่ถูกต้องได้ ท้ายที่สุดแล้ว การลดการปล่อยมลพิษจะช่วยเราทุกคนได้ เราจะใช้พลังงานน้อยลง

ตอนนี้ Big Data ไม่ใช่แนวคิดที่เป็นนามธรรม ซึ่งอาจจะพบการใช้งานในอีกไม่กี่ปีข้างหน้า นี่คือชุดเทคโนโลยีที่ใช้งานได้อย่างสมบูรณ์ซึ่งมีประโยชน์ในเกือบทุกด้านของกิจกรรมของมนุษย์ ตั้งแต่การแพทย์และความสงบเรียบร้อยไปจนถึงการตลาดและการขาย ขั้นตอนของการรวม Big Data เข้ากับชีวิตประจำวันของเราเพิ่งเริ่มต้นขึ้น และใครจะรู้ว่าอีกไม่กี่ปีข้างหน้า Big Data จะมีบทบาทอย่างไร



มีคำถามหรือไม่?

รายงานการพิมพ์ผิด

ข้อความที่จะส่งถึงบรรณาธิการของเรา: