บิ๊กดาต้า: สึนามิข้อมูลผู้บงการชีวิตเรา

Updated: Sep 10, 2020


ตลอดระยะเวลา 5 ปีที่ผ่านมา นับตั้งแต่บิ๊กดาต้าถือกำเนิดขึ้น ไม่มีใครเข้าใจว่าข้อมูลจากการค้นหากูเกิ้ล การกดไลค์เฟสบุ๊ค หรือการรีทวีตที่ดูเหมือนจะไร้สาระทั้งหลาย จะเอื้อประโยชน์อะไรกับบริษัทกูเกิ้ล เฟสบุ๊ค หรือทวิตเตอร์นักหนา…

แต่ท่านผู้อ่านเชื่อหรือไม่ว่า เราสามารถทำนายพฤติกรรมของคนคนหนึ่งได้อย่างแม่นยำยิ่งกว่าตำราโหราศาสตร์ทุกเล่มรวมกัน เพียงแค่พิจารณาพฤติกรรมการกดไลค์ของเขาในเฟสบุ๊คเพียงอย่างเดียวเท่านั้น นายมิคาล โคซินสกี้ (Michal Kosinski) นักวิจัยแห่งศูนย์จิตมิติ (Psychometrics Centre) มหาวิทยาลัยเคมบริดจ์ ได้พัฒนาต้นแบบเพื่อประเมินมนุษย์โดยอาศัยบุคลิกภาพห้าแบบที่เรียกว่า “Big Five” โดยสร้างแอพพลิเคชั่นบนเฟสบุ๊คที่มีชื่อว่า “My personality app” โดยท่านผู้อ่านสามารถตอบคำถามง่าย ๆ อาทิ ฉันเป็นคนตื่นตกใจง่าย ฉันชอบขัดกับผู้อื่น จากนั้นจึงประเมินลักษณะทั่วไปในบุคลิกภาพของผู้ใช้นั้น จากที่เขาเคยคิดว่าจะมีเพียงกลุ่มเพื่อนไม่กี่คนร่วมทำแบบทดสอบนี้ ไม่นานนักก็กลายเป็นไวรัล และมีผู้เข้ายินยอมเปิดเผยข้อมูลเพื่อทำแบบทดสอบนี้เป็นล้านคน

โคซินสกี้ไม่ได้หยุดอยู่เพียงแค่นั้น เขายังพัฒนาโมเดลของเขาต่อไป โดยเปรียบเทียบคำตอบของแบบทดสอบกับข้อมูลที่เกี่ยวกับบุคคลนั้น ๆ ว่าโพสต์ ไลค์ แชร์ อะไรบ้าง ด้วยปริมาณบิ๊กดาต้าที่เขามีอยู่ในมือ ทำให้เห็นความสัมพันธ์ของหลาย ๆ สิ่งไปในทิศทางเดียวกัน จนกระทั่งเขาสามารถทำนายผิวสี พฤติกรรมทางเพศ หรือแม้กระทั่งพรรคการเมืองที่ชื่นชอบได้จากจำนวนไลค์แค่ 58 ครั้งเท่านั้น

ทั้งนี้ หลังจากที่เขาตีพิมพ์งานวิจัยนี้ออกไป ภายในวันนั้นเองก็มีโทรศัพท์มาหาเขาถึงสองครั้ง ครั้งแรกขู่ว่าจะฟ้องศาล ส่วนครั้งที่สองเสนอว่าจะให้งานทำ ทั้งสองครั้งมาจากบริษัทเฟสบุ๊ค!

ทำไมจึงเป็นเช่นนั้น? เพราะเราซื่อสัตย์กับอินเทอร์เน็ตมากกว่าคนรอบข้างของเราอย่างไม่น่าเชื่อ การสนทนาต่อหน้า หรือตอบแบบสอบถาม จริยธรรมจะกลั่นกรองการแสดงออกให้ไม่สุดโต่งตามความคิด แต่ในอินเทอร์เน็ตไม่มีใครรู้จักเรา ไม่มีใครตัดสินว่าเราเป็นคนมีความคิดประหลาด กูเกิ้ลจึงเป็นแหล่งรองรับแนวคิดสุดโต่งเหล่านี้ และทำลายกรอบความเชื่อเก่า ๆ จนหมดสิ้นยกตัวอย่างเช่น ท่านผู้อ่านคิดว่าคนตกงานจะใช้คีย์เวิร์ดอะไรในกูเกิ้ลบ่อยที่สุด ปรากฎว่า ไม่ใช่คำว่า “หางาน” แต่เป็นคำว่า “เว็บโป๊” หรือ “เกมออนไลน์” ต่างหากครับ เพราะคนที่ว่างงานก็ไม่รู้จะทำอะไรมากไปกว่าหากิจกรรมฆ่าเวลาจริงไหมครับ?

บิ๊กดาต้าเปล่งประกายอีกครั้ง เมื่อนายโดนัล ทรัมป์ เอาชนะการเลือกตั้งการเป็นประธานาธิบดีสหรัฐฯ ครั้งล่าสุด โดยมีนายอเล็กซานเดอร์ นิก (Alexander James Ashburner Nix) ซีอีโอของบริษัทเคมบริดจ์อนาลิติก้า (Cambridge Analytica) เป็นผู้อยู่เบื้องหลัง นิกใช้วิธีการโฆษณาแบบมุ่งเป้าเฉพาะ โดยสร้างแบบโฆษณาถึง 175,000 แบบ ซึ่งแตกต่างกันในรายละเอียดเล็กๆ น้อยๆ เช่น พาดหัว สี คำบรรยาย เพื่อพุ่งเป้าไปยังผู้รับสารแต่ละคน ให้ตรงตามข้อมูลทางจิตวิทยาของ Big Five เช่นเดียวกับที่โคซินสกี้เคยทำไว้ รวมถึงโจมตีนางฮิลลารี คลินตันด้วยการโปรโมทข่าวฉาว อาทิ คลิปวีดีโอที่คลินตันกล่าวดูถูกคนผิวดำ เฉพาะเจาะจงให้กับคนบางกลุ่มเห็นเพียงเท่านั้น เพื่อยับยั้งไม่ให้ลงคะแนนให้กับคลินตัน และเพิ่มโอกาสมากขึ้นให้กับทรัมป์

จากเหตุการณ์นี้ นิกได้ทำลายนิยามของคำว่า “สื่อสารมวลชน” จนหมดสิ้น และจากนี้ไปการโฆษณาแบบเหมาเข่งจะค่อย ๆ ตายจากไป ด้วยอานุภาพแห่งบิ๊กดาต้าที่มีอยู๋ในมือ การสื่อสารแบบเฉพาะเจาะจง ทำให้คุณสามารถควบคุมการตัดสินใจของผู้คนได้อย่างไม่น่าเชื่อ

มากแค่ไหนถึงจะเรียกว่าบิ๊กดาต้า? ข้อมูลที่จะนับเป็นบิ๊กดาต้าได้ต้องมีขนาดระดับเทระไบต์​ (ล้านล้านไบต์) หรือเพตะไบต์ (พันล้านล้านไบต์) ซึ่งมากเกินกว่าเครื่องคอมพิวเตอร์เครื่องหนึ่งจะประมวลผลได้ จึงเป็นที่มาของ “ดาต้าเซนเตอร์” ซึ่งเป็นศูนย์รวมคอมพิวเตอร์จำนวนมาก ๆ มาช่วยกันประมวลผล โดยปัจจุบันดาต้าเซนเตอร์ทั่วโลกมีอัตราการใช้พลังงานไฟฟ้า 200 เทระวัตต์ต่อชั่วโมง ซึ่งเป็นอัตราที่มาก

กว่าอัตราการใช้พลังงานไฟฟ้าในบางประเทศเสียอีก

อัตราการเติบโตของบิ๊กดาต้าก้าวกระโดดขึ้นเรื่อย ๆ การใช้อินเทอร์เน็ต ทั้งหาความรู้ ซื้อของออนไลน์ พูดคุยกับเพื่อน จนทิ้งร่องรอยของข้อมูล (digital footprints) เอาไว้มากมาย ทุกครั้งที่เราพิมพ์ คลิก หรือแม้แต่เลื่อนเม้าส์ไปมา กลายเป็นข้อมูลพฤติกรรมที่บ่งบอกความเป็นตัวตนของเราได้ แม้ว่าเราจะไม่ได้ล็อกอินก็ตาม บางแอพพลิเคชั่นสำหรับเด็ก สามารถระบุอายุของผู้ใช้ได้จากการเคลื่อนไหวของเม้าส์เพียงเท่านั้น เพราะทักษะการควบคุมกล้ามเนื้อแบบละเอียดนั้นสัมพันธ์โดยตรงกับอายุของเด็กและวัยรุ่นเป็นอย่างมาก ดังนั้น ไม่ต้องแปลกใจหากคุณเลื่อนหน้าจอไปเจอโฆษณาที่ตรงกับสิ่งที่คุณคิดพอดี เพราะดีเอ็นเอของคุณมันถูกฝังไว้ในมือถือเรียบร้อยแล้ว

ข้อมูลที่เราให้ไปเพื่อการตลาดแบบเฉพาะเจาะจง (personalization) ยังสรรหาสิ่งดึงดูดใจ เพื่อให้เราติดอยู่ในแอพลิเคชั่นนั้น ๆ นานที่สุดเท่าที่จะเป็นไปได้ จากที่ตั้งใจจะซื้อของหนึ่งอย่าง เลื่อนไปดู อันนี้ก็อยากได้ อันนั้นก็เล็งไว้นานแล้ว อันโน้นมีโปรโมชั่นพอดี สุดท้ายก็จบลงที่จ่ายเงินเกินความจำเป็นอยู่เสมอ

ยิ่งไปกว่านั้น การยินยอมเปิดเผยข้อมูล แปลว่าเราต้องสูญเสียความเป็นส่วนตัว (privacy) ไปเช่นกัน กูเกิ้ลแมพขอตำแหน่งของผู้ใช้ โดยอ้างความแม่นยำของการให้ข้อมูลการเดินทาง แต่ในขณะที่เราเดินชอปปิ้งในห้างสรรพสินค้า กูเกิ้ลแมพก็ยังคงติดตามเราอย่างต่อเนื่อง เพื่อคาดเดาว่าเราหยุดดูอะไรเป็นพิเศษ และใช้เป็นข้อมูลโฆษณาต่อไป เส้นบาง ๆ ระหว่างความสะดวกสบายและความเป็นส่วนตัวนี้ ทำให้เราต้องกลับมาฉุกคิดว่า จะแน่ใจได้อย่างไรว่าบริษัทที่ขอข้อมูลเราไป จะไม่ก้าวล่วงเส้นแบ่งนั้นในเมื่อไม่นานมานี้เฟสบุ๊คเพิ่งออกมายอมรับว่ามีการแอบฟังบทสนทนาจาก messenger ทั้งที่เคยปฏิเสธข้อกล่าวหามาตลอด?และปัจจุบันไม่ได้มีแค่บริษัทยักษ์ใหญ่อย่างเฟสบุ๊คและกูเกิ้ลเท่านั้นที่มีข้อมูลเหล่านี้ ทุกวันนี้ไม่ว่าคุณจะเข้าเว็บไซต์ไหน ต่างก็พยายามจะขอสิทธิ์การเข้าถึงข้อมูลคุกกี้จากคุณอยู่เสมอสังเกตไหมครับ?

แล้วเราจะมั่นใจได้อย่างไร ว่าข้อมูลส่วนตัวที่เราให้ไปจะปลอดภัยอยู่ตลอดเวลา?ขนาดบริษัทใหญ่ ๆ ยังมีข่าวถูกขโมยข้อมูลอยู่บ่อย ๆ อย่าลืมว่าเมื่อไรก็ตามที่ข้อมูลส่วนตัวเราหลุดไปอยู่ในมือของแฮกเกอร์ นั่นหมายถึงการถูกโจรกรรมตัวตน (Identity theft) เขาสามารถทำธุรกรรมใด ๆ ภายใต้ชื่อของเราก็ได้อย่างถูกกฎหมาย…น่ากลัวเสียจริง

ในสหภาพยุโรปเริ่มมีการตื่นตัวเรื่องนี้ โดยออกเป็นกฎหมายว่าด้วยการคุ้มครองข้อมูลและภาวะเฉพาะส่วนตัวแก่ปัจเจกบุคคลทุกคนในสหภาพยุโรป และเขตเศรษฐกิจยุโรป (General Data Protection Regulation: GDPR) ซึ่งจะไม่อนุญาตให้บริษัทใด ๆ เก็บข้อมูลที่ระบุตัวบุคคลได้ (Personal Identifiable Information: PII) เช่น ชื่อ วันเกิด เบอร์โทรศัพท์ อีเมล์ เป็นต้น หากมีความจำเป็นต้องเก็บ จะต้องอยู่ในสถานะเข้ารหัสไว้ และสามารถถอดรหัสได้จากระบบ โดยไม่มีตัวบุคคลมาเกี่ยวข้องเท่านั้น และต้องลบข้อมูลที่เกี่ยวกับผู้ใช้คนใดคนหนึ่งได้ทันทีที่มีการร้องขอ…

แต่น่าเสียดายที่กฎหมายนี้คุ้มครองแค่ประชากรในสหภาพยุโรปเท่านั้น ขณะที่คนไทยนั้นยังอ่อนต่อโลกกับเรื่องภัยคุกคามทางอินเทอร์เน็ตนักแม้เราจะใช้อินเตอร์เน็ตถึง 10 ชม.ต่อวันโดยเฉลี่ย มากเป็นอันดับต้น ๆ ของโลกก็ตาม จึงไม่น่าแปลกใจแต่อย่างใดที่เราจะเห็นการก่ออาชญากรรมโดยใช้โซเชียลมีเดียเป็นเครื่องมือมากขึ้นเรื่อย ๆ

มันน่าแปลกไหมครับว่า ในฐานะผู้ให้กำเนิดบิ๊กดาต้าชุดนั้น ๆ แท้ ๆ แต่เรากลับไม่มีสิทธิ์กำหนดชะตาชีวิตของตัวเองได้เลย ได้แต่เพียงเดินตามทิศทางที่เขาชี้นำอย่างไม่มีทางเลือก ภายใต้ภาพลักษณ์อันสวยหรูว่า นี่เป็นสิ่งพิเศษสำหรับเราเท่านั้นที่ได้รับการหยิบยื่นให้…

อย่างไรก็ดี กระแสบิ๊กดาต้ากะยังคงอยู่กับเราไปอย่างหลีกเลี่ยงไม่ได้ เพราะฉะนั้น อย่างน้อยเราก็ควรสามารถปกป้องตัวเอง ไม่เก็บข้อมูลส่วนตัวเกินความจำเป็นเลือกใช้บัตรเครดิตที่ต้องมีการยืนยันตัวตน เช่น OTP ทุกครั้งที่ใช้งาน ตรวจสอบสิทธิ์การเข้าถึงจากแอพพลิเคชั่นต่าง ๆ ในมือถืออยู่ให้สม่ำเสมอ และลบแอพพลิเคชั่นที่ขอสิทธิ์การเข้าถึงเราเกินความจำเป็น ไม่อัพสเตตัสบ่อยจนคาดเดาพฤติกรรมได้ง่าย และที่สำคัญ หากต้องเดินทางไปต่างถิ่น ไม่จำเป็นต้องแจ้งกำหนดการเดินทางให้ชาวโลกรู้ โดยเฉพาะถ้าเราอยู่คนเดียว ใช้อินเทอร์เน็ตเฉพาะเวลาที่จำเป็นและใช้เวลากับคนรอบข้างให้มากขึ้น เพราะนอกจากจะลดปริมาณ digital footprints ที่อาจสร้างอันตรายให้แก่เราในที่สุดแล้ว ที่สำคัญมาก ๆ คือยังช่วยลดปริมาณบิ๊กดาต้าที่เก็บใน data center อันเป็นตัวการสำคัญที่เร่งให้เกิดโลกร้อนอีกด้วยครับ!


บทความโดย รชต ว่องการวาณิชย์


ประวัติผู้เขียน

คุณรชต ว่องการวาณิชย์ ปัจจุบันเป็นวิศวกรคอมพิวเตอร์ระดับอาวุโส เว็บไซต์จองเที่ยวบินและที่พักออนไลน์ จบการศึกษาปริญญาตรีคณะวิทยาศาสตร์ สาขาวิทยาการคอมพิวเตอร์ จากจุฬาลงกรณ์มหาวิทยาลัย


อ้างอิง:

หนังสือ รู้อะไรไม่สู้รู้ดาต้า: Data for the people

หนังสือ Big data ดัดจริต

https://motherboard.vice.com/en_us/article/how-our-likes-helped-trump-win

https://www.psychologytoday.com/us/blog/why-bad-looks-good/201807/how-your-cell-phone-habits-impact-your-productivity

https://www.twfdigital.com/blog/2019/03/thailand-internet-user-profile-2018/

https://www.longtunman.com/17406

https://www.nature.com/articles/d41586-018-06610-y

11 views

KBO EARTH © 2019 | All Rights Reserved