Wie samel groot data in en hoekom?

In die herfs van 2019 het 'n skandaal losgebars met die Apple Card-diens: met registrasie het dit verskillende kredietlimiete vir mans en vroue uitgereik. Selfs Steve Wozniak was ongelukkig:

’n Jaar vroeër is dit onthul dat die Netflix-platform gebruikers verskillende plakkate en teasers wys, afhangende van hul geslag, ouderdom en nasionaliteit. Hiervoor is die diens van rassisme beskuldig.

Ten slotte word Mark Zuckerberg gereeld berispe omdat hy na bewering die data van sy gebruikers deur Facebook versamel, verkoop en gemanipuleer het. Deur die jare is hy beskuldig en selfs verhoor vir manipulasie tydens die Amerikaanse verkiesings, die Russiese spesiale dienste gehelp, haat en radikale sienings aangehits, onvanpaste advertensies, uitlek van gebruikersdata, belemmering van ondersoeke teen pedofiele.

Facebook-plasing deur zuck

Terselfdertyd publiseer die Pornhub-aanlyndiens jaarliks ​​verslae oor na watter soort pornografie mense van verskillende nasionaliteite, geslag en ouderdom soek. En om een ​​of ander rede pla dit niemand nie. Alhoewel al hierdie stories soortgelyk is: in elkeen van hulle het ons te doen met groot data, wat in die XNUMXste eeu "nuwe olie" genoem word.

Wat is groot data

Groot data – hulle is ook groot data (eng. Big Data) of metadata – is 'n reeks data wat gereeld en in groot volumes aankom. Hulle word versamel, verwerk en ontleed, wat lei tot duidelike modelle en patrone.

’n Treffende voorbeeld is die data van die Large Hadron Collider, wat voortdurend en in groot hoeveelhede inkom. Met hul hulp los wetenskaplikes baie probleme op.

Maar groot data op die web is nie net statistieke vir wetenskaplike navorsing nie. Hulle kan gebruik word om na te spoor hoe gebruikers van verskillende groepe en nasionaliteite optree, waaraan hulle aandag gee en hoe hulle met inhoud omgaan. Soms word data hiervoor nie uit een bron ingesamel nie, maar uit verskeie, wat sekere patrone vergelyk en identifiseer.

Oor hoe belangrik groot data op die netwerk is, het hulle begin praat toe daar regtig baie daarvan was. Aan die begin van 2020 was daar 4,5 miljard internetgebruikers in die wêreld, waarvan 3,8 miljard in sosiale netwerke geregistreer was.

Wie het toegang tot Big Data

Volgens opnames glo meer as die helfte van ons lande dat hul data op die netwerk deur derde partye gebruik word. Terselfdertyd plaas baie persoonlike inligting, foto's en selfs 'n telefoonnommer op sosiale netwerke en toepassings.

Wie samel groot data in en hoekom?
Wie samel groot data in en hoekom?
Wie samel groot data in en hoekom?
Wie samel groot data in en hoekom?

Dit moet hier verduidelik word: die eerste persoon is die gebruiker self, wat sy data op enige hulpbron of toepassing plaas. Terselfdertyd stem hy in (plaas 'n regmerkie in die ooreenkoms) tot die verwerking van hierdie data tweede party – dit wil sê die eienaars van die hulpbron. 'n Derde party is diegene aan wie die eienaars van die hulpbron gebruikersdata kan oordra of verkoop. Dikwels word dit in die gebruikersooreenkoms geskryf, maar nie altyd nie.

Die derde party is regeringsagentskappe, kuberkrakers of maatskappye wat data vir kommersiële doeleindes koop. Eersgenoemde kan data verkry deur 'n beslissing van 'n hof of 'n hoër gesag. Kuberkrakers gebruik natuurlik geen toestemmings nie – hulle hack bloot die databasisse wat op die bedieners gestoor is. Maatskappye (wetlik) kan slegs toegang tot data verkry as jy dit self toegelaat het – deur die blokkie onder die ooreenkoms te merk. Andersins is dit onwettig.

Hoekom gebruik maatskappye Big Data?

Groot data in die kommersiële veld word al dekades lank gebruik, dit was net nie so intens soos dit nou is nie. Dit is byvoorbeeld rekords van toesigkameras, data van GPS-navigators of aanlynbetalings. Nou, met die ontwikkeling van sosiale netwerke, aanlyndienste en toepassings, kan dit alles verbind word en die mees volledige prentjie kry: waar potensiële kliënte woon, waarna hulle graag kyk, waarheen hulle op vakansie gaan en watter handelsmerk motor hulle het.

Uit die voorbeelde hierbo is dit duidelik dat maatskappye met behulp van groot data eerstens advertensies wil teiken. Dit wil sê om produkte, dienste of individuele opsies slegs aan die regte gehoor aan te bied en selfs die produk vir 'n spesifieke gebruiker aan te pas. Boonop word advertensies op Facebook en ander groot platforms al hoe duurder, en om dit vir almal in 'n ry te wys is glad nie winsgewend nie.

Inligting oor potensiële kliënte van oop bronne word aktief deur versekeringsmaatskappye, private klinieke en werkgewers gebruik. Eersgenoemde kan byvoorbeeld die versekeringsbepalings verander as hulle sien dat jy dikwels inligting oor sekere siektes of medisyne soek, en werkgewers kan bepaal of jy geneig is tot konflikte en antisosiale gedrag.

Maar daar is nog ’n belangrike taak wat die afgelope jare sukkel: om naby die mees oplosbare gehoor te kom. Dit is nie so maklik om te doen nie, hoewel die taak aansienlik vergemaklik word deur betalingsdienste en elektroniese tjeks deur 'n enkele OFD (fiskale data-operateur). Om so naby as moontlik te kom, probeer maatskappye selfs om potensiële klante van kleins af op te spoor en te “koester”.: deur aanlyn speletjies, interaktiewe speelgoed en opvoedkundige dienste.

Hoe werk dit?

Die grootste geleenthede vir data-insameling is van wêreldwye korporasies wat verskeie dienste gelyktydig besit. Facebook het nou meer as 2,5 miljard aktiewe gebruikers. Terselfdertyd besit die maatskappy ook ander dienste: Instagram – meer as 1 miljard, WhatsApp – meer as 2 miljard en ander.

Maar Google het selfs meer invloed: Gmail word deur 1,5 miljard mense in die wêreld gebruik, nog 2,5 miljard deur die Android-selfoonbedryfstelsel, meer as 2 miljard deur YouTube. En dit tel nie die Google-soektog- en Google Maps-toepassings, die Google Play-winkel en die Chrome-blaaier nie. Dit bly om jou aanlyn bank vas te maak – en Google sal letterlik alles van jou kan weet. Terloops, Yandex is reeds 'n stap voor in hierdie verband, maar dit dek slegs die Russiessprekende gehoor.



👍 Eerstens stel maatskappye belang in wat ons op sosiale netwerke plaas en daarvan hou. Byvoorbeeld, as die bank sien dat jy getroud is en aktief van meisies op Instagram of Tinder hou, is jy meer geneig om 'n verbruikerslening goed te keur. En die verband op die familie is weg.

Dit is ook belangrik op watter advertensies jy klik, hoe gereeld en met watter resultaat.

(Dws Die volgende stap is privaat boodskappe: dit bevat baie meer inligting. Boodskappe is op VKontakte, Facebook, WhatsApp en ander kitsboodskappers uitgelek. Volgens hulle is dit terloops maklik om die geo-ligging op te spoor ten tyde van die stuur van die boodskap. Jy het sekerlik opgemerk: wanneer jy met iemand bespreek om iets te koop of net pizza te bestel, verskyn relevante advertensies dadelik in die voer.

🚕 Groot data word aktief gebruik en “uitgelek” deur aflewerings- en taxidienste. Hulle weet waar jy woon en werk, waarvan jy hou, wat jou benaderde inkomste is. Uber wys byvoorbeeld die prys hoër as jy van die kroeg af huis toe ry en klaarblyklik oordoen. En as jy 'n klomp ander aggregators op jou foon het, inteendeel, hulle sal goedkopers aanbied.

(Dws Daar is dienste wat foto's en video's gebruik om soveel moontlik inligting in te samel. Byvoorbeeld, rekenaarvisiebiblioteke – Google het een. Hulle skandeer jou en jou omgewing om te sien watter grootte of lengte jy is, watter handelsmerke jy dra, watter motor jy ry, of jy kinders of troeteldiere het.

(Dws Diegene wat SMS-poorte aan banke verskaf vir hul posstukke, kan jou aankope op die kaart naspoor – deur die laaste 4 syfers en 'n telefoonnommer te ken – en verkoop dan hierdie data aan iemand anders. Vandaar al hierdie strooipos met afslag en pizza as geskenk.

🤷️️ Uiteindelik lek ons ​​self ons data aan die linkerkant dienste en toepassings. Onthou daardie hype rondom Getcontact, toe almal graag hul telefoonnommer invul om uit te vind hoe dit deur ander geskryf is. En vind nou hul ooreenkoms en lees wat dit sê oor die oordrag van jou data (bederf: die eienaars kan dit na goeddunke aan derde partye oordra):

Wie samel groot data in en hoekom?

Korporasies kan jare lank gebruikersdata suksesvol insamel en selfs verkoop, totdat dit by 'n regsgeding kom - soos met dieselfde Facebook gebeur het. En toe is die deurslaggewende rol gespeel deur die maatskappy se oortreding van die GDPR – ’n wet in die EU wat die gebruik van data baie strenger as die Amerikaanse een beperk. Nog 'n onlangse voorbeeld is die Avast-antivirusskandaal: een van die maatskappy se filiaaldienste het data van 100 tot 400 miljoen gebruikers ingesamel en verkoop.

Maar hou dit alles vir ons enige voordele in?

Hoe groot data help ons almal?

Ja, daar is ook 'n blink kant.

Groot data help om misdadigers vas te trek en terreuraanvalle te voorkom, vermiste kinders te vind en hulle teen gevaar te beskerm.

Met hul hulp het ons ons ontvang koel aanbiedinge van banke en persoonlike afslag. Danksy hulle ons ons betaal nie vir baie dienste en sosiale netwerke wat net op advertensies verdien nie. Andersins sou Instagram alleen ons etlike duisende dollars per maand kos.

Facebook alleen het 2,4 miljard aktiewe gebruikers. Terselfdertyd het hul wins vir 2019 $18,5 miljard beloop. Dit blyk dat die maatskappy tot $7,7 per jaar van elke gebruiker deur middel van advertensies verdien.

Ten slotte, soms is dit net gerieflik: wanneer die dienste reeds weet waar jy is en wat jy wil hê, en jy nie self hoef te soek na die inligting wat jy nodig het nie.

Nog 'n belowende area vir die toepassing van Big Data is onderwys.

In een van die Amerikaanse universiteite in Virginia is 'n studie gedoen om data oor studente van die sogenaamde risikogroep in te samel. Dit is diegene wat swak studeer, klasse mis en op die punt staan ​​om uit te val. Die feit is dat in die state elke jaar ongeveer 400 mense afgetrek word. Dit is sleg vir beide universiteite, wat hul graderings verlaag en hul befondsing besnoei word, en vir die studente self: baie neem lenings vir onderwys, wat na aftrekking nog terugbetaal sal moet word. Om nie eens te praat van verlore tyd en loopbaanvooruitsigte nie. Met behulp van groot data is dit moontlik om die agterblyers betyds te identifiseer en vir hulle 'n tutor, bykomende klasse en ander geteikende bystand aan te bied.

Dit is terloops ook geskik vir skole: dan sal die stelsel onderwysers en ouers in kennis stel – hulle sê, die kind het probleme, kom ons help hom saam. Big Data sal jou ook help om te verstaan ​​watter handboeke beter werk en watter onderwysers die materiaal makliker verduidelik.

Nog 'n positiewe voorbeeld is loopbaanprofilering.: dit is wanneer tieners gehelp word om oor hul toekomstige beroep te besluit. Hier laat groot data jou toe om inligting in te samel wat nie met tradisionele toetse verkry kan word nie: hoe die gebruiker optree, waarna hy aandag gee, hoe hy met die inhoud omgaan.

In dieselfde VSA is daar 'n loopbaanvoorligtingsprogram – SC ACCELERATE. Dit gebruik onder meer CareerChoice GPS-tegnologie: hulle ontleed data oor die aard van studente, hul geneigdheid tot vakke, sterk- en swakpunte. Die data word dan gebruik om tieners te help om die regte kolleges vir hulle te kies.


Teken in en volg ons op Yandex.Zen — tegnologie, innovasie, ekonomie, onderwys en deel in een kanaal.

Lewer Kommentaar