Hjem meninger Big data er bare en stor svindel john c. dvorak

Big data er bare en stor svindel john c. dvorak

Video: BIG DATA - архитектор матрицы (Oktober 2024)

Video: BIG DATA - архитектор матрицы (Oktober 2024)
Anonim

Den nyoppståtte "big data" -memen er aldri blitt definert på noen meningsfull og definitiv måte. Det er den mest amorfe nye buzz-termen som jeg har sett på et tiår. Det er et av de "øye på betrakternes" begrep som brukes til å livne opp et seminar og til slutt suge investorer.

La oss starte med å spørre hva betyr big data? Masse data? Flere data enn du kan håndtere? Amorfe data? Ut av kontrolldata? Nyttige data for analyse? Nytteløse data? For mye informasjon?

Hvis du leser nok om big data, er alt det ovennevnte og mer. Nøkkelen er ikke dataene, men utfordringen om hvordan man skal håndtere dataene og hva man skal gjøre med selve dataene.

Med andre ord, hvordan kan vi få denne enorme bunken med data, som vi har klart å samle, til å være nyttig på nye og lønnsomme måter? Datapoolene kan komme hvor som helst via forskjellige databehandlingsmekanismer som Facebook-innlegg, NSA-logger, adresselister, kunder, etc.

Jeg vil hevde at de fleste lesere av denne spalten selv er depoter av big data. Jeg har nettopp kjøpt en 3 Terabyte-stasjon for sikkerhetskopiering. Jeg har mye data å sikkerhetskopiere! Stor Data!

Et nyttig verktøy jeg kan forestille meg ville være et big data-analyseverktøy som politiet kan bruke for å finne deg skyldig i tilfeldig kriminalitet ved å gå gjennom filene dine. Eller i det minste finne noe som vil flau deg. Stor Data!

Alt dette kommer tilbake til en kommentar fra en tidligere administrerende direktør i American Express, som fortalte et publikum at hvis selskapet ville (og dette gjelder alle kredittkortselskaper), kunne det bruke dine personlige kjøpsvaner og tendenser til å sette sammen en komplett dossier og fortell definitivt om du har en affære eller ikke. Stor Data!

Fra hva jeg kan fortelle, er det nøyaktig hva big data gjør best, spionere på enkeltpersoner.

Den populære kommentaren fra bransjen er at på en eller annen måte enorme databaser som inneholder informasjon om deg, vil bli brukt til fordel. Ja, du vet, så du vil få ting du faktisk er interessert i. Målrettet annonsering. Dette kommer alle til gode!

Slik fungerer dette. Jeg er interessert i å kjøpe et nytt kamera og høre om det nye Bogus One. Jeg leste en artikkel på PCMag.com om kameraet, så går jeg til Amazon og sjekker priser og brukeromtaler. Det ser ut som om ingen liker kameraet. Det er et åpenbart stykke dritt. Anmelderne avskjønnet alle kameraet. Kjøperne hater kameraet. Dette er ikke et kamera jeg vil ha. Men programvaren for stor dataanalyse bestemmer seg for å gi meg hundrevis av annonser, på hver webside jeg besøker, og alle viser Bogus One-kameraet. Stor Data!

Det er verre enn det. Hvis ting gikk i den andre retningen og jeg bestemte meg for at jeg likte og ville ha kameraet og faktisk kjøpte kameraet, ville jeg fremdeles fått annonser som oppmuntret meg til å kjøpe kameraet. Stor Data!

Målrettet "big data" -reklame er den største mengden baloney, noensinne.

OK, så la oss glemme fiaskoen og gå til å bruke big data for trender. Big data kan finne forskjellige nåler i forskjellige høysnakker. Så du vil få noe slikt: Førti prosent av alle Subaru-kjøpere er vegetarianer / veganer og 80 prosent av dem er demokrater. Men det tallet økte til henholdsvis 60 og 90 prosent, hvis vi snakker om en Subaru Outback. Videre øker den til 99 prosent vegetarianer / veganer og 99 prosent demokrat hvis bilen er malt grønn.

Big data teoretikere ville ha en feltdag på seminaret med denne informasjonen. Men den ignorerer alle variablene som kan endre beregninger og trender, som er uendelige. Hvor lenge vil noen av denne spesielle big dataen holde seg hvis administrerende direktør i Subaru kjører opp til en samling i en grønn Outback og erklærer at "Alle hvaler må tilintetgjøres!"?

Det tar ikke engang så mye å endre dynamikken i big data-konklusjoner. Til tross for hva American Express-fyren sier, er data faktisk blinde. Derfor får du annonser for produkter du allerede har kjøpt.

Big data ville ha deg til å hoppe til konklusjoner.

Hvis noen kjøper ti bøker om hvordan man lager en bombe, betyr det da at han vil sprenge Federal Building? Hva om han var en ekspert på bombe og det ikke inngikk i stillingen som politikonsulent? Big data kan ikke vite alt ennå. Den kan ikke vite hva du tenker. Jeg tenker for eksempel at Bogus One-kameraet suger. Big data kan ikke vite det med mindre jeg blir forhørt. Og jeg kan lyve om det.

Ingenting av dette høres bra ut eller sunt for samfunnet. Hoppe til konklusjoner, gjøre antagelser, handle etter falske forutsetninger. Hounding the public with unyttig s.

Big data som et høyt konsept vil aldri helt definere seg selv og dø en elendig død. Jeg håper.

Big data er bare en stor svindel john c. dvorak