Domov Názory Velká data jsou jen velký podvod | john c. dvorak

Velká data jsou jen velký podvod | john c. dvorak

Video: Лучшие в своём деле: Артур Хачуян | Большие данные — Big Data | ЛСД #7 (Listopad 2024)

Video: Лучшие в своём деле: Артур Хачуян | Большие данные — Big Data | ЛСД #7 (Listopad 2024)
Anonim

Nově vznikající systém „velkých dat“ nebyl nikdy definován žádným smysluplným a definitivním způsobem. Je to nejvíce amorfní nový bzučák, který jsem viděl deset let. Je to jeden z těch termínů „oko diváka“, který oživoval seminář a nakonec namočil investory.

Začněme otázkou, co znamenají velká data? Spousta dat? Více dat, než dokážete zvládnout? Amorfní data? Mimo kontrolu? Užitečná data pro analýzu? Zbytečná data? Přetížení informací?

Pokud o velkých datech čtete dost, je to všechno výše a další. Klíčem nejsou data, ale výzva, jak s daty nakládat a co dělat s daty samotnými.

Jinými slovy, jak můžeme udělat tuto obrovskou hromadu dat, kterou se nám podařilo akumulovat, být užitečnými novými a výnosnými způsoby? Datové fondy mohou přicházet odkudkoli prostřednictvím různých výpočetních mechanismů, jako jsou příspěvky na Facebooku, protokoly NSA, e-mailové konference, zákazníci atd.

Řekl bych, že většina čtenářů tohoto sloupce je sama úložištěm velkých dat. Právě jsem koupil 3 Terabyte jednotku pro zálohování. Mám spoustu dat k zálohování! Velká data!

Užitečným nástrojem, který si dokážu představit, by byl nástroj pro analýzu velkých dat, který by policie mohla použít k tomu, aby vás prohledala vinnými z nějakého náhodného zločinu procházením vašich souborů. Nebo alespoň najděte něco, co by vás trápilo. Velká data!

To vše se vrací k komentáři bývalého generálního ředitele American Express, který řekl publiku, že pokud by společnost chtěla (a to platí pro všechny společnosti vydávající kreditní karty), mohla by vaše osobní nákupní zvyky a tendence dát dohromady kompletní dokumentace a rozhodně řekněte, zda máte poměr nebo ne. Velká data!

Z toho, co mohu říct, to je přesně to, co velká data umí nejlépe, špehovat jednotlivce.

Oblíbeným komentářem tohoto odvětví je, že pro váš prospěch budou použity obrovské databáze, které obsahují informace o vás. Jo, víte, takže dostanete věci, které vás zajímají. Cílená reklama. To prospívá všem!

Takto to funguje. Mám zájem o koupi nové kamery a slyším o nové Bogus One. Četl jsem článek o PCMag.com o fotoaparátu, pak jdu do Amazonu a podívejte se na ceny a uživatelské recenze. Vypadá to, jako by nikdo neměl rád kameru. Je to očividný kus svinstva. Všichni recenzenti se vyhýbali fotoaparátu. Kupující nenávidí fotoaparát. Toto není kamera, kterou chci. Ale software pro analýzu velkých dat se rozhodl dát mi stovky reklam, na každé webové stránce, kterou navštěvuji, všechny zobrazující fotoaparát Bogus One. Velká data!

Je to horší než tohle. Pokud by to šlo jiným směrem a já jsem se rozhodl, že se mi líbí a chci kameru a skutečně jsem kameru koupil, pořád bych dostával reklamy, které mě povzbuzují ke koupi kamery. Velká data!

Cílená reklama „velkých dat“ je vůbec největší zátěží balónku.

Dobře, tak zapomeňme na fiasko a přejděte k používání velkých dat pro trendy. Velká data mohou najít různé jehly v různých stohech sena. Takže byste dostali něco takového: Čtyřicet procent všech kupujících Subaru jsou vegetariáni / vegani a 80 procent z nich jsou demokraté. Pokud však hovoříme o Subaru Outback, tento počet se zvýšil na 60 procent a 90 procent. Navíc se zvyšuje na 99 procent vegetariánských / veganských a 99 procent demokratů, pokud je vůz natřen zeleně.

Teoretici velkých dat by měli na semináři s těmito informacemi polní den. Ignoruje však všechny proměnné, které mohou změnit výpočty a trendy, které jsou nekonečné. Jak dlouho vydrží některé z těchto velkých dat, pokud generální ředitel Subaru jede na shromáždění v zeleném Outbacku a prohlásí, že „všechny velryby musí být zničeny!“?

Neznamená to ani tolik, aby se změnila dynamika závěrů velkých dat. Navzdory tomu, co říká americký expres, data jsou ve skutečnosti slepá. Proto se vám zobrazují reklamy na již zakoupené produkty.

Velká data by vás přivedla k závěrům.

Pokud si někdo koupí deset knih o tom, jak vyrobit bombu, znamená to, že chce vyhodit do vzduchu federální budovu? Co kdyby byl odborníkem na likvidaci bomby a to nebylo zahrnuto do jeho pracovního zařazení jako policejní poradce? Velká data zatím nemohou vědět všechno. Nemůže vědět, co si myslíte. Například si myslím, že kamera Bogus One saje. Velká data to nemohou vědět, pokud nebudu vyslýchána. A mohl bych o tom lhát.

Nic z toho pro společnost nezní dobře nebo zdravě. Skok k závěrům, vytváření předpokladů, jednání na základě falešných předpokladů. Honí veřejnost zbytečnými s.

Velká data jako vysoký koncept se nikdy plně nedefinují a nezemřou ubohou smrtí. Doufám.

Velká data jsou jen velký podvod | john c. dvorak