Video: Life In A Day 2010 Film (Listopad 2024)
Podniky nezískávají žádné body za to, jak účinně běží jejich infrastruktura nebo jak vysoko dokážou ukládat veškerá velká data, která shromažďují. Počítá se kvalita analýzy a inteligence, které data vytvářejí.
V posledních několika letech je Hadoop slovo, které se stalo nej synonymem pro přijímání, zpracování a transformaci dat. Tento open-source framework pro distribuované ukládání a zpracování dat vytvořil vlastní podnikový prostor a integroval svou cestu do všech hlavních cloudových platforem. Hadoop zdaleka není jediná technologie Big Data, o které stojí za to hovořit, ale stala se ta, na které je postaveno mnoho dalších.
Problémem pro podniky je prostor Hadoop plný možností distribuce a nástrojů a jak vysvětlil ředitel výzkumu Gartner Nick Heudecker, mnoho z nich vypadá stejně. Heudecker, jehož výzkum pokrývá správu informací, včetně prostorů Big Data a NoSQL, řekl, že pokud se podíváte na obecné možnosti zpracování dat, mnoho dodavatelů nabízí velmi podobné funkce.
Rozbití trhu
Existují tři hlavní start-upy Hadoop s čistou hrou - Cloudera, Hortonworks a MapR - a všechny se v roce 2015 neustále rozrůstaly. Podle společnosti Gartner má každý přibližně 700 zákazníků, dejte nebo berte 10 procent, čímž se světový trh mezi 2 100 - 2 400 zákazníků Hadoop po celém světě. Všechny tři nabízejí bezplatnou i podnikovou úroveň své distribuce Hadoop a každá z nich významně přispívá k otevřeným zdrojovým kódům pro projekty v rámci banneru Apache Software Foundation (ASF).
"Naše data naznačují, že 44 procent užívání Hadoop je v současné době nezaplaceno, " řekl Heudecker. "Je tu jasný vůdce? Nemyslím si to. Všichni mají trhový podíl, protože je to velmi nový prostor."
V posledních několika měsících došlo ke konkurenci mezi těmito třemi konkurenty v oblasti analytických schopností dat a kreativních způsobů integrace Apache Spark, otevřeného zdroje zpracování velkých dat s případy použití od datových toků v reálném čase až po strojové učení.. Společnost MapR nedávno oznámila MapR Streams jako součást „konvergované datové platformy“, která integruje Hadoop, zpracování toku založené na Spark a analytiku. Společnost Hortonworks představila aktualizaci datové platformy Hortonworks Data Platform (HDP) pomocí analytické analýzy Spark v paměti a společnost Cloudera nabízí prostřednictvím své iniciativy One Platform Iniciativu Open Source source integraci spolu s nabídkou školicích kurzů Spark.
„V prostorech pro správu informací a informační infrastrukturu se toho hodně děje a není to všechno Hadoop, “ vysvětlil Heudecker. „Za modelem Sparkovy rychlosti a pamětově orientovaného zpracování dat je obrovská dynamika, přestože vývoj Spark je stále v počátečních fázích. Spark bude další lingua franca ve zpracování dat, podobně jako dnes SQL, a rozhodně ukazuje známky, že má nějaké nohy protože do něj investuje stále více společností. “
Heudecker také zdůraznil význam cloudových hráčů v Big Data; technologičtí giganti, kteří integrovali technologii Hadoop a další technologie velkých dat do svých stávajících nabídek IaaS (Infrastruktura-a-Service).
Amazon Web Services (AWS) používá pro Amazon Elastic MapReduce (EMR) službu pro cloudovou orchestraci Hadoop. Společnost Microsoft nabízí celou řadu velkých datových služeb v rámci cloudové platformy Azure a spolupracuje se společností Hortonworks na své službě HDInsight pro správu Apache Hadoop, Spark, HBase a Storm, spolu s analytickým jezerem Azure Data Lake založeným na SQL a Azure Data Analytics. IBM má v nabídce IBM Open Platform v místě pro Hadoop i IBM BigInsights, analytický balíček, který se má spustit, spolu se spravovaným Hadoop a Apache Spark-as-a-service v cloudu Bluemix. Seznam pokračuje a podniky naleznou více použitelných případů použití v cloudu.
"Odhadujeme, že samotný AWS má asi 5 000 zákazníků, takže je to více než dvojnásobek zákaznické základny čistých her dohromady, " řekl Heudecker. „Jednou z výhod přechodu do cloudu je to, že získáte ekosystém. Můžete získat distribuci Hadoopu s čistou hrou pro jakoukoli nabídku IaaS. MapR je k dispozici ve všech oblacích, na které si vzpomenete, kromě IBM; stejné pro Cloudera a Hortonworks. Neviděli jsme, jak se cloudová dostupnost stává příliš důležitým faktorem při výběru mezi jedním prodejcem a druhým. ““
Výběr strategie podnikových dat
Pro malé a střední podniky i pro rostoucí podnikové podniky při investování do řešení zpracování dat a analytických řešení Heudecker uvedl, že rozhodujícím faktorem je, která platforma může poskytovat nejvyšší úroveň služeb. Největší výzvou pro podniky je podle společnosti Gartner mezera v dovednostech - zjistit, kdo bude platformu spravovat, jakmile bude nainstalována a nasazena.
„Pokud společnosti hledají partnera pro datovou platformu, kdo jim pomůže s přijímáním dat? Kdo jim pomůže vybudovat analytickou aplikaci? Pokud jde o tři čistě hrající Hadoopers, hodnotící kritéria bývají kolem vyspělost nástrojů pro správu a konzolí, nástrojů pro správu dat a výkonu. “
Dalším zajímavým aspektem výběru platformy Hadoop je nedostatek loajality. Společnosti přehodnocují svou platformu Hadoop tak často, jako každých 6–12 měsíců, aby zjistily, zda jsou komponenty pro zpracování dat stále v pořádku, protože se rychle mění prostor a jak málo se velcí hráči diferencovali. Heudecker uvedl, že 20 procent společností, o nichž hovořil, má ve svých datových centrech nebo cloudu spuštěno více distribucí Hadoop, ať už nechají různé týmy zvolit si platformu výběru nebo záměrně diverzifikovat, aby se zabránilo uvíznutí pouze s jednou distribucí Hadoop.
Tento druh diverzifikovaného portfolia platforem přispívá k tomu, co Frank Buytendijk, viceprezident společnosti Gartner Research and Distinguished Analyst zaměřující se na digitální strategii, nazývá „informace jako aktivum“. Stejně jako vy nemůžete podnikat bez kapitálu, práce, materiálů a fyzického nebo virtuálního vybavení, Buytendijk řekl, že nemůžete podnikat bez informací.
"Dříve jsme se dívali na podnikání z hlediska tří toků: primárním tokem bylo zboží, sekundárním tokem byly peníze a tokem terciárním byly informace, které zajišťovaly, že zboží a peníze jsou sladěny. Nyní ve většině podniků je to naopak. Primárním tokem jsou informace, od identifikace a konfigurace až po marketing obsahu, atd. Ať už tomu tak říkáte Big Data, nezáleží. “
„Velká data“ je zastaralá
Buytendjik řekl, že Big Data nevidí jako samostatnou technologii pro podniky, ale jako jedno téma nebo myšlení v rámci vaší celkové digitální strategie.
„Nevěřím, že mám strategii velkých dat, “ řekl Buytendjik. "S digitálními součástmi už téměř neexistuje obchodní strategie, takže věřím v digitální strategii, v níž všechny druhy technologií poskytují kritické schopnosti. Patří sem mobilní, sociální, cloud, IoT, inteligentní stroje a velká data."
Heudecker věří, že začneme mluvit o „velkých datech“ čím dál tím méně, protože nyní jsou to jen data. Je to způsob, jakým se podnikání dělá. Obrovské objemy a vysoká rychlost dat již nejsou tak skličující.
"Big Data se opět začleňují do informací a analytiků, " řekl Heudecker. „Kategorie Big Data se upřímně neliší. Vždy se ptáme velikosti trhu s velkými daty, ale co to dokonce znamená? Big Data není ve skutečnosti trh, je to koncept. Pro podnikání, přemýšlet o Big Data jako něco jedinečného a zvláštního, které se radikálně liší od toho, co jste předtím udělali, je chyba. V tomto bodě jsou data prostě normální. “