Domov Recenze Jak mohou podniky vnímat trh velkých dat

Jak mohou podniky vnímat trh velkých dat

Video: Life In A Day 2010 Film (Listopad 2024)

Video: Life In A Day 2010 Film (Listopad 2024)
Anonim

Podniky nezískávají žádné body za to, jak účinně běží jejich infrastruktura nebo jak vysoko dokážou ukládat veškerá velká data, která shromažďují. Počítá se kvalita analýzy a inteligence, které data vytvářejí.

V posledních několika letech je Hadoop slovo, které se stalo nej synonymem pro přijímání, zpracování a transformaci dat. Tento open-source framework pro distribuované ukládání a zpracování dat vytvořil vlastní podnikový prostor a integroval svou cestu do všech hlavních cloudových platforem. Hadoop zdaleka není jediná technologie Big Data, o které stojí za to hovořit, ale stala se ta, na které je postaveno mnoho dalších.

Problémem pro podniky je prostor Hadoop plný možností distribuce a nástrojů a jak vysvětlil ředitel výzkumu Gartner Nick Heudecker, mnoho z nich vypadá stejně. Heudecker, jehož výzkum pokrývá správu informací, včetně prostorů Big Data a NoSQL, řekl, že pokud se podíváte na obecné možnosti zpracování dat, mnoho dodavatelů nabízí velmi podobné funkce.

Rozbití trhu

Existují tři hlavní start-upy Hadoop s čistou hrou - Cloudera, Hortonworks a MapR - a všechny se v roce 2015 neustále rozrůstaly. Podle společnosti Gartner má každý přibližně 700 zákazníků, dejte nebo berte 10 procent, čímž se světový trh mezi 2 100 - 2 400 zákazníků Hadoop po celém světě. Všechny tři nabízejí bezplatnou i podnikovou úroveň své distribuce Hadoop a každá z nich významně přispívá k otevřeným zdrojovým kódům pro projekty v rámci banneru Apache Software Foundation (ASF).

"Naše data naznačují, že 44 procent užívání Hadoop je v současné době nezaplaceno, " řekl Heudecker. "Je tu jasný vůdce? Nemyslím si to. Všichni mají trhový podíl, protože je to velmi nový prostor."

V posledních několika měsících došlo ke konkurenci mezi těmito třemi konkurenty v oblasti analytických schopností dat a kreativních způsobů integrace Apache Spark, otevřeného zdroje zpracování velkých dat s případy použití od datových toků v reálném čase až po strojové učení.. Společnost MapR nedávno oznámila MapR Streams jako součást „konvergované datové platformy“, která integruje Hadoop, zpracování toku založené na Spark a analytiku. Společnost Hortonworks představila aktualizaci datové platformy Hortonworks Data Platform (HDP) pomocí analytické analýzy Spark v paměti a společnost Cloudera nabízí prostřednictvím své iniciativy One Platform Iniciativu Open Source source integraci spolu s nabídkou školicích kurzů Spark.

„V prostorech pro správu informací a informační infrastrukturu se toho hodně děje a není to všechno Hadoop, “ vysvětlil Heudecker. „Za modelem Sparkovy rychlosti a pamětově orientovaného zpracování dat je obrovská dynamika, přestože vývoj Spark je stále v počátečních fázích. Spark bude další lingua franca ve zpracování dat, podobně jako dnes SQL, a rozhodně ukazuje známky, že má nějaké nohy protože do něj investuje stále více společností. “

Heudecker také zdůraznil význam cloudových hráčů v Big Data; technologičtí giganti, kteří integrovali technologii Hadoop a další technologie velkých dat do svých stávajících nabídek IaaS (Infrastruktura-a-Service).

Amazon Web Services (AWS) používá pro Amazon Elastic MapReduce (EMR) službu pro cloudovou orchestraci Hadoop. Společnost Microsoft nabízí celou řadu velkých datových služeb v rámci cloudové platformy Azure a spolupracuje se společností Hortonworks na své službě HDInsight pro správu Apache Hadoop, Spark, HBase a Storm, spolu s analytickým jezerem Azure Data Lake založeným na SQL a Azure Data Analytics. IBM má v nabídce IBM Open Platform v místě pro Hadoop i IBM BigInsights, analytický balíček, který se má spustit, spolu se spravovaným Hadoop a Apache Spark-as-a-service v cloudu Bluemix. Seznam pokračuje a podniky naleznou více použitelných případů použití v cloudu.

"Odhadujeme, že samotný AWS má asi 5 000 zákazníků, takže je to více než dvojnásobek zákaznické základny čistých her dohromady, " řekl Heudecker. „Jednou z výhod přechodu do cloudu je to, že získáte ekosystém. Můžete získat distribuci Hadoopu s čistou hrou pro jakoukoli nabídku IaaS. MapR je k dispozici ve všech oblacích, na které si vzpomenete, kromě IBM; stejné pro Cloudera a Hortonworks. Neviděli jsme, jak se cloudová dostupnost stává příliš důležitým faktorem při výběru mezi jedním prodejcem a druhým. ““

Výběr strategie podnikových dat

Pro malé a střední podniky i pro rostoucí podnikové podniky při investování do řešení zpracování dat a analytických řešení Heudecker uvedl, že rozhodujícím faktorem je, která platforma může poskytovat nejvyšší úroveň služeb. Největší výzvou pro podniky je podle společnosti Gartner mezera v dovednostech - zjistit, kdo bude platformu spravovat, jakmile bude nainstalována a nasazena.

„Pokud společnosti hledají partnera pro datovou platformu, kdo jim pomůže s přijímáním dat? Kdo jim pomůže vybudovat analytickou aplikaci? Pokud jde o tři čistě hrající Hadoopers, hodnotící kritéria bývají kolem vyspělost nástrojů pro správu a konzolí, nástrojů pro správu dat a výkonu. “

Dalším zajímavým aspektem výběru platformy Hadoop je nedostatek loajality. Společnosti přehodnocují svou platformu Hadoop tak často, jako každých 6–12 měsíců, aby zjistily, zda jsou komponenty pro zpracování dat stále v pořádku, protože se rychle mění prostor a jak málo se velcí hráči diferencovali. Heudecker uvedl, že 20 procent společností, o nichž hovořil, má ve svých datových centrech nebo cloudu spuštěno více distribucí Hadoop, ať už nechají různé týmy zvolit si platformu výběru nebo záměrně diverzifikovat, aby se zabránilo uvíznutí pouze s jednou distribucí Hadoop.

Tento druh diverzifikovaného portfolia platforem přispívá k tomu, co Frank Buytendijk, viceprezident společnosti Gartner Research and Distinguished Analyst zaměřující se na digitální strategii, nazývá „informace jako aktivum“. Stejně jako vy nemůžete podnikat bez kapitálu, práce, materiálů a fyzického nebo virtuálního vybavení, Buytendijk řekl, že nemůžete podnikat bez informací.

"Dříve jsme se dívali na podnikání z hlediska tří toků: primárním tokem bylo zboží, sekundárním tokem byly peníze a tokem terciárním byly informace, které zajišťovaly, že zboží a peníze jsou sladěny. Nyní ve většině podniků je to naopak. Primárním tokem jsou informace, od identifikace a konfigurace až po marketing obsahu, atd. Ať už tomu tak říkáte Big Data, nezáleží. “

„Velká data“ je zastaralá

Buytendjik řekl, že Big Data nevidí jako samostatnou technologii pro podniky, ale jako jedno téma nebo myšlení v rámci vaší celkové digitální strategie.

„Nevěřím, že mám strategii velkých dat, “ řekl Buytendjik. "S digitálními součástmi už téměř neexistuje obchodní strategie, takže věřím v digitální strategii, v níž všechny druhy technologií poskytují kritické schopnosti. Patří sem mobilní, sociální, cloud, IoT, inteligentní stroje a velká data."

Heudecker věří, že začneme mluvit o „velkých datech“ čím dál tím méně, protože nyní jsou to jen data. Je to způsob, jakým se podnikání dělá. Obrovské objemy a vysoká rychlost dat již nejsou tak skličující.

"Big Data se opět začleňují do informací a analytiků, " řekl Heudecker. „Kategorie Big Data se upřímně neliší. Vždy se ptáme velikosti trhu s velkými daty, ale co to dokonce znamená? Big Data není ve skutečnosti trh, je to koncept. Pro podnikání, přemýšlet o Big Data jako něco jedinečného a zvláštního, které se radikálně liší od toho, co jste předtím udělali, je chyba. V tomto bodě jsou data prostě normální. “

Jak mohou podniky vnímat trh velkých dat