Domov Podnikání Google zjednodušuje strojové učení pomocí sql

Google zjednodušuje strojové učení pomocí sql

Obsah:

Video: Уроки SQL для начинающих / #3 - Добавление и обновление записей в БД (Listopad 2024)

Video: Уроки SQL для начинающих / #3 - Добавление и обновление записей в БД (Listopad 2024)
Anonim

Google nyní přidal funkce strojového učení (ML) do své nabídky Google BigQuery, společnosti nabízející cloudovou databázi petabyte (PB). Nová verze, která se nyní nazývá BigQuery ML, vám umožňuje používat jednoduché příkazy jazyka Structured Query Language (SQL) k vytváření a nasazování modelů ML pro prediktivní analýzu.

To není jen dobrá zpráva pro vědce, kteří používají Google. Je to také dobré pro podnikatelské subjekty, které mají zájem o zdokonalení svých analytických funkcí, protože přidává jednoho účinnějšího konkurenta do poměrně malého seznamu dodavatelů schopných poskytovat tuto úroveň sofistikovanosti prostřednictvím cloudu. Další dvě nejznámější jména jsou Amazon's Relational Database Service a Microsoft Azure SQL a další informace najdete v našem nedávném završení cloudové databázové služby.

Zlomem všech prodejců a kupujících datových produktů byla vždy mezera v dovednostech. To platí zejména pro zájemce o ML a prediktivní analýzu, protože tyto obory často vyžadují znalost nových technologií a dotazovací jazyky.

„Pro každého vědce v oblasti dat pracují s daty stovky analytiků a nejvíce využívají SQL, “ řekl PCMag Sudhir Hasbe, ředitel produktového managementu ve službě Google Cloud. Něco se muselo dát, kdyby se síla armády datových analytiků odtrhla od úzkého hrdla, které vytvořilo příliš málo a příliš přepracovaných vědců s údaji.

Odpověď společnosti Google na toto dilema není nic pozoruhodného. Zatímco ML je horký trend a objevuje se ve výrobcích všeho druhu všude, stále je to pevně teritorium datových vědců. Spousta prodejců udělala pokrok ve zjednodušení technologie, ale ošklivá pravda je, že ji můžete hodně zjednodušit a pro stále více než 99 procent lidské populace je stále příliš těžké ji použít. Přesto musíme být schopni jej používat, protože ML umí více, a to rychleji, než dokáže skupina super inteligentních lidí.

Google vysazuje ML uvnitř Google BigQuery tak, aby byl umístěn blíže k datům. Aplikace přinese funkce ML rychleji než tradiční modely ML z části, protože analytika dat může být provedena u zdroje. Nyní ve verzi beta umožňuje BigQuery ML analytikům (a vědcům v oblasti dat) provádět prediktivní analýzu, jako je prognóza prodeje a vytváření zákaznických segmentů, přímo nad daty, kde jsou uložena. To samo o sobě je slušný a pozoruhodný upgrade.

Google však šel ještě dále tím, že přidal funkci, která umožňuje datovým analytikům používat jednoduché příkazy SQL k vytváření a nasazování ML modelů. Momentálně jsou možnosti pro prediktivní analýzu lineární regresní a logistické regresní modely, protože tyto dva nejčastěji používané modely jsou.

Zde je příklad, který společnost Google poskytla, aby předvedla, jak by analytici mohli tuto schopnost využívat:

Podle Hasbe Google plánuje do této schopnosti v průběhu času přidat další možnosti ML. "Musíme od našich zákazníků slyšet, ke kterým modelům chtějí přidat, abychom nejprve poskytli ty nejužitečnější, " řekl.

Další upgrady Google BigQuery

Nejvýznamnějším seznamem upgradů po ML je schopnost shlukování, BigQuery Geographic Information Systems (BigQuery GIS), nový datový konektor Tabulek Google a nový datový konektor Tabulek Google.

Clustering je také v beta verzi a umožňuje vytváření seskupených tabulek v pohybu optimalizace dat, který spojuje řádky s podobnými klastrovými klíči dohromady. To snižuje náklady, protože zlepšuje výkon a umožňuje službě Google BigQuery účtovat uživateli pouze za naskenovaná data, nikoli celou tabulku nebo oddíl.

BigQuery GIS je v současné době ve verzi alfa a používá se pro analýzu geoprostorových dat. Zatímco tým Google Cloud spolupracoval s aplikací Google Earth Engine při vytváření BigQuery GIS, musíte přinést vlastní geoprostorová data ke stolu. To není problém v několika průmyslových odvětvích, včetně propojených automobilových systémů, internetu věcí (IoT), výroby, maloobchodu, inteligentních měst a telematiky. Nemluvě o vládních agenturách od Agentury na ochranu životního prostředí (EPA) a Národní geoprostorové zpravodajské služby po Národní správu oceánů a atmosfér (NOAA) a samozřejmě všechny vojenské pobočky.

BigQuery GIS používá knihovnu S2, která má nyní přes miliardu uživatelů prostřednictvím různých produktů, jako je Google Earth Engine a Google Maps. Pokud potřebujete více geoprostorových dat, pak federální vláda sdílí jejich obrovské množství na GeoPlatformu.

Nový datový konektor Tabulek Google pravděpodobně potěší mnoho analytiků dat jednoduše proto, že je pro každodenní použití tak praktické. K nástroji Google BigQuery můžete přistupovat z Tabulek Google (tabulkový program) a používat nástroje Tabulek Google, jako je například Explore, což je kombinovaná spolupráce, vizualizace dat a dotazování v přirozeném jazyce.

Google BigQuery má nyní také nové uživatelské rozhraní (UI) ve verzi beta. Jedním ze zajímavějších prvků je funkce vizualizace jedním kliknutím, kterou Google Data Studio podporuje. Všichni říkají, je to skvělé kolo upgradů pro již elegantní službu. Tyto aktualizace budou testovány v dalším kole přezkumů řešení DBaaS (Database-as-a-Service) databáze PCMag, poté, co jsou chyby vyřešeny a produkty přesáhly své příslušné stavy alfa a beta.

PCMag EIC Dan Costa diskutuje o budoucnosti dat:
Google zjednodušuje strojové učení pomocí sql