Hjem Virksomhet Google forenkler maskinlæring med sql

Google forenkler maskinlæring med sql

Innholdsfortegnelse:

Video: Data Visualization and D3 by David Chouinard (Oktober 2024)

Video: Data Visualization and D3 by David Chouinard (Oktober 2024)
Anonim

Google har nå lagt til maskinlæring (ML) -funksjoner i Google BigQuery, selskapets petabyte (PB) -skala-databasetilbud. Den nye versjonen, som nå kalles BigQuery ML, lar deg bruke enkle SQL-setninger (Structured Query Language) til å bygge og distribuere ML-modeller for prediktiv analyse.

Det er ikke bare gode nyheter for dataforskere som bruker Google. Det er også bra for forretningsoperatører som er interessert i å fremme sine dataanalysemuligheter, fordi det tilfører en mer effektiv konkurrent til en ganske liten liste over leverandører som kan levere dette nivået av sofistikering via skyen. De to andre mest kjente navnene er Amazons Relational Database Service og Microsofts Azure SQL, og du kan finne mer i vår siste cloud-databasetjenesteoppdatering.

Banen til alle leverandører og kjøpere av produktprodukter har alltid vært kompetansegapet. Det har særlig vært sant for de som er interessert i ML og prediktiv analyse, siden disse fagområdene ofte krever kunnskap om nye teknologier og spørringsspråk.

"For hver enkelt dataforsker er det hundrevis av analytikere som jobber med data, og de fleste som bruker SQL, " sa Sudhir Hasbe, direktør for produktstyring i Google Cloud, til PCMag. Noe måtte gi hvis kraften til en hær av dataanalytikere skulle bli utkorket fra flaskehalsen skapt av for få og for overarbeidede dataforskere.

Googles svar på dette dilemmaet er intet mindre enn bemerkelsesverdig. Mens ML er en hot trend og dukker opp i produkter av alle slag overalt, er det fremdeles fast dataforsker territorium. Mange leverandører har gjort et forsøk på å forenkle teknologien, men den stygge sannheten er at du kan forenkle den med mye, og det er fremdeles for vanskelig for mer enn 99 prosent av den menneskelige befolkningen å bruke. Likevel må vi kunne bruke det fordi ML kan mer, og gjøre det raskere enn en gruppe supersmarte mennesker kan.

Google planter ML i Google BigQuery slik at den ligger nærmere dataene. Applikasjonen vil bringe ML-kapasiteter raskere enn tradisjonelle ML-modeller delvis fordi dataanalysen kan utføres ved kilden. Nå i beta gjør BigQuery ML analytikere (og dataforskere) i stand til å kjøre prediktive analyser som forutsi salg og å skape kundesegmenter øverst på dataene der de er lagret. Det alene er en respektabel og bemerkelsesverdig oppgradering.

Google gikk imidlertid lenger enn det ved å legge til en funksjon som gjør det mulig for dataanalytikere å bruke enkle SQL-setninger for å bygge og distribuere ML-modeller. Akkurat nå er alternativene lineær regresjon og logistiske regresjonsmodeller for prediktiv analyse, ettersom de er de to modellene som er mest brukt.

Her er en illustrasjon som Google ga for å demonstrere hvordan dataanalytikere ville bruke denne muligheten:

Google planlegger å legge til flere ML-alternativer til denne muligheten over tid, ifølge Hasbe. "Vi må høre fra kundene våre om hvilke modeller de vil at vi skal legge til, slik at vi først tilbyr de mest nyttige, " sa han.

Ytterligere Google BigQuery-oppgraderinger

Topping av den vesentlige listen over oppgraderinger etter ML er en grupperingskapasitet, BigQuery Geographic Information Systems (BigQuery GIS), en ny Google Sheets-datakontakt og en ny Google Sheets-datakontakt.

Clustering er også i beta, og muliggjør oppretting av gruppertabeller i et dataoptimaliseringsflytt som bunter rader med lignende klyngtaster sammen. Dette reduserer kostnadene siden det forbedrer ytelsen og gjør det mulig for Google BigQuery å belaste brukeren bare for dataene som er skannet i stedet for hele tabellen eller partisjonen.

BigQuery GIS er for tiden i alfa, og brukes til geospatial data-analyse. Mens Google Cloud-teamet samarbeidet med Google Earth Engine for å bygge BigQuery GIS, må du ta med dine egne geospatiale data til bordet. Det er ikke noe problem i og på tvers av flere bransjer, inkludert tilkoblede bilsystemer, Internet of Things (IoT), produksjon, detaljhandel, smarte byer og telematikk. For ikke å nevne offentlige etater som spenner fra Environmental Protection Agency (EPA) og National Geospatial-Intelligence Agency til National Oceanic and Atmospheric Administration (NOAA) og alle militærgrenene, selvfølgelig.

BigQuery GIS bruker S2-biblioteket, som nå har over en milliard brukere gjennom en rekke produkter som Google Earth Engine og Google Maps. Hvis du trenger mer geospatial data, deler den føderale regjeringen en enorm mengde av dem på GeoPlatform.

En ny Google Sheets-datakontakt vil sannsynligvis glede mange dataanalytikere ganske enkelt fordi den er så praktisk for daglig bruk. Du kan få tilgang til Google BigQuery fra Google Sheets (regnearksprogrammet) og bruke Google Sheets-verktøy som Explore, som er et kombinert verktøy, datavisualisering og spørringsverktøy for naturlig språk.

Google BigQuery har nå også et nytt brukergrensesnitt (UI) i beta. Et av de mer interessante elementene er visualisering-funksjonaliteten med ett klikk, som Google Data Studio støtter. Alt i alt er det en flott runde med oppgraderinger for en allerede elegant tjeneste. Disse oppgraderingene vil bli testet i neste runde av PCMags database-as-a-Service (DBaaS) løsningsevalueringer, etter at feilene er utarbeidet, og produktene har beveget seg utover deres respektive alfa- og beta-statuser.

PCMag EIC Dan Costa diskuterer fremtiden for data:
Google forenkler maskinlæring med sql