Hjem meninger Hvordan ai, ml vil transformere tale-til-tekst, språkoversettelser | tim bajarin

Hvordan ai, ml vil transformere tale-til-tekst, språkoversettelser | tim bajarin

Video: AI Language Models & Transformers - Computerphile (Oktober 2024)

Video: AI Language Models & Transformers - Computerphile (Oktober 2024)
Anonim

En av de mest imponerende demonstrasjonene ved Google I / O var Duplex, en kunstig intelligens som ringte til forretningssteder - i dette tilfellet en frisørsalong og en restaurant - for å bestille avtaler. Menneskene på den andre enden av linjen var tilsynelatende ingen klokere, og Duplex håndterte utfordringer med letthet, som når restauranten sa at den ikke godtok reservasjoner for små fester.

Denne spesielle AI-kunngjøringen fikk mye dekning på Google I / O, men AI og maskinlæring var utbredt i alle produktene og tjenestene som ble vist på utviklerkonferansen. Bare se på dette diagrammet, som Google viste ved en AI-fokusert analytikerhendelse dagen før I / O åpnet.

Det var to andre ting som ble vist på det arrangementet at jeg vurderer potensielle spillskiftere.

Den første er hvordan AI brukes til tale-til-tekst-oversettelse. Målet er å få dette til 99 prosent nøyaktighet ved bruk av AI og ML de neste årene. Når det er sagt, demoene der de dikterte kommentarer til forskjellige G-Suite-applikasjoner, var allerede ganske nøyaktige. Vi så også en mer dyptgående demonstrasjon av Smart Compose, der en person skriver en setning i Gmail, og Smart Compose skriver neste setning for deg basert på den første setningens kontekst.

Ulike stemmegjenkjenningsprodukter, for eksempel Dragon Dictate, har vært på markedet i mange år. Men disse programmene var avhengige av lokal programvare og benyttet seg av den gjeldende prosessorkraften som var tilgjengelig på hver utgivelse. Disse programmene ble bedre med årene, men hvis du annonserer AI og ML, vil nøyaktighetsgraden sannsynligvis bli bedre.

Google forstår viktigheten av tale-til-tekst når det gjelder vår hverdag. Et nøyaktig tale-til-tekst-grensesnitt er kritisk når du svarer på en melding mens du kjører. Det er en meningsfull måte å svare på en e-post eller tekstmelding på bærbare eller smarttelefoner. Det vil til slutt bli et verdifullt innspill når du bruker blandede reality-briller, der bruk av stemme som en del av navigasjonsprosessen og tale-til-tekst er nødvendig for forskjellige typer AR-applikasjoner.

Det andre er hvordan AI og ML brukes i Google Translate, som vil være virkelig transformative når oversettelser skjer i sanntid. Som en internasjonal reisende som bare snakker engelsk, ville denne typen oversettelser være en gave. Det er noen håndholdte enheter som prøver å oversette det du sier til et lokalt språk, men de har for øyeblikket mange begrensninger.

Google har øye med denne typen oversettelser, så det er trygt å si at vi kunne se noen reelle gjennombrudd i mer nøyaktig språkoversettelse på Android-telefoner innen kort tid. Apple har også AI- og ML-forskning som foregår rundt forskjellige aspekter ved tale- og tekstoversettelse, slik at det også, sammen med potensielle partnere, kan levere en mobil oversettelsesløsning på iOS en dag.

AI og ML vil ha en dramatisk innvirkning på tale-til-tekst-oversettelse, og den mest fremtredende effekten kan være som en del av brukergrensesnittet i AR og VR eller blandet reality-briller. Personlig begeistrer språkoversettelsene meg mest, da det ville gjøre verdensreise lettere.

Hvordan ai, ml vil transformere tale-til-tekst, språkoversettelser | tim bajarin