Hjem meninger Ai er (også) en styrke for godt | ben dickson

Ai er (også) en styrke for godt | ben dickson

2024

Innholdsfortegnelse:

Hvordan Deep Learning genererer menneskelige stemmer
Gjenopprette stemmen til en stemmeløs person
Balansere de negative bruken av AI-synthesizers

Video: KomDigital: To former for kunstig intelligens (Oktober 2024)

I 2017 frarøvet Amyotrophic Lateral Sclerosis (ALS), en ødeleggende nevrologisk lidelse, Pat Quinn, grunnleggeren av den berømte Ice Bucket Challenge, for hans evne til å snakke.

I 2018 hjalp kunstig intelligens ham med å få den tilbake.

Takket være fremskritt innen maskinlæring og dyp læring, har kunstig intelligens algoritmer blitt veldig gode til å imitere mennesker. Men mens mange fremtredende utviklinger i rommet har vært negativ, var AIs etterligningsmakt en styrke av positiv endring for Quinn.

"De fleste som lever med ALS (også kjent som motorisk nevronsykdom) ender opp med å være lammede og ikke i stand til å kommunisere med annet enn kunstige 'datamaskin' -stemmer, " sier Oskar Westerdal, medstifter av Project Revoice, et initiativ som tar sikte på å hjelpe ALS-pasienter som Quinn.

For å gjenskape Quinns stemme, samarbeidet Project Revoice med Lyrebird, et av en håndfull selskaper som bruker AI for å klone en persons stemme - en gruppe som også inkluderer Googles WaveNet og Voicery, en Y Combinator-støttet oppstart som bruker AI for å lage syntetiserte stemmeopptak.

Hvordan Deep Learning genererer menneskelige stemmer

Bak disse applikasjonene ligger dybdelæringsalgoritmer, en populær gren av AI som gjennomgår store datasett for innsikt og mønstre som ikke kan fanges opp med tradisjonell, regelbasert programvare. Når du trener en dyptlærende stemmesynteser med nok stemmeopptak, lager den en digital modell som representerer personens stemme og kan generere nye stemmeprøver.

Før ankomsten av AI-drevet stemmesynteteknologi måtte ALS-pasienter bruke generiske digitale stemmer som ikke var deres egne. Andre teknologier kunne sy sammen forhåndsinnspilte setninger med pasientens stemme, men resultatene var for kunstige og krevde dusinvis av timer med stemmeopptak for å være minimal bruk.

Dyplæringsapplikasjoner derimot, krever mye mindre data og gir bedre resultater. "Hva Lyrebird kan oppnå med bare et par timer lyd er bemerkelsesverdig - det gir folk en komplett digital stemmeklone, slik at de kan si hva de vil, " sier Westerdal.

Gjenopprette stemmen til en stemmeløs person

En av grensene for dyplæringsapplikasjoner er deres avhengighet av dataprøver av høy kvalitet for å trene nevrale nettverk. Problemet med ALS-pasienter er at når de mister stemmene, er det umulig å spille inn stemmeprøver. Heldigvis hadde Quinn timer med innspilte grunntoner og intervjuer.

"Den største utfordringen var kvalitet. Denne teknologien er helt avhengig av å ha konsistente innspillinger av høy kvalitet som også følger et eksakt manus - så vi måtte jobbe med et lydstudio for å manuelt 'remaster' og transkribere hver dialoglinje vi kunne finne. av Pat, "sier Westerdal.

"Vi var litt redde for at vi ikke ville være i stand til å gi en god kvalitet for å skape Pats stemme, " sier Jose Sotelo, medstifter av Lyrebird. "Siden vi ikke kunne få rene innspillinger, er den endelige kvaliteten på den kunstige stemmen ikke perfekt. Vi tror vi kan gjøre en mye bedre jobb med rene innspillinger."

Resultatene høres fremdeles ut unaturlige og syntetiske ut. Men for Quinn, som hadde brukt en generisk stemme for å kommunisere, var forskjellen dramatisk. "Etter å ha hørt stemmen min gjennom denne nye teknologien, ble jeg blåst bort! For at pasienter skal vite at de kan ha sin egen stemme etter at ALS tar den bort, vil det endre måten folk lever med ALS på, " sier han.

Quinn anbefaler at ALS-pasienter registrerer stemmene sine før det er for sent. "Etter å ha hørt min egen stemme igjen, trenger jeg at ALS-pasienter vet at det er utrolig viktig å spille inn stemmen deres, " sier han.

Balansere de negative bruken av AI-synthesizers

Tidligere i år utløste FakeApp, en AI-drevet ansiktsbytteapplikasjon, et angrep med falske pornografiske videoer med kjendiser og politikere. Det er bekymring for at applikasjoner som FakeApp og Lyrebird vil innlede en ny tid med falske nyheter, svindel og forfalskning.

Etikk-siden på Lyrebird sine nettsider erkjente tidligere at teknologien kan "potensielt ha farlige konsekvenser som villedende diplomater, svindel og mer generelt ethvert annet problem forårsaket av å stjele identiteten til noen andre."

For å drive poenget har selskapets nettsted flere syntetiserte innspillinger som er laget med stemmene til Donald Trump og Barack Obama.

@realDonaldTrump https://t.co/N6DRPdEGPT pic.twitter.com/G30DvmQNdk
- Lyrebird AI (@LyrebirdAi) 4. september 2017

Quinns historie kan bidra til å belyse de positive aspektene ved en industri som har tatt flak for den potensielt skumle og uetiske bruken av applikasjonene. "Det er viktig at folk innser den lyse siden av denne teknologien, " minner Lyrebirds Sotelo.

Bortsett fra medisinsk bruk, kan AI-synthesizer-applikasjoner tjene andre produktive mål. Voicery leverer merker med tilpassede digitaliserte stemmer drevet av AI-algoritmer. Google eksperimenterer også med WaveNet for å gi en mer naturlig opplevelse for brukerne av Google Assistant-drevne enheter. Andre områder der teknologien er nyttig inkluderer å automatisere lydbøker eller gjøre stemme-dubbing i filmer mye enklere.

Etiske og juridiske hindringer vil uten tvil oppstå og debatter vil fortsette. Men for Quinn er AI en styrke for det gode. "Jeg vil ikke høres ut som en datamaskin, " sier han. "Jeg vil høres ut som meg."