Hjem Fremover tenking Intel ser en utvidende rolle for fpgas, heterogen databehandling

Intel ser en utvidende rolle for fpgas, heterogen databehandling

Video: TornadoVM: Java for GPUs and FPGAs (Oktober 2024)

Video: TornadoVM: Java for GPUs and FPGAs (Oktober 2024)
Anonim

Mye av den interessante prosessordiskusjonen har i det siste dreid seg om å bruke forskjellige typer brikker og kjerner, i motsetning til de generelle beregningskjernene som er vanlige i konvensjonelle CPU-er. Vi har sett mange forskjellige kombinasjoner av brikker som brukes til bestemte dataoppgaver, inkludert CPUer, GPU-er, DSP-er, tilpassede ASICS og feltprogrammerbare gate-arrays (FPGs), og i økende grad ser vi applikasjoner som kombinerer aspekter av alle disse, noen ganger i et system og noen ganger i en enkelt brikke.

Til og med Intel - lenge tilhenger av generelle beregningskjerner som doblet hastighet hvert par år - har kommet i gang med kjøpet av Altera, en av de ledende FPGA-produsentene. Nylig hadde jeg en mulighet til å snakke med Dan McNamara, daglig leder i Intels Programmable Solutions Group (PSG) - som en gang var kjent som Altera - som kastet litt lys over Intels planer på dette området og ga mer detalj om selskapets planer for tilkobling forskjellige typer kjerner og forskjellige dør sammen i høyhastighetsbrikkepakker.

"Verden går heterogen, " sa McNamara og la merke til at det nå er en vanlig erkjennelse av at du ikke kan løse alle problemer med kjerner til generell bruk. Tilpassede ASIC-er - for eksempel Googles Tensor-prosesseringsenheter eller TPU-er kan akselerere visse typer funksjoner langt utover tradisjonelle CPUS eller GPU-er, men disse tar lang tid å lage. I motsetning, sa han, gir FPGAs mulighet for tilpassbar kode som gir mye av ytelsesfordelene til ASIC-er uten å vente i to år på chipdesign og produksjon. En utvikler kan endre algoritmer i en FPGA umiddelbart, mens en CPU, GPU eller tilpasset brikke fungerer på en fast måte.

McNamara sa også at FPGA-er er veldig lite-latens og kan være svært parallelle, med forskjellige deler av en brikke som fungerer samtidig på applikasjoner som bildebehandling eller kommunikasjon.

Intel sender nå Arria 10 FPGA, produsert på TSMCs 20nm-prosess, og tilbyr en pakke som kombinerer en Xeon (Broadwell) prosessor og Arria 10. Dette er i bruk i applikasjoner som søk på web og skala. McNamara sa at FPGA-er kunne akselerere søket med opptil 10 ganger og bemerket at Microsoft har vært offentlig om å bruke slike FPGA-er for å fremskynde søket.

Et stort forbedringsområde i det siste har vært å lage raskere flisjakkpakker som kan kombinere brikkedyser laget på forskjellige prosesser og kanskje fra forskjellige produsenter. Disse inkluderer pakker som inneholder en CPU og en FPGA, for eksempel Xeon / Arria-kombinasjonen; en FPGA med forskjellige transceivere, som i Intels Stratix 10 FPGA; eller til og med forskjellige deler av en full CPU, slik Intel beskrev i sin nylige teknologi og produksjonsdag.

Intel har laget en ny teknologi kalt embedded multi-chip interconnect bridge (EMIB) for å gjøre dette, som debuterte i Stratix 10. I EMIB blir kjernedysen opprettet på Intels 14nm-prosess og sendere på TSMCs 16nm-prosess.

Totalt sett sa McNamara at flere områder går mot å ta i bruk flere FPGA-er ved bruk av slik emballasje. Han snakket om hyperskala nettsteder, som ser etterspørsel raskt endre seg og hvor en FPGA / CPU-kombinasjon kan fungere bra på områder som søk, analyse og videostreaming, samt nettverkstransformasjon, der trender som programvaredefinert nettverk og nettverksfunksjoner virtualisering driver behov for mer pakkebehandling. Andre fokusområder inkluderer 5G og trådløse applikasjoner, autonom kjøring og kunstig intelligens (AI) applikasjoner. I AI sa McNamara at optimaliserte ASIC-er og rå datamaskinkraft kan være best for trening (Intel har kjøpt Nervana), men at FPGA-er ofte er best på inferanse, på grunn av deres fleksibilitet og lave latenstid, og bemerket at ZTE brukte Arria 10s til viser veldig imponerende skårer for bildegjenkjenning.

Personlig er jeg nysgjerrig på om fremtidige CPU-er virkelig vil ta forskjellige komponenter og blande og matche dem ved å bruke EMIB eller en lignende teknologi for å endre det vi tenker på som en prosessorbrikke. Jeg er fascinert av ideen om at fremtidens systemer kan bruke mange forskjellige kjerner - noen programmerbare (FPGA) og noen faste (en blanding av både tilpassede ASIC-er og tradisjonelle CPUer og GPU-er) for å gjøre ting sammen som forbedrer hva som helst teknologi kan gjøre på egen hånd.

Intel ser en utvidende rolle for fpgas, heterogen databehandling