Hjem Fremover tenking Supercomputing 17 har noen overraskelser, antydninger for fremtiden

Supercomputing 17 har noen overraskelser, antydninger for fremtiden

Video: Janice Murray, Statpedkonferansen (Oktober 2024)

Video: Janice Murray, Statpedkonferansen (Oktober 2024)
Anonim

Det var noen overraskelser på denne månedens Supercomputing 17-konferanse, inkludert en veldig god visning for PEZY-SC2-akseleratoren, samt Intels retningsendring for sin Xeon Phi-linje. I tillegg så vi også de første systemene som er bygd på Intels Xeon Scalable Processor (Skylake) og de første med Nvidias Volta-akselerator.

Men kanskje mest bemerkelsesverdig er nyheten om at kinesiske systemer nå står for 202 av de 500 superdatamaskinene på den nyeste Topp 500-listen sammenlignet med bare 143 fra USA. Amerikanske systemer har dominert listen siden oppstarten for 25 år siden, og for bare noen måneder siden hadde USA 169 systemer til Kinas 160. Det samme er tilfelle når det gjelder samlet ytelse, med de kinesiske systemene til sammen utgjør 35, 4 prosent av den totale ytelsen til Top 500-systemer.

De raskeste datamaskinene i verden fortsetter å være de to massive kinesiske maskinene som har toppet listen i flere år nå: Sunway TaihuLight, fra Kinas National Supercomputing Center i Wuxi, med vedvarende Linpack-ytelse på mer enn 93 petaflops (93 tusen billioner flytende punkt operasjoner per sekund), og Tianhe-2, fra Kinas National Super Computer Center i Guangzhou, med vedvarende ytelse på mer enn 33, 8 petaflops. Disse forblir de raskeste maskinene, og med enorm margin. Piz Daint-systemet fra Swiss National Supercomputing Center, et Cray-system som bruker Intel Xeons og Nvidia Tesla P100s, holdt tredjeplassen med Linpack vedvarende ytelse på 19, 6 petaflops.

Den største endringen på toppen er et nytt system på fjerdeplass: en oppgradert versjon av Gyoukou-superdatamaskinen, et ZettaScaler-2.2-system distribuert hos Japans byrå for marin-jordvitenskap og teknologi. Denne maskinen bruker PEZY-SC2-akseleratorer, en andre generasjons 2048-kjerne-brikke som gir en toppytelse på 4.096 teraflops i dobbel presisjon, så vel som konvensjonelle Intel Xeon-prosessorer, for totalt 19 860 000 kjerner. (En tidligere ZettaScaler-maskin med PEZY-SC2 gjorde listen på et lavere nivå på juni-versjonen). Det gir det høyeste antallet kjerner som brukes sammen - også kjent som det høyeste nivået av samtidighet - hittil sett overgår TaihuLight, som har 10, 6 millioner kjerner. Gyoukou-maskinen oppnådde en Linpack vedvarende ytelse på 19, 14 petaflops, men det interessante er at den bruker 1, 35 megawatt kraft, sammenlignet med 2, 27 megawatt for PizDaint, 17, 8 megawatt for Tinahe-2 og 15, 4 megawatt for Taihulight. Det er fortsatt mye strøm, men det er en stor reduksjon sammenlignet med de andre systemene og en sterk indikasjon på at strømproblemer er viktige, selv for de raskeste maskinene i verden. Det er også verdt å merke seg at dette viser hvordan nye arkitekturer kan redusere krafttrekk dramatisk.

Det øverste amerikanske systemet forblir Titan-superdatamaskinen på Oak Ridge National Laboratory, et fem år gammelt system som bruker Nvidia K20x GPU-akseleratorer og leverer 17.59 petaflops, som nå ligger på femteplass på listen.

I den siste Green 500-listen over de mest energieffektive superdatamaskinene, gikk fire av de fem øverste sporene - inkludert de tre beste - til nylig installerte japanske systemer, alle basert på ZettaScaler-2.2-arkitekturen og PEZY-SC2-akseleratoren. Den mest effektive av disse er Shoubu System B, som er installert på RIKENs Advanced Center for Computing and Communication. Shoubu System B oppnådde 17, 0 gigaflops / watt; Shoubu System B og de to neste systemene, som bruker henholdsvis 16, 8 og 16, 7 gigaflops / watt, er alle i den nederste halvdelen av Topp 500-listen. Det femte systemet på den grønne rangeringen er Gyoukou-systemet nevnt ovenfor - nummer fire-systemet på Topp 500-listen, med 14, 2 gigaflops / watt.

Dette er store gjennombrudd for PEZY-SC2-akseleratoren, og kan peke på fremtidige retninger for superdataarkitekturer.

Den fjerde grønneste superdatamaskinen er Nvidias interne DGX SaturnV Volta-system, som oppnådde 15, 1 gigaflops / watt, og kommer på 149 på topp 500-listen. Dette systemet har 22.440 Volta-kjerner (som ser ut til å telles på en noe annen måte på listen enn noen av de andre kjernene.) Nvidia har hatt et veldig godt år for gasspedalen, og har store forhåpninger om flere maskiner som bruker Volta GPU-arkitektur.

Som vanlig krøllet de største leverandørene om suksessene sine på listen, med Intel som la merke til at CPU-ene var i seks av de ti beste systemene og en rekordhøyde på 471 av 500 systemer. Intel bemerket også at de nye Xeon skalerbare prosessorene var i 18 superdatamaskiner med over 25 petaflops ytelse. Men det som kan være mer bemerkelsesverdig er at Intel sa at det avlyser Knights Hill, den planlagte 10nm-etterfølgeren til 14nm Knights Landing Xeon Phi-prosessor. Selskapet sa at det nå planlegger en ny plattform for eksascale systemer (1 000 petaflops) innen 2021, men røper ikke noen detaljer.

Nvidia la vekt på at det hadde 34 nye systemer med akseleratorene på listen, noe som ga selskapets totalsum til 87. Nvidia og partner IBM krøpet om muligheten for at den neste listen skal komme i juni, Summit-maskinen på Oak Ridge National Laboratory (ORNL) skal være blant maskinene øverst på listen. Denne maskinen har 4600 noder, hver med to IBM Power 9-base-CPUer og 6 Nvidia Volta-akseleratorer, med en anslått ytelse på rundt 200 petaflops. Dette skiller seg fra Nvidias interne løsning, ved at CPUene og GPU-ene alle kommuniserer over NVLink 2.0 på en cache-koherent måte ved hjelp av OpenCAPI, slik at GPU-ene kan få direkte tilgang til hovedsystem RAM. Toppmøtet blir fulgt av Sierra-maskinen på Lawrence Livermore National Laboratory, og av AI Bridging Cloud Infrastructure (ABCI) -maskin i Japan.

Jeg var interessert i å høre Cray kunngjøre en "produksjonsklar" superdatamaskin basert på Cavium ThunderX2-prosessoren på 64-biters Armv8-A-arkitekturen, nå tilgjengelig som en del av XC50-superdatamaskinen. ARM-baserte maskiner testes på Barcelona Supercomputer Center (hvis Mare Nostrum-maskin nå ligger på nummer 16 på topp 500-listen), samt "Post-K" superdatamaskinen i Japan og Isambard supercomputer i Storbritannia. Cavium hadde noen tidlige benchmarks på ThunderX2, som viste at 14nm-brikken hadde en bedre ytelse på flertrådede eller minnebundne applikasjoner enn Intels Skylake Xeons, selv om Intel fortsatt er ledende innen enkeltrådede og i rå teraflops. Merk at Qualcomm, i tillegg til Cavium-designen, også har kunngjort en ARM-basert serverbrikke kalt Centriq.

I andre prosessornyheter kunngjorde AMD at de hadde satt i verk produksjonen av Epyc-prosessorene, selv om disse ennå ikke er i noen Top 500-systemer, mens NEC kunngjorde versjoner av Vector Engine PCIe-akseleratorkortet for sin nye SX-Aurora TSUBASA superdatamaskin-serie, som har en spesielt rask minnebåndbredde.

På sammenkoblingssiden sa Mellanox at 77 prosent av de nye systemene på Topp 500-listen bruker InfiniBand, mens Intel spionerer de nylige suksessene med Omni-Path Architecture, som mest brukes i sine Xeon Scalable Processor (Skylake) systemer. I mellomtiden ser en rekke leverandører til Gen-Z, designet for å være en mindre latens, minnesentrisk tilnærming for svært høyhastighetsforbindelser mellom datamaskin og minne / lagringsenheter.

Det er også interessant å merke seg at for første gang kjører alle maskinene på Top 500 nå Linux.

Mellom det sterke førsteinntrykket fra PEZY-SC2, Intels beslutning om å dumpe Knights Mill for en ny arkitektur, Nvidias Volta, og ny konkurranse fra AMD, ARM-leverandører og NEC, er nå en spennende tid i superdatamiljøen. Neste års lister bør være ganske interessante, da vi ser hvilke arkitekturer som virkelig utfører, og hvilke som er mest effektive, ettersom mange av leverandørene og superdataartene prøver å posisjonere seg i løpet for å produsere en exascale (1000 petaflop) datamaskin med en sub -20 megawatt effekttrekning.

Er du nysgjerrig på bredbåndets internetthastighet? Test det nå!

Supercomputing 17 har noen overraskelser, antydninger for fremtiden