Hjem Fremover tenking Superdatamaskin rangerer stort sett uendret, men sitter tett

Superdatamaskin rangerer stort sett uendret, men sitter tett

Video: SCP-914 The Clockworks | safe | transfiguration / sapient scp (Oktober 2024)

Video: SCP-914 The Clockworks | safe | transfiguration / sapient scp (Oktober 2024)
Anonim

Den siste listen over verdens raskeste superdatamaskiner endret ikke mye, men det årlige Supercomputing-showet (SC14) inneholdt mye diskusjon om nye systemer på listen, i tillegg til flere høyytelsesdataarkningsmeldinger, som nye akseleratorer fra Intel og Nvidia.

Kinas superdatamaskin Tianhe-2, som bruker Intel Xeon-CPUer og Xeon Phi-akseleratorer, forble på førsteplass på Top500-listen med topp ytelse på 54, 9 petaflops (firedoblinger med flytende punktoperasjoner per sekund). I år var faktisk de ni beste systemene identiske med det øverste nye tilskuddet på 10. plass - en uspesifisert amerikansk regjeringssystemmaskin som er en Cray CS-Storm drevet av Intel Xeon E5-2660 v2 CPUer og Nvidia K40 GPUer, koblet via Infiniband.

Lenger nede på listen var det 78 nye systemer, selv om dette til og med er en ny rekordlave. Og totalt sett ser det ut til at vi ser en avmatning i veksttakten for den samlede kraften til de 500 systemene.

Rangeringen til disse systemene er basert på LINPACK-referanseporteføljen, selv om det nå er en rekke anstrengelser for å lage nye benchmarks rettet mot forskjellige typer databehandling. Jeg syntes det var interessant at Horst Simon, redaktør for Top500-listen, sa i en tale på showet at til tross for målet om å nå en ekstern datamaskin - 1 eksaflops per sekund (omtrent 1000 petaflops) - innen 2020, tror han det sannsynligvis vil ta oss til slutten av 2024. Delvis skyldes dette at vi vil trenge mer strømsparende teknikker - for eksempel silisiumfotonikk og 3D-integrasjon og -emballasje - for å holde kraften som trengs for et exascale system ned til 20 megawatt. Dette er store systemer.

Til tross for mangelen på store endringer på toppen, hørte vi et par nye kunngjøringer - spesielt de fra Intel og Nvidia, som kan peke vei mot raskere maskiner.

Nvidia, hvis GPU-er og CUDA-programmeringsspråk virkelig startet bevegelsen mot akseleratorer og koproprosessorer innen databehandling med høy ytelse, var over hele showet med mange systemer. Den tilbyr for øyeblikket K40-akseleratoren og på utstillingen kunngjorde den neste versjonen, Tesla K80, som bruker en dual-GPU-tilnærming for å tilby det firmaet sier er nesten to ganger høyere ytelse og doble minnebåndbredden til forgjengeren.

Nvidia sier at K80 tilbyr 4 992 CUDA-kjerner og 24 megabyte RAM og har en toppkapasitet på 2, 91 teraflops per brett. Det er interessant at K80 er tilgjengelig nå, og at mange av systemprodusentene allerede tilbyr systemer med styret. For eksempel viste Dell frem sine nye PowerEdge C4130-servere, som lar deg få plass til opptil fire Nvidia-akseleratortavler (eller Intel Xeon Phi-akseleratorer) på en 1U-server, med K80-versjonen som tilbyr opptil 7, 2 teraflops i hver boks. Det er bare en gal mengde datakraft i et stativ (selv om en som vil bruke mye energi og trenger mye kjøling).

I mellomtiden kunngjorde Intel at den neste versjonen av sin Xeon Phi-brikke - en versjon kjent som Knight's Landing som de første kommersielle systemene skulle begynne å sende neste år - nå har mer enn 50 kunder som planlegger å bruke den nye prosessorversjonen av delen (hvor Xeon Phi fungerer som systemprosessor) i nye superdatamaskiner. Mange flere systemer bruker coprocessor PCIe-kortversjonen av produktet.

Blant kundene til Knights Landing er Trinity-superdatamaskinen, en felles innsats mellom Los Alamos og Sandia National Laboratories, og Cori-superdatamaskinen, kunngjort av US Department of Energy's (DOE) National Energy Research Scientific Computing (NERSC) Center. Knight's Landing skal visstnok tilby rundt 3 teraflops ytelse, og vil integrere Intels silisiumfotonikkbaserte Omni-Path Fabric-teknologi, som selskapet sa vil tilby 100 Gbps linjehastighet og opptil 56 prosent lavere svitsjestoff-latens enn InfiniBand-alternativer. (Legg merke til at InfiniBand-leverandørene nå også snakker om nye versjoner.)

Intel sa at oppfølgingen, kjent som Knight's Hill, vil bli bygget ved hjelp av Intels 10nm prosessteknologi og bruke neste generasjon av Omni-Path-stoffet. Den vil følge Knights Landing, men den nøyaktige tidspunktet ble ikke offentliggjort.

AMD, som kunngjorde og viste sitt FirePro S9150 enkelt-CPU-kort, som ikke kan bli liggende utenfor ligningen, som den sier kan tilby 2, 53 teraflops ytelse. Dette systemet, som er programmert ved hjelp av OpenCL, leveres allerede.

Faktisk toppet en ny superdatamaskin kalt L-CSC fra GSI Helmholtz Center, basert på S9150 GPU-er og Intel Xeon 2690v2 10-kjerne-prosessorer den nye versjonen av Green500-listen, som viser superdatamaskiner i rekkefølge prosessorkraft per watt. Dette markerte første gang et system var i stand til å overgå 5 gigaflops / watt (milliarder operasjoner per sekund per watt). Merknad på den listen, det andre stedet systemet var Suiren, drevet av PEZY-SC mange-core akseleratorer og Xeon CPUer; mens resten av de ti beste bruker Nvidia Tesla GPUer, som viser rekkevidden til slike systemer.

Det er andre, mer uvanlige alternativer også. Micron viser sin Automata-brikke, egentlig en spesiell sjetong designet for samsvarende mønstre, for bruk i ting som nettverkssikkerhet og genomikk-søk. Dette utvikles til et PCIe 3-brett med 32 brikker og skal etter planen lanseres i første kvartal 2015, i begynnelsen i lave volumer. (Selskapet står også bak Hybrid Memory Cube for neste generasjons minne for slike systemer.) IBM har sin TrueNorth-prosessor, som den håper peker veien for mer "hjernelignende databehandling." NEC jobber med neste generasjon av sin SX-ACE vektorprosessor, som den sier er lettere å programmere enn GPUer. Og selvfølgelig prøver ARM å komme inn i servermarkedet også med at Applied Micros X-Gene1 blir brukt som en prosessor som kobles til forskjellige akseleratorkort.

En rekke leverandører viste nye systemer. I tillegg til Dell-systemet jeg nevnte tidligere, viste Lenovo et vannkjølt dual-prosessorsystem basert en tilpasset Intel Xeon E5-2798A prosessor (med 16 kjerner som kjører opp til 3, 2 GHz), som den sa leverer 1.083 teraflops. Og det sa at neste års Knights Landing Xeon Phi-prosessor vil muliggjøre et "peta-cube" -system som leverer mer enn en petaflop i bare to standard 42U-stativer.

One Stop Servers viste en High Density Compute Accelerator, som bruker PCIe Gen3 for å støtte opptil 16 high-end akseleratortavler fra en enkelt eller flere servere, og selskapet sier at den gir opptil 89, 6 teraflops ved hjelp av Tesla K80-brett. Dette kan fungere med IBMs Power8-prosessor. Huawei viste USAs tilgjengelighet av sin X6800 Data Center Server og en væskekjølt versjon av FusionServer 9000 bladserveren.

For å koble sammen systemer lanserte Obsidian Technologies sitt InfiniCortex-initiativ, designet for å ta en 100 Gigabit InfiniBand-forbindelse over lange avstander. Selskapet kunngjorde støtte fra Singapores Agency for Science, Technology and Research (A * STAR). Og Mellanox viste 100 Gigabit Infiniband som arbeidet over 100 meter via fiber og 8 meter via kobber.

For å lage de største superdatamaskiner, henvender organisasjoner seg vanligvis til selskaper som IBM og Cray for å sette sammen systemene, selv om disse ofte tar mange år å bygge. Crays største kunngjøring av typen på utstillingen var et system på 80 millioner dollar kjent som Shaheen II ved King Abdullah University of Science and Technology i Saudi-Arabia for en Cray XC40, inkludert et Urika-GD-grafikkanalyseapparat.

Og selvfølgelig, like før showet, tildelte DOE IBM (og komponentleverandørene Nvidia og Mellanox) en enorm kontrakt for det som skulle være de to største superdatamaskinene i landet, hver med mer enn 100 petaflops.

Redaktørens merknad: Dette innlegget ble oppdatert 11/26. Tianhe-2 har en toppytelse på 54, 9 petaflops, ikke teraflops.

Superdatamaskin rangerer stort sett uendret, men sitter tett