Domov Myslet dopředu Velké změny jsou konečně na obzoru pro superpočítače

Velké změny jsou konečně na obzoru pro superpočítače

2024

Video: PŘEZKUM DRUHÉ OBJEDNÁVKY Z katalogu Oriflame č. 16-2020 (Listopad 2024)

Při pohledu zpět na superpočítačovou konferenci ISC 17 z tohoto týdne to vypadá, že v superpočítačovém světě se v příštích několika letech objeví nějaké velké vylepšení, ale aktualizace dvouletého seznamu 500 nejrychlejších superpočítačů na světě se příliš nelišila od předchozí verze.

Nejrychlejšími počítači na světě jsou i nadále dva masivní čínské stroje, které si po několik let udržely nejvyšší příčku: počítač Sunway TaihuLight z čínského národního superpočítačového centra ve Wuxi, s trvalým výkonem Linpack více než 93 petaflop (93 tisíc bilionů bodů s pohyblivou řádovou čárkou) operace za sekundu); a počítač Tianhe-2 z čínského Národního superpočítačového centra v Guangzhou, s trvalým výkonem více než 33, 8 petaflop. Tito zůstanou nejrychlejšími stroji s obrovským rozpětím.

Nové číslo tři je systém Piz Daint ze Švýcarského národního superpočítačového centra, systému Cray, který využívá Intel Xeons a Nvidia Tesla P100s, která byla nedávno upgradována, aby získala Linpack trvalý výkon 19, 6 petaflopsů, což je dvojnásobek předchozí hodnoty. To ji posunulo nahoru z čísla osm na seznamu.

Tím se sníží nejvyšší americký systém - systém Titan v Oak Ridge National Laboratory - až na čtvrté místo, což je poprvé za dvacet let, že v prvních třech letech není žádný americký systém. Zbytek seznamu zůstává nezměněn, přičemž USA stále představují pět z deseti nejlepších celkově a Japonsko dva.

I když nejrychlejší seznam počítačů se příliš nezměnil, jinde jsou velké změny. Na seznamu Zelených 500 nejúčinnějších systémů se změnilo devět z prvních deseti. Nahoře je systém Tsubame 3.0, modifikovaný systém HPE ICE XA v Tokijském technologickém institutu založený na jádru Xeon E5-2680v4 14, propojení Omni-Path a Tesla P100 Nvidia, což umožňuje 14, 1 gigaflopy na watt. Jedná se o obrovský skok z DGX Saturn V Nvidia, založený na platformě DGX-1 firmy a čipy P100, které byly v listopadu seznamu číslo jedna, ale tentokrát číslo 10, na 9, 5 gigaflops / Watt. P100 je v devíti z deseti nejlepších systémů Green500.

Rozbití 10 gigaflops / watt je velký problém, protože to znamená, že hypotetický exaflopový systém postavený pomocí dnešní technologie by spotřeboval pod 100 megawattů (MW). To je stále příliš - cílem je 20 - 30 MW pro exaflop systém, který vědci doufají, že uvidíme v příštích pěti letech - ale je to obrovský krok vpřed.

Stejně jako seznam 500 nejlepších došlo v podobných seznamech k různým benchmarkům pouze k drobným změnám, jako je benchmark HPCG (High Performance Conjugate Gradients), kde stroje mají tendenci vidět pouze 1-10 procent svého teoretického špičkového výkonu a kde jsou nejvyšší systém - v tomto případě stroj Riken K - stále dodává méně než 1 petaflop. Oba systémy TaihuLight a Piz Daint se v tomto seznamu posunuly nahoru. Když vědci hovoří o exaflopovém stroji, mají sklon znamenat benchmark Linpack, ale HPCG může být realističtější z hlediska výkonu v reálném světě.

Vývoj GPU jako urychlovače - téměř vždy pomocí procesorů Nvidia GPU, jako je P100 - byl v posledních letech nejviditelnější změnou na těchto seznamech, následovalo zavedení vlastního akcelerátoru Intel, mnohojádrového Xeon Phi (včetně nejnovější verze rytířských vykládek). Aktuální seznam 500 nejlepších zahrnuje 91 systémů, které používají akcelerátory nebo koprocesory, včetně 74 s GPU Nvidia a 17 s Xeon Phi (další tři používají oba); jeden s GPD AMD Radeon jako urychlovač a dva, které používají mnohojádrový procesor od PEZY Computing, japonského dodavatele. Dalších 13 systémů nyní používá Xeon Phi (Knights Landing) jako hlavní jednotku zpracování.

Ale mnoho z větších změn superpočítačů je stále na obzoru, když začneme vidět větší systémy navržené s ohledem na tyto koncepty. Jedním z příkladů je nové MareNostrum 4 v barcelonském superpočítačovém centru, které vstoupilo do seznamu 500 nejlepších na čísle 13. Toto je systém Lenovo, založený na připravované verzi Xeon Skylake-SP (oficiálně Xeon Platinum 8160 24). -core procesor). Zajímavé jsou zde tři nové klastry „vznikající technologie“ plánované na příštích pár let, včetně jednoho klastru s procesory IBM Power 9 a GPU Nvidia, které jsou navrženy tak, aby měly špičkové zpracování přes 1, 5 Petaflops; druhý založený na verzi rytířských kopců Xeon Phi; a třetí založený na 64bitových procesorech ARMv8 navržených společností Fujitsu.

Tyto koncepty se používají v řadě dalších velkých superpočítačových projektů, zejména v několika sponzorovaných ministerstvem energetiky USA jako součást jeho CORAL Collaboration v Oak Ridge, Argonne a Lawrence Livermore National Labs. Nejprve by měl být Summit v Oak Ridge, který bude používat procesory IBM Power 9 a GPU Nvidia Volta, a měl by být dodáván přes 150 až 300 špičkových petaflop; následuje Sierra na Lawrence Livermore, kritizovaný dodávat přes 100 špičkových petaflop.

Pak bychom měli vidět superpočítač Aurora v Argonne National Laboratory, založený na verzi rytířských kopců Xeon Phi a postavené Crayem, který je navržen tak, aby dodal 180 špičkových petaflop. Systémy CORAL by měly být aktivní a běh příští rok.

Mezitím čínské a japonské skupiny plánovaly také upgrady, většinou s využitím jedinečných architektur. Mělo by být zajímavé sledovat.

Ještě větší posun se zdá být jen o kousek dál: posun směrem ke strojovému učení, obvykle na masivně paralelních procesorových jednotkách uvnitř samotného procesoru. Zatímco číslo Linpack odkazuje na 64bitový nebo dvojitý přesný výkon, existují třídy aplikací - včetně mnoha aplikací založených na hluboké neuronové síti -, které lépe fungují s výpočty s jednoduchou nebo dokonce poloviční přesností. Využívají to noví zpracovatelé, například nedávné oznámení společnosti Volta V100 od společnosti Nvidia a připravovaná verze Xeon Phi v Knights Mill. Na výstavě Intel uvedl, že verze, která má být ve výrobě ve čtvrtém čtvrtletí, by měla nové instrukční sady pro „výpočet s nízkou přesností“ nazvaný Quad Fused Multiply Add (QFMA) a Quad Virtual Neural Network Instruction (QVNNI).

Předpokládám, že tyto koncepty by mohly být aplikovány i na jiné architektury, jako jsou TPU společnosti Google nebo FPGA společnosti Intel a čipy Nervana.

I když tento rok nevidíme velké změny, příští rok bychom měli očekávat více. Koncept stroje exascale (1 000 teraflop) je stále v dohledu, i když pravděpodobně bude zahrnovat řadu ještě větších změn.