Včerejší zpráva, že čínský superpočítač Tianhe-2 je nyní nejrychlejší na světě, není tak šokující. Koneckonců, starší verze byla na vrcholu seznamu superpočítačů již v roce 2010.
O něco překvapivější je architektura za Tianhe-2 (známá také jako Mléčná dráha-2). Je založen na nové architektuře Intel Xeon Phi, která kombinuje velké množství jader x86 do jediného čipu; superpočítač kombinuje tyto čipy do jediné architektury. Neočekávalo se, že tento systém bude nasazen dalších pár let, takže jsem byl překvapen, když jsem na vrcholu seznamu viděl systém založený na Xeon Phi. To, co je pro mě nejzajímavější, je konkurence se systémy založenými hlavně na počítačích GPU. Systém založený na jádrech CUDA GPU společnosti Nvidia, který byl naposledy na seznamu, je nyní na druhém místě.
Seznam nejlepších 500 nejrychlejších počítačů na světě obvykle vychází dvakrát ročně: jednou ve spojení s Mezinárodní superpočítačovou konferencí (ISC), která se děje nyní v Německu a znovu na superpočítačové konferenci (SC 13) na podzim.
Tianhe-2, který sídlí na Národní univerzitě obranné technologie v čínské Čchang-še, vykazuje trvalý výkon více než 33, 8 petaflop (více než 17 500 bilionů operací s pohyblivou řádovou čárkou za sekundu) a špičkový výkon 54, 9 petaflop v benchmarku LINPACK. Díky tomu je asi dvakrát rychlejší než předchozí vůdce, systém Titan založený na Národní laboratoři dubové vyvýšeniny amerického ministerstva energetiky (ORNL). Tianhe-2 má 16 000 uzlů, každý se dvěma procesory Intel Xeon E5-2692 (12jádrové procesory využívající Ivy Bridge) a tři procesory Xeon Phi pro celkový počet 3 120 000 výpočetních jader. Jádra Xeon jsou založena na připravované 12jádrové verzi rodiny Xeon # 5-2600, která je založena na 22nm architektuře Ivy Bridge. Celkový systém čerpá 17, 8 MW, což je většina ze všech nejlepších systémů na seznamu 500 nejlepších, ale protože čísla výkonu jsou tak vysoká, je stále považována za relativně energeticky účinnou. Červenový seznam nejúčinnějších superpočítačů, Green500, bude brzy uveden.
Titanový systém ORNL, který překonal předchozí seznam, je nyní na druhém místě. Toto je založeno na systému Cray XK7 s 18 688 uzly, z nichž každý obsahuje 16jádrový procesor AMD Opteron 6274 a akcelerátor grafické karty Nvidia Tesla K20x (GPU). Tento systém vykazuje trvalý výkon 17, 5 petaflop (více než 17 500 bilionů operací s pohyblivou řádovou čárkou za sekundu) a špičkový výkon více než 27 petaflop v benchmarku LINPACK. Systém Sequoia v Lawrence Livermore National Laboratory, založený na systému BlueGene / Q společnosti IBM a jeho výkonových procesorech, byl před rokem na druhém místě v seznamu Top500, ale posunul se na třetí místo. Čtvrtým místem zůstává systém „K computer“ v japonském RIKEN Advanced Institute for Computational Science založeném na procesorech Fujitsu SPARC64.
První čtyři systémy ukazují čtyři velmi odlišné architektury. Tradiční velké železné systémy, jako jsou systémy založené na architekturách IBM BlueGene (Power) a Fujitsu SPARC, jsou stále v provozu, ale většina pozornosti bude věnována nové architektuře Xeon Phi společnosti Intel a architektuře NUDia CUDA. Mezitím stále existují příběhy o tom, že Čína pracuje na vytvoření vlastního procesoru pro superpočítač.
V detailu Nvidia včera oznámila, že vědci na Stanfordské univerzitě používají GPU k vytvoření největší umělé neuronové sítě na světě, která má modelovat, jak se lidský mozek učí. Také odhalil, že jeho sada nástrojů CUDA bude nyní podporovat platformy založené na ARM.
V rámci superpočítačové konference představila společnost Intel také nové verze své rodiny koprocesorů Xeon Phi, včetně 7100 s 61 jádry taktovanými na 1, 23 GHz, 16 GB podpory kapacity paměti a více než 1, 2 TFlopy s dvojnásobnou přesností; rodina Xeon Phi 3100 s 57 jádry taktovanými na 1, 1 GHz a 1TFlopy s dvojitým přesným výkonem; a nový 5100D, navržený tak, aby se zásuvky mohly připevnit k mini-desce pro použití ve faktorech tvaru čepele. Intel říká, že příští generace, známá jako „Knights Landing“ a založená na nadcházející technologii 14nm, bude fungovat nejen jako koprocesor, ale také jako primární procesor, čímž se odstraní složitost přesunu dat do různých oblastí paměti. Tím se integruje paměť na balíčku a zrychlí se výkon.
Intel nazývá kombinaci tradičních procesorů Xeon a Xeon Phi „neo-heterogenní architekturou“. Hardwarová architektura má několik tříd výpočetních schopností, ke kterým má přístup společný programovací model. Společnost zdůrazňuje, že jelikož je to všechno x86, které by mohlo zefektivnit vývoj a optimalizaci způsoby, které by byly při použití kombinace procesorů a urychlovačů GPU těžší. Nvidia a další společnosti prosazující výpočet GPU by s tímto hodnocením nesouhlasily.
Intel také hovořil o používání vysoce výkonných výpočetních prostředků nejen pro tradiční použití, jako je vládní a vojenský výzkum a špičkové komerční aplikace, jako je simulace ropy a plynu, ale také pro aplikace, jako jsou velká data. Cílem je učinit superpočítač běžnějším.
Podívejte se na úplný seznam superpočítačů Top500 zde.