Video: I Paid 5 Internet Architecture Artists To Photoshop My Sketch (Listopad 2024)
V posledních letech jsme viděli některé zajímavé nové přístupy k vysoce výkonným výpočetním prostředkům, zejména posun od tradičních velkých procesorů a směrem ke shlukům procesorů x86 s urychlovači nebo koprocesory, aby se zrychlily konkrétní druhy výpočtů. Vycházíme z minulého týdne superpočítačové show a viděli jsme, jak se Intel snaží integrovat svůj koprocesor Xeon Phi s tradičním serverovým procesorem Xeon, aby se usnadnilo programování; Nvidia představuje novou verzi svého urychlovače Tesla GPU; a Micron podporující velmi odlišný druh procesoru pro ještě specializovanější výpočetní techniku. A to vše se dělo v době, kdy akcelerátory a koprocesory začínají ovládat seznam 500 nejrychlejších počítačů na světě, což vede některé odborníky k tomu, aby navrhli, aby stávající standardy těmto procesorům přisoudily příliš velkou váhu.
Nvidia vychvalovala své úspěchy svými deskami akcelerátoru Tesla, velkými shluky GPU připojenými k hlavním procesorům od Intelu nebo AMD. Tyto čipy se používají v celé řadě systémů, včetně systému Titan v Národní laboratoři Oak Ridge a nového systému Piz Daint ve Švýcarském národním superpočítačovém výpočetním centru. Ještě zajímavější je, že společnost říká, že desky Tesla jsou ve všech 10 nejlepších systémech na nejnovějším seznamu Green 500, který patří mezi energeticky nejúčinnější superpočítače na světě. Všechny tyto systémy také používají Intel Xeons s výjimkou Titanu založeného na AMD Opteron, který je druhým nejrychlejším systémem na světě v žebříčku Top 500, ale na seznamu Green 500 je mnohem nižší.
Společnost Nvidia navíc oznámila partnerství s IBM s cílem nabídnout své urychlovače Tesla v systémech založených na architektuře IBM Power. IBM dlouhodobě nabízel svůj sériový výkon a jeho BlueGene / Q systém založený na procesorech Power provozuje mimo jiné Sequoia systém v Lawrence Livermore National Laboratory a systém Mira v Argonne National Laboratory. Společná spolupráce společností IBM a Nvidia by měla v budoucnu vyústit v některé zajímavé systémy.
Na výstavě společnost oznámila svou Tesla K40, další generaci své desky akcelerátoru GPU. Společnost uvedla, že nabídne 1, 4 teraflopy s dvojnásobnou přesností, 12 GB paměti (šířka pásma 288 GB / s) a funkci GPU Boost, která jí umožňuje v některých situacích pracovat rychleji. Jedná se o upgrade ze stávající řady Tesla K20 pomocí stejného základního designu GPU vyrobeného na technologii 28nm.
Mezi další iniciativy patří způsoby, jak usnadnit programování GPU, včetně CUDA 6, která nyní podporuje sjednocenou paměť, umožňující vývojářům přistupovat k paměti jako jeden fond, přestože CPU a GPU paměť zůstávají oddělené. Společnost také podporuje OpenACC, standardní sbírku direktiv překladačů, které systému říkají, které části programu (napsané v C / C ++ a Fortran) lze z CPU na akcelerátor vyložit, aby se zvýšil výkon.
Přístup společnosti Intel, který nazývá svou architekturou Mnoho integrovaného jádra (MIC), je velmi odlišný. Kombinuje několik malých jader x86 do jednoho čipu zvaného Xeon Phi. V posledních několika letech společnost Intel vychvalovala skutečnost, že je to všechno x86, což usnadňuje programování, i když je zřejmé, že vývojáři se stále musí zaměřit na architekturu přímo. Současná verze Xeon Phi, zvaná Knights Corner, je navržena pro použití jako akcelerátor spolu s tradičními Xeon E serverovými čipy, a používá ji celá řada špičkových systémů, včetně čínského Tianhe-2 (v současné době nejrychlejší systém) na světě) a systém Stampede v Advanced Computing Center na University of Texas.
Na výstavě společnost Intel oznámila novou verzi s názvem Knights Landing, která bude fungovat také jako samostatný procesor, který se vejde do standardní architektury stojanu a bude přímo spouštět operační systém, aniž by vyžadoval hostitelský procesor (například Xeon E). To by mohlo být docela důležité při rozšiřování přitažlivosti Xeon Phi, zejména na trhu pracovních stanic. Znovu je to navrženo tak, aby vývojářům softwaru usnadnilo prohlížení jako jeden procesor. Knights Landing bude k dispozici jako samostatný procesor i jako deska PCI Express, která se vejde do stávajících systémů jako upgrade z Knights Corner.
Existují i další významné změny v rytířském přistání, včetně přidání „téměř paměti“, efektivně DRAM, který je nabízen na balíčku s procesorem a může tak přinést mnohem větší šířku pásma než tradiční paměť DDR, která je omezena rychlostí autobus. (To se také zrychluje, ale ne zdaleka tolik.) Toto není první krok tímto směrem; Společnost IBM již léta nabízí vestavěné DRAM ve své architektuře napájení a Intel sám uvádí vestavěné DRAM pro grafiku do verzí Iris Pro své rodiny Haswell Core. Přesto se domnívám, že v následujících letech uvidíme mnohem více úsilí tímto směrem.
Mezitím jeden z nejzajímavějších nových přístupů pochází od společnosti Micron, která oznámila nový akcelerátor nazvaný Automata Processor, který byl navržen převážně pro řešení složitých nestrukturovaných datových problémů.
Micron to popsal jako nabídku textilie složené z desítek tisíc až milionů zpracovatelských prvků připojených k řešení konkrétních úkolů. Společnost, jeden z největších výrobců paměti DRAM a NAND, říká, že toto bude používat zpracování založené na paměti k řešení složitých výpočetních problémů v oblastech, jako je zabezpečení sítě, bioinformatika, zpracování obrazu a analytika. Společnost Micron zpočátku distribuuje automatový procesor na desce PCI-Express, aby s ním vývojáři mohli pracovat, ale společnost plánuje prodat procesory na standardních paměťových modulech známých jako DIMM nebo jako jednotlivé čipy pro vestavěné systémy. V některých ohledech to zní podobně jako pole programovatelná hradlová pole (FPGA), která jsou vyladěna tak, aby řešila konkrétní aplikace zahrnující porovnávání vzorů.
Společnost uvedla, že spolupracuje s Georgia Tech, University of Missouri a University of Virginia na vývoji nových aplikací pro Automatu. Přestože společnost neoznámila datum finálních produktů, předpokládá se, že příští rok vyjde sada pro vývoj softwaru spolu se simulačními nástroji.
Automaty zní jako nedokončená práce a je pravděpodobně příliš brzy vědět, jak široké jsou aplikace, ale je to zajímavý přístup.
Celkově vidíme vývoj vysoce výkonných počítačových systémů. Není to tak mnoho let, nejrychlejší počítače byly většinou jen obrovské množství standardních serverových procesorů. Systémy IBM Blue Gene a systémy založené na Sparcu (například počítač K v RIKEN Advanced Institute for Computational Science v Japonsku, který používá procesory Fujitsu Sparc) stále představují velkou část trhu, včetně pěti z 10 nejrychlejších systémy na světě. V posledních letech se však hybnost posunula směrem k koprocesoru, přičemž systémy využívající Tesla a nověji akcelerátory Xeon Phi tvoří více novějších systémů. Se zlepšením těchto systémů, novým partnerství, lepším softwarem a některými novými přístupy se trh superpočítačů může v budoucnosti velmi lišit.