Video: HC28-S1: GPUs and HPC Processors (Listopad 2024)
Zatímco většina z nadšení z čipů přišla minulý týden z oznámení společnosti Intel Broadwell, na výroční konferenci Hot Chips se podrobně diskutovalo o řadě dalších čipů, které se většinou zaměřovaly především na čipy určené pro servery a datová centra.
Přehlídka je známá pro špičkové čipy, přičemž Intel, Oracle a IBM diskutují o svých nejnovějších příspěvcích, ale pouze Oracle Sparc M7 byl opravdu nový. Místo toho se většina show soustředila na produkty založené na ARM, včetně prvních podrobností o připravované 64bitové verzi Denveru společnosti Nvidia v procesoru Tegra K1.
Oracle, Intel a IBM se zaměřují na serverové čipy
Z nejmodernějších čipů přicházely nejpůsobivější zprávy od společnosti Oracle, která diskutovala o další generaci procesoru SPARC, známého jako M7. Tento čip bude mít 32 jader SPARC S4 (každé s až osmi dynamickými vlákny), 64 MB vyrovnávací paměti L3, osm řadičů paměti DDR4 (až 2 TB na procesor a 160 GB / s šířku pásma paměti s DDR4-2133) a osm urychlovačů datové analýzy připojených přes síť na čipu.
Čip je uspořádán do osmi klastrů se čtyřmi jádry, z nichž každá má sdílenou mezipaměť L2 a rozdělenou 8 MB mezipaměti L3 s šířkou pásma více než 192 GB / s mezi jádrovým klastrem a jeho místní mezipamětí L3. Ve srovnání s M6 (28nm čip s 12 3, 6GHz SPARC S3 jádry), M7 poskytuje 3-3, 5krát lepší výkon na šířku pásma paměti, celoprůchodovou propustnost, OLTP, Java, systémy ERP a propustnost s pohyblivou řádovou čárkou. Stephen Phillips, vrchní ředitel společnosti Oracle pro architekturu SPARC, uvedl, že cílem je spíše zvýšení výkonu, než přírůstkové zisky.
M7 může škálovat až na 8 soketů bez lepidla (až 256 jader, 2 000 vláken a 16 TB paměti) a pomocí přepínače ASIC spravovat provoz mezi nimi v konfiguraci SMP, až 32 procesorů, takže můžete skončit se systémem s 1024 jádry, 8 192 vlákny a až 64 TB paměti. Docela působivé. Společnost Oracle uvedla, že nabízí 3 až 3, 5krát lepší výkon při různých testech ve srovnání s loňským SPARC M6. Společnost uvedla, že to bude optimalizováno pro vlastní softwarový balík Oracle, vyrobené na 20nm procesu a dostupné v systémech někdy příští rok.
IBM také uvedla více podrobností o své řadě Power8, kterou oznámila na loňské výstavě. Tato verze čipu měla 12 jader, každé s až osmi vlákny s 512 kB SRAM úrovně 2 mezipaměti na jádro (celkem 6 MB L2) a 96 MB sdíleného integrovaného DRAM jako mezipaměť úrovně 3. Tento obrovský čip, který měří 650 čtverečních milimetrů s 4, 2 miliardami tranzistorů, je podle IBM vyráběn na 22nm procesu SOI společnosti IBM a začal dodávat v červnu.
Před několika měsíci IBM oznámila verzi se šesti jádry, která měří 362 mm 2. Letošní diskuse byla o tom, jak může IBM kombinovat dvě ze šesti jádrových verzí do jednoho balíčku se 48 jízdními pruhy PCIe Gen 3. IBM uvedla, že dvoujádrová verze s celkem 24 jádry a 192 vlákny překoná dva procesory Server Xeon Ivy Bridge s 24 jádry (se 48 vlákny). IBM prodává Power většinou na vysoce výkonných a specializovaných trzích, takže většina lidí tyto dva nebude srovnávat, ale je to zajímavé. Ve snaze učinit architekturu Power mainstreamovou společností IBM loni oznámila Open Power Consortium a letos společnost uvedla, že pro platformu má k dispozici kompletní open-source softwarový balík. Zatím však nikdo jiný než IBM neoznámil server založený na platformě.
Intel mluvil o „Ivytown“, serverové verzi Ivy Bridge, která zahrnuje verze Xeon E5 představené před rokem, a Xeon E7 představené v únoru. Letošní přednáška se zaměřila na to, jak má Intel v podstatě jednu architekturu, která může pokrýt oba trhy, s čipy, které umožňují až 15 jader, dva řadiče paměti DDR3, tři QPI propojení a 40 PCI Gen 3 pruhů, které jsou uspořádány v modulární podlaze plán, který lze proměnit ve tři různé formy, z nichž každá je navržena pro různé zásuvky, s celkem více než 75 variantami. To lze použít na dvou-, čtyř- a osmi-soketových serverech bez zvláštního propojení.
Tyto čipy samozřejmě dnes tvoří většinu serverových nákupů, protože společnost Intel představuje velkou většinu serverových jednotek. Ale mnoho informací bylo dříve zahrnuto v ISSCC a Intel se obecně očekává, že představí příští verzi rodiny E5 (E5-1600v3 a E5-2600 v3) velmi brzy, na základě aktualizované verze s využitím varianty Haswellova architektura zvaná Haswell-EP. (Minulý týden společnost Dell oznámila nové pracovní stanice založené na těchto nových čipech.)
Intel také prodiskutoval svůj Atom C2000, známý jako Avoton, který byl uveden do výroby na konci roku 2013. Tento čip a čipy Ivy Bridge a Haswell jsou založeny na 22nm procesu společnosti Intel.
Nvidia, AMD, Applied Micro Aim ve společnosti New Markets for ARM
Největším překvapením přehlídky bylo pravděpodobně zaměření na technologii založenou na ARM, včetně klíčových sdělení od reproduktorů ARM a Nvidia podrobně popisovala svou nadcházející verzi „Denveru“ svého procesoru Tegra K1.
V hlavní řeči, ARM CTO Mike Muller diskutoval o omezeních výkonu ve všem, od senzorů po servery, a zaměřil se na to, jak se ARM pokouší expandovat do podniku. Muller také prosazoval koncept použití senzorových čipů ARM pro internet věcí, téma, které se také ozvalo v klíčové řeči od Roba Chandhoka Qualcomm. Ani jedna společnost však neoznámila nová jádra ani procesory.
Místo toho velká zpráva na této frontě přišla od společnosti Nvidia, která poskytla mnohem více podrobností o nové verzi jeho procesoru K1. Když byl poprvé oznámen projekt společnosti Denver, znělo to, jako by se tento čip měl zaměřit na vysoce výkonný počítačový trh, ale nyní se zdá, že se společnost více zaměřila na věci, jako jsou tablety a automobilový trh. Tegra K1 bude ve dvou verzích. První, který byl ohlášen na začátku tohoto roku a nyní je dodáván v tabletě Shield společnosti, má čtyři 32bitová jádra ARM Cortex-A15 plus nízkoenergetické „doprovodné jádro“ v konfiguraci 4 + 1, kterou Nvidia tlačí její linie Tegra několik let.
Verze Denver je zcela odlišná se dvěma novými patentovanými 64-bitovými jádry navrženými společností Nvidia a společnost skutečně nabízí zvýšení výkonu, které získává. Jádro je sedmimístné superscalar (což znamená, že může provádět až sedm mikrooptik současně) a má 128kB čtyřcestnou L1 instrukční cache a 64KB čtyřcestnou L1 datovou cache. Čip kombinuje dvě z těchto jader spolu s mezipamětí úrovně 2 MB, která slouží oběma jádrům, protože 192 „jader CUDA“ (grafická jádra) sdílí s 32bitovými K1. Představuje tedy velký odklon od architektury 4 + 1.
Jedna velká změna zahrnuje to, co Nvidia nazývá „dynamická optimalizace kódu“, která je navržena tak, aby přijímala často používaný ARM kód a převáděla jej na mikrokód speciálně optimalizovaný pro procesor. Toto je uloženo ve 128 MB mezipaměti (vytesané z tradiční hlavní systémové paměti). Cílem je poskytnout mu provedení provádění mimo objednávku, aniž by bylo třeba tolik energie, jakou tato technika obvykle používá. Koncept není nový - Transmeta to vyzkoušel před lety s čipem Crusoe - ale Nvidia říká, že to nyní funguje výrazně lépe.
Nvidia vykázala několik benchmarků, ve kterých tvrdila, že nový čip může dosáhnout výrazně vyššího výkonu než stávající čtyřjádrové nebo osmjádrové mobilní procesory - konkrétně citovat Qualcomm Snapdragon 800 (MSM8974), Apple A7 (někdy nazývaný Cyclone) používaný v iPhone 5s - a dokonce i některé běžné PC procesory. Společnost Nvidia uvedla, že překonala procesor Atom (Bay Trail) a byla podobná procesoru Intel 1.4GHz s dvoujádrovým procesorem Celeron (Haswell). Mám samozřejmě tendenci brát výkonnostní čísla dodavatele se zrnkem soli: nejenom že prodejci vyberou měřítka, není vůbec jasné, že mluvíme o stejných rychlostech hodin nebo stejném čerpání energie.
Mezitím v čipech zaměřených více na servery hovořil AMD více o svém Opteronu A1100, známém jako „Seattle“. Společnost uvedla, že v současné době vzorkuje a měla by být k dispozici na serverech koncem letošního roku. Tento čip má osm 64bitových procesorových jader Cortex A57; 4 MB vyrovnávací paměti L2 a 8 MB vyrovnávací paměti L3; dva paměťové kanály až pro 128 GB paměti DDR3 nebo DDR4 s opravou chyb; spousta integrovaných I / O (8 pruhů každý z PCIe Gen3 a 6Gbps SATA a dva 10Gbps Ethernet porty); Cortex A5 „systémový řídicí procesor“ pro bezpečné spuštění; a urychlovač pro urychlení šifrování a dešifrování. Vyrábí se na 28nm procesu GlobalFoundries. AMD dosud neuvedla podrobnosti o frekvenci, výkonu nebo výkonu čipu, ale ukázala základní schéma čipu. (výše)
Applied Micro již dlouho prohlašuje, že má na trhu první čip serverů ARM, se svým X-Gene 1 (známým jako Storm) obsahujícím 8 2.4GHZ proprietárních jader ARMv8, čtyři řadiče paměti DDR3, PCIe Gen3 a 6Gbps SATA a 10Gbps Ethernet. Společnost je v současné době ve výrobě na 40nm procesu TSMC.
Na Hot Chips, Applied Micro posunula svůj X-Gene 2 (Shadowcat) design, který bude k dispozici s osmi nebo 16 "vylepšenými" jádry, běží rychlostí 2, 4 až 2, 8 GHz a přidává RoCE (RDMA over Converged Ethernet) Host Adaptér kanálu jako propojení navržený tak, aby umožňoval spojení s nízkým zpožděním mezi klastry mikroskopů. Je navržen pro použití v klastrech, přičemž jediný serverový stojan podporuje až 6 480 vláken a 50 TB paměti, všechny sdílejí jediný fond úložiště. Společnost říká, že X-Gene 2 nabídne o 60 procent lepší celočíselný výkon, dvakrát vyšší výkon než Memcache a asi o 25 procent lepší webový server Apache. Vyrábí se na 28nm procesu a v současné době odebírá vzorky.
Applied Micro říká, že X-Gene 2 vyplňuje mezeru mezi konkurenčními mikroservery (Cavium ThunderX, Intel Atom C2000 „Avoton“ a AMD Opteron A1100 „Seattle“) a servery Xeon v plné velikosti. Poskytl několik podrobností o další generaci, X-Gene 3 (Skylark), která by měla začít vzorkovat příští rok. Tento čip bude mít 16 jader ARMv8 běžících až do 3 GHz a bude vyráběn pomocí technologie 16nm FinFet.