7 Minuty
Samsung se už připravuje na další zvýšení výkonu pamětí: po uvedení svého prvního HBM4 na SEDEX 2025 plánuje společnost na ISSCC 2026 představit výrazně rychlejší variantu HBM4. Níže shrnujeme, co o navýšení rychlosti víme, jaké inženýrské změny za tím stojí a proč to bude důležité pro umělou inteligenci (AI) a výpočetní systémy s vysokým výkonem (HPC).
Velký skok v propustnosti: z 2,4 TB/s na 3,3 TB/s
Na SEDEXu minulý měsíc Samsung představil svůj první čip šesté generace pamětí s vysokou propustností (HBM4) s propustností 2,4 TB/s. Podle průmyslových zpráv nová varianta HBM4, kterou chce Samsung ukázat na International Solid-State Circuits Conference (ISSCC) — plánované na 15.–19. února 2026 v San Franciscu — zvýší špičkovou propustnost na přibližně 3,3 TB/s. To představuje zhruba 37,5% nárůst oproti dříve ukázané verzi.
Tento nárůst propustnosti není jen marketingovým údajem: v praxi může znamenat výrazné zrychlení u aplikací, které jsou limitovány paměťovou propustností, například při tréninku rozsáhlých neuronových sítí nebo při výpočtech v datových centrech. Vyšší šířka pásma umožňuje zpracovat větší objem dat paralelně, snížit čekací doby na přístup k datům a zlepšit celkovou efektivitu výpočtů na jednotku energie.
Pro provozovatele cloudových služeb a výrobce akcelerátorů (GPU/TPU) to znamená příležitost zvýšit propustnost bez dramatického navýšení počtu modulů či rozměrů balení, což je kritické pro návrh rackových serverů a chlazení v datových centrech.
Co se změnilo „pod kapotou“?
Podle zdrojů plynoucích z průmyslu je hlavním zdrojem výkonového zisku přepracovaná vrstvená (stacked) architektura a aktualizované rozhraní (interface). Tyto úpravy společně zvyšují datový tok a současně zlepšují energetickou účinnost. Samsung údajně využil pro své HBM4 stohy DRAM variantu označovanou jako 1c, zatímco konkurenti jako Micron a SK Hynix se rozhodli pro 1b. V běžné řeči to znamená, že kombinace architektonických vylepšení a volba výrobního procesu DRAM pomáhá vytěžit více bitů za watt ze stejného pouzdra.
Konkrétně se vylepšení týkají několika úrovní návrhu paměťového modulu:
- Stacking a mikro-bumpy: zlepšení propojení mezi jednotlivými DRAM vrstvami a logickým (controller) čipem s menšími odporovými ztrátami a lepším termálním profilem.
- Interposer a routování: optimalizované rozložení signálů na interposeru s nižšími přeslechy (crosstalk) a lepší signálovou integritou při vyšších datech za sekundu (Gb/s).
- PHY a rozhraní paměti: špičkové fyzické vrstvy (PHY) s agresivnější marginací a laděním časování pro vyšší přenosové rychlosti bez zvýšení chybovosti.
- Napájení a řízení napětí: efektivnější řízení napájení (power management), které snižuje plýtvání energií při vysokém datovém provozu a zároveň pomáhá při řízení teploty.
Tyto technické změny dohromady umožňují posunout datovou propustnost směrem k 3,3 TB/s, aniž by bylo nutné významně zvětšit pouzdro nebo změnit základní fyzické parametry modulu.
Klíčové parametry na první pohled
- Propustnost dřívější verze HBM4: 2,4 TB/s
- Propustnost připravované verze HBM4: až 3,3 TB/s
- Zlepšení: přibližně 37,5 %
- Designové změny: nová vrstvená struktura a aktualizované rozhraní
- DRAM varianta: Samsung používá 1c DRAM vs konkurenti 1b

Na obrázku výše je ilustrační zobrazení vrstevnatého paměťového modulu (stacked HBM), které lepší ukazuje, jak těsné propojení mezi vrstvami DRAM a logickým čipem ovlivňuje propustnost a termální chování. Fotografie či schémata vystavená na konferencích jako SEDEX či ISSCC obvykle doplňují technické papíry o podrobnější data o fyzických úpravách a testovacích metodikách.
Proč je to důležité pro AI a servery
Paměť s vysokou propustností (High-Bandwidth Memory, HBM) je jedním z hlavních úzkých míst v akcelerátorech pro AI a v grafických jednotkách určených pro datová centra. Zvýšení propustnosti paměti snižuje dobu čekání na přístup k datům (memory stalls), zrychluje trénink i inferenci modelů a může snížit celkovou spotřebu energie na operaci díky lepšímu využití paralelních výpočetních jednotek.
V praxi to znamená, že modely s vyššími požadavky na přenos dat — například velké jazykové modely (LLM), modely pro zpracování obrazu nebo multimodální architektury — mohou těžit z vyšší šířky pásma tím, že budou moci zpracovat větší dávky (batch) dat najednou, snížit frekvenci přepínání mezi pamětí a výpočetními jednotkami a zlepšit elasticitu při distribuovaném tréninku napříč více GPU.
Po dřívějších problémech souvisejících s přehříváním některých HBM produktů se zdá, že Samsung do návrhu vložil opravy a postupy pro zlepšení výtěžnosti (yield), což mu umožnilo zlepšit konkurenceschopnost. Společnost očekává, že HBM4 bude zásadním zdrojem tržeb v kontextu obnoveného růstu poptávky po pamětech v oblasti AI a výpočetních clusterů.
Na nedávném brífinku ISSCC Korea uvedl odborník ze SK Hynix Kim Dong-gyun, že vývoj DRAM je hnán dvojicí požadavků — propustností a energetickou účinností. Kroky Samsungu směrem k předvedení výkonnější verze HBM4 na ISSCC 2026 tento trend potvrzují a připravují půdu pro novou vlnu soutěže v oblasti pamětí nové generace pro AI servery.
Kromě samotné propustnosti hrává roli i latence a prefetching dat: rychlejší HBM může umožnit efektivnější přednačítání (prefetch) a lepší orchestraci paměťových přístupů, což se projeví v nižším počtu cache missů a hladším využití výpočetních jader v GPU nebo specializovaných AI akcelerátorech.
Architekti serverových systémů a cloudoví poskytovatelé by měli očekávat další technické detaily a reálná měření výkonu, až Samsung oficiálně představí čip na ISSCC příští únor — bude to klíčový okamžik pro návrháře hardwaru i provozovatele cloudu, kteří usilují o vyšší propustnost pro AI pracovní zátěže.
Praktické dopady se mohou projevit v několika oblastech:
- Rychlejší trénink velkých modelů díky lepšímu napájení datovými kanály.
- Efektivnější inferenční smyčky s menší latencí pro aplikace v reálném čase.
- Snížené náklady na energii na jednu operaci (inference/training step), pokud se zlepší bitová efektivita (bandwidth per watt).
- Možnost konsolidace více výpočetních jednotek v rámci stejného racku bez nutnosti výrazných změn v chlazení či napájení.
V kontextu konkurence představují nárůst propustnosti a zlepšení energetické účinnosti signál pro zvýšenou konkurenci mezi Samsungem, SK Hynix a Micronem o dodávky paměťových modulů do výroby GPU pro datová centra a do OEM ekosystému. Zatímco výrobci akcelerátorů mohou preferovat jednoho dodavatele z důvodu specifických parametrů (latence, kompatibilita rozhraní, dostupnost), tlak na ceny a výkonnost bude i nadále motivovat inovace ve výrobě DRAM a v návrzích paměťových balíků.
Nakonec je třeba dodat, že samotná verze HBM4 je jen jedním článkem širšího řetězce systémových inovací: rychlejší linky PCIe/NVLink, lepší paměťové kontrolery v GPU, a pokročilé softwarové optimalizace (datové pipeline, memory management v frameworkech jako TensorFlow nebo PyTorch) společně určují, jak velký reálný přínos bude mít vyšší teoretická propustnost v produkčních prostředích.
Zdroj: sammobile
Zanechte komentář