ARM Lumex: Nová éra produkčních výpočetních subsystémů pro 3nm mobilní čipy

ARM Lumex: Nová éra produkčních výpočetních subsystémů pro 3nm mobilní čipy

0 Komentáře Tereza Malá

5 Minuty

ARM dnes představil Lumex, plně připravený výpočetní subsystém (CSS) určený pro 3nm výrobní procesy, který urychluje vývoj vysoce výkonných a energeticky efektivních mobilních SoC. Lumex ARM neproměňuje v tradičního dodavatele čipů, ale nabízí hotová a flexibilní řešení připravená k výrobě. Tyto stavební bloky lze volně využívat, což partnerům umožňuje soustředit inženýrské kapacity na vlastní inovace u CPU a GPU na úrovni clusterů.

Co je Lumex CSS?

Lumex je modulární návrh čipové sady pro moderní smartphony, nositelnou elektroniku a další zařízení na okraji sítě. Spojuje nejnovější jádra CPU ARM, rodinu GPU Mali-G1, škálovatelný systémový propojovač a bezpečné paměťové subsystémy, všechny optimalizované pro různé 3nm foundry. Cílem je zkrátit vývojové cykly, zajistit konzistentní výkon napříč výrobci čipů a zpřístupnit pokročilé funkce jako bezpečná virtualizace a vysoce efektivní systémová cache výrobcům zařízení (OEM).

Klíčové hardwarové bloky

  • Škálovatelné CPU clustery prostřednictvím nové C1-DSU (Design System Unit): Podpora konfigurací od 1 do 14 CPU jader a až tří typů jader vybraných ze čtyř možností C1.
  • Rodina GPU Mali-G1: škáluje od 1 do 24 shader jader, včetně nejvýkonnější varianty Mali-G1 Ultra.
  • Systémový interconnect L1 & SLC: Implementace systémové cache, která redukuje únik energie přibližně o 71 % oproti standardnímu RAM přístupu a minimalizuje spotřebu v nečinnosti.
  • MMU L1: hardwarová jednotka správy paměti optimalizovaná pro bezpečnou a ekonomickou virtualizaci, umožňující více operačních systémů i oddělené workloady na jednom SoC.

CPU řada a výkonnostní úrovně

Jádra série ARM C1 pokrývají celý rozsah od špičkového výkonu až po ultraúsporná nositelná zařízení. Nabídka a hlavní použití zahrnují:

  • C1-Ultra — Vlajkový jedno-vláknový výkon s přibližně +25 % nárůstem výkonu na vlákno a dvouciferným zlepšením IPC meziročně. Ideální pro inference velkých modelů, výpočty ve fotografii, tvorbu obsahu a generativní AI.
  • C1-Premium — Výkonnost téměř na úrovni C1-Ultra, ale s cca 35% úsporou prostoru na čipu. Skvělé pro vyšší střední třídu, multitasking a neustále aktivní hlasové asistenty.
  • C1-Pro — Optimalizováno pro dlouhodobou efektivitu, nárůst udržitelného výkonu +16 %; vhodné pro dlouhé přehrávání videa, streamovací inference i trvalé background úlohy.
  • C1-Nano — Ultraúsporné, kompaktní jádro zajišťující až +26 % lepší efektivitu pro nejmenší zařízení, například wearables a IoT.

GPU, AI a akcelerace matic

Rodina GPU Mali-G1 je flexibilní, aby vyhovovala různým segmentům mobilních zařízení. ARM uvádí, že Mali-G1 Ultra dosahuje přibližně o 20 % lepší rasterizační výkon a až 2× rychlejší ray tracing ve srovnání s předchozím Immortalis-G925. V AI inference úlohách je GPU G1 přibližně o 20 % rychlejší než minulá generace.

Srdcem AI strategie ARM je Scalable Matrix Extension 2 (SME2), která akceleruje maticové výpočty zásadní pro moderní neuronové sítě. ARM uvádí až 5× vyšší propustnost a 3× lepší efektivitu ML workloadů na CPU ve srovnání s dřívějšími návrhy, což umožňuje realizovat složitější modely přímo na zařízení.

Efektivita a bezpečnost na úrovni platformy

Lumex klade důraz na energeticky hospodárné subsystémy. Systémový Interconnect L1 s cache SLC zásadně snižuje únik proudu a tím spotřebu v klidovém režimu — což je zásadní pro životnost baterie. MMU L1 přináší hardwarové základy pro bezpečnou virtualizaci, což výrobcům umožňuje rozdělit hardware mezi více OS nebo izolovat citlivé workloady s nižší režijní náročností než čistě softwarová řešení.

Výkonnostní testy a srovnání

ARM uvádí, že C1 CPU cluster překonává své předchozí jádra v průměru o 30 % v šesti průmyslových benchmarcích. Skutečný přínos závisí na typu úlohy: hraní her a streamování nabízí asi 15% zlepšení, běžné úlohy jako přehrávání videa, prohlížení webu a sociální aplikace pak mají v průměru 12% nárůst efektivity. Proti Cortex-X925 nabízí C1-Ultra dvouciferné zlepšení IPC, což zdůrazňuje trend ARM směrem k vyššímu výkonu na jedno vlákno a posílení schopností pro AI.

Praktické využití a tržní význam

Lumex je navržen pro široké spektrum zařízení: od vlajkových mobilů vyžadujících maximální výkon a pokročilou AI, přes výkonné a úsporné tablety a streamovací zařízení, až po miniaturní wearables s extrémní energetickou účinností. Pro OEM a výrobce čipů Lumex znamená rychlejší uvedení na trh, jednotné nasazení na 3nm procesech a jasnou cestu pro nasazení AI přímo na zařízení při zachování baterie a teplotní stability.

Odezva průmyslu

Několik ARM partnerů přivítalo Lumex jako klíčovou inovaci. Přední OEM a vývojářské týmy označily hotový, modulární výpočetní subsystem za způsob, jak výrazně snížit složitost nízkoúrovňové integrace a umožnit soustředit se na inovace — ať už jde o zpracování fotografií, AI nebo optimalizaci spotřeby. Hlavní výrobci platforem oceňují, že SME2 umožní přinést pokročilé AI modely na více zařízení, sníží latenci a podpoří soukromí díky lokálnímu zpracování.

Závěr

Lumex představuje zásadní proměnu v přístupu ARM k poskytování čipových architektur pro 3nm generaci: místo výroby čipů ARM nabízí komplexní, plně přizpůsobitelné a výrobně připravené základy, které zrychlují vývoj a standardizují špičkové funkce jako bezpečnou virtualizaci a akceleraci maticových výpočtů. Pro výrobce zaměřené na AI, grafiku a výkon šetřící baterii je Lumex praktickou zkratkou k budoucí generaci mobilního výpočetního výkonu.

Zdroj: gsmarena

Ahoj! Jmenuji se Tereza a technologie mě fascinuje od prvního smartphonu. Každý den pro vás vybírám a překládám nejnovější tech novinky ze světa.

Komentáře

Zanechte komentář