Skutečná spotřeba vody a energie modelů typu ChatGPT

Skutečná spotřeba vody a energie modelů typu ChatGPT

Komentáře

10 Minuty

Úvod

Virový údaj — „každý dotaz na ChatGPT spotřebuje 64 litrů vody“ — se šířil natolik často, že začal znít jako fakt. Není to pravda. Sam Altman, generální ředitel OpenAI, na akci pořádané The Indian Express v Indii rozhodně odmítl toto číslo a označil tvrzení o spotřebě vody za „bezpředmětná“ a zavádějící.

Jádro problému: starší příběhy o obrovské spotřebě vody pramenily z doby, kdy některá datová centra používala odpařovací chlazení. Tato technika skutečně spotřebovává vodu. V mnoha moderních centrech se však postupně nahrazuje efektivnějšími metodami. Altman poukázal, že čísla kolující online ignorují změny v infrastruktuře a strategiích chlazení — a vytvářejí tak zkreslený obraz skutečných nároků systémů jako ChatGPT na vodu.

Znamená to, že bychom měli environmentální otázky ignorovat? Vůbec ne. Altman připustil, že spotřeba energie je relevantní a rostoucí starost. Důležitá je škála: jeden dotaz může vyžadovat zlomek kilowatthodiny, ale globální nepřetržitá poptávka po AI rychle roste. Kumulativní energetická zátěž — nikoli izolovaná estimace na jeden dotaz — je metrika, kterou by měli sledovat tvůrci politik i provozovatelé.

Altman pak přidal provokativní srovnání. Jak hodnotit energetické náklady inteligence? Lidé se učí desítky let. Altman uvedl, že člověk spotřebuje přibližně potravinovou a metabolickou energii odpovídající zhruba 20 letům, než dosáhne plně vyvinuté kognitivní schopnosti. Lidské vědomí je také výsledkem evolučního procesu zahrnujícího zhruba 100 miliard lidí, kteří kdy žili na Zemi — pomalý, rozprostřený a energeticky nákladný proces.

Altmanův závěr: pokud chcete spravedlivé porovnání, měřte energii potřebnou k tomu, aby natrénovaný model AI odpověděl na otázku, oproti energii, kterou využije člověk při odpovědi na tutéž otázku. Podle tohoto kritéria by AI mohla být efektivnější — ale pouze pokud je energie, která ji napájí, nízkouhlíková.

Co znamenalo odpařovací chlazení a proč to vedlo k mylným statistikám

Historické údaje o „spotřebě vody“ často použitě zjednodušovaly realitu. Odpařovací chlazení (adiabatické chlazení) snižuje teplotu vzduchu pomocí vypařování vody, a v některých lokalitách a starších datových centrech se používalo jako levné řešení. To vedlo k vyšší spotřebě vody, zvlášť v suchých oblastech s irelevantními environmentálními normami.

Nicméně technologický vývoj a environmentální regulace výrazně změnily praxi v datových centrech. Moderní centrum je navrženo s ohledem na energetickou efektivitu, lepší management tepla a často s použitím méně vodných technologií:

  • Uzavřené chladicí okruhy a kapalné chlazení: místo ochlazování velkého objemu vzduchu se teplo přenáší přímo z komponent do chladicí kapaliny s minimální ztrátou vody.
  • Suché chlazení a chladiče vzduch-vzduch: v mnoha lokalitách dochází k přechodu na systémy, které nepotřebují přímou spotřebu vody.
  • Adiabaticí systémy s recirkulací a vysokou účinností: kde se odpařovací prvky používají, bývají designovány tak, aby spotřeba vody byla minimalizována a aby se využívaly zařízení s vyšší hospodárností.

Navíc je potřeba rozlišovat mezi dvěma typy metrik: akutní spotřeba vody na jednu operaci (např. dotaz) a provozní spotřeba vody centrálně na chlazení zařízení. Staré analogie, které převáděly provozní spotřebu velkých center na „na dotaz“, přepočítávaly komplexní, závislou a lokalizovanou spotřebu vody do jednoduchého čísla, které pak bylo šířeno jako senzace bez kontextu.

Metriky a měření: WUE a další ukazatele

Existují standardy a metriky, které pomáhají hodnotit environmentální dopad datových center. Jednou z nich je Water Usage Effectiveness (WUE), která měří množství vody spotřebované vztaženo k energetickému výstupu centra. Další klíčové ukazatele jsou Power Usage Effectiveness (PUE) a Carbon Usage Effectiveness (CUE). Když se podíváme na tyto údaje společně — PUE, WUE, využití kapacity a regionální uhlíkovou intenzitu sítě — získáme mnohem přesnější obrázek o skutečných ekologických nárocích provozu AI.

Energetická náročnost: proč to není jen o jednom dotazu

Altman správně upozornil, že samotné hodnoty na dotaz mohou být zavádějící. Vyšší starost by měla směřovat k agregovanému dopadu. Důležité je rozlišit mezi dvěma fázemi životního cyklu modelu:

  1. Trénink modelu: náročná fáze, která může vyžadovat obrovské výpočetní zdroje a odpovídající spotřebu energie po dobu týdnů či měsíců.
  2. Inference (dotazy): provozní fáze, kdy model zpracovává dotazy uživatelů — energie na jednotlivý dotaz je obvykle mnohem menší než náklady na celý trénink, ale kumulativně může být vysoká při miliardách dotazů denně.

Klíčové faktory, které ovlivňují energetickou bilanci, zahrnují:

  • Velikost modelu a architektura (počet parametrů, efektivita výpočtů).
  • Optimalizace inference (kvantizace, distilace, efektivní knihovny pro běh modelu na specializovaném HW).
  • Efektivita datového centra (PUE), včetně způsobu chlazení a distribuční ztráty.
  • Uhlíková intenzita elektřiny v místě provozu (kolik CO2 je emitováno na vyrobenou MWh).

Proto i když jeden dotaz skutečně spotřebuje jen zlomek kWh, rostoucí poptávka po nepřetržitém využití AI může znamenat významný nárůst celkové spotřeby elektřiny a tedy i emisí, pokud zdroj energie není nízkouhlíkový.

Trénink vs. inference: kde leží hlavní zátěž

Trénink velkých jazykových modelů bývá energeticky intenzivní a v některých případech může představovat hlavní část uhlíkové stopy projektu. Nicméně opakované a masové inference (komercializované služby, chatboti, integrace API do produktů) dávají vzniknout kontinuální poptávce, která po čase může značnou část emisí replikovat každodenním způsobem. Proto je důležité optimalizovat obě fáze — snižovat náklady na trénink (efektivnější algoritmy, obnovitelné zdroje během tréninku) a optimalizovat inference (kompresní techniky, dedikovaný hardware, caching odpovědí).

Porovnání s lidskou kognicí: co Altman navrhl

Altmanovo srovnání s lidskou energií je provokativní, protože otevírá širší otázku měření inteligence z perspektivy energetické efektivity. Lidský organismus vynakládá značné množství energie na vývoj mozku během dětství a dospívání. Pokud bychom měli porovnat „energie na odpověď“ u člověka a u modelu, je důležité vzít v úvahu:

  • Životní a evoluční náklady: lidský mozek je výsledkem generací a množství živých bytostí, což je unikátní typ investice, neporovnatelný s jednostranným energetickým výpočtem stroje.
  • Metabolická energie vs. elektrická energie: lidská tělesná energie pochází z potravin, zatímco AI se napájí elektřinou — ale obě lze v energetických ekvivalentech porovnávat.
  • Frekvence a škála: člověk poskytne omezené množství kvalitních odpovědí ze své aktivní kognice, zatímco modely AI mohou poskytovat miliony odpovědí denně, což proměňuje metriky poměru energie na odpověď.

Altman tedy navrhl, že víc smysluplné srovnání bere v úvahu celkové množství energie vynaložené na to, aby měl subjekt (člověk nebo model) „naučené“ schopnosti odpovídat. Podle něj v takovém porovnání může mít AI výhodu, pokud je napájena nízkouhlíkovou energií a pokud byly její tréninkové náklady rozloženy na velmi vysoký počet odpovědí.

Řešení: rychlejší nasazení čisté energie

Altman zdůraznil praktické opatření: rychlejší rozšíření nízkouhlíkových zdrojů energie — jaderných elektráren, větrných farem a solárních elektráren — je podle něj klíčové, aby svět zvládl rostoucí poptávku po elektřině bez prohlubování klimatické krize. Tento přístup není pouze „volitelným doplňkem“; jedná se o základ zodpovědného škálování AI.

Konkrétní strategie, které snižují uhlíkovou stopu AI, zahrnují:

  • Investice do obnovitelných zdrojů energie a jejich přímé napojení na datová centra (přímé PPA — power purchase agreements).
  • Mix nízkouhlíkových zdrojů s flexibilními sítěmi a úložišti energie (baterie, vodík, přečerpávací elektrárny), které snižují potřebu fosilních záložních zdrojů.
  • Zvyšování energetické účinnosti datových center (lepší PUE, tepelné znovuvyužití, modulární architektury).
  • Regionální plánování kapacity a zohlednění energetické intenzity sítě při umisťování nových center.

Technické a ekonomické překážky

Rychlý přechod na jaderné, větrné a solární zdroje vyžaduje čas, kapitál a politickou vůli. Jaderná energetika má vysoké počáteční náklady a regulační bariéry; větrné a solární projekty zase potřebují vhodné lokality, skladování a přenosové kapacity. Nicméně bez zásadní změny v energetickém mixu riskujeme, že jakýkoli nárůst spotřeby AI přispěje k vyšším emisím, pokud bude pokryt převážně fosilní elektřinou.

Transparentnost, regulace a metriky

Další komplikací je, že v současnosti neexistuje globální zákonná povinnost pro technologické firmy zveřejňovat přesné, auditované vodní a energetické stopy. To nutí nezávislé výzkumníky modelovat dopady za pomoci nepřímých odhadů, což může vést k rozporuplným závěrům. V některých regionech datová centra skutečně přispěla k růstu cen elektřiny a ke zvýšenému zatížení rozvodných sítí.

Pro zlepšení důvěryhodnosti a řízení rizik by mohla být užitečná opatření jako:

  • Povinné reportování PUE, WUE a CUE pro velká datová centra a provozovatele cloudových služeb.
  • Audity a standardizované metodiky měření energie a vody, které umožní srovnání napříč provozovateli a regiony.
  • Veřejné registry a štítky s environmentálními profily služeb AI, které zákazníkům usnadní informované rozhodování.

Role nezávislých výzkumníků a transparentnost

Nezávislé modelování a výzkum hrají důležitou roli při odhalování nerovností a identifikaci problémů. Ale takové odhady jsou citlivé na předpoklady: od typu energetického mixu až po efektivitu provozu a způsob chlazení. Proto je nutné, aby průmysl spolupracoval s akademickou obcí a regulačními orgány a poskytoval přesnější data, aniž by zveřejňoval citlivé komerční informace.

Praktická doporučení pro provozovatele a politiky

Pro provozovatele datových center a poskytovatele AI

  • Zveřejňujte metriky PUE, WUE a CUE a umožněte nezávislé audity.
  • Investujte do energeticky efektivních architektur a HW určeného pro inference s nízkou spotřebou energie.
  • Preferujte lokality s nízkou uhlíkovou intenzitou sítě nebo zajistěte přímé dodávky z obnovitelných zdrojů.
  • Nasazujte techniky pro snížení energetické náročnosti modelu (kvantizace, distilace, optimalizované runtime systémy).

Pro politiky a veřejné instituce

  • Stanovte jasné reportingové požadavky a standardizujte metodiky měření energetické a vodní stopy.
  • Podporujte investice do sítí a úložišť energie, které umožní integraci obnovitelných zdrojů.
  • Zvažte ekonomické a regulační pobídky pro provozovatele, kteří používají nízkouhlíkové zdroje a vysokou efektivitu.

Závěr

Diskuse kolem „64 litrů vody na dotaz“ ukazuje, jak snadno senzace převálcují složitou realitu. Je důležité odmítnout nepodložené a vytržené statistiky, ale zároveň nezlehčovat skutečné environmentální výzvy související s růstem AI. Potřebujeme lepší data, standardizované metriky a zejména rychlejší nasazení čisté energie, aby rozvoj umělé inteligence probíhal zodpovědně.

Pokud myslíme udržitelnost vážně, měla by se debata přesunout z titulkových senzací k reálným otázkám: jakým způsobem napájet datová centra nízkouhlíkovou elektřinou, jak investovat do infrastruktury a jak zajistit veřejné reportování a transparentnost. To je cesta k tomu, aby škálování AI bylo kompatibilní s klimatickými cíli a ochranou vzácných zdrojů vody.

Zdroj: smarti

Zanechte komentář

Komentáře