Co je to fyzická prompt injection a proč je nebezpečná?

Fyzická prompt injection je útok, který využívá tištěný nebo zobrazený text v prostředí, aby zmátl vision-language modely a přiměl autonomní systém vykonat nežádoucí akce. Nebezpečí spočívá v tom, že útočník nemusí kompromitovat software: stačí umístit čitelný text do zorného pole kamery, což může vést k tomu, že model přetvoří tento text na proveditelný příkaz.

Jaké typy systémů jsou nejvíce zranitelné vůči tomuto útoku?

Nejvíce zranitelné jsou systémy, které spoléhají na vision-language modely (VLM) a mají textové mezivýstupy (command layer). Patří sem autonomní vozidla, doručovací roboty, průmyslová AGV a autonomní drony. Zvlášť ohrožené jsou nasazení v otevřeném prostředí, kde je snadné fyzicky umístit manipulační značení.

Jaké obranné strategie výzkum doporučuje?

Studie doporučuje vícevrstvé obrany: detekci a filtrování podezřelého textu v obrazech, sladění modelů (alignment) aby odmítaly spouštět příkazy z náhodného textu, robustnostní testy proti fyzickým manipulacím a provozní pravidla, která považují vnímaný text za nedůvěryhodný vstup vyžadující ověření před použitím v plánování pohybu.

Může tento útok fungovat napříč jazyky a různými modely?

Ano. Autoři popisují univerzální prompty a testy, které fungovaly na nepředchozích snímcích a v různých jazycích (např. čínština, španělština, smíšené jazyky). Útoky mohou být přizpůsobeny tak, aby byly pro lidi méně nápadné, ale pro modely stále velmi čitelné.

Tištěné instrukce, které klamou autonomní stroje

8 Minuty

Robot, který „čte" svět pomocí kamery a vision-language modelu, může uposlechnout tištěný nápis dříve, než vyslechne člověka. Nový výzkum ukazuje, že prompt injection — známá především jako problém chatbotů — může vyskočit ze obrazovky do fyzického světa a nenápadně srážet autonomní stroje z plánované trasy. Tato zranitelnost zasahuje oblasti jako bezpečnost robotů, autonomní vozidla a řízení dronů a zdůrazňuje potřebu robustních obranných mechanismů proti injekci příkazů v reálném prostředí.

Místo hackování softwaru nebo záměrného klamání senzorů tento útok nakládá s prostředím jako s datovým vstupním polem. Zavádějící štítek, plakát nebo cedule ve stylu silničního značení se umístí tam, kde ji kamera robota snadno zaznamená. Pro člověka v okolí může takový prvek vypadat neškodně; pro AI systém trénovaný k interpretaci textových a vizuálních signálů se ale může chovat jako příkaz nebo plán.

V simulovaných experimentech autoři uvádějí úspěšnost 81,8 % v scénáři autonomního řízení a 68,1 % v úloze nouzového přistání dronu. V reálném testu s malým robotickým vozítkem přepsané tištěné pokyny přesměrovaly navigaci s úspěšností alespoň 87 % napříč různými světelnými podmínkami a úhly pohledu — což naznačuje, že nejde jen o laboratorní kuriozitu, ale o praktický útok na systémy s vision-language modely (VLM) a autonomními řídicími vrstvami.

When a sign turns into an instruction

Technika označená zkratkou CHAI cílí na klíčový krok v mnoha moderních autonomních zásobnících: na tzv. „command layer" neboli vrstvu generování příkazů. V systémech, které využívají vision-language modely, model často vytvoří mezivýstup ve formě textového instrukčního plánu — v podstatě postup popsaný slovy — než ho downstream kontroler přepočítá na konkrétní řízení kol, brzdění nebo povely motorů.

Pokud útočník dokáže nenápadně posunout tento plánovací krok směrem k nesprávnému příkazu, může zbytek robotického řetězce tento příkaz věrně vykonat. Žádný malware, žádný privilegovaný přístup. Robot v technické rovně dělá to, co má — jen na základě zavádějícího textu. Tento typ útoku využívá slabinu v architektuře, kde jazykové výstupy slouží jako mezivrstva mezi vnímáním a akční vrstvou, což zvyšuje riziko, že vizuální text bude chybně interpretován jako autorizovaný příkaz.

Důležité je, že model hrozby je záměrně nízkonákladový a „low-tech". Útočník je uvažován jako outsider, který nemá přístup k palubním systémům. Stačí mu fyzická možnost umístit text do zorného pole kamery: cedule přilepená na stěnu, plakát na dveřích, samolepka u orientačního bodu nebo dočasné značení u trasy. Takový vstup může být pro lidi okolo nenápadný, ale pro VLM vysoce čitelný a proto akceptovatelný jako instrukce.

Pro praktické testy to znamená, že akce nevyžaduje sofistikované nástroje ani připojení k síti: stačí znalost otevíracího úhlu kamery, očekávané velikosti textu a situace, kdy bude robot text číst. Útočník tak může cílit na různé aplikace — autonomní automobily, logistické autovyvahy, doručovací roboty nebo průmyslové AGV — bez potřeby interních kompromitací systému.

Designed to “travel” across scenes, models, and languages

CHAI neoptimalizuje pouze co prompt říká; optimalizuje i jak se zobrazuje — upravuje atributy jako barvu, velikost písma a umístění — protože čitelnost pro model často rozhoduje o tom, zda se zpráva stane proveditelnou instrukcí. Z hlediska útoku to znamená, že je potřeba ladit vizuální vlastnosti tak, aby text byl robustně rozpoznatelný napříč různými kamerami a podmínkami osvětlení.

Autoři studie popisují také „univerzální" prompty, které fungují i na nepředem viděných snímcích a v jiných prostředích. Tyto univerzální útoky vykazují v průměru alespoň 50% úspěšnost napříč úlohami a modely, a v jednom nastavení založeném na GPT překročily 70 %. Zajímavé je, že metoda funguje napříč jazyky — byly testovány verze v čínštině, španělštině i smíšené jazykové vstupy — což má praktický dopad: vícejazyčný text může být pro lidské pozorovatele méně nápadný nebo vyvolávat menší podezření, přitom však zůstává velmi čitelný pro model.

To má vážné důsledky pro škálu aplikací: nejde pouze o jediného robota v jedné místnosti, ale o třídu systémů robotiky a autonomního řízení, které stále častěji integrují psané a vizuální informace jako součást své „světové modelace". Jak roste nasazení VLM v průmyslových, logistických a veřejných prostředích, roste i povrch útoku pro fyzickou prompt injection.

Technicky to souvisí s tím, že vision-language modely provádějí víceúrovňové zpracování obrazu a textu: extrahují objekty, rozpoznávají text (OCR-like kroky), poté spojují symbolické významy s kontextem úkolu. CHAI zasahuje přesně do této mezipaměti — doslovného mezikroku, kde se rozpoznaný text transformuje v instrukci, čímž obrací očekávanou roli prostředí z pasivního pozorovatelného stavu na aktivní vstupní kanál.

Why robot safety teams may need a new checklist

Autoři práce navrhují několik obranných směrů. Jedním je filtrování a detekce: skenování obrazových snímků z kamery (a také mezivýstupů modelu) za účelem identifikace podezřelého či nepatřičného textu. To obejít zahrnuje vývoj OCR detektorů, které ne pouze extrahují text, ale hodnotí kontext, pravděpodobnost manipulace a shodu s misijními cíli. K takovým obranám patří i sledování konzistence mezi tím, co model „vidí", a tím, co by mělo být považováno za relevantní pro aktuální úkol.

Dalším směrem je alignment — práce na sladění modelových preferencí s bezpečnostními politikami tak, aby modely byly méně ochotné považovat libovolné psaní v prostředí za vykonatelnou instrukci. To znamená trénovat nebo dolaďovat VLM tak, aby rozlišovaly mezi okolním textem (např. reklama, značení, grafika) a textem, který je implikovaně součástí řídícího rozhraní. Zahrnuje to metody pro posílení odolnosti vůči kontextovým záměnám a pravidla, která vyžadují dodatečnou verifikaci zdroje textu před jeho převedením na příkaz.

Do dálkové perspektivy autoři apelují na výzkum robustness, který by nabídl silnější formální záruky: prověřování, testování proti široké škále fyzických a vizuálních manipulací a certifikační postupy pro nasazení VLM v bezpečnostně citlivých aplikacích. Konkrétním praktickým krokem, který lze implementovat v krátkodobém horizontu, je jednoduché: považovat vnímaný text za nedůvěryhodný vstup a vyžadovat jeho validaci vzhledem k misijním a bezpečnostním omezením, než bude mít vliv na plán pohybu.

Testovací protokoly by měly zahrnovat scénáře, kde „cedule lžou": modely je třeba vystavit různým variantám tištěných a digitálních manipulací, včetně vícejazyčných promptů, chybějící či zkomolené typografie, kontrastních barevných kombinací a částečně zakrytých nápisů. Součástí bezpečnostní checklistu by měly být i provozní zásady — např. minimalizovat závislost plánování na několika typech senzorů, zavést křížové ověřování informací z LIDARu, GPS nebo inerciálních senzorů, a nastavit konzervativní fallback chování při nejasnostech.

Pokud váš robot „čte" cedule, stojí za to otestovat, co se stane, když cedule lžou. Studie je plánována k prezentaci na konferenci SaTML 2026, kde se očekává zvýšená pozornost věnovaná rizikům fyzické prompt injection a opatřením proti nim. Pro týmy zodpovědné za bezpečnost robotů by měla tato práce znamenat impuls k revizi bezpečnostních auditů, testovacích sad a provozních pravidel pro nasazení vision-language systémů v reálném světě.

Proti útokům jako CHAI mohou fungovat i další vrstvy obrany: šifrované a podepsané značení v interních sítích robotů (tam, kde je to možné), fyzické omezení přístupu do kritických zón, vzdělávání personálu o rizicích sociálního inženýrství zaměřeného na umístění škodlivých podnětů a pravidelné aktualizace modelů s důrazem na negativní příklady z reálného světa. Kombinace technických, procedurálních a organizačních opatření zvyšuje celkovou odolnost proti prompt injection a dalším útokům založeným na manipulaci prostředí.

V konečném důsledku jde o to, že rozšíření jazykového porozumění do vnímání světa otevřelo nové sémantické kanály napříč fyzickým a digitálním světem. Zatímco to přináší užitečné schopnosti — lepší interpretaci značení, flexibilní komunikaci s okolím a robustnější rozhodování — zároveň to rozšiřuje škálu útoků na autonomní systémy. Bezpečnostní týmy ve vývoji robotiky a autonomních systémů proto budou muset aktualizovat své checklisty, testovací scénáře a zásady správy rizik, aby zahrnovaly i tyto nové kategorie hrozeb souvisejících s prompt injection a vision-language modely.

Zdroj: digitaltrends

Tištěné instrukce, které klamou autonomní stroje

When a sign turns into an instruction

Designed to “travel” across scenes, models, and languages

Why robot safety teams may need a new checklist

Zanechte komentář

Komentáře

Související příspěvky

Austrálie zakázala sociální sítě pro mladší 16 let; Dělá to i Česká?

Sequoia Capital zdvojnásobuje fond pro investice do AI

MediaTek Dimensity 9600 Pro: vyvážený krok k vyšším taktům

Uchování infračerveného světla v 42nm atomové mřížce

Pixel Glow: Google oživuje zadní svítící systém zařízení

Redmi Buds 8 s 50dB aktivním potlačením hluku a výkonem

Svolt spouští výrobu 80kWh PHEV baterie Fortress 2.0

Proč Nvidia rozšiřuje sítě investic do startupů a ekosystému

Motorola Razr Fold: předobjednávky, cena a specifikace

YouTube umožnil trvale skrýt Shorts z domovské obrazovky

Google oživuje Fitbit: bezdisplejová páska pro výkon

Samsung zkoumá širší TriFold: budoucnost skládacích zařízení