Gemma 4 posouvá AI v zařízení na Androidu dál a rychleji

Gemma 4 posouvá AI v zařízení na Androidu dál a rychleji

Komentáře

3 Minuty

Po léta měla mobilní AI trochu masku. Zeptáte se, ona odpoví, ale někde mezi tím se vaše data posílají na vzdálený server, zpracují a vrátí se zpět. Ta skrytá odbočka byla vždy kompromisem. Google teď chce přestat na cloud spoléhat, a Gemma 4 je nejjasnějším důkazem, že on-device AI na Androidu to myslí vážně.

Google DeepMind minulý týden představil Gemma 4 společně s Armem s jasným cílem: umožnit pokročilé AI běžet přímo na telefonech s čipy Arm místo spoléhání se na cloud. Podle Googlu je nová rodina modelů až čtyřikrát rychlejší než předchozí verze a může spotřebovat až o 60 % méně baterie. Menší varianty E2B a E4B byly navrženy s ohledem na telefony a zvládnou text, obrázky i zvuk bez odesílání požadavku přes internet.

Proč je Arm důležitý

Tichým motorem za tímto skokem je instrukční sada SME2 od Arm, která je součástí novějších čipů Armv9. Jednoduše řečeno, urychluje maticové výpočty, na nichž moderní umělá inteligence závisí. Arm uvádí, že jeho rané inženýrské testy ukázaly průměrné zlepšení zpracování vstupu uživatele o 5,5× a generování odpovědí až 1,6× rychlejší u modelu Gemma 4 E2B. Zajímavé je, že vývojáři nemusí přepisovat své aplikace, aby tyto výhody pocítili. Softwarová vrstva KleidiAI od Arm se připojuje k existujícím běhovým knihovnám Googlu, takže vylepšení přichází s minimálním třením.

Takový neviditelný upgrade může právě proměnit umělou inteligenci v zařízení z ukázky na něco, co lidé opravdu používají každý den. Rychlejší. Lehčí. Méně závislá na datovém připojení. To jsou tři věci, po kterých mobilní umělá inteligence od začátku usiluje.

Nejjasnějším příkladem je Envision, aplikace pro přístupnost určená pro nevidomé a uživatele se zrakovým postižením. Dosud často záviselo rozpoznávání scény na přístupu do cloudu. V prototypu používajícím Gemma 4 lokálně na CPU Arm mohl uživatel pořídit fotku a okamžitě obdržet podrobný popis scény, bez nutnosti připojení k síti. U takové aplikace není podpora offline doplňkovou funkcí. Je to hlavní funkce.

Google také připravuje základy pro další krok. Gemma 4 slouží jako základ pro Gemini Nano 4, nadcházející model na zařízení pro Android. To znamená, že vývojáři, kteří dnes staví na Gemma 4, by měli být připraveni na kompatibilitu s Gemini Nano 4, až dorazí do vlajkových zařízení později v tomto roce. Gemini Nano už pohání lokální funkce jako chytré odpovědi a audio shrnutí a výrobci čipů jako MediaTek tímto směrem silně tlačí. Gemma 4 do toho přidává další možnosti, včetně multimodální podpory a vestavěných agentních schopností.

Pro vývojáře je přístup již otevřený. Modely E2B a E4B jsou dostupné přes Google AI Edge Gallery na Androidu a iOS pod licencí Apache 2.0. A to má význam, protože závod o užitečnou, soukromou a nízkolatenční umělou inteligenci se už neodehrává jen v cloudu. Přesouvá se do telefonu ve vaší ruce.

Zanechte komentář

Komentáře