3 Minuty
Microsoft posouvá hranice ladění velkých jazykových modelů pomocí Direct Preference Optimization
Microsoft zásadně mění způsob, jakým organizace optimalizují velké jazykové modely (LLM), prostřednictvím nových aktualizací své platformy Azure AI. Nejnovější vylepšení portálu Azure AI Foundry, stejně jako modernizované API a SDK v službě Azure OpenAI, nyní přinášejí podporu metody Direct Preference Optimization (DPO) jak pro model GPT-4.1, tak i pro jeho odlehčenou variantu GPT-4.1-mini.
Co je Direct Preference Optimization a proč je to důležité?
Direct Preference Optimization je pokročilá metoda ladění AI modelů, která umožňuje vývojářům zpřesnit schopnosti umělé inteligence na základě preferencí uživatelů – nikoli pouze pomocí tradičního způsobu posilovaného učení s lidskou zpětnou vazbou (RLHF). DPO přizpůsobuje váhy modelu na základě porovnání preferovaných i nepreferovaných odpovědí, aby výsledky lépe odpovídaly očekáváním uživatelů i firemní identitě. Oproti RLHF je metoda DPO méně náročná na výpočetní výkon, podstatně rychlejší a přitom zachovává vysokou úroveň přesnosti při ladění modelu.
Tato inovace dává firmám možnost vyškolit si jazykové modely přesně podle vlastního komunikačního stylu, bezpečnostních požadavků a zásad brandingu, a to za výrazně nižší časové i provozní náklady.
Rozšiřování globálního tréninku Azure AI do nových regionů
Microsoft zároveň rozšiřuje dostupnost funkce Global Training pro Azure AI do dalších 12 regionů, včetně oblasti East US, West Europe, UK South a Switzerland North. I přes toto rozšíření zůstává Global Training ve fázi veřejného preview. Geografická expanze přichází vhod v době, kdy význam data sovereignty – zejména v Evropě s přísnými požadavky na lokální zpracování dat kvůli ochraně soukromí a regulacím – rapidně roste.
Chystané funkce a nové možnosti
Připravované aktualizace slibují další vylepšení, jako je možnost pozastavit a znovu spustit proces ladění modelu nebo průběžné dolaďování modelů. Microsoft navíc plánuje zpřístupnit verzi GPT-4.1-nano v nově podporovaných regionech Azure, což vývojářům a firmám poskytne ještě větší flexibilitu i výkon.
Spuštění Responses API: Chytřejší integrace AI do pracovních postupů
Vývojáři nyní mohou využít nově představené Responses API, speciálně navržené pro bezproblémovou integraci customizovaných, jemně vyladěných modelů do komplexních aplikací a pracovních procesů. API je optimalizované pro agentickou a víceotáčkovou konverzační AI, dokáže udržet širší kontext během delších dialogů a umožňuje spolehlivé využívání externích nástrojů.
Responses API navíc uchovává historii konverzací, zobrazuje proces uvažování modelu, nabízí podrobný postup generování odpovědí a podporuje paralelní zpracování. Je plně kompatibilní s řadou AI nástrojů od živého vyhledávání po extrakci informací z dokumentů.
Dopad na trh a využití v praxi
Díky těmto inovacím Microsoft upevňuje pozici Azure AI jako flexibilní a globální platformy pro škálovatelný a bezpečný vývoj umělé inteligence. Nové ladění modelů s DPO, rozšiřování regionální podpory a vývojářsky orientovaná rozhraní API umožňují organizacím v různých oborech vytvářet AI řešení, která jsou nejen přesně přizpůsobena jejich potřebám, ale vyhovují také aktuálním regulacím ohledně zpracování dat.
Firmám, které chtějí využít konverzační AI například v zákaznické podpoře, tvorbě obsahu nebo komunikaci se zákazníky, nabízí aktualizovaný nástrojový balíček Azure novou úroveň efektivity, flexibility i ochrany soukromí.
Zdroj: neowin

Komentáře