Microsoft urychluje ladění GPT-4.1 díky Direct Preference Optimization v Azure AI

3 Minuty

Microsoft posouvá hranice ladění velkých jazykových modelů pomocí Direct Preference Optimization

Microsoft zásadně mění způsob, jakým organizace optimalizují velké jazykové modely (LLM), prostřednictvím nových aktualizací své platformy Azure AI. Nejnovější vylepšení portálu Azure AI Foundry, stejně jako modernizované API a SDK v službě Azure OpenAI, nyní přinášejí podporu metody Direct Preference Optimization (DPO) jak pro model GPT-4.1, tak i pro jeho odlehčenou variantu GPT-4.1-mini.

Co je Direct Preference Optimization a proč je to důležité?

Direct Preference Optimization je pokročilá metoda ladění AI modelů, která umožňuje vývojářům zpřesnit schopnosti umělé inteligence na základě preferencí uživatelů – nikoli pouze pomocí tradičního způsobu posilovaného učení s lidskou zpětnou vazbou (RLHF). DPO přizpůsobuje váhy modelu na základě porovnání preferovaných i nepreferovaných odpovědí, aby výsledky lépe odpovídaly očekáváním uživatelů i firemní identitě. Oproti RLHF je metoda DPO méně náročná na výpočetní výkon, podstatně rychlejší a přitom zachovává vysokou úroveň přesnosti při ladění modelu.

Tato inovace dává firmám možnost vyškolit si jazykové modely přesně podle vlastního komunikačního stylu, bezpečnostních požadavků a zásad brandingu, a to za výrazně nižší časové i provozní náklady.

Rozšiřování globálního tréninku Azure AI do nových regionů

Microsoft zároveň rozšiřuje dostupnost funkce Global Training pro Azure AI do dalších 12 regionů, včetně oblasti East US, West Europe, UK South a Switzerland North. I přes toto rozšíření zůstává Global Training ve fázi veřejného preview. Geografická expanze přichází vhod v době, kdy význam data sovereignty – zejména v Evropě s přísnými požadavky na lokální zpracování dat kvůli ochraně soukromí a regulacím – rapidně roste.

Chystané funkce a nové možnosti

Připravované aktualizace slibují další vylepšení, jako je možnost pozastavit a znovu spustit proces ladění modelu nebo průběžné dolaďování modelů. Microsoft navíc plánuje zpřístupnit verzi GPT-4.1-nano v nově podporovaných regionech Azure, což vývojářům a firmám poskytne ještě větší flexibilitu i výkon.

Spuštění Responses API: Chytřejší integrace AI do pracovních postupů

Vývojáři nyní mohou využít nově představené Responses API, speciálně navržené pro bezproblémovou integraci customizovaných, jemně vyladěných modelů do komplexních aplikací a pracovních procesů. API je optimalizované pro agentickou a víceotáčkovou konverzační AI, dokáže udržet širší kontext během delších dialogů a umožňuje spolehlivé využívání externích nástrojů.

Responses API navíc uchovává historii konverzací, zobrazuje proces uvažování modelu, nabízí podrobný postup generování odpovědí a podporuje paralelní zpracování. Je plně kompatibilní s řadou AI nástrojů od živého vyhledávání po extrakci informací z dokumentů.

Dopad na trh a využití v praxi

Díky těmto inovacím Microsoft upevňuje pozici Azure AI jako flexibilní a globální platformy pro škálovatelný a bezpečný vývoj umělé inteligence. Nové ladění modelů s DPO, rozšiřování regionální podpory a vývojářsky orientovaná rozhraní API umožňují organizacím v různých oborech vytvářet AI řešení, která jsou nejen přesně přizpůsobena jejich potřebám, ale vyhovují také aktuálním regulacím ohledně zpracování dat.

Firmám, které chtějí využít konverzační AI například v zákaznické podpoře, tvorbě obsahu nebo komunikaci se zákazníky, nabízí aktualizovaný nástrojový balíček Azure novou úroveň efektivity, flexibility i ochrany soukromí.

Zdroj: neowin

Tereza Malá

Ahoj! Jmenuji se Tereza a technologie mě fascinuje od prvního smartphonu. Každý den pro vás vybírám a překládám nejnovější tech novinky ze světa.

Komentáře

Zanechte komentář

Microsoft urychluje ladění GPT-4.1 díky Direct Preference Optimization v Azure AI

Microsoft posouvá hranice ladění velkých jazykových modelů pomocí Direct Preference Optimization

Co je Direct Preference Optimization a proč je to důležité?

Rozšiřování globálního tréninku Azure AI do nových regionů

Chystané funkce a nové možnosti

Spuštění Responses API: Chytřejší integrace AI do pracovních postupů

Dopad na trh a využití v praxi

Komentáře

Související příspěvky

Google Meet vylepšuje AI poznámky ze schůzek: Efektivní shrnutí nyní přímo ve vaší poště

Obrovské slevy na technologie během Prime Day 2025: Galaxy Tab S9 za bezkonkurenční cenu

Meta získává klíčového architekta AI od Applu uprostřed intenzivního boje o talenty

Oficiální rendery Realme 15 Pro 5G odhaleny před globálním uvedením

Samsung představuje One UI 8: Nové standardy zabezpečení a ochrany soukromí pro Android telefony

Pátý odvolací soud podpořil Apple ve sporu týkajícím se odborů

Xiaomi 16 míří na globální trh: EEC certifikace potvrzuje blížící se uvedení

Nothing Phone (3): První dojmy a podrobný unboxing nového Android telefonu

Parrot OS 6.4: Nová verze přináší významné aktualizace jádra a bezpečnostních nástrojů

Honor X70: Revoluce ve výdrži baterie a rychlosti nabíjení u chytrých telefonů