Blog

Vojtěch Čermák

Vojtěch Čermák

Senior Test Automation Engineer

Nejvýznamnější AI novinky v září 2025: Méně show, více reálné práce

Umělá inteligence

Září potvrdilo, že umělá inteligence se méně předvádí a víc řeší praxi. Velcí hráči budují obří infrastrukturu, aby zvládli další generaci modelů, a samotné modely se posouvají k „agentům“, kteří umí dlouho a spolehlivě pracovat na konkrétních úkolech.  K tomu přibyla i jasnější pravidla v EU pro hlášení vážných incidentů. Co to znamená pro firmy i běžné uživatele? Rychlejší a dostupnější služby, ale také větší nároky na bezpečnost a odpovědné nasazení. 

Výpočetní kapacita roste do gigawattů 

OpenAI a NVIDIA oznámily záměr nasadit nejméně 10 GW nových systémů NVIDIA pro trénink a provoz budoucích modelů; NVIDIA současně uvádí plán investovat až 100 mld. USD podle tempa výstavby. Jde o „letter of intent“ (záměr), nikoli finální smlouvu, ale měřítko růstu je zřejmé [1][2]. Paralelně CoreWeave rozšířil kontrakt s OpenAI až o 6,5 mld. USD; celkově letos uzavřené dohody dosahují zhruba 22,4 mld. USD [3]. 

Modely míří k agentům — méně show, více práce 

Anthropic uvedl Claude Sonnet 4.5. Firma zdůrazňuje lepší „computer use“ (práce v OS a aplikacích), kódování a delší autonomní běhy — tedy praktické scénáře, kde model plní vícekrokové úkoly bez stálého dohledu [4][5]. Google aktualizoval rychlé modely Gemini 2.5 Flash a Flash-Lite: lépe dodržují instrukce, zlepšily se v práci s nástroji (agentní úlohy) a zkrátily odezvy; Google uvádí i +5 p. b. na benchmarku SWE-Bench Verified oproti předchozí verzi [6]. 

„Programátorské olympiády“: viditelný milník 

DeepMind oznámil, že pokročilá verze Gemini 2.5 Deep Think dosáhla na světovém finále ICPC „gold-level“ výkonu (10/12 úloh v pětihodinovém limitu). Média zároveň informují, že systém OpenAI v odděleném testu vyřešil všech 12/12 úloh. Nejde o oficiální soutěžní účast mezi týmy, ale o testy v podmínkách srovnatelných s pravidly ICPC. Je to důkaz posunu ve vícekrokovém uvažování — v praxi to může znamenat stabilnější pomoc v analýze dat a při vývoji softwaru, byť to samo o sobě negarantuje „bezchybný kód“ [7][8]. 

Čína přitlačila: Alibaba Qwen3-Max 

Alibaba oznámila partnerství se společností NVIDIA a plánuje nová datová centra po celém světě. Zároveň také představila Qwen3-Max, svůj dosud největší model s více než bilionem parametrů, a hlásí důraz na kódování a agentní schopnosti. Model je dostupný přes Alibaba Cloud; reálný přínos mimo čínský ekosystém ukážou následující měsíce [9][10]. 

EU zpřesňuje provozní povinnosti 

Evropská komise otevřela veřejnou konzultaci k pracovní verzi metodiky a šablony pro hlášení „vážných incidentů“ u vysoce rizikových AI systémů podle AI Act (26. 9.–7. 11. 2025). Jde o praktický krok k tomu, jak budou poskytovatelé AI incidenty reálně oznamovat [11]. 

Závěr

Září ukázalo střízlivý trend: nejde jen o „chytřejší“ modely, ale hlavně o to, zda je lze spolehlivě provozovat ve velkém a zapojit do běžné práce. Pro firmy dává smysl začít tam, kde je rychlá návratnost: vyhledávání v dokumentech, reporting, testování a příprava kódu — právě tam agentní přístup přináší nejvíc užitku. Pro veřejnost to znamená více AI v každodenních službách, ale také větší význam transparentnosti, bezpečnosti a možnosti obrátit se na poskytovatele, když něco selže. V říjnu bude klíčové sledovat uzavírání konkrétních kontraktů na výpočet a první širší piloty agentních nástrojů v podnicích — tam se ukáže, co z papíru obstojí v praxi. 

Zdroje:

[1] NVIDIA newsroom: LOI s OpenAI na ≥ 10 GW. NVIDIA Newsroom 
[2] Reuters: NVIDIA plánuje investovat až 100 mld. USD; LOI s OpenAI. Reuters 
[3] CoreWeave (investors): rozšíření dohody s OpenAI až o 6,5 mld. USD; celkem ~22,4 mld. USD. investors.coreweave.com 
[4] Anthropic blog: Introducing Claude Sonnet 4.5. Anthropic 
[5] Reuters/Axios k uvedení Sonnet 4.5 (výkon, delší autonomní běhy). Reuters+1 
[6] Google Developers Blog: aktualizace Gemini 2.5 Flash/Flash-Lite (+5 p. b. na SWE-Bench Verified). developers.googleblog.com 
[7] DeepMind blog: Gemini 2.5 Deep Think — gold-level výkon na ICPC. Google DeepMind 
[8] Financial Times: kontext k ICPC (OpenAI 12/12; význam a limity). Financial Times 
[9] Reuters: Alibaba spustila Qwen3-Max (> 1 bilion parametrů). Reuters 
[10] Alibaba Cloud: přehled Qwen3-Max a schopností (Apsara). AlibabaCloud 
[11] Evropská komise: konzultace — draft guidance & reporting template pro „serious AI incidents“ (26. 9.–7. 11. 2025). Digitální strategie EU 


Don't miss out on the latest updates.

Fill in your email address to stay informed about upcoming training sessions, events, and testing know-how.

By submitting this form, you agree to the processing of your personal data in accordance with GDPR and to receiving marketing emails.