Blog

Jakub Benešovský

Jakub Benešovský

Test Automation Engineer

Ohlédnutí za AI v roce 2024

Umělá inteligence

Ať už jste novinky z AI tolik nesledovali, chatboty využívali jen občas, nebo vás jen zajímá, co vám mohlo uniknout, přinášíme shrnutí roku 2024 z naší perspektivy – co nás nejvíce ovlivnilo a zaujalo.

Umělá inteligence a zejména chatboti se stávají stále častějšími společníky v naší práci. Používáme je k analýze a sumarizaci zdrojů, generování segmentů textací i kódu, zprostředkování přehledů a informací o specifických znalostních oblastech. Zvykli jsme si na ně natolik, že i výrazné pozitivní změny v jejich schopnostech je snadné rychle zapomenout a brát za samozřejmé. Jak rok 2024 tedy ve světě AI vypadal?  

Rok plný novinek: Od textových modelů po komplexnější vnímání a odpovědi 

Na začátku roku 2024 primárně pracujeme s modely Gemini (dříve Bard), Claude 3.0, GPT-3.5, GPT-4. Tyto modely jsou vesměs pouze textové, maximálně s omezenou podporou práce se soubory, často u nich narážíme na omezení délky zprávy a aktuálnosti jejich znalostí. 

V únoru nabízí Gemini Advanced možnost upravovat a spouštět kód v Pythonu, míra adopce zpoplatněného Gemini Advanced je ale stále velmi nízká, proto doufáme, že se tato možnost objeví i u chatbotů, které používáme denně. 

Od května běží Gemini Advanced na modelu Gemini 1.5 Pro a je schopen přímo pracovat se soubory PDF, Word a Google dokumenty. Open-AI představuje model GPT-4o-preview, který zvládá nyní zpracovávat i generovat zvuk a obraz v reálném čase. Je nyní schopen naslouchat konverzaci a reagovat na ni. Pro úspěch verze 4o-preview, dočasně zapomínáme na ostatní modely. 

V červnu dostává Gemini mobilní aplikaci. Přichází nová verze Claude 3.5 Sonnet přístupná zdarma. Claude dále představuje funkci Artifacts, pro kolaboraci mezi uživatelem a chatbotem nad soubory, a funkci Projects, pro sdílení sady souborů s chatbotem, čímž pro některé z nás se dorovnává na úroveň ChatGPT. 

Červenec přináší nové modely Gemini 1.5 Flash a GPT-4o mini, což je nemalá výhra pro ty z nás, kteří si stále chatbota neplatí. V srpnu pak Gemini představuje roboty Gem, jako možnost vytvoření vlastního přizpůsobeného chatbota. 

V září Claude představuje předplatné pro firmy, kde zaručuje bezpečí dat. OpenAI přichází s modely o1-preview a o1-mini, čímž se naše nabyté znalosti prompt engineeringu zdají stále méně relevantní. 

V říjnu Google představuje Imagen 3, zatím jejich nejlepší generátor obrázků z textu. Claude uvádí Analysis tool, pro psaní a spouštění kódu s možnostmi pokročilé datové analýzy, a možnost hlasového zadávání v mobilních aplikacích. 

Od listopadu lze v Gemini uložit preference ohledně zájmů a komunikace. Podobně i Claude nabízí skrz Styles upravovat tón a styl výstupů. Claude již také nabízí možnost integrace s Google dokumenty. Vychází AI DeepSeek, jako konkurence modelů GPT co do výkonu, efektivity a zejména ceny. 

V prosinci přichází Gemini 2.0 Flash Experimental, Geminy 2.0 Experimental Flash (Gemini-exp-1206) a také Deep Research pro Gemini 1.5 Pro. Claude poskytuje Custom Instructions, pro zadání trvalých preferencí a instrukcí, vylepšuje také práci s velkými soubory a schopnosti Analysis tool. OpenAI uvádí oficiální verzi o1, ta oproti 01-preview věnuje více zdrojů analýze dotazu a snaží se zpětně kontrolovat vracenou odpověď pro kontrolu zodpovězení původního dotazu. Také spouští službu ChatGPT Pro s neomezeným přístupem k verzi o1 a hlasovému zadávání. 

Koncem roku již vnímáme možnost hlasového zadávání, práce se soubory, včetně snímků obrazovky, a preferencemi jako standard. Také jsme si zvykli, že pro generování obrázků, ilustrací a dohledávání odkazů není nutně potřeba chodit nijak daleko. Modely v oblastech logiky, řešení úloh a základních aritmetických operací již nevnímáme jako neschopné a nespolehlivé.  

Co přinese rok 2025? Výzvy a očekávání 

Nezbývá než zakončit tužbami na rok 2025, doufáme totiž, že se modely nadále budou zlepšovat zejména ve schopnostech držení kontextu a historie konverzace, které se zdánlivě zhoršují. Očekáváme další pokroky ke zlepšení přívětivosti spolupráce nad společnou obrazovkou a schopnostech našich asistentů provádět autonomní akce ve vybraných aplikacích. Také očekáváme, že AI agenti se budou zdokonalovat ve schopnostech řešení komplexních úkolů a proniknou hlouběji do našich každodenních životů. 

Nenechejte si ujít nejnovější informace.

Vyplňte nám vaši e-mailovou adresu a dostávejte pravidelnou nálož informací ohledně nadcházejících školení, akcí a testingového know-how.

Odesláním tohoto formuláře souhlasíte se zpracováním osobních údajů dle GDPR a se zasíláním marketingových e-mailů.