Jakub Benešovský
Test Automation Engineer
Blog
Jakub Benešovský
Test Automation Engineer
Ať už jste novinky z AI tolik nesledovali, chatboty využívali jen občas, nebo vás jen zajímá, co vám mohlo uniknout, přinášíme shrnutí roku 2024 z naší perspektivy – co nás nejvíce ovlivnilo a zaujalo.
Umělá inteligence a zejména chatboti se stávají stále častějšími společníky v naší práci. Používáme je k analýze a sumarizaci zdrojů, generování segmentů textací i kódu, zprostředkování přehledů a informací o specifických znalostních oblastech. Zvykli jsme si na ně natolik, že i výrazné pozitivní změny v jejich schopnostech je snadné rychle zapomenout a brát za samozřejmé. Jak rok 2024 tedy ve světě AI vypadal?
Na začátku roku 2024 primárně pracujeme s modely Gemini (dříve Bard), Claude 3.0, GPT-3.5, GPT-4. Tyto modely jsou vesměs pouze textové, maximálně s omezenou podporou práce se soubory, často u nich narážíme na omezení délky zprávy a aktuálnosti jejich znalostí.
V únoru nabízí Gemini Advanced možnost upravovat a spouštět kód v Pythonu, míra adopce zpoplatněného Gemini Advanced je ale stále velmi nízká, proto doufáme, že se tato možnost objeví i u chatbotů, které používáme denně.
Od května běží Gemini Advanced na modelu Gemini 1.5 Pro a je schopen přímo pracovat se soubory PDF, Word a Google dokumenty. Open-AI představuje model GPT-4o-preview, který zvládá nyní zpracovávat i generovat zvuk a obraz v reálném čase. Je nyní schopen naslouchat konverzaci a reagovat na ni. Pro úspěch verze 4o-preview, dočasně zapomínáme na ostatní modely.
V červnu dostává Gemini mobilní aplikaci. Přichází nová verze Claude 3.5 Sonnet přístupná zdarma. Claude dále představuje funkci Artifacts, pro kolaboraci mezi uživatelem a chatbotem nad soubory, a funkci Projects, pro sdílení sady souborů s chatbotem, čímž pro některé z nás se dorovnává na úroveň ChatGPT.
Červenec přináší nové modely Gemini 1.5 Flash a GPT-4o mini, což je nemalá výhra pro ty z nás, kteří si stále chatbota neplatí. V srpnu pak Gemini představuje roboty Gem, jako možnost vytvoření vlastního přizpůsobeného chatbota.
V září Claude představuje předplatné pro firmy, kde zaručuje bezpečí dat. OpenAI přichází s modely o1-preview a o1-mini, čímž se naše nabyté znalosti prompt engineeringu zdají stále méně relevantní.
V říjnu Google představuje Imagen 3, zatím jejich nejlepší generátor obrázků z textu. Claude uvádí Analysis tool, pro psaní a spouštění kódu s možnostmi pokročilé datové analýzy, a možnost hlasového zadávání v mobilních aplikacích.
Od listopadu lze v Gemini uložit preference ohledně zájmů a komunikace. Podobně i Claude nabízí skrz Styles upravovat tón a styl výstupů. Claude již také nabízí možnost integrace s Google dokumenty. Vychází AI DeepSeek, jako konkurence modelů GPT co do výkonu, efektivity a zejména ceny.
V prosinci přichází Gemini 2.0 Flash Experimental, Geminy 2.0 Experimental Flash (Gemini-exp-1206) a také Deep Research pro Gemini 1.5 Pro. Claude poskytuje Custom Instructions, pro zadání trvalých preferencí a instrukcí, vylepšuje také práci s velkými soubory a schopnosti Analysis tool. OpenAI uvádí oficiální verzi o1, ta oproti 01-preview věnuje více zdrojů analýze dotazu a snaží se zpětně kontrolovat vracenou odpověď pro kontrolu zodpovězení původního dotazu. Také spouští službu ChatGPT Pro s neomezeným přístupem k verzi o1 a hlasovému zadávání.
Koncem roku již vnímáme možnost hlasového zadávání, práce se soubory, včetně snímků obrazovky, a preferencemi jako standard. Také jsme si zvykli, že pro generování obrázků, ilustrací a dohledávání odkazů není nutně potřeba chodit nijak daleko. Modely v oblastech logiky, řešení úloh a základních aritmetických operací již nevnímáme jako neschopné a nespolehlivé.
Nezbývá než zakončit tužbami na rok 2025, doufáme totiž, že se modely nadále budou zlepšovat zejména ve schopnostech držení kontextu a historie konverzace, které se zdánlivě zhoršují. Očekáváme další pokroky ke zlepšení přívětivosti spolupráce nad společnou obrazovkou a schopnostech našich asistentů provádět autonomní akce ve vybraných aplikacích. Také očekáváme, že AI agenti se budou zdokonalovat ve schopnostech řešení komplexních úkolů a proniknou hlouběji do našich každodenních životů.
Don't miss out on the latest updates.
Fill in your email address to stay informed about upcoming training sessions, events, and testing know-how.
Need Advice?
Request our free, non-sales consultation. Fill out the form and we will get back to you.
Notice