Predstavenie najnovšieho modelu umelej inteligencie od Googlu s názvom Gemini predstavuje dôležitý míľnik v rýchlom vývoji tejto technológie. Gemini je multimodálny model, čo znamená, že je schopný spracovávať rôzne typy informácií, vrátane textu, kódu, zvuku, obrazu a videa. Tento model je dostupný v troch verzách: Ultra, určenej pre komplexné úlohy, Pro, ktorá pokrýva široké spektrum úloh, a Nano, optimalizovanej pre efektívne pracovanie na mobilných zariadeniach.
Schopnosti a výkon
V oblasti výkonu sa Gemini vyznačuje v testoch na rôznych benchmarkoch, poráža súčasné modely a prináša výnimočné výsledky, najmä v oblasti porozumenia jazyka. Verzia Ultra dosiahla pôsobivý výsledok 90,0% na masívnom multitaskovom benchmarku porozumenia jazyka, čím prevýšila výkon ľudských expertov. Model sa taktiež výrazne presadzuje v matematickom uvažovaní a generovaní kódu v populárnych programovacích jazykoch.
Gemini nie je len výkonný v porozumení jazyka, ale aj unikátny svojou schopnosťou pracovať s rôznymi druhmi informácií. Má schopnosť spracovať text, kód, zvuk, obraz a video, čo z neho robí všestranný nástroj pre rôzne úlohy. Prekonáva tradičný prístup k multimodálnym modelom, ktoré sú často zložené zo separátnych komponentov pre jednotlivé druhy úloh.
Gemini je navrhnutý tak, aby bol prirodzene multimodálny, čo znamená, že bol predtrénovaný na rôznych modalitách a následne doladený na základe multimodálnych dát. Tento prístup umožňuje Gemini lepšie porozumieť a pracovať s rôznorodými vstupmi a zlepšuje jeho schopnosti v mnohých oblastiach.
Okrem schopnosti porozumieť jazyku, matematike a programovaciemu kódu Gemini exceluje aj vo viacrozmerných úlohách, ako sú multimodálne benchmarky, ktoré zahŕňajú kombináciu rôznych modalít. Verzia Ultra dosahuje vynikajúce výsledky na týchto úlohách, prekonáva súčasné modely a otvára nové možnosti v oblasti multimodálneho uvažovania.
Bezpečnosť
Google zdôrazňuje, že pri vývoji Gemini kladie veľký dôraz na zodpovedný a bezpečný prístup. Model prešiel podrobným hodnotením bezpečnosti, ktoré zahŕňa analýzu skreslenia a toxicity. Spoločnosť spolupracuje s externými odborníkmi na identifikáciu potenciálnych rizík a na ich minimalizáciu. Tento prístup zdôrazňuje záväzok Googlu voči etickému a bezpečnému vývoju umelej inteligencie.
Dostupnosť
Gemini 1.0 už začína byť dostupný v niektorých produktoch Google, ako napríklad v jazykovom modeli Bard a smartfóne Pixel 8 Pro. Bard, integrovaný do vyhľadávacieho engine Google, bude využívať model Gemini Pro na pokročilé úlohy ako plánovanie, porozumenie a uvažovanie. Pixel 8 Pro, nový smartfón od Google, bude poháňaný modelom Gemini Nano, čo prinesie nové funkcie ako Summarize v aplikácii Recorder a Smart Reply v klávesnici Gboard. Google plánuje postupné rozšírenie prítomnosti Gemini v ďalších produktoch a službách, vrátane vyhľadávania, reklamy, prehliadača Chrome a Duet AI. Pre vývojárov a firemných zákazníkov bude možné pristupovať k modelu Gemini Pro prostredníctvom API v Google AI Studio alebo Google