Apple má AI, která popisuje obrázky lépe

Apple má AI, která popisuje obrázky lépe i než modely desetkrát větší

Výzkumníci Applu ukázali nový způsob trénování AI pro detailní popisy obrázků. Menší modely díky němu zvládají přesnější výsledky než mnohem větší konkurenti.

Také si přečtěte

Apple rozdává uživatelům peníze. Kdo má nárok na kompenzaci?

25.7.2026

Apple TV překvapuje! Poprvé sází na seznamovací reality show

25.7.2026

Apple Research přišel s metodou RubiCap, která umí naučit AI popisovat obrázky přesněji i na výrazně menších modelech. V praxi to znamená méně halucinací, více detailů a lepší využití v hledání fotek nebo v přístupnosti pro zrakově znevýhodněné uživatele.

Zapojte se

Chcete k tomu něco dodat? Napište krátce proč.

Aktuální cenu produktu Apple AirPods 4 najdete na Alze.

Apple AirPods 4

3 190 Kč

Koupit na Alze

RubiCap trénuje AI na přesnější popisy detailů

Nový systém se zaměřuje na takzvané dense image captioning, tedy popisování jednotlivých částí obrázku místo jednoho stručného shrnutí. Místo věty typu „na fotce je pes v parku“ tak model dokáže popsat i menší regiony snímku a rozlišit třeba lidi, objekty nebo děj v pozadí.

To je důležité hlavně proto, že běžné datové sady pro trénink bývají buď drahé na ruční anotace, nebo příliš omezené. Apple proto zvolil chytřejší cestu: nehoní se za obřím modelem, ale za lepším způsobem učení. RubiCap kombinuje více existujících vision-language modelů, generuje několik variant popisu a pak je nechává hodnotit podle přesných kritérií.

Výsledek je model, který dostává strukturovanou zpětnou vazbu místo jednoduchého „správně/špatně“. Díky tomu se učí psát popisy, které jsou konkrétnější, méně zaměňují objekty a lépe vystihují to, co je na obrázku opravdu vidět.

Menší modely tentokrát porazily mnohem větší soupeře

Apple a University of Wisconsin–Madison ukázali tři verze RubiCap: 2B, 3B a 7B parametrů. A právě tady přichází to zajímavé. I nejmenší z nich dokázaly v testech překonat modely s desítkami miliard parametrů, tedy i výrazně větší systémy, které by papírově měly mít navrch.

Nejde jen o laboratorní úspěch. Pokud podobný přístup doputuje do produktů, může zlepšit vyhledávání v aplikaci Fotky, třídění snímků podle obsahu nebo popisky pro VoiceOver a další přístupnostní funkce. Menší model navíc znamená nižší nároky na výkon, paměť i provozní náklady, což je pro Apple ekosystém zásadní.

Zajímavé je i to, že menší 3B model v některých testech překonal svou větší verzi. To naznačuje, že kvalita výsledku nemusí záviset jen na velikosti modelu, ale hlavně na tom, jak dobře je trénovaný. Pro Apple je to dobrá zpráva: místo honby za největší AI může stavět na efektivitě, která se lépe hodí pro zařízení v kapse i na on-device funkce.

RubiCap tak ukazuje směr, který je pro Apple typický: méně zbytečné masy, víc praktického užitku. Pokud se tahle technologie dostane do reálných produktů, uživatelé z ní nebudou mít jen „chytrou AI“, ale hlavně přesnější výsledky tam, kde na detailech opravdu záleží.

Pokud vás téma zajímá víc, přečtěte si také iOS 26: Podpora, novinky a seznam kompatibilních iPhonů a iOS 18.2 bude vydáno dnes večer! Jaké novinky nabídne?.

Podrobnosti přinesl také 9to5mac.