Apple Intelligence se má neustále zlepšovat. Věřte tomu nebo ne, Apple neustále na funkcích pracuje. Jaké to má výsledky?
Díky nekompromisnímu důrazu na soukromí uživatelů se společnost Apple potýká s problémy při shromažďování dostatečného množství dat pro trénování rozsáhlých jazykových modelů, které pohánějí funkce Apple Intelligence a které nakonec vylepší Siri.
Apple Intelligence jde dopředu
Aby bylo možné vylepšit Apple Intelligence, musí Apple přijít s možnostmi tréninku umělé inteligence, které zachovávají soukromí, a některé z metod, které společnost používá, byly popsány v novém příspěvku na blogu Machine Learning Research.
Apple v podstatě potřebuje data uživatelů, aby mohl vylepšit sumarizaci, nástroje pro psaní a další funkce Apple Intelligence, ale nechce shromažďovat data od jednotlivých uživatelů. Místo toho tedy Apple vypracoval způsob, jak pochopit trendy používání pomocí rozdílného soukromí a dat, která nejsou spojena s žádnou osobou. Apple vytváří syntetická data, která jsou reprezentativní pro souhrnné trendy v datech skutečných uživatelů, a k porovnávání používá detekci na zařízení, což společnosti poskytuje přehled bez nutnosti přístupu k citlivým informacím.
Funguje to takto: Společnost Apple generuje několik syntetických e-mailů na témata, která jsou v e-mailech uživatelů běžná, například pozvánku na tenis v 15:00. Společnost Apple pak z tohoto e-mailu vytvoří „vložení“ se specifickými informacemi o jazyce, tématu a délce. Společnost Apple může vytvořit několik embeddingů s různou délkou e-mailu a různými informacemi.
Tyto embeddingy jsou zaslány malému počtu uživatelů iPhonu, kteří mají zapnutou funkci Device Analytics, a iPhony, které embeddingy obdrží, vyberou vzorek skutečných e-mailů uživatelů a vypočítají embeddingy pro tyto skutečné e-maily. Syntetické embeddingy vytvořené společností Apple jsou porovnány s embeddingem pro skutečný e-mail a iPhone uživatele rozhodne, který ze syntetických embeddingů je nejblíže skutečnému vzorku.
Společnost Apple pak pomocí rozdílu soukromí určí, která ze syntetických embeddingů jsou nejčastěji vybírána ve všech zařízeních, takže ví, jak jsou e-maily nejčastěji formulovány, aniž by kdy viděla e-maily uživatelů a aniž by věděla, která konkrétní zařízení vybrala který embedding jako nejpodobnější.
Společnost Apple uvádí, že nejčastěji vybraná syntetická vložení, která shromažďuje, lze použít k vytvoření trénovacích nebo testovacích dat nebo je lze použít jako příklady pro další zpřesnění dat. Tento proces poskytuje společnosti Apple způsob, jak vylepšit témata a jazyk syntetických e-mailů, což následně trénuje modely k vytváření lepších textových výstupů pro shrnutí e-mailů a další funkce, a to vše bez narušení soukromí uživatelů.
Genmoji
Něco podobného dělá Apple i v případě Genmoji, kdy využívá diferencované soukromí k identifikaci oblíbených podnětů a vzorů podnětů, které lze použít ke zlepšení funkce generování obrázků. Apple používá techniku, která zajišťuje, že dostává pouze podněty Genmoji, které použily stovky lidí, a nic konkrétního nebo jedinečného, co by mohlo identifikovat jednotlivou osobu.
Společnost Apple nevidí Genmoji spojené s osobním zařízením a všechny přenášené signály jsou anonymizovány a obsahují náhodný šum, aby se skryla identita uživatele. Apple také nespojuje žádná data s IP adresou nebo ID, které by mohlo být spojeno s účtem Apple.
U obou těchto metod se testování účastní pouze uživatelé, kteří se přihlásili k odesílání analýzy zařízení společnosti Apple, takže pokud nechcete, aby se vaše data tímto způsobem používala, můžete tuto možnost vypnout.
Společnost Apple plánuje rozšířit používání diferencovaných technik ochrany soukromí pro vylepšení aplikací Image Playground, Memories Creation, Writing Tools a Visual Intelligence v systémech iOS 18.5, iPadOS 18.5 a macOS Sequoia 15.5.