Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Giliai pasinerkite į „iOS 26“ vaizdinio intelekto vaizdo analizę


Giliai pasinerkite į „iOS 26“ vaizdinio intelekto vaizdo analizę


„iOS 26“ pristato reikšmingą „Apple“ vizualinės žvalgybos technologijos evoliuciją, išplėsdama jos galimybes nuo paprasto fotoaparato atpažinimo iki plataus vaizdo analizės, tiesiogiai analizuojamos įrenginio ekrano turinyje. Šis atnaujinimas iš naujo nustato, kaip vartotojai sąveikauja su vaizdais ir vaizdiniu turiniu programose ir ekrano kopijos savo „iPhone“, ypač tie, kuriuose yra naujausias „Apple“ siliconas, skirtas patobulinti įrenginių apdorojimą.

Vaizdinis intelektas atsirado „iOS 18.2“ kaip fotoaparato valdymo funkcija, leidžianti „iPhone“ kamerai apibūdinti aplinką, išversti tekstą ir realiu laiku identifikuoti įvairius objektus, tokius kaip augalai ir gyvūnai. Naudodama „iOS 26“, „Apple“ pavertė vaizdinį intelektą į išsamesnį vaizdinės analizės įrankį, kuris nebeįvaržo savo naudingumo to, ką fotoaparatas pastebi fiziškai, bet giliai tęsiasi į paties įrenginio ekrano turinį, įskaitant ekrano kopijas ir programų vaizdus.

Pagrindinis akcentas yra tas, kad vartotojai gali suaktyvinti vaizdinę intelektą ekrano turinyje, paspausdami tuos pačius mygtukus, naudojamus ekrano kopijoms atlikti. Šis veiksmas suaktyvina sąsają, leidžiančią vartotojams sąveikauti su užfiksuotais vaizdiniais duomenimis per kelias intelektualias parinktis pagal aptikto turinio tipą. Sistema gali išskaidyti konkrečių objektų ar teksto segmentų vaizdus ekrano kopijoje ar ekrano fiksavime ir pateikti svarbią informaciją, paieškos rezultatus ar tiesioginius veiksmus, tokius kaip kalendoriaus įvykių pridėjimas ar darbų sąrašai iš atpažintos detalės.

Žvelgiant iš techninės perspektyvos, „Visual Intelligence“ įvaizdžio analizę maitina moderni „Apple“ įrenginiai AI, platesnės „Apple Intelligence“ ekosistemos dalis. Ši ekosistema sustiprina „Siri“, rašymo įrankius ir ekosistemos supratimą tarp „Apple“ įrenginių. Patikėjimas įrenginio apdorojimu išsaugo vartotojo privatumą išvengiant duomenų įkėlimo į išorinius serverius, o apdorojimo reikalavimams reikia galingo silicio, rasto tik naujesniuose „iPhone“ modeliuose („iPhone 15 Pro“, 16 serijos, 17 serijų) ir suderinami „iPad“ ir „Mac“.

Objektų tipai Vaizdinis intelektas gali būti identifikuotas. Be pagrindinių gyvūnų ir augalų, dabar jis atpažįsta meno kūrinius, knygas, orientyrus, natūralius orientyrus ir skulptūras tiek fotoaparatų įvestis, tiek ekrano kopijas. Šis plataus spektro atpažinimas leidžia sistemai siūlyti turtingus kontekstinius duomenis, pradedant nuo paveikslo ar skulptūros nustatymo iki eksploatavimo informacijos apie verslą, matytą ekrano kopijoje ar tiesioginiame fotoaparato vaizde, pateikiant.

Kūrėjams taip pat naudinga šis patobulinimas per atnaujintą „App Intent API“, leidžiančią trečiųjų šalių programas integruoti su vaizdine intelektu. Tai įgalina novatoriškas programas, tokias kaip kūno rengybos programos, ištraukiančios treniruotės planus iš ekrano kopijų, virimo programas, paverčiančias receptų vaizdus į maisto prekių sąrašus, ir produktyvumo įrankius, aiškinančius lentos nuotraukas į veiksmingą turinį.

Vienas praktinis vaizdinio intelekto funkcionalumo pavyzdys apima įvykių skrajutės ekrano kopijos paėmimą ir AI analizės duomenis ir duomenis apie įvykį, turint galimybę ją pridėti tiesiai prie kalendoriaus. Sistema taip pat gali atlikti tikslines vaizdų paieškas ekrano kopijoje, leisdama vartotojui apeiti konkrečias ekrane esančias sritis ar objektus, siųsdama jas internetinės vaizdo paieškos rezultatams (pvz., „Google“ vaizdo paieškai). Vartotojai netgi gali užduoti pokalbių programas, pavyzdžiui, „ChatGPT“ klausimus apie ekrano kopijos elementus, susiedami vaizdinį intelektą su pokalbio AI, kad būtų galima interaktyvesnei patirčiai.

Ši vaizdo analizės ir turinio analizės funkcija apima ne tik objektų identifikavimą ar paieškų atlikimą; Tai suteikia vartotojams galimybę imtis neatidėliotinų, reikšmingų veiksmų, atsižvelgiant į kontekstą. Pvz., Per vaizdinę žvalgybą galima užsisakyti maistą iš restorano meniu, matyto ekrano kopijoje, rezervuoti, peržiūrėti vietos darbo valandas arba tiesiogiai įdėti skambučius naudodamiesi vizualiai rasta kontaktinė informacija. Gebėjimas analizuoti tekstą leidžia vertimą realiu laiku, santraukos ir garsiai skaityti, sustiprinti prieinamumą ir supratimą apie įvairias kalbas.

„Visual Intelligence“ architektūra yra labai optimizuota greičiui ir privatumui. Funkcijos realiojo laiko atsakymai ir analizė vyksta visiškai įrenginiuose nereikalaujant interneto ryšio, suteikiant galimybę vartotojams gauti greitus rezultatus be latentinio ar privatumo problemų, susijusių su debesų apdorojimu. Tai daro jį novatorišku žingsniu į kontekstą suvokiantį skaičiavimą, perkeldami įtaisus iš pasyvių žiniasklaidos pranešėjų prie iniciatyvių padėjėjų, kurie sklandžiai aiškina ir veikia vaizdinius duomenis.

Naudojant „iOS 26“, „Visual Intelligence“ sistemos sąsaja yra patogi vartotojui ir intuityvi. Suaktyvinę šią funkciją naudojant ekrano kopijos mygtukus ar fotoaparato valdymą, vartotojai mato parinktis, rodomas kontekstiniu požiūriu, pavyzdžiui, klauskite, ieškokite, ar konkretus programų veiksmus, leidžiančius sklandžiai sąveikauti. Intelektualus analizės variklis protingai nustato turinio tipą, nesvarbu, ar tai tekstas, menas, orientyras, kontaktinė informacija ar įvykio informacija “ir dinamiškai atitinkamai sureguliuoja savo išvestį ir turimus vartotojo veiksmus.

Apribojimai išlieka atsižvelgiant į įrenginio palaikymą, nes skaičiavimo intensyvumas reiškia, kad visos „Visual Intelligence“ galimybės yra skirtos pažangiausiems „Apple“ mikroschemų rinkiniams. Be to, kalbų palaikymas tam tikroms objektų atpažinimo funkcijoms daugiausia yra anglų kalba, o „Apple“ dirba su platesne daugiakalbė parama, nes ši funkcija subręsta.

Apibendrinant galima pasakyti, kad „IOS 26“ vaizdinio intelekto vaizdo analizė yra nemaža pažanga integruojant AI varomą vaizdinę analizę į kasdienį išmaniųjų telefonų naudojimą. Ši technologija pereina nuo reaktyvių kamerų pagrindu sukurtų objektų atpažinimo prie iniciatyvaus įrankio, kuris ekrano turinį paverčia veiksmingomis įžvalgomis, įgalinant vartotojus bendrauti su savo įrenginiais ir informacija naujais, sklandžiais būdais. Šis atnaujinimas nustato pagrindinį žingsnį link būsimų „Apple“ sąsajų, kur kontekstas ir ketinimai formuoja sąveiką, giliai maišant regėjimą, žinias ir veiksmus, kad būtų privatumas ir reagavimas.

***
Išsami evoliucija, funkcionalumas, kūrėjų integracija, vartotojo sąsaja ir aukščiau pateiktos praktiniai pavyzdžiai parodo „Visual Intelligence“ įvaizdžio analizės galimybių esmę „iOS 26“, kaip paskelbta ir išsamioje įvairiuose su obuoliu susijusiose šaltiniuose ir ekspertų aprėptį 2025 m.