Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon IOS 26'nın görsel zeka görüntü ayrıştırmasına derinlemesine dalış


IOS 26'nın görsel zeka görüntü ayrıştırmasına derinlemesine dalış


IOS 26, Apple'ın görsel zeka teknolojisinde önemli bir evrim sunarak, yeteneklerini basit kamera tabanlı tanımadan doğrudan cihazın ekran içeriğinde genişletmeye kadar genişletiyor. Bu yükseltme, kullanıcıların iPhone'larındaki uygulamalar ve ekran görüntüleri, özellikle de Apple'ın gelişmiş cihazda işleme için en son silikonuyla donatılmış uygulamalar ve ekran görüntüleri arasında görüntülerle etkileşim kurma şeklini yeniden tanımlar.

Görsel zeka iOS 18.2'de iPhone kamerasının çevreyi tanımlamasına, metni çevirmesine ve bitkiler ve hayvanlar gibi çeşitli nesneleri gerçek zamanlı olarak tanımlamasına izin veren bir kamera kontrol özelliği olarak ortaya çıktı. İOS 26 ile Apple, görsel zekayı artık kameranın fiziksel olarak gözlemlediği şeyle sınırlamayan ancak ekran görüntüleri ve uygulama görüntüleri de dahil olmak üzere cihazın kendi ekran içeriğine genişleyen daha kapsamlı bir görsel analiz aracına dönüştürdü.

Önemli bir vurgu, kullanıcıların ekran görüntüleri almak için kullanılan aynı düğmelere basarak ekran içeriğinde görsel zekayı etkinleştirebilmeleridir. Bu eylem, kullanıcıların algılanan içerik türüne göre birden fazla akıllı seçenek aracılığıyla yakalanan görsel verilerle etkileşime girmesine izin veren bir arayüzü tetikler. Sistem, ekran görüntüsü veya ekran yakalama içindeki belirli nesneler veya metin segmentleri için görüntüleri inceleyebilir ve ilgili bilgiler, arama sonuçları veya takvim olayları ekleme veya tanınan ayrıntılardan yapılacaklar listeleri oluşturma gibi doğrudan eylemler sunabilir.

Teknik açıdan bakıldığında, görsel zekanın görüntü ayrıştırma, Apple'ın daha geniş "Apple Zekası" ekosisteminin bir parçası olan sofistike cihaz içi yapay zekası tarafından desteklenmektedir. Bu ekosistem, Apple cihazlarında Siri, yazma araçları ve ekosistem farkındalığını geliştirir. Bitiş ayı işlemine olan güven, harici sunuculara veri yüklemesinden kaçınarak kullanıcı gizliliğini korur ve işleme talepleri sadece daha yeni iPhone modellerinde (iPhone 15 Pro, 16 Serisi, 17 Serisi) ve uyumlu iPad ve Mac'lerde bulunan güçlü silikon gerektirir.

Görsel zekanın tanımlayabileceği nesnelerin türleri özellikle genişlemiştir. Temel hayvanların ve bitkilerin ötesinde, şimdi hem kamera girişlerinde hem de ekran görüntülerinde sanat eserlerini, kitapları, yer işaretlerini, doğal yerleri ve heykelleri tanıyor. Bu geniş spektrum tanıma, sistemin bir resim veya heykel tanımlamaktan bir ekran görüntüsünde veya canlı kamera görünümünde görülen bir işletme hakkında operasyonel ayrıntılar sağlamaya kadar zengin bağlamsal veriler sunmasına izin verir.

Geliştiriciler ayrıca, üçüncü taraf uygulamaların görsel zeka ile entegre olmasını sağlayan yükseltilmiş uygulama niyet API'sı aracılığıyla bu geliştirmeden de yararlanır. Bu, ekran görüntülerinden egzersiz planları çıkarma, tarif görüntülerini bakkal listelerine dönüştüren pişirme uygulamaları ve beyaz tahta fotoğraflarını eyleme geçirilebilir içeriğe yorumlayan üretkenlik araçları gibi Fitness Apps gibi yenilikçi uygulamalar sağlar.

Görsel zeka işlevinin pratik bir örneği, bir etkinlik broşürünün ekran görüntüsünü almayı ve AI'nın tarih ve olay ayrıntılarını doğrudan takvime ekleyebilmesini içerir. Sistem ayrıca, kullanıcının ekrandaki belirli alanları veya nesneleri daire içine almasına ve bunları web tabanlı görüntü arama sonuçlarına (Google Resim Arama gibi) göndermesine izin vererek bir ekran görüntüsü içinde hedeflenen görüntü aramalarını da gerçekleştirebilir. Kullanıcılar, daha etkileşimli bir deneyim için görsel zekayı konuşma AI ile bağlayan ekran görüntüsü hakkında chatgpt soruları gibi chatbots bile sorabilir.

Bu görüntü ayrıştırma ve içerik analizi özelliği, sadece nesneleri tanımlamanın veya aramaların gerçekleştirilmesinin ötesine geçer; Kullanıcıların bağlama bağlı olarak anında, anlamlı eylemler yapmalarını sağlar. Örneğin, görsel zeka aracılığıyla, bir ekran görüntüsünde görülen bir restoran menüsünden yiyecek sipariş edebilir, rezervasyon yaptırabilir, bir mekanın çalışma saatlerini görüntüleyebilir veya görsel olarak bulunan iletişim bilgilerini kullanarak doğrudan çağrıları yerleştirebilir. Metin ayrıştırma yeteneği, gerçek zamanlı çeviriler, özetler ve yüksek sesle okumaya, erişilebilirliği ve diller arası anlayışı artırmaya izin verir.

Görsel Zekanın mimarisi, hız ve gizlilik için büyük ölçüde optimize edilmiştir. Özelliğin gerçek zamanlı yanıtları ve analitikleri, bir İnternet bağlantısı gerektirmeden tam cihazda gerçekleşir ve kullanıcıların bulut işleme ile ilişkili gecikme veya gizlilik endişeleri olmadan anında sonuçlar almasını sağlar. Bu, bağlama duyarlı hesaplamada öncü bir adım haline getirir, cihazları pasif medya sunucularından görsel verileri akıcı bir şekilde yorumlayan ve hareket eden proaktif asistanlara kaydırır.

İOS 26 ile sistemin görsel zeka arayüzü kullanıcı dostu ve sezgiseldir. Özelliği ekran görüntüsü düğmeleri veya kamera kontrolü yoluyla tetikledikten sonra, kullanıcılar, sorunsuz etkileşime izin veren  sorma,          veya belirli uygulama eylemleri gibi görüntülenen seçenekleri görürler. Akıllı ayrıştırma motoru, metin, sanat, dönüm noktası, iletişim bilgileri veya olay ayrıntıları olan içerik türünün türünü akıllıca belirler ve çıktısını ve kullanılabilir kullanıcı eylemlerini buna göre dinamik olarak ayarlar.

Hesaplama yoğunluğu, görsel zekanın tam yeteneklerinin Apple'ın en gelişmiş yonga setleri için ayrıldığı anlamına geldiğinden, sınırlamalar cihaz desteği açısından kalır. Ayrıca, belirli nesne tanıma özellikleri için dil desteği şu anda öncelikle İngilizce'dir ve Apple, özellik olgunlaştıkça daha geniş çok dilli destek üzerinde çalışıyor.

Özetle, iOS 26'nın görsel zeka görüntü ayrıştırması, AI ile çalışan görsel analizi günlük akıllı telefon kullanımına entegre etmede önemli bir ilerlemeyi temsil etmektedir. Teknoloji, reaktif kamera tabanlı nesne tanımadan ekrandaki içeriği eyleme geçirilebilir bilgilere dönüştüren, kullanıcıları cihazlarıyla ve bilgileriyle yeni, akıcı yollarla etkileşim kurmaları için güçlendiren proaktif bir araca geçiyor. Bu yükseltme, bağlam ve niyet şekil etkileşimlerinin, görme, bilgi ve gizlilik ve duyarlılığa karşı görüşlü eylemleri derinden harmanlayan gelecekteki Apple arayüzlerine doğru bir adım belirler.

***
Yukarıdaki ayrıntılı evrim, işlevsellik, geliştirici entegrasyonu, kullanıcı arayüzü ve pratik örnekler, 2025'te Apple ile ilgili çeşitli kaynaklarda ve uzman kapsamında açıklandığı ve detaylandırıldığı gibi görsel zekanın imaj ayrıştırma yeteneklerinin özünü temsil etmektedir.