ABD'li teknoloji devi Google, video görüntülerindeki nesneleri otomatik olarak tanıyıp aranabilir hale getiren yeni bir makine öğrenme teknolojisini hizmete sokacağını açıkladı.
Google'ın "Akıllı Video Uygulama Programlama Arayüzü" adını verdiği yeni teknoloji, şirketin bulut bilişim birimi Google Cloud'un ABD'nin San Francisco şehrinde düzenlediği "Next" konferansında kamuoyuna duyuruldu.
Yeni teknolojinin, bir video arşivindeki tüm görüntülerde yer alan nesneleri tek tek kaydederek, bunları daha sonra anahtar sözcüklerle arayıp, nesnelerin yer aldığı sahneleri otomatik olarak seçebilen uygulamalar üretmeye olanak sağlayacağı belirtildi.
Google'da "Geliştirici temsilcisi" olarak görev yapan Sara Robinson'ın konferans sırasında yaptığı sunumda programın uygulama arayüzüne yüklenen bir videonun birbirini izleyen sahnelerindeki dağ manzarası, kır evi, şehir, cadde, köpek, garaj gibi nesne ve kavramları görüntülerin akışıyla eş zamanlı olarak anahtar sözcükler olarak kaydettiği görüldü.
Robinson, sonraki adımda geniş bir video arşivi içinde belirli bir nesneye odaklanan aramalar yaptı. "Beyzbol" anahtar sözcüğüyle yapılan aramada, saatlerce uzunluktaki video arşivi içinden beyzbol topu, şapkası ve maç görüntülerinin olduğu sahneler, "plaj" anahtar sözcüğüyle yapılan aramada ise odağında veya fonunda plaj görüntülerinin bulunduğu sahneler otomatik olarak seçilip, listelendi.
Google Cloud'un Yapay Zeka ve Makine Öğrenme Birimi baş araştırmacısı Fei-Fei Li, günümüzde piksellerin dünyasının hareketsiz imajların çok ötesine geçtiğini vurgularken, yeni teknolojinin video içeriklerinde kavramsal aramayı mümkün kılması sayesinde makine öğrenme teknolojilerine geniş bir saha açacağını ifade etti.
İmaj tanıma teknolojileri bugüne dek yalnızca hareketsiz resimlere uygulanabiliyordu. AA