Potansiyel dolu ama biraz zaman alacak
I/O 2024'te Google'ın teaser'ı bize yapay zeka asistanlarının gelecekte nereye gideceğine dair bir fikir verdi. Bu, Gemini'nin akıllı özelliklerini, Google Lens'te edineceğiniz türden görüntü tanıma yeteneklerinin yanı sıra güçlü doğal dil yanıtlarıyla birleştiren çok modlu bir özelliktir. Ancak tanıtım videosu şık olsa da, bizzat denedikten sonra, Astra gibi bir şeyin telefonunuza gelmesinden önce kat edilmesi gereken uzun bir yol olduğu açık. İşte Google'ın yeni nesil yapay zekasıyla ilk deneyimimizden çıkaracağımız üç sonuç.
Sam'in görüşü:
Şu anda çoğu insan dijital asistanlarla kendi sesini kullanarak etkileşime giriyor, dolayısıyla Astra'nın yapay zeka ile iletişim kurmak için kullandığı çoklu mod (yani metin/konuşmanın yanı sıra görüntü ve sesi de kullanması) nispeten yeni. Teorik olarak, bilgisayar tabanlı varlıkların, yalnızca sözlü komutlara yanıt veren daha robotik bir şey yerine, Google'ın program için en çok konuşulan sözcüklerinden biri olan gerçek bir asistan veya temsilci gibi çalışmasına ve davranmasına olanak tanıyor.
Demomuzda, Astra'dan kameranın önüne yerleştirdiğimiz bazı nesnelere dayanarak bir hikaye anlatmasını isteme seçeneğimiz vardı, ardından bize uğursuz bir kırmızı ışıktan kaçmaya çalışan bir dinozor ve onun güvenilir bagetiyle ilgili güzel bir hikaye anlattı. Eğlenceliydi ve hikaye sevimliydi ve yapay zeka beklediğiniz gibi çalıştı. Ancak aynı zamanda, Google'ın teaser'ında gördüğümüz, görünüşte her şeyi bilen asistandan da çok uzaktı. Ve belki bir çocuğu orijinal bir uyku öncesi hikayesiyle eğlendirmenin yanı sıra, Astra'nın bu bilgilerle sizin istediğiniz kadar fazla şey yaptığını hissetmiyordum.
Daha sonra meslektaşım Karissa, dokunmatik ekrana pastoral bir sahne çizdi ve bu noktada Astra, boyadığı çiçek ve güneşi doğru bir şekilde tanımladı. Ancak en ilgi çekici demo, Astra'nın Pixel 8 Pro'da çalıştığı sırada ikinci kez geri döndüğümüz zamandı. Bu, her birinin konumunu takip edip hatırlarken kameralarını bir dizi nesneye doğrultmamıza olanak sağladı. Hatta bu nesneler aslında demoda yer almasa da, kıyafetlerimi ve güneş gözlüklerimi nereye koyduğumu tanıyacak kadar akıllıydı.
Deneyimlerimiz bazı açılardan yapay zekanın potansiyel iniş çıkışlarını vurguladı. Bir dijital asistanın, markete gitmek üzere yola çıkmadan önce anahtarlarınızı nereye bırakmış olabileceğinizi veya meyve kasenizde kaç tane elma bulunduğunu size söyleyebilmesi bile gerçek anlamda zaman kazanmanıza yardımcı olabilir. Ancak Astra'nın arkasındaki bazı araştırmacılarla konuştuktan sonra hâlâ aşılması gereken pek çok engel olduğunu görüyoruz.
Google'ın yeni yapay zeka özelliklerinin çoğundan farklı olarak Astra (Google tarafından “araştırma önizlemesi” olarak tanımlanıyor) cihazda çalışmak yerine hâlâ buluttan yardıma ihtiyaç duyuyor. Belirli bir düzeyde nesne kalıcılığını desteklese de, bu “anılar” yalnızca tek bir oturumda sürüyor ve bu oturum şu anda yalnızca birkaç dakika sürüyor. Astra bazı şeyleri daha uzun süre hatırlayabilse bile, depolama ve gecikme gibi dikkate alınması gereken şeyler vardır, çünkü Astra'nın hatırladığı her nesne için yapay zekayı yavaşlatma riskiyle karşı karşıya kalırsınız ve bu da daha gösterişli bir deneyimle sonuçlanır. Astra'nın büyük bir potansiyele sahip olduğu açık olsa da, daha fazla tam özellikli işlevsellik elde etmemizin biraz zaman alacağı bilgisiyle heyecanım azaldı.
Karissa'nın görüşü:
Tüm üretken yapay zeka gelişmeleri arasında en çok ilgimi çeken multimodal yapay zeka oldu. En son modeller ne kadar güçlü olsa da, metin tabanlı sohbet robotlarına yönelik yinelemeli güncellemeler beni heyecanlandırmakta zorlanıyor. Ancak çevrenizle ilgili soruları gerçek zamanlı olarak tanıyabilen ve bunlara yanıt verebilen yapay zeka fikri, bir bilim kurgu filminden fırlamış gibi geliyor. Ayrıca, en son yapay zeka gelişme dalgasının akıllı gözlük gibi yeni cihazlara nasıl gireceğine dair daha net bir fikir veriyor.
Google, bir gün gözlük bileşenine sahip olabilecek ancak şimdilik çoğunlukla deneysel olan Project Astra ile bunun bir ipucunu verdi ( I/O açılış konuşması sırasındaki video görünüşe göre bir “araştırma prototipiydi.”) Ancak Project Astra şahsen bilim kurgu filminden çıkmış bir şey gibi hissetmiyordu.
Odanın çeşitli yerlerine yerleştirilmiş nesneleri doğru bir şekilde tanıyabildi ve “2 yaşındaki bir çocuk bu oyuncaklardan hangisiyle oynamalı?” gibi bunlarla ilgili incelikli sorulara yanıt verebildi. Karalamamdakileri tanıyabiliyor ve ona gösterdiğimiz farklı oyuncaklar hakkında hikayeler uydurabiliyordu.
Ancak Astra'nın yeteneklerinin çoğu Meta'nın sahip olduğu özelliklerle aynı görünüyordu akıllı gözlüğüyle sunuluyor. Meta'nın çok modlu yapay zekası aynı zamanda çevrenizi tanıyabilir ve sizin adınıza bir miktar yaratıcı yazı yazabilir. Meta bu özellikleri deneysel olarak nitelendirse de en azından geniş çapta kullanılabilir durumda.
Google'ın yaklaşımını farklılaştırabilecek Astra özelliği, yerleşik bir “belleğe” sahip olmasıdır. Bir grup nesneyi taradıktan sonra, belirli öğelerin nereye yerleştirildiğini hâlâ “hatırlayabiliyordu”. Şimdilik Astra'nın hafızası nispeten kısa bir zaman aralığıyla sınırlı gibi görünüyor, ancak araştırma ekibinin üyeleri bize hafızanın teorik olarak genişletilebileceğini söyledi. Bu açıkça teknoloji için daha fazla olasılık yaratacak ve Astra'nın daha çok gerçek bir asistan gibi görünmesini sağlayacaktır. 30 saniye önce gözlüklerimi nerede bıraktığımı bilmeme gerek yok ama dün gece onları nerede bıraktığımı hatırlayabilseydin, bu aslında bilim kurgunun yeniden canlanmış gibi hissettirirdi.
Ancak birçok üretken yapay zeka gibi, en heyecan verici olasılıklar henüz gerçekleşmemiş olanlardır. Astra eninde sonunda oraya varabilir ama şu anda Google'ın oraya ulaşmak için hâlâ yapması gereken çok iş var gibi görünüyor.
Google I/O 2024'ten tüm haberleri hemen takip edin Burada!
Kaynak: https://www.engadget.com/google-project-astra-hands-on-full-of-potential-but-its-going-to-be-a-while-235607743.html?src=rss