Yapay zeka dünyayı ele geçirecekse neden Yazım Yarışmasını çözemiyor?
Yapay zeka üst düzey yöneticilerimiz için görevim basitti: şifreyi çözmeme yardım edin New York Times Heceleme yarışması.
Cumartesi akşamının büyük bir kısmını G, Y, A, L, P, O ve N harflerini mümkün olduğu kadar çok kelimeye dönüştürmeye çalışarak geçirmiştim. Ancak üç saat, 141 puan ve 37 kelimeden sonra – “özür dilememek”, “lagün” ve “analoji” de dahil olmak üzere – bir duvara çarptım. Kendimi Spelling Bee'nin “dahi” kademesine itmek için ihtiyacım olan tek şey birkaç kelimeydi; bu başlık, verilen harfleri kullanarak tüm olası kelimelerin yüzde 70'ini çözenlere ve bulmacanın kendisini etkili bir şekilde çözülmüş saydığı noktaya ayrılmıştı. . (Yüzde 100 çözenlere “kraliçe arı” rütbesi verilir, ama benim bile sınırlarım var.)
İnsan zihnim açıkça mücadele ediyordu, ancak bu görev yapay zeka için çocuk oyuncağı gibi görünüyordu, bu yüzden ChatGPT'yi çalıştırdım, ona Yazım Yarışmasını kazanmaya çalıştığımı söyledim, ona mektuplarımı verdim ve kuralları belirledim. “Bana onlarla oluşturulabilecek her kelimenin bir listesini ver” diye yazdım. “Harfleri tekrarlamanıza izin var, ancak her kelimenin 'N' içermesi gerekiyor.”
Enter tuşuna bastığımda ChatGPT'nin cevabı şu oldu:
“N” harfini içermesi gereken “GYALPON” harfleriyle oluşturulan kelimelerin listesi:
GNPAYO
YPNL
PGNOYL
ONAPİLG
LGNAPYO
HER ZAMAN
NAYGOPL
GİPON
AOGPLNY
PNAOGLİ
Mümkün olan çok sayıda permütasyon nedeniyle bu listenin yalnızca bir örneğidir.
Harika bir başlangıç değil.
“Kelimelerin sözlükte olması gerekiyor” diye yazdım. “Elbette” yanıtı geldi. “Verilen harflere göre geçerli İngilizce kelimelerin bir listesini sunacağım.” ANGLY, GALON, LANG.
Açıkçası bu işe yaramadı, bu yüzden Microsoft'un Copilot'una döndüm (YANG, OYNAMAK, PLANLAMAK, SİNİRLENDİRİCİ BİR ŞEKİLDE), Google'ın İkizler burcu (GAPON, GON, GIAN) ve Antropik'ten Claude (MANGO, DEVAM EDİYOR, LAWN17.LAY). Meta AI bana yararlı bir şekilde, aşağıdakileri içeren bir listeye yalnızca sözlükler tarafından tanınan kelimeleri dahil ettiğinden emin olduğunu söyledi. NALYP Ve NAGY, Google Arama'yı öldürmeyi amaçlayan bir sohbet robotu olan Perplexity ise şunu yazdı: GAL aniden donmadan önce yüzlerce kez.
Yapay zeka artık istediğiniz şeyin açıklamasını yazabildiğiniz kadar hızlı bir şekilde resim, video ve ses oluşturabilir. Şiir, deneme ve dönem ödevi yazabilir. Aynı zamanda kız arkadaşınızın, terapistinizin ve kişisel asistanınızın soluk bir taklidi de olabilir. Ve pek çok insan, insanları işlerinden otomatikleştirmenin ve dünyayı hayal bile edemeyeceğimiz şekillerde dönüştürmenin hazır olduğunu düşünüyor. Peki basit bir kelime bulmacasını çözmek neden bu kadar zor?
Cevap, modern yapay zeka çılgınlığımızı güçlendiren temel teknoloji olan büyük dil modellerinin ne kadar çalıştığında yatıyor. Bilgisayar programlama geleneksel olarak mantıksal ve kurallara dayalıdır; Bir bilgisayarın bir dizi talimata göre takip ettiği komutları yazıyorsunuz ve geçerli bir çıktı sağlıyor. Ancak üretken yapay zekanın bir alt kümesi olduğu makine öğrenimi farklıdır.
Bentley Üniversitesi'nde matematik ve veri bilimi profesörü Noah Giansiracusa bana “Bu tamamen istatistiksel bir şey” dedi. “Aslında bu, verilerden kalıplar çıkarmak ve ardından bu kalıplara büyük ölçüde uyan yeni verileri ortaya çıkarmakla ilgili.”
OpenAI kayıtlara göre yanıt vermedi ancak bir şirket sözcüsü bana bu tür “geribildirimlerin” OpenAI'nin modelin anlaşılmasını ve sorunlara yanıt vermesini geliştirmesine yardımcı olduğunu söyledi. Microsoft ve Meta yorum yapmayı reddetti. Google, Anthropic ve Perplexity yayınlanma zamanına göre yanıt vermedi.
Büyük dil modellerinin kalbinde, 2017 yılında Google'daki araştırmacılar tarafından gerçekleştirilen teknik bir atılım olan “transformatörler” yer alır. Bir istemi yazdığınızda, büyük bir dil modeli, kelimeleri veya bu kelimelerin kesirlerini “belirteç” adı verilen matematiksel birimlere ayırır. Transformers, her bir jetonu, bir modelin üzerinde eğitildiği daha büyük veri kümesi bağlamında birbirlerine nasıl bağlandıklarını görmek için analiz etme yeteneğine sahiptir. Bir transformatör bu ilişkileri anladıktan sonra, sıradaki bir sonraki olası jetonu tahmin ederek isteğinize yanıt verebilir. Finans Zamanları Eğer ilgileniyorsanız, bunların hepsini açıklayan harika bir animasyonlu açıklayıcı var.
BEN düşünce Sohbet robotlarına Spelling Bee kelimelerimi oluşturmaları için kesin talimatlar veriyordum, onların yaptığı tek şey kelimelerimi jetonlara dönüştürmek ve makul yanıtları geri vermek için dönüştürücüler kullanmaktı. Giansiracusa, “Bu, bilgisayar programlamak veya DOS komut istemine komut yazmakla aynı şey değil” dedi. “Kelimeleriniz sayılara çevrildi ve istatistiksel olarak işlendi.” Tamamen mantığa dayalı bir sorgu, yapay zekanın becerileri açısından en kötü uygulama gibi görünüyor; yoğun kaynak kullanan bir çekiçle vidayı çevirmeye benzer.
Bir yapay zeka modelinin başarısı aynı zamanda üzerinde eğitim aldığı verilere de bağlıdır. Yapay zeka şirketlerinin şu anda haber yayıncılarıyla hararetli bir şekilde anlaşmalar yapmasının nedeni budur; eğitim verileri ne kadar taze olursa, yanıtlar da o kadar iyi olur. Örneğin üretken yapay zeka, satranç hamleleri önerme konusunda berbat ama bu görevde en azından kelime bulmacalarını çözmekten biraz daha iyi. Giansiracusa, internette mevcut olan çok sayıda satranç oyununun, mevcut yapay zeka modellerinin eğitim verilerine neredeyse kesinlikle dahil edildiğine dikkat çekiyor. “Satranç oyunları olduğu için yapay zekanın üzerinde çalışabileceği çevrimiçi açıklamalı Spelling Bee oyunlarının yeterince olmadığından şüpheleniyorum” dedi.
Şirketin sahibi olduğu bir yapay zeka şirketi olan Neudesic'ten yapay zeka araştırmacısı Sandi Bensen, “Chatbot'unuzun kafası Rubik küpü olan bir kediden ziyade bir kelime oyunuyla karışmış gibi görünüyorsa, bunun nedeni karmaşık kelime oyunları oynamak için özel olarak eğitilmemiş olmasıdır” dedi. IBM. “Kelime oyunlarının, eğitim, ince ayar veya yönlendirme sırasında özel olarak talimat verilmediği sürece bir modelin uymakta zorlanacağı belirli kuralları ve kısıtlamaları vardır.”
“Chatbot'unuzun kafası Rubik küpü olan bir kediden daha çok bir kelime oyunuyla karışıyorsa, bunun nedeni karmaşık kelime oyunları oynamak için özel olarak eğitilmemiş olmasıdır.”
Bunların hiçbiri, dünyanın önde gelen yapay zeka şirketlerini, teknolojiyi her derde deva bir ilaç olarak pazarlamaktan, yeteneklerine ilişkin iddiaları çoğunlukla aşırı derecede abartmaktan alıkoymadı. Nisan ayında hem OpenAI hem de Meta, yeni yapay zeka modellerinin “akıl yürütme” ve “planlama” yeteneğine sahip olacağıyla övündü. Bir röportajda OpenAI'nin baş işletme sorumlusu Brad Lightcap şunları söyledi: Finans Zamanları ChatGPT'yi destekleyen yapay zeka modeli olan yeni nesil GPT'nin, akıl yürütme gibi “zor sorunları” çözme konusunda ilerleme göstereceğini söyledi. Meta'nın yapay zeka araştırmalarından sorumlu başkan yardımcısı Joelle Pineau, yayına şirketin “bu modellerin sadece konuşmasını değil, aynı zamanda akıl yürütmesini, planlamasını ve hafıza sahibi olmasını sağlamak için de yoğun bir şekilde çalıştığını” söyledi.
GPT-4o ve Llama 3'ün Spelling Bee'yi kırmasını sağlamak için defalarca yaptığım girişimler olağanüstü bir şekilde başarısız oldu. ChatGPT'ye bunu söylediğimde GALON, LANG ve ANGLY sözlükte yoktu, chatbot benimle aynı fikirde olduğunu söyledi ve önerdi GALVANOPİ yerine. Meta AI'nin daha fazla kelime bulma teklifine yanıt olarak dünyayı “elbette” kelimesini “sur” olarak yanlış yazdığımda, chatbot bana “sur”un aslında G, Y harfleriyle oluşturulabilecek başka bir kelime olduğunu söyledi. , A, L, P, O ve N.
Açıkçası, makinelerin çoğu görevi insanlardan daha iyi veya daha iyi yapabileceği anı tanımlayan belirsiz kavram olan Yapay Genel Zeka'dan hala çok uzaktayız. Meta'nın baş yapay zeka bilimcisi Yann LeCun gibi bazı uzmanlar, büyük dil modellerinin sınırlamaları hakkında açık sözlü davrandı ve gerçekte mantığı kullanmadıkları için bunların asla insan düzeyinde zekaya ulaşamayacağını iddia etti. Geçen yıl Londra'da düzenlenen bir etkinlikte LeCun, mevcut nesil yapay zeka modellerinin “dünyanın nasıl çalıştığını anlamadığını” söyledi. Planlama yeteneğine sahip değiller. Gerçek muhakeme yeteneğine sahip değiller” dedi. “Yaklaşık 20 saatlik pratikle kendi kendini eğitebilen, 17 yaşındaki bir çocuğun yapabileceği, tamamen otonom, sürücüsüz arabalarımız yok.”
Ancak Giansiracusa daha temkinli bir tavır takınıyor. “İnsanların nasıl mantık yürüttüğünü gerçekten bilmiyoruz, değil mi? Zekanın gerçekte ne olduğunu bilmiyoruz. Beynimin sadece büyük bir istatistiksel hesap makinesi olup olmadığını bilmiyorum, bir bakıma büyük bir dil modelinin daha etkili bir versiyonu gibi.”
Belki de abartıya ya da kaygıya yenik düşmeden üretken yapay zekayla yaşamanın anahtarı, onun doğasında var olan sınırlamalarını anlamaktır. Washington Üniversitesi'nde yapay zeka ve makine öğrenimi profesörü Chirag Shah, “Bu araçlar aslında insanların onları kullandığı pek çok şey için tasarlanmamıştır” dedi. 2022'de arama motorlarında büyük dil modellerinin kullanımını eleştiren yüksek profilli bir araştırma makalesinin ortak yazarı oldu. Shah, teknoloji şirketlerinin yapay zekayı bize dayatmadan önce yapabilecekleri ve yapamayacakları konusunda şeffaf olma konusunda çok daha iyi bir iş çıkarabileceğini düşünüyor. Ancak o gemi çoktan yola çıkmış olabilir. Geçtiğimiz birkaç ay içinde dünyanın en büyük teknoloji şirketleri (Microsoft, Meta, Samsung, Apple ve Google) yapay zekayı ürünlerine, hizmetlerine ve işletim sistemlerine sıkı bir şekilde entegre edeceklerini açıkladılar.
Shah, kelime oyunu bilmecem hakkında “Botlar berbat çünkü bunun için tasarlanmamışlardı” dedi. Teknoloji şirketlerinin onlara yönelttiği tüm diğer sorunları çözüp çözemediklerini zaman gösterecek.
Yapay zeka sohbet robotları sizi başka nasıl başarısızlığa uğrattı? Bana e-posta gönder [email protected] ve bana haber ver!
Kaynak: https://www.engadget.com/if-ai-is-going-to-take-over-the-world-why-cant-it-solve-the-spelling-bee-170034469.html?src=rss