Anthropic’in Claude’u, AI uygulamalarınızı hızla geliştirmek için hızlı bir oyun alanı ekliyor
Yapay zeka sektöründe geçtiğimiz yıl hızlı mühendislik popüler bir iş haline geldi, ancak Anthropic’in bunu en azından kısmen otomatikleştirecek araçlar geliştirdiği anlaşılıyor.
Anthropic, şirket blog yazısına göre Salı günü geliştiricilerin, girişimin dil modeli Claude ile daha kullanışlı uygulamalar oluşturmasına yardımcı olmak için birkaç yeni özellik yayınladı. Geliştiriciler artık Claude 3.5 Sonnet’i kullanarak istemleri oluşturabilir, test edebilir ve değerlendirebilir, istem mühendisliği tekniklerini kullanarak daha iyi girdiler oluşturabilir ve Claude’un özel görevler için verdiği yanıtları iyileştirebilir.
Dil modelleri, bazı görevleri gerçekleştirmelerini istediğinizde oldukça affedicidir, ancak bazen bir istemin ifadesinde yapılan küçük değişiklikler sonuçlarda büyük iyileştirmelere yol açabilir. Normalde bu ifadeyi kendiniz bulmanız veya bunu yapması için bir istem mühendisi tutmanız gerekir, ancak bu yeni özellik iyileştirmeleri bulmayı kolaylaştırabilecek hızlı geri bildirimler sunar.
Özellikler, yeni bir Değerlendirme sekmesi altında Anthropic Konsolu’nda yer almaktadır. Konsol, Claude ile ürün geliştirmek isteyen işletmeleri çekmek için oluşturulan, geliştiriciler için girişimin test mutfağıdır. Mayıs ayında açıklanan özelliklerden biri, Anthropic’in yerleşik istem oluşturucusudur; bu, bir görevin kısa bir tanımını alır ve Anthropic’in kendi istem mühendisliği tekniklerini kullanarak çok daha uzun, ayrıntılı bir istem oluşturur. Anthropic’in araçları, istem mühendislerinin yerini tamamen almasa da, şirket bunun yeni kullanıcılara yardımcı olacağını ve deneyimli istem mühendisleri için zaman kazandıracağını söyledi.
Evaluate’te geliştiriciler, AI uygulamalarının istemlerinin çeşitli senaryolarda ne kadar etkili olduğunu test edebilir. Geliştiriciler, gerçek dünya örneklerini bir test takımına yükleyebilir veya Claude’dan AI tarafından oluşturulan bir dizi test vakası oluşturmasını isteyebilir. Geliştiriciler daha sonra çeşitli istemlerin ne kadar etkili olduğunu yan yana karşılaştırabilir ve örnek cevapları beş puanlık bir ölçekte derecelendirebilir.
Anthropic’in blog yazısından bir örnekte, bir geliştirici uygulamasının birkaç test vakasında çok kısa cevaplar verdiğini tespit etti. Geliştirici, cevapları daha uzun hale getirmek için istemindeki bir satırı ayarlayabildi ve bunu aynı anda tüm test vakalarına uygulayabildi. Bu, özellikle az veya hiç istem mühendisliği deneyimi olmayan geliştiricilere çok fazla zaman ve emek kazandırabilir.
Anthropic CEO’su ve kurucu ortağı Dario Amodei, bu yılın başlarında Google Cloud Next’ten verdiği bir röportajda, hızlı mühendisliğin üretken yapay zekanın yaygın bir şekilde kurumsal olarak benimsenmesi için en önemli şeylerden biri olduğunu söyledi. Amodei, “Basit geliyor, ancak hızlı bir mühendisle geçirilen 30 dakika, daha önce çalışmadığı bir uygulamayı çalıştırabilir” dedi.
(çevirilecek etiketler)Antropik
Kaynak: https://techcrunch.com/2024/07/09/anthropics-claude-adds-a-prompt-playground-to-quickly-improve-your-ai-apps/