OpenAI, web tarayıcılarında ve grafiksel kullanıcı arayüzlerinde (GUI) bağımsız olarak gezinebilen yeni yapay zeka aracı Operator’ı tanıttı. Şirket, Operator’ın, Bilgisayar Kullanan Aracı (CUA) adı verilen bir teknolojiden yararlandığını açıkladı. CUA, düğmeler, menüler ve metin alanları gibi grafiksel öğelerle etkileşim kurabilecek şekilde tasarlandı ve bu da araca işletim sistemi veya web’e özgü API’lere gerek kalmadan esneklik sağlıyor.
Operator, OpenAI’nin geliştirilmiş GPT-4o modeline dayanıyor. Bu model, görsel algılama yeteneklerini, takviyeli öğrenme ile geliştirilen “ileri düzey muhakeme” yetenekleriyle birleştiriyor. OpenAI, Operator’ın görevleri çok adımlı planlara bölme ve karşılaştığı zorluklara uyum sağlayarak kendi kendini düzeltme yeteneğine sahip olduğunu belirtti.
Operator’ın özellikleri şu şekilde:
- Görev Bölme ve Uyarlanabilirlik: Operator, karmaşık görevleri adım adım çözebiliyor ve gerektiğinde kendi planlarını düzeltebiliyor.
- Güvenlik Kontrolleri: Araç, zararlı istekleri reddetmek ve izin verilmeyen içeriği engellemek üzere tasarlanmış. Örneğin, hassas bilgiler istendiğinde kontrol kullanıcıya devrediliyor.
- İlk Kullanıcı Deneyimi: Görevin karmaşıklığına bağlı olarak, kullanıcıların daha ayrıntılı komutlar sağlaması gerekebiliyor. Ayrıca, Operator bir görevde takılırsa kontrol kullanıcıya geçiyor.
Operator şu anda yalnızca ChatGPT Pro aboneleri için erişilebilir durumda. Bu abonelik aylık 200$’lık bir ücretle sunuluyor. Ayrıca, OpenAI’nin Instacart gibi şirketlerle ortaklık kurarak Operator’ı platformlarına entegre ettiği bildirildi. Ancak, bu entegrasyonun test edilmesi için de bir ChatGPT Pro aboneliği gerekiyor. Bu yeni hizmete ulaşmak için buraya tıklayabilirsiniz.
Operator, yapay zekanın web tarayıcılarında ve işletim sistemlerinde gezinme yeteneklerini kullanan araçlar listesine katılıyor. Bu yetenek, ilk kez Anthropic’in Claude 3.5 Sonnet modeliyle tanıtıldı ve ardından Google, Gemini 2.0 modeli ve Project Mariner ile bu yeteneği takip etti.
OpenAI, Operator’ı gelecekte daha geniş bir kullanıcı kitlesine sunmayı planlıyor. Ancak, şirket bu aracın hala erken bir aşamada olduğunu ve tüm senaryolarda güvenilir bir performans sergileyemeyebileceğini belirtti.
Operator, yapay zekanın günlük dijital görevlerde kullanıcı deneyimini daha da ileri taşıyabileceğinin bir göstergesi. Ancak, bu teknoloji henüz tamamen olgunlaşmadığı için kullanıcıların sabırlı olması gerekebilir. OpenAI’nin yeni aracı, yapay zekanın insanlarla dijital dünyada daha etkili bir şekilde etkileşim kurmasını sağlayan önemli bir adım olarak değerlendiriliyor.