OpenAI, "düşünme" becerisine sahip olduğunu öne sürdüğü yeni yapay zeka serisi o1'i dün (12 Eylül Perşembe) kullanıma sundu. Yeni seri, "Strawberry" adıyla da biliniyor ve o1-preview (ön izleme) ile o1-mini olmak üzere iki farklı sürüm sunuluyor.

Model, ilk aşamada yalnızca ChatGPT Plus ve Team kullanıcıları ile 5. seviye API katmanına hak kazanan geliştiricilere açılıyor. ChatGPT Enterprise ve Edu üyeleri, gelecek haftadan itibaren araca erişim sağlayabilecek. Şirket, ileride o1-mini'yi tüm kullanıcılara ücretsiz sunmayı planladığını belirtiyor, ancak bu konuda henüz bir tarih açıklanmadı. OpenAI, önceki modellerine 2, 3, 4 gibi isimler verirken, bu yeni serinin yepyeni becerilere sahip olması nedeniyle "sayacı sıfırladıklarını" ve o1 adını seçtiklerini ifade ediyor.

MASRAFLAR YÜKSEK, YENİ MODEL DAHA PAHALI

Yeni modelin kullanımı, Mayıs ayında çıkan öncülü GPT-4o'dan üç kat daha masraflı. o1-preview'un maliyeti, 1 milyon girdi jetonu başına 15 dolar, 1 milyon çıktı jetonu başına ise 60 dolar olarak belirlenmiş. Jetonlar, yapay zeka araçlarının büyük verileri parçalara ayırıp dili işlemesini sağlıyor ve 1 milyon jeton yaklaşık 750 bin kelimeye denk geliyor. OpenAI, o1-mini versiyonunun yüzde 80 daha ucuz olduğunu belirtse de, bu sürüm daha dar bir bilgi yelpazesine sahip.

YENİ O1'İN BEKLENEN BECERİLERİ

OpenAI, o1 serisinin, sorulara cevap vermeden önce daha uzun süre düşündüğünü ve vereceği yanıtların doğruluğunu kontrol ettiğini ifade ediyor. Bununla birlikte, "Düşünüyorum" gibi yanıtlar vermesi, o1'in insanlar gibi akıl yürüttüğünü göstermez. OpenAI'ın araştırma ekibinin lideri Jerry Tworek, yapay zeka modelinin düşünme biçiminin insanlarınkiyle örtüşmediğini belirtiyor. Arayüz, modelin problemleri

çözerken daha fazla zaman harcadığını ve daha derine indiğini gösterme amacıyla tasarlandı.

o1, pekiştirmeli öğrenme yöntemiyle eğitiliyor; doğru yanıtlar karşısında ödül, yanlış cevaplar karşısında ise ceza verilmesi ilkesine dayanıyor. Bu yöntem, yapay zeka aracının doğru yanıtlara ulaşma becerisini geliştiriyor. OpenAI, bu yöntemin doğruluğu artırdığını ifade ediyor.

Yeni modelin, dil becerilerinden ziyade bilimsel çalışmalar, veri işleme ve kodlama gibi alanlarda daha iyi performans göstermesi bekleniyor. o1-mini, daha küçük bir sürüm olmasına rağmen özellikle kod üretme amacıyla geliştirilmiş. OpenAI'ın baş araştırma görevlisi Bob McGrew, yeni modelin ileri seviye matematik sorularında kendisinden daha iyi olduğunu belirtiyor. Ayrıca, o1'in bilim insanlarının hücre dizileme çalışmalarına ve fizikçilerin karmaşık matematiksel formüller üretmesine katkı sağlayacağı ifade ediliyor.

o1, önceki modellerin bazı alanlarda gerisinde kalıyor ancak bazı testlerde GPT-4o'yu geride bırakmış durumda. o1'in, Uluslararası Matematik Olimpiyatı'nda soruların yüzde 83'ünü doğru çözdüğü, GPT-4o'nun ise sadece yüzde 13'ünü doğru yanıtladığı belirtiliyor. Thomson Reuters'tan Pablo Arredondo, o1'in yasal belgeleri analiz etme ve hukuk fakültesi sınavında da daha başarılı olduğunu ifade ediyor.

İNSANLIĞA TEHDİT OLUR MU?

Yeni modelin "düşünme" becerisine yaklaşması endişeleri artırsa da, o1'in mevcut becerileri henüz korkutucu bir seviyede değil. Ars Technica'nın ifadesine göre, bir bulmacayı çözerken 108 saniye harcayan ve bazı bilgilerde halüsinasyon gören bir modelin potansiyel tehlike oluşturması abartılı olabilir. Ancak, Meta ve Google gibi şirketlerin çabaları ve son yıllardaki hızlı gelişmeler göz önüne alındığında, insan seviyesine ulaşan yapay zeka araçlarının uzak olmadığını söylemek mümkün.