ChatGPT’nin Yeni O1 Modeli: Zor Problemler İçin ‘Muhakeme’ Yeteneğiyle İlk Model

OpenAI, yeni O1 modelini duyurdu ve bu model şu anda o1-preview ve o1-mini olarak ikiye ayrılmış durumda. Bu model, Codeforces programlama yarışmalarında yüzde 89’luk dilime girerken, ABD’deki Matematik Olimpiyatı’nda ilk 500 öğrenci arasında yer aldı ve fizik, biyoloji ve kimya problemlerinde doktora seviyesindeki doğruluğu aştı.

OpenAI’nin araştırma lideri Jerry Tworek, The Verge ile yaptığı röportajda, “Bu modelin daha az hayal ettiğini fark ettik” dedi. O1, yeni bir optimizasyon algoritması ve özel olarak tasarlanmış bir eğitim veri setiyle eğitildi. Geçmiş modeller, eğitim verilerindeki kalıpları taklit etmeye çalışırken, O1 pekiştirmeli öğrenme kullanarak ödüller ve cezalar yoluyla öğreniyor.

O1 Modelini Diğerlerinden Ayıran Özellikler

The Information tarafından Salı günü yayınlanan bir rapora göre, O1 modelini önceki modellerden ayıran en büyük fark, “düşünebilme” yeteneği. Bu model, hemen yanıt vermek yerine 10 ila 20 saniye boyunca düşünerek, daha derin bir cevap oluşturuyor. O1 modeli, “çilek” lakabıyla anılıyor ve bu isim, sosyal medyada viral olan “çilek kelimesinde kaç tane R harfi var?” sorusuna atıfta bulunuyor olabilir. O1, kullanıcıların ekstra sorular sormasını gerektiren zincir düşünme istemleri ihtiyacını ortadan kaldırıyor. Bunun yerine, model varsayılan olarak kendi muhakeme sürecini gösteriyor.

O1 Modelinin Sınırlamaları

O1 hâlâ önizleme aşamasında olduğu için bazı büyük kısıtlamalar mevcut. GPT-4o‘dan farklı olarak O1, internete bağlı değil, dosya yüklemelerini desteklemiyor ve geliştiriciler için bir dizi API sınırlaması bulunuyor. O1-mini modeli ise STEM ile ilgili sorulara hızlı yanıtlar vermeye odaklanıyor.

Yapay Zeka Rekabeti Kızışıyor

Yapay zeka alanındaki rekabet, büyük teknoloji devlerinin birbirleriyle yarışarak kullanıcıların yerine görevleri tamamlayacak “ajan” yapay zekalar geliştirme çabalarıyla daha da yoğunlaşıyor. Google, bu yılın başlarında I/O etkinliğinde Gemini‘nin daha güçlü bir versiyonunu tanıttı ve bu yapay zeka, daha doğal bir şekilde konuşabiliyor ve hatta cümlenin ortasında kesintiye uğratılabiliyor. Apple ise geçtiğimiz hafta düzenlenen iPhone 16 lansmanında, Apple Intelligence adını verdiği bir yapay zeka özellikleri paketini tanıttı.

Yapay zeka dalgası son iki yılda teknoloji hisselerini rekor seviyelere taşırken, yatırımcıların daha temkinli olmaya başladığı görülüyor. Dünyanın en büyük yapay zeka veri merkezlerine güç sağlayan çip üreticisi Nvidia, geçen hafta %10’luk bir düşüş yaşadı. Teknoloji dünyası, hizmetlerden daha somut sonuçlar beklerken, OpenAI’nin 150 milyar dolarlık değerlemeye ulaşması bu ilgiyi azaltmadı.

O1 Modelinin Yaygınlaşması

ChatGPT Plus ve Team kullanıcıları, O1-preview modeline şu anda erişim sağlayabiliyor. ChatGPT Enterprise ve Edu kullanıcıları ise önümüzdeki hafta bu modele erişebilecek. Geliştiriciler de bu modeli API aracılığıyla prototip oluşturma amaçlı kullanabilecekler.


Yayımlandı

kategorisi