OpenAI’nin GPT modelindeki büyük sıçramalar, muhtemelen tüm internetten toplanan yazılı içeriklerden kaynaklanıyor. Buna, Axel Springer, Condé Nast ve The Associated Press gibi büyük yayıncıların arşivleri de dahil, ancak bu içerikler izinsiz olarak kullanılmış durumda. Fakat ilginç bir şekilde, OpenAI bu medya devleriyle anlaşmalar yapmayı sürdürüyor.
İlk bakışta bu pek mantıklı görünmüyor. OpenAI, zaten elinde olan bir şey için neden ödeme yapıyor? Ve eserlerinin izinsiz kullanımı nedeniyle dava açmaya hazırlanan yayıncılar neden bu anlaşmaları kabul ediyor?
Eğer bu anlaşmalara yakından bakarsak, internetin geleceğine dair olası bir senaryo belirdiğini görebiliriz. Google, giderek daha az trafiği dış kaynaklara yönlendiriyor ve bu durum, internetin geri kalanının varlığını tehdit ediyor. Bu arama boşluğunu OpenAI doldurmaya çalışıyor olabilir.
Anlaşmalar Bilinenlerden başlayalım. Bu anlaşmalar, OpenAI’ye çeşitli yayınlara erişim sağlayarak, örneğin, “ChatGPT kullanıcı deneyimini geniş bir konu yelpazesinde güncel ve otoriter içeriklerle zenginleştirmek” için yapılmıştır. Axel Springer anlaşmasını duyuran basın açıklamasında belirtilen bu “güncel içerik” kısmı, son derece önemli. Web’den bilgi toplamanın bir sınırı var; ChatGPT, belirli bir tarihten sonra güncel bilgiye erişemiyor. OpenAI’nin gerçek zamanlı erişime ne kadar yakın olursa, ürünleri de o kadar gerçek zamanlı sonuçlar sunabilir.
Bir yandan bu ödemeler çok küçük ve komik derecede düşük tutarlarda. OpenAI, bazı büyük yayıncılara yılda 1 milyon ila 5 milyon dolar arasında tekliflerde bulunuyor. Axel Springer, Financial Times, NewsCorp, Condé Nast ve AP gibi yayıncılarla yapılan anlaşmalar hakkında bazı haberler yayımlandı. Kamuoyuna açıklanan rakamlara dayanarak yaptığım hesaplamalar, bu anlaşmaların her biri için yıllık 10 milyon dolarlık bir tavan olduğunu gösteriyor.
Öte yandan, OpenAI zaten bu yayınların tüm verilerini toplamış durumda. Mahkemeler tarafından bu işlemi durdurmaları istenmedikçe, bunu yapmaya devam edebilirler. O halde, bu anlaşmalarla neyi ödüyorlar?
Belki de bu ödemeler, veri toplamayı daha kolay ve güncel hale getirmek için API erişimini sağlıyor. Şu anda, ChatGPT anlık sorulara yanıt veremiyor; API erişimi bu durumu değiştirebilir.
Ancak bu ödemeler, aynı zamanda, OpenAI’nin daha önce topladığı verilerle ilgili dava açılmasını önlemek için bir yol olarak da düşünülebilir. Zaten büyük bir yayıncı dava açtı ve bu durum OpenAI için çok daha pahalıya mal olabilir. Hukuki mücadele yıllar sürecektir.
New York Times, Dava Açmaya Hazır Eğer OpenAI, internetin tüm metin tabanlı içeriğini topladıysa, bu birkaç şeyi ifade eder. Birincisi, bu kadar büyük bir veri yığını yeniden oluşturulamayacağı için ChatGPT’nin faydalı olma düzeyindeki sıçramalar sınırlanmış olabilir. İkincisi, birçok kişi bu durumdan rahatsız.
Bu kişilerin birçoğu dava açtı ve en önemlisi The New York Times tarafından açılan davadır. Times’ın davası, OpenAI’nin çalışmalarını LLM’lerini eğitmek için kullandığını ve bunun telif hakkı ihlali olduğunu iddia ediyor. Ayrıca, OpenAI’nin yarattığı ürün, Times ile rekabet ediyor ve onun kitlesini çalmayı amaçlıyor.
Times, OpenAI ile çalışmalarının kullanılmasına izin vermek için müzakere etmeye çalıştığını, ancak bu görüşmelerin başarısız olduğunu söylüyor. Yukarıda yaptığım matematiğe dayanarak, OpenAI’nin Times’a hakaret edici derecede düşük bir miktar teklif ettiğini tahmin ediyorum. Gerekçesi mi? Fair use (adil kullanım) — bu, belirli koşullar altında telif hakkıyla korunan materyalin lisanssız kullanımına izin veren bir hükümdür.
Eğer Times, davasını kazanırsa, OpenAI en az 7,5 milyar dolar tazminat ödemek zorunda kalabilir.
Sonuç olarak, OpenAI’nin yayıncılarla yaptığı bu anlaşmalar, aslında yayıncıların Times’ın yaptığı gibi OpenAI’ye dava açmamasını sağlamak için yapılan anlaşmalardır. Ayrıca, OpenAI’nin yayıncıların eserlerinin önceki kullanımlarını adil kullanım olarak koruyabilmesi için tasarlandı — çünkü OpenAI, Times ile olan davasında bunu savunmak zorunda kalacak.
Görünüşe göre OpenAI, itibarını biraz temizlemeye çalışıyor. Satışa sunmak istediğiniz yeni bir ürünün, bir ton yükle ve belirsizlikle gelmemesi gerekiyor. Ancak, OpenAI’nin yükü var: adil kullanım savunmasını yapabilmek için, The New York Times’ın telif hakkıyla korunan materyalini izinsiz aldığını itiraf etmek zorunda — bu da, başka birçok telif hakkıyla korunan materyali de izinsiz aldığını dolaylı olarak ima eder. Ancak OpenAI’nin savunması, bunu yasal olarak yapma hakkına sahip olduğudur.
Ayrıca doğruluk sorunu da var. Bu noktada, hepimiz jeneratif yapay zekanın hatalar yaptığını biliyoruz. Yayıncı anlaşmaları sadece meşruiyet sağlamakla kalmaz, aynı zamanda jeneratif yapay zekanın hatalı sonuç verme olasılığını azaltabilir.
Google Dava önleme ve itibar yönetiminden daha fazlası söz konusu. Anlaşmaların OpenAI’ye güncel bilgi sağladığını unutmayın. OpenAI, yakın zamanda kendi arama motoru SearchGPT’yi duyurdu. AI tabanlı web araması henüz yeni doğmakta, ancak gerçek bilgi kaynaklarını tercih ederek AI tarafından üretilen SEO içeriklerini filtreleyebilmek büyük bir avantaj sağlar.
Google Arama, son birkaç yılda ciddi şekilde bozuldu ve sonuçların üzerine eklenen AI sohbet robotu durumu daha da kötüleştirdi. Yanlış cevaplar verebilirken, gerçek bilgileri içeren bağlantıları daha aşağıda gizliyor. Eğer mevcut web aramasını kökten değiştirebilecek bir ürün geliştirmek istiyorsanız, zaman tam da şimdi.
OpenAI’nin yaptığı anlaşmalar, yayıncılara biraz daha fazla pazarlık gücü kazandırabilir ve Google’ı da müzakere masasına oturmaya zorlayabilir.
Google genellikle arama için ücretli anlaşmalar yapmaz; bugüne kadar yapılan düzenleme, yayıncıların trafik yönlendirmeleri almasıydı. Ancak sohbet robotu için Google, Reddit ile bir anlaşma yaptı. Reddit’e yıllık 60 milyon dolar karşılığında erişim sağladı ve benzer bir anlaşma yapmayan tüm arama motorlarının bu verilerden mahrum kalmasını sağladı. Bu, OpenAI’nin yayıncılara ödediği miktardan çok daha fazla ve bu durum, yayıncıların yararlanmayı amaçladığı bir kapıyı araladı.
Arama pazarını ele geçirmek, tüm bu yatırımları haklı çıkaracak türden bir şeydir.
Google, yıllardır ortalama bir kullanıcı için giderek daha az kullanışlı hale geliyor. Jeneratif yapay zeka, bu durumu daha da kötüleştirebilir, çünkü reklam gösterimi yapan anlamsız metinlerle dolu siteler yaratılmasına neden olabilir. Google, taradığı tüm sitelere aynı şekilde davranmaz. Ancak birisi, daha yüksek kaliteli bilgi vadeden bir alternatifle çıkarsa, yolunu kaybetmiş olan arama motoru ciddi bir tehlike altında olabilir. Sonuçta, Google’ın kendisi de AltaVista gibi önceki arama motorlarını bu şekilde saf dışı bırakmıştı.
OpenAI çok para harcıyor ve bu yıl 5 milyar dolar kaybedebilir. Şu anda, şirketin değerini 100 milyar doların üzerinde değerlendiren bir tur için görüşmeler yapıyor. Bu değerlendirmenin yakınından bile geçmek için, kârlılığa giden bir yol gerekiyor. Arama pazarını ele geçirmek, bu tür bir yatırımın haklı gösterebileceği bir şeydir.
OpenAI’nin SearchGPT’si henüz ciddi bir tehdit değil. Hala bir “prototip” aşamasında, bu nedenle insanlara pizzalarına yapıştırıcı sürmelerini söylemek gibi hatalar yaptığında, bunu açıklamak daha kolay. Google gibi, neredeyse her çevrimiçi kişi için bir yardımcı olan bir araç değil, SearchGPT’nin sınırlı sayıda kullanıcısı var — bu yüzden erken hataları çok daha az insan görecektir.
Yayıncılarla yapılan anlaşmalar, SearchGPT’ye bir başka itibar kalkanı daha sağlıyor. Rakibi Perplexity, sitelerin açıkça yasakladığı içeriği taradığı için eleştiri altında. Buna karşın, SearchGPT, anlaşma imzalayan yayıncılarla yapılan bir işbirliği olarak öne çıkıyor.
Mahkemeler Gerçekten Karar Verdiğinde Ne Olacak?
“Yanıt motorlarına” geçişin yayıncıların kârları üzerindeki etkisi tam olarak net değil. Belki bazı insanlar, büyük dil modellerinden hataları kaldırmak mümkün olmadığında, orijinal kaynakları görmek için tıklamaya devam edeceklerdir. Bir başka olası model, Perplexity’nin sonradan tanıttığı gelir paylaşım programıdır.
Gelir paylaşım programı, Perplexity’nin taramalarını adil kullanım olarak savunmasını biraz daha kolaylaştırır. Perplexity’nin durumu, ChatGPT’den biraz farklıdır; telif hakkıyla korunan materyalleri kopyalamak konusunda kötü bir eğilime sahip olan bir “Pages” ürünü yaratmıştır. Forbes ve Condé Nast, Perplexity’ye hukuki uyarılar göndermiştir.
Peki mahkemeler gerçekten karar verdiğinde ne olacak? Bu yayıncı anlaşmalarının var olmasının bir nedeni de yasal işlemlerin tehdidini azaltmaktır. Ancak bu anlaşmaların varlığı, AI için telif hakkıyla korunan materyali taramanın adil kullanım olduğu savunmasına ters düşebilir.
Telif Yanlışları The New York Times lehine verilecek bir karar, hem Google’a hem de OpenAI’ye, ayrıca OpenAI’yi destekleyen Microsoft’a yardımcı olabilir. Belki de eski Google CEO’su Eric Schmidt’in “telif hakkıyla korunan eserlerle ne isterseniz yapın ve sonra bu karışıklığı temizlemek için bir sürü avukat tutun” derken kastettiği şey buydu.
Mahkemeler telif hakkı yasaları konusunda öngörülemez, çünkü bu yasalar biraz pornografi gibi çalışır — yargıçlar bir ihlali gördüklerinde tanırlar. Ayrıca, The New York Times ve OpenAI arasında gerçekten bir dava olursa, kim kazanırsa kazansın, karara itiraz edilecektir.
Mahkeme davaları zaman alır ve temyizler daha fazla zaman alır. Mahkemelerin bu durumu çözmesi yıllar alacak. Ve bu, OpenAI gibi bir oyuncunun baskın bir iş geliştirmesi için fazlasıyla yeterli zaman.
Coffey, Google’ın o kadar büyük olduğunu, yayıncıları kendi şartlarına zorlayabileceğini belirtiyor.
Diyelim ki OpenAI sonunda kaybetti. Bu, büyük dil modeli yaratıcılarının hepsinin ödeme yapmak zorunda kalacağı anlamına gelir. Bu, çok hızlı bir şekilde çok pahalı hale gelebilir — bu da yalnızca en büyük oyuncuların rekabet edebileceği anlamına gelir. Bu, her oyuncuyu daha da önemli hale getirir ve halihazırda zaten hakim oldukları ekosistemi daha da güçlendirir — OpenAI ve Anthropic de dahil, her ikisinin de bazı büyük oyuncularla anlaşmaları vardır.
News Media Alliance’dan Coffey, büyük teknoloji şirketlerinin aleyhlerine verilen kararlardan nasıl kaçındıklarına dair bazı örnekler sunuyor. Google’ın o kadar büyük olduğunu, yayıncıları kendi şartlarına zorlayabileceğini belirtiyor; bu görüşünü desteklemek için, röportajımızdan birkaç hafta sonra, Google’ın antitröst davasında bir tekel olarak ilan edilmesi örneğini veriyor.
İşte Google’ın aşırı gücüne bir örnek: 2019’da, AB dijital yayıncılara Google’ın çalışmalarını kullanırken ödeme talep etme hakkı verdi. Bu yasa, ilk olarak Fransa’da uygulandı ve Google, yayıncılara yalnızca çalışmalarından başlıkları kullanacağını, ödeme yapmayacağını söyledi. Coffey, “Ve böylece Fransız yayınlara, bulunmak istiyorsanız telif hakkı korumanızdan feragat edin dediler,” diyor. “Bu anlamda neredeyse yasanın üstündeler” çünkü Google Arama çok baskın.
Google şu anda yayıncıları benzer bir şekilde sıkıştırmak için arama hakimiyetini kullanıyor. AI özetlemelerini engellemek, Google’ın onları hiç listelemeyeceği anlamına gelir çünkü web araması ve AI eğitimi için aynı aracı kullanıyor.
“Ekosistemin başında gerçek bir rekabet karşıtı trajedi olurdu.”
Eğer Times kazanırsa, Google ve diğer büyük AI oyuncularının yine de yayıncıların lehine pek bir şey getirmeyen anlaşmalar talep edebileceği ve aynı zamanda rakip büyük dil modellerini yok edebileceği olasılığı mümkündür. “Ekosistemin başında yalnızca en büyük şirketlerin eğitim verilerini karşılayabileceği bir sistem kurma olasılığı beni inanılmaz derecede endişelendiriyor,” diyor Public Knowledge’tan Nicholas Garcia.
Aslında, bu davanın varlığı, bazı oyuncuları modellerini eğitmek için kamuya açık verileri kullanmaktan caydırmak için yeterli olabilir. İnsanlar, kamuya açık verilerle eğitim yapamayacaklarını düşünebilirler — bu, zaten uzmanların tedariki ve uzmanlıkla sınırlı olan rekabet dinamiklerini daha da daraltır. Garcia, “Ekosistemin başında gerçek bir rekabet karşıtı trajedi olurdu,” diyor.
OpenAI, Times davasında tek sanık değil; diğer sanık ise ortağı Microsoft. Ve OpenAI, en az yüz milyonlarca dolarlık bir tazminat ödemek zorunda kalırsa, bu durum, OpenAI’yi satın alacak bir kapı açabilir — ki bu durumda, OpenAI’nin halihazırda müzakere ettiği tüm lisans anlaşmalarına sahip olacak, lisans anlaşmalarının telif hakkı yasası gereği zorunlu olduğu bir dünyada. Bu, oldukça büyük bir rekabet avantajı sağlar. Elbette şu anda, Microsoft antitröst konusundaki yeni hükümet ilgisi nedeniyle OpenAI’yi gerçekten tanımadığını iddia ediyor, ancak telif hakkı davaları sistemde ilerledikçe bu durum değişebilir.
Ve OpenAI, müzakere ettiği lisans anlaşmaları nedeniyle kaybedebilir. Bu anlaşmalar, yayıncıların verileri için bir pazar yaratmıştır ve telif hakkı yasası altında, böyle bir pazarı bozuyorsanız, bu adil kullanım olarak kabul edilmez. Bu özel argüman hattı, en son olarak, Andy Warhol’un bir tablosunun orijinal fotoğrafla haksız rekabet içinde olduğu bulunan bir Yüksek Mahkeme davasında gündeme gelmiştir.
Yasal sorular tek başına değil elbette. Düşündüğüm daha temel bir şey var: insanlar yanıt motorlarını istiyor mu ve eğer istiyorlarsa, bunlar finansal olarak sürdürülebilir mi? Arama sadece cevap bulmakla ilgili değil — Google, belirli bir web sitesini, URL’yi ezberlemek veya yer imlerine eklemek zorunda kalmadan bulmanın bir yolu. Ayrıca, AI pahalıdır. OpenAI, kâr elde edemediği için başarısız olabilir. Google ise, bu tekel bulgusu nedeniyle düzenleyiciler tarafından parçalanabilir.
Bu durumda, belki de yayıncılar sonunda en akıllı olanlardır: para hala iyiyken paralarını alıyorlar.
Önemli Not: Bu yazı Google Gemini yapay zekası tarafından otomatik olarak oluşturulmuştur ve hatalı bilgiler içerebilir. Düzeltmek için iletişim sayfamızdaki formdan veya yine iletişim sayfamızda bulunan eposta adresi yoluyla bizimle iletişime geçebilirsiniz. Hata varsa hemen düzeltilmektedir.