AI Görsellere Font Nasıl Eklenir?

Hobi Sahipleri, AI ile Üretilen Görüntülere Özel Yazı Tipleri Eklemeyi Keşfediyor

Geçtiğimiz hafta, yeni Flux AI görüntü sentezleme modeli üzerinde deney yapan bir hobi sahibi, bu modelin özel olarak eğitilmiş yazı tiplerini beklenenden çok daha iyi yeniden üretebildiğini keşfetti. On yıllardır bilgisayar yazı tiplerini görüntülemek için çok daha verimli yöntemler bulunmasına rağmen, bu yeni teknik, AI görüntüleme meraklıları için kullanışlıdır çünkü Flux, doğru metinleri oluşturabilme yeteneğine sahiptir ve kullanıcılar artık özel yazı tiplerinde oluşturulan kelimeleri doğrudan AI görüntü üretimlerine ekleyebilirler.

Daha fazla bilgi FLUX: Bu yeni AI görüntü üreteci, insan ellerini oluşturmakta ürkütücü derecede iyi 1980’lerden beri özel şekillerde düzgün bilgisayar yazı tipleri üretme teknolojisine sahibiz (araştırma alanında 1970’lerden itibaren), bu nedenle AI tarafından üretilmiş bir yazı tipi oluşturmak tek başına büyük bir haber değildir. Ancak yeni bir teknik, belirli bir yazı tipini bir AI tarafından üretilen görüntülerde görebileceğiniz anlamına geliyor, örneğin, fotogerçekçi bir restoranda bir kara tahta menüsü ya da bir sibernetik tilkinin elinde tutulan bir basılı kartvizit gibi.

2022’de Stable Diffusion gibi ana akım AI görüntü sentezleme modellerinin ortaya çıkmasından kısa bir süre sonra, bazı insanlar şu soruyu sormaya başladı: Kendi ürünümü, kıyafetimi, karakterimi ya da stilimi AI tarafından üretilen bir görüntüye nasıl ekleyebilirim? Bu soruya verilen cevaplardan biri, 2021’de keşfedilen ve kullanıcıların bir AI temel modeline modüler eklerle özel olarak eğitilmiş bilgileri eklemelerine olanak tanıyan LoRA (düşük dereceli adaptasyon) tekniği oldu.

Bu modüller, temel modelin eğitim verilerinde başlangıçta bulunmayan (veya kötü temsil edilen) yeni kavramları oluşturmak için görüntü sentezleme modellerinin kullanılmasına olanak tanır. Pratikte, görüntü sentezleme meraklıları bunları benzersiz stiller (örneğin, her şeyi tebeşir sanatı olarak yapmak) veya konular (örneğin, Spider-Man’in ayrıntılı görüntüleri) oluşturmak için kullanır. Her LoRA, kullanıcı tarafından sağlanan örneklerle özel olarak eğitilmelidir.

Flux’a kadar, çoğu AI görüntü üreteci, bir sahne içindeki metni doğru şekilde oluşturma konusunda pek iyi değildi. Eğer Stable Diffusion 1.5’ten “peynir” yazılı bir tabela oluşturmasını isteseydiniz, anlamsız bir şey dönerdi. Geçen yıl piyasaya sürülen OpenAI’nin DALL-E 3’ü, metni oldukça iyi yapan ilk ana akım model oldu. Flux hala zaman zaman kelimeler ve harflerle ilgili hatalar yapsa da, şimdiye kadar gördüğümüz “dünya içi metin” (bu şekilde adlandırabilirsiniz) oluşturma konusunda en yetenekli AI modeli.

Flux, indirilebilir ve ince ayar yapılabilir açık bir model olduğu için, bu geçen ay bir yazı tipi LoRA’sı eğitmek mantıklı hale geldi. Bu, bir AI meraklısı olan Vadim Fedenko’nun (basın zamanı itibariyle röportaj talebine yanıt vermeyen) yakın zamanda keşfettiği bir durumdur. Fedenko, Reddit’te yaptığı bir paylaşımda, “Sonuçtan gerçekten çok etkilendim,” dedi. “Flux, belirli bir stil/yazı tipinde harflerin nasıl göründüğünü anlıyor, bu da belirli Yazı Tipleri, Yazı Şekilleri vb. ile Loras’ı eğitmeyi mümkün kılıyor. Yakında bunlardan daha fazlasını eğitmeye devam edeceğim.”

İlk deneyi için Fedenko, 1990’ların sonları ve 2000’lerin başlarında popüler olan kabarcıklı “Y2K” stilinde bir yazı tipi seçti ve ortaya çıkan modeli 20 Ağustos’ta Civitai platformunda yayınladı. İki gün sonra, “AggravatingScree7189” adlı bir Civitai kullanıcısı, Cyberpunk 2077 video oyununda bulunan bir yazı tipine benzeyen bir yazı tipini çoğaltan ikinci bir yazı tipi LoRA’sı yayınladı.

“Metin daha önce o kadar kötüydü ki bunu yapabileceğim aklıma bile gelmemişti,” dedi Fedenko’nun Y2K yazı tipi hakkında yaptığı paylaşıma yanıt veren “eggs-benedryl” adlı bir Reddit kullanıcısı. Bir başka Reddit kullanıcısı ise, “Y2K günlüğünün sahte olduğunu fark edemedim, ta ki onu yakından inceleyene kadar,” diye yazdı.

Gereksiz mi? Bir LoRA örneği, Flux geliştiricisiyle oluşturuldu. Büyüt / Bir LoRA örneği, Flux geliştiricisiyle oluşturuldu. Doğrudur ki, düz bir eski yazı tipini basit bir arka planda oluşturmak için derinlemesine eğitilmiş bir görüntü sentezleme sinir ağını kullanmak muhtemelen gereksizdir. Bu yöntemi, bir belge tasarlarken Adobe Illustrator’ı değiştirmek için kullanmak istemezsiniz.

“Bu iyi görünüyor ama fontların 300MB LoRAs olarak yeniden icat edilmesi biraz komik,” diye yazdı bir Reddit yorumcusu, Cyberpunk 2077 yazı tipi hakkında bir başlıkta.

Üretici AI, genellikle çevresel etkisi nedeniyle eleştirilir ve bu, büyük bulut veri merkezleri için geçerli bir endişedir. Ancak Flux’un bu yazı tiplerini AI tarafından üretilen sahnelere yerleştirebildiğini ve bunu bir RTX 3060 üzerinde yerel olarak çalışırken boyutları küçültülmüş bir formda gerçekleştirebildiğimizi görüyoruz (ve tam geliştirme modeli bir RTX 3090 üzerinde çalıştırılabilir). Bu, aynı PC’de video oyunu oynamakla benzer bir elektrik tüketimi gerektirir. Aynı şey LoRA oluşturma için de geçerlidir: Cyberpunk 2077 yazı tipinin yaratıcısı, LoRA’yı 3090 GPU’da üç saat içinde eğitti.

Daha fazla bilgi Procreate, AI trendine karşı duruyor ve illüstrasyon uygulamasında “üretici AI yok” taahhüdünde bulunuyor AI görüntü üreteçlerini kullanmanın etik sorunları da vardır, örneğin, bu araçların içerik sahibi izni olmadan toplanan verilerle eğitilmesi gibi. Teknoloji, bazı sanatçılar arasında tartışmalı olsa da, birçok insan bu teknolojiyi her gün kullanıyor ve sonuçları Reddit gibi sosyal medya platformları aracılığıyla paylaşıyor, bu da bu tür yeni teknolojik uygulamaların ortaya çıkmasına neden oluyor.

Bu yazının yazıldığı sırada, yalnızca iki özel Flux yazı tipi LoRA’sı mevcut, ancak bu yazıyı yazarken daha fazlasının oluşturulacağına dair planlar duyduk. Henüz ilk aşamalarında olmasına rağmen, yazı tipi LoRA’ları oluşturma tekniği, AI görüntü sentezlemesinin daha yaygın olarak kullanılması durumunda temel bir yöntem haline gelebilir. Adobe, kendi görüntü sentezleme modelleriyle, muhtemelen bu gelişmeleri yakından takip ediyor.


Yayımlandı

kategorisi