D-ID, AI video çeviri aracı (ses klonlama ve dudak senkronizasyonu)

AI video oluşturma platformu D-ID, videoları başka dillere çevirmek için AI teknolojilerini kullanan en yeni şirketlerden biri olarak sahneye çıktı. Ancak D-ID’nin sunduğu çözüm, sadece çeviri yapmakla kalmıyor; aynı zamanda konuşmacının sesini klonluyor ve çevrilen kelimelere uygun olarak dudak hareketlerini de değiştiriyor.

Bu teknoloji, D-ID’nin birkaç yıl önce viral olan eski aile fotoğraflarını canlandırma çalışmasından kaynaklanıyor. Bu başarı sayesinde, şirket 2022 yılında Series B yatırım turunda 25 milyon dolar fon topladı ve ABD’deki kurumsal müşterilerine AI destekli videolar sunma hedefiyle yola devam etti.

D-ID’nin şimdi kullanıcılarına sunduğu AI Video Translate teknolojisi, videoları otomatik olarak diğer dillere çevirebiliyor, bu da yaratıcıların içeriklerini daha geniş kitlelere ulaştırmasını sağlıyor. Arapça, Mandarin, Japonca, Hintçe, İspanyolca ve Fransızca gibi diller dahil olmak üzere toplamda 30 dilde çeviri yapılabiliyor. D-ID abonelikleri yıllık 56 dolardan başlıyor ve AI özelliklerini kullanmak için gerekli kredi sayısına göre fiyat artıyor, bu fiyatlandırma yıllık 1.293 dolara kadar çıkabiliyor ve ardından kurumsal fiyatlandırma uygulanıyor.

D-ID, yeni AI video teknolojisinin müşterilere, kampanyalarını global bir izleyici kitlesine ölçeklendirirken yerelleştirme maliyetlerinden tasarruf sağlayabileceğini öne sürüyor. Bu teknoloji, hem dublaj hem de AI video çözümleri ile rekabet edecek.

Dublaj teknolojileri yıllardır video izleyicilerinin kendi dillerinde ses dinlemelerini kolaylaştırdı ancak genellikle küçük yaratıcılar için erişilemez durumdaydı. Bu durum, teknolojinin erişilebilirliğinin artmasıyla değişmeye başladı. Örneğin, YouTube, içerik oluşturucuların videolarını diğer dillere çevirerek daha geniş bir kitleye ulaşmalarını sağlamak amacıyla çok dilli ses özelliğini duyurdu. Ünlü içerik oluşturucu MrBeast (Jimmy Donaldson) bu teknolojiyi erken benimseyenlerden biri oldu ve popüler videolarını 11 farklı dile çevirdi.

AI ile sesleri oluşturma, çevirme veya klonlama yeteneği de genişliyor. Microsoft, bu yıl YouTube videolarını izlerken AI kullanarak çeviri ve dublaj yapacağını duyurdu. Temmuz ayında Vimeo, ses ve altyazı çevirme araçlarını ve bunları konuşmacının sesini AI teknolojisiyle çoğaltarak yapma araçlarını tanıttı. Descript, ElevenLabs, Speechify, Veed, Camb.ai, Captions.ai ve Akool gibi birçok şirket de ses klonlama veya AI çeviri araçları sunuyor. Ayrıca, HeyGen, Deepbrain AI gibi şirketlerin AI avatarlarıyla video oluşturma araçları da birçok dili konuşabilen AI avatarları yaratmaya olanak tanıyor.

Dublaj ve dudak senkronizasyonu için AI kütüphaneleri, startup’ların bu tür araçları daha kolay geliştirmesine yardımcı oluyor. (D-ID’nin yeni geliştirdiği Rosetta-1 adlı model, AI Video Translate’i güçlendiriyor.)

D-ID, yeni Video Çeviri teknolojisinin D-ID Studio ve API aracılığıyla erişilebilir olacağını belirtiyor. Bir aylık deneme süresi sunuluyor ve daha fazla demo şirketin web sitesinde mevcut.

Şirket, videoların 10 saniye ile 5 dakika arasında olabileceğini ve dosya boyutunun 2GB’ı geçmemesi gerektiğini söylüyor. Özelliğin en iyi şekilde çalışması için karede sadece bir kişinin bulunması ve bu kişinin yüzünün her zaman kameraya dönük olması öneriliyor.


Yayımlandı

kategorisi