Google DeepMind, yapay zeka destekli video oluşturma teknolojisindeki rekabete güçlü bir giriş yaptı. OpenAI'ın Sora modeline rakip olarak geliştirilen Veo 2, daha uzun süreli, daha yüksek çözünürlüklü ve gerçekçi videolar üretebiliyor. Veo 2, 4K kalitesinde iki dakikadan uzun videolar oluşturabilme kapasitesine sahip. Bu özellik, OpenAI'ın Sora modelinin sunduğu çözünürlükten 4 kat, süre açısından ise 6 kat daha üstün. Ancak bu teorik bir üstünlük, çünkü şu anda Veo 2 yalnızca Google’ın VideoFX platformu üzerinden 720p çözünürlükte ve 8 saniyelik videolarla sınırlı durumda.
Google Labs tarafından yönetilen VideoFX, kullanıcıların bekleme listesine kayıt olarak erişim sağladığı deneysel bir video platformu. Google, platformun yakın zamanda daha fazla kullanıcıya açılacağını duyurdu.
Gerçekçilik ve Kontrol Seviyesi Artıyor
Veo 2, yalnızca bir metin girişi ya da referans görsel kullanarak video üretebiliyor. Ancak önceki sürüme göre önemli yenilikler sunuyor:
- Fiziksel Gerçekçilik: Model, sıvıların dinamiği ve hareketlerin detaylandırılması konusunda büyük ilerleme kaydetti. Örneğin, bir fincana dökülen kahvenin akışındaki gerçekçilik dikkat çekiyor.
- Kamera Kontrolleri: Kullanıcılar, sanal kamerayı farklı açılardan kontrol ederek sahneleri detaylı bir şekilde oluşturabiliyor.
- Netlik ve Hareket: Özellikle hareketli sahnelerde görüntü netliği artırılırken, Pixar benzeri animasyonlardan sinematik efektlere kadar geniş bir yelpazede video oluşturmak mümkün.
DeepMind’ın paylaştığı örnek videolar, sıvıların yansıması, karmaşık hareketler ve nesne detaylarında kayda değer ilerlemeleri gözler önüne seriyor. Ancak şirket, modelin bazı durumlarda hâlâ gerçekçilik sorunları yaşadığını kabul ediyor.
Sanatçılarla Ortak Çalışma ve Telif Hakları Endişesi
DeepMind, Veo 2’nin geliştirme sürecinde Donald Glover (Childish Gambino), The Weeknd ve d4vd gibi ünlü sanatçılarla yakın iş birliği gerçekleştirdi. Ayrıca model, büyük miktarda video içeriği üzerinde eğitildi. Google, içeriklerin nereden toplandığını açıklamasa da YouTube’un bir kaynak olabileceğini belirtiyor. Telif hakları konusundaki endişeleri gidermek adına şirket, Veo 2 ile oluşturulan videolara SynthID adı verilen görünmez filigranlar ekliyor. Ancak bu filigranın tamamen kaldırılamayacağına dair kesin bir garanti verilemiyor.
Google'dan Görsel Üretimde de Yenilik: Imagen 3
Video üretimindeki yeniliklerin yanı sıra Google DeepMind, görsel üretim alanında da ilerliyor. Imagen 3 adlı yeni model, metin tabanlı komutlarla yüksek çözünürlüklü ve detaylı görseller oluşturabiliyor. Özellikle yazı yazma ve ince dokular oluşturma yeteneğiyle dikkat çekiyor.
Google, geliştirdiği bu yapay zeka modellerinde güvenlik, etik ve yaratıcı kullanım alanlarına odaklandığını vurguluyor. Hem Veo 2 hem de Imagen 3’ün ilerleyen dönemlerde içerik üreticileri, sinema sektörü ve reklamcılık gibi alanlarda devrim yaratması bekleniyor.