Yeni AI araştırması, görüntüleri saniyeler içinde değiştirmek için tıklayıp sürüklemenize olanak tanır

Hayır, henüz bitmedi: AI araçlarının görüntüleri manipüle etme yeteneği gelişmeye devam ediyor. En son örnek, şimdilik yalnızca bir araştırma makalesi, ancak çok etkileyici, kullanıcıların bir resmin öğelerini görünümlerini değiştirmek için basitçe sürüklemelerine izin veriyor.

Bu, ilk bakışta çok heyecan verici görünmüyor, ancak bu sistemin neler yapabileceği hakkında bir fikir edinmek için aşağıdaki örneklere göz atın.

Basit bir tıklama ve sürüklemeyle yalnızca bir arabanın boyutlarını değiştirmekle veya bir gülümsemeyi kaşlarını çatmakla değiştirmekle kalmaz, aynı zamanda bir resmin öznesini 3 boyutlu bir modelmiş gibi döndürebilir, örneğin birinin baktığı yönü değiştirebilirsiniz. Hatta bir demo, kullanıcının birkaç tıklamayla bir göldeki yansımaları ve bir dağ sırasının yüksekliğini ayarladığını gösteriyor.

İşte çeşitli konularda bir genel bakış:

Manzara manipülasyonuna daha yakından bir bakış:

Ve sadece eğlence için, aslanlarla uğraşmak için:

Bu videolar, araştırma ekibinin ana sayfasından geliyor, ancak bu, Twitter tarafından siteye gönderilen trafik miktarı nedeniyle kilitleniyor (esas olarak @_akhaliq kullanıcısı tarafından, ilginç AI makalelerini vurgulayarak harika bir iş çıkaran ve ilginizi çekiyorsa takip etmeye değer). ArXiv ile ilgili araştırma makalesini de buradan okuyabilirsiniz.

Sorumlu ekibin not ettiği gibi, bu çalışmayla ilgili gerçekten ilginç olan şey, ille de görüntü manipülasyonu değildir. kendi başına, ancak kullanıcı arabirimi. Bir süredir gerçekçi görüntüler oluşturmak için GAN’lar gibi yapay zeka araçlarını kullanabiliyoruz, ancak çoğu yöntem esneklik ve hassasiyetten yoksun. Bir yapay zeka görüntü oluşturucuya “savana doğru ilerleyen bir aslanın resmini yapmasını” söyleyebilirsiniz ve bir tane elde edersiniz, ancak bu gerçek olmayabilir. bire bir aynı İstediğiniz veya ihtiyacınız olan poz.

DragGAN isimli bu model buna net bir çözüm sunuyor. Arayüz, geleneksel görüntü çarpıtma ile tamamen aynıdır, ancak mevcut pikselleri basitçe lekelemek ve ezmek yerine, model konuyu yeniden oluşturur. Araştırmacıların yazdığı gibi: “[O]Yaklaşımınız, bir aslanın ağzındaki dişler gibi tıkalı içeriği halüsinasyona uğratabilir ve bir atın bacağının bükülmesi gibi, nesnenin katılığına bağlı olarak deforme olabilir.”

Açıkçası bu şimdilik sadece bir demo ve teknolojiyi tamamen değerlendirmek imkansız. (Örneğin, son görüntüler ne kadar gerçekçi? Mevcut düşük çözünürlüklü videolara dayanarak bunu söylemek zor.) Ancak bu, görüntü işlemeyi daha erişilebilir hale getirmenin başka bir örneği.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir