Dall-E ve Stable Difusion bir tek başlangıçtı. verimli suni zeka sistemleri çoğaldıkça ve firmalar tekliflerini azılı rakiplerinden değişik şartlarını yerine getirmek için çalıştıkça, internetteki söyleşi robotları, Shutterstock ve Adobe gibilerinin öncülük etmesiyle görselleri düzenlemenin yanında ayrıca yeni görseller oluşturma kuvveti de kazanıyor. Sadece suni zeka destekli bu yeni kabiliyetler, var olan çevrimiçi çizimlerin ve görsellerin izinsiz olarak değiştirilmesi ya da direkt çalınması benzer biçimde tanıdık tuzakları da bununla beraber getiriyor. Filigran teknikleri, çalıntı risklerini hafifletmeye muavin olabiliyorken, MIT CSAIL tarafınca zenginleştirilen yeni “PhotoGuard” tekniği, izinsiz değiştirmeleri önlemeye yardım edebilir.
PhotoGuard nasıl çalışmakta?
PhotoGuard, bir görüntüdeki seçili pikselleri, suni zekanın görüntünün ne işe yaradığını anlama kabiliyetini bozacak biçimde değiştirerek çalışmakta. Araştırma ekibinin adlandırdığı şekliyle bu “düzensizlikler” insan gözüyle görülemez sadece makineler tarafınca basitçe ve rahatça okunabilir. Bu yapıları ortaya çıkaran “kodlayıcı” hücum metodu, algoritmik modelin, bir görüntüdeki her pikselin konumunu ve rengini tanımlayan karmaşık işlemi olan hedef görüntünün gizli saklı temsilini hedef alıyor ve esasen suni zekanın neye baktığını anlamasını engelliyor.
Daha gelişmiş ve hesaplama penceresinden yoğun olan “difüzyon” hücum metodu ise, bir görüntüyü suni zekanın gözünde değişik bir görüntü olarak kamufle ediyor. Bu metot, bir hedef görüntüyü tanımlıyor ve hedefine benzeyecek biçimde görüntüdeki düzensizlikleri optimize ediyor. Bir suni zekanın bu dayanıklı görüntüler üstünde halletmeye çalmış olduğu rastgele bir düzenleme, düzmece “hedef” görüntülere uygulanarak gerçekçi olmayan bir görüntü oluşmasına niçin olabilmektedir.
MIT doktora talebesi ve çalışmanın kafa yazarı Hadi Salman, Engadget ile yapmış olduğu görüşmede “Kodlayıcı saldırısı, modelin giriş görüntüsünün (düzenlenecek) başka bir görüntü (mesele gri bir görüntü) bulunduğunu düşünmesine niçin olabilmektedir” diyor ve devam ediyor: “Difüzyon saldırısı ise, difüzyon modelini çeşitli hedef görüntülere (gri ya da rastgele bir görüntü de olabilir) yönelik düzenlemeler halletmeye zorlar.”
Salman yapmış olduğu açıklamada, “Model geliştiricileri, toplumsal medya platformları ve siyaset yapıcıları içeren işbirlikçi bir yaklaşım, yetkisiz görüntü manipülasyonuna karşı kuvvetli bir müdafa sağlıyor. Bu acil mevzu, bahis üstünde çaba göstermek ve uğraşmak bugün büyük ehemmiyet taşıyor” diyor ve sözlerini “bu çözüme katkıda bulunmaktan kıvanç duysam da, bu korumayı ergonomik hale ulaştırmak için daha çok emek harcama gerekmektedir. Bu modelleri geliştiren şirketlerin, bu suni zeka araçlarının yol açmış olduğu ihtimaller içinde tehditlere karşı sağlam önlemler tasarlamaya yatırım yapması gerekmektedir” şeklinde ifade ederek tamamlıyor.
