Google, YouTube İçin Gerçek Zamanlı Dublaj Hizmetini Test Ediyor

Google, YouTube İçin Gerçek Zamanlı Dublaj Hizmetini Test Ediyor

PaLM 2‘deki suni zeka özelliklerinin Bard da iç oluş suretiyle Google ekosistemine sorunsuz bir halde entegre edilmesi, Google I/O 2023 etkinliğinin anne temalarından birisi oldu. Sadece Google çeşitli özelliklerin derhal piyasaya sürülmemesi gerektiğine inanıyor. Ayrıca PaLM 2, Google’ın makine öğrenimi ve suni zeka alanındaki araştırmalarına dayanan yeni kuşak büyük lisan modeli olarak biliniyor.

Google I/O konuşmasında, firmanın teknoloji ve toplumdan görevli kıdemli reis yardımcısı James Manyika, yanlış bilgilendirme ve çeşitli suni zeka kabiliyetleri, doğrusu suni zeka yöntemiyle yapılabilecek dezenformasyon ilgili endişelerini dile getirdi. Manyika’nın bahsetmiş olduğu şey, deepfake çalışmalarının videolarda seslendirme oluşturmak için kullandıkları lisan modelleri.

REKLAM ALANI

Google, bu hızla gelişen teknolojinin kötüye kullanılma potansiyeli bulunduğunu düşünerek, çeşitli adımlar atmayı dikkatsizlik etmemiş. Şimdilik kontrol sürecinde prototip olarak yayınladığı “Evrensel Çevirmen” vasfı ise şimdiden geliştiriciler tarafınca alaka odağı haline gelmiş durumda.

Google’ın Evrensel Çevirmen’i, konuşmaları gerçek zamanlı olarak çevirebiliyor. Bir video izlerken başka bir dilde ne söylendiğini anında görebiliyor ve okuyabiliyorsunuz. Bunun bir çeşit deneysel bir suni zeka video dublaj hizmeti bulunduğunu söylememiz mümkündür.

Prototip, etkinlik esnasında Arizona Eyalet Üniversitesi ile ortaklaşa oluşturulan bir emek harcamadan alınan videolar vasıtasıyla sergilendi. Google, ilk sonuçların ümit verici bulunduğunu söylüyor.

Model 4 aşamada çalışmakta. İlk aşamada model, bir videodaki dudak hareketlerini tanımış olduğu kelimelerle eşleştiriyor. 2’inci adım, anlık konuşma üretimi elde eden bir algoritmayı tetikliyor. Modelin 3’üncü aşaması, çeviriye yardım etmek için konuşan kişinin naturel konuşma hızındaki yükselme ve alçalmayı ölçen tonlamayı kullanıyor. nihayet olarak, yoldam kopyalandıktan ve konuşmacının dudak hareketlerinden ton eşleştirildikten sonrasında, çeviriyi oluşturmak için hepsini bir araya getiriyor.

Evrensel Çevirmen vasfı hemen hemen ufak bir kontrol grubu haricinde kullanım alanına açık değil. Google bu vasfı kontrol ettikten sonrasında, YouTube ve video konuşma hizmeti Google Meet benzer biçimde hizmetlerde kullanım alanına sunabilir.

ZİYARETÇİ YORUMLARI

Henüz yorum yapılmamış. İlk yorumu aşağıdaki form aracılığıyla siz yapabilirsiniz.

BİR YORUM YAZ