Microsoftun süni zəkası səs əsasında insan üzünü hərəkət etdirir

10 Oktyabr 2019 21:50

Microsoft tədqiqatçıları, demək olar ki, hər kəsin üz hərəkətlərinin nitq və səs klipləri ilə sinxronizasiya edilə biləcəyini söylədi və süni intellektdən istifadə edərək insan animasiyalarını istehsal etməyə başladılar. Əslində, bu təəccüblü deyil, çünki "deepfake" videoları indi həyatımızın bütün sahələrində görünür.

Milli.Az techland.az-a istinadən bildirir ki, bu və digər tədqiqatlara əsaslanaraq, Microsoft Araşdırma qrupu səs yönümlü danışıq baş animasiyalarının keyfiyyətini artırmaq üçün iddia etdikləri bir texnikanı təklif etdi. Əvvəlki insan başının meydana gətirmə cəhdləri üçün neytral bir tonda təmiz və nisbətən səssiz bir səs lazım idi. Bununla birlikdə, tədqiqatçılar yeni araşdırma ilə səs ardıcıllığını fonetik məzmun və fon səs-küyü kimi amillərə ayıran metodların səs-küylü və emosional baxımdan zəngin məlumat nümunələrini ümumiləşdirə biləcəyini söyləyirlər.

Təklif olunan texnikaya əsasən gizli nümayəndəlikləri öyrənən dəyişkən avtomatik kodlayıcı (VAE) tətbiq olunur. Giriş və səs ardıcıllığı VAE tərəfindən məzmunu, emosiya və digər dəyişmə amillərini kodlayan fərqli nümayəndəliklərə çevrilir. Giriş audiosuna əsasən, üzdə hərəkət etmək üçün giriş üz şəkilləri ilə birlikdə bir video generatoruna qidalanan paylamadan nümunələr götürülür. Beləliklə, bu üzə uyğun ola biləcək bir səs var.

Komanda açıq, qərəzsiz şifahi ifadələrin digər üsulları ilə yanaşı, bütün meyarlar üzrə performansda bərabər olduğunu söyləyir. Üstəlik, onlar bütün emosional spektrdə ardıcıl olaraq çıxış edə bilirlər və başdan-ayağa danışmağın bütün müasir yanaşmalarına uyğundurlar.

Milli.Az