Инженерите од истражувачката лабораторија за вештачка интелигенција (AI) на Facebook креирале систем со машинско учење кој не само што може да клонира нечиј глас, туку и неговата каденца – што го презентирале со правење на дупликат на гласовите на Бил Гејтс и други познати личности.
AI системот наречен Melnet би можел да доведе до пореалистични AI гласовни асистенти или модели кои би се користеле од луѓе со потешкотии во говорот, но исто така би можел да го отежни разликувањето на вистински говор, и на лажен компјутерски генериран т.н “deepfake” говор
Компјутерските системи кои текстот го претвораат во говор не се ништо ново, но истражувачите од Facebook велат дека Melnet се разликува од неговите претходници.
Додека претходните системи биле тренирани со користење на звучни бранови, тимот на Facebook користел спектрограми, форма кој е многу покомпактен и исполнет со информации.
За тренирање на системот тие користеле аудио од TED говори, а крајниот резултат бил говор кој сепак звучен малку роботски, но чиј глас бил препознатлив и многу близок на оној од вистинските личности кои ги имитирал.