Tech

Hihetetlen: Így énekelné Frank Sinatra a Gangsta’s Paradise-t – videó

  • Szerző:nuus
  • 2023.07.20 | 15:18

Odáig vannak érte.

Egy hónapja töltötték fel YouTube-ra és már több mint 1,1 millió megtekintés érkezett rá. TikTokra csak a napokban került fel, ott már 4,7 millióan látták.

Fontos megjegyezni, hogy a hangutánzás képessége nem korlátozódik csak az emberi hangokra. Az AI képes különböző hangok, hangszerek vagy akár nem létező lények hangjának létrehozására is, attól függően, hogy milyen hangmintákat és adatokat használtak a tanítás során.

Az AI hangutánzás képessége a neurális hálózatok és mélytanulás technikáinak fejlődésével vált egyre hatékonyabbá. Az AI képes hangot utánozni a generatív modellek segítségével, amelyek lehetővé teszik a hangszignálok létrehozását vagy manipulációját úgy, hogy előzetesen tanulmányozzák a bemeneti hangadatokat.

Az egyik népszerű generatív modell típus, amely képes hangot utánozni, a generatív adversarial hálózatok (GAN-ok). A GAN egy két részből álló neurális hálózat, amelynek van egy generátor része és egy diszkriminátor része. A generátor feladata olyan hangadatok előállítása, amelyek a tanítóadatokhoz hasonlítanak, míg a diszkriminátor célja, hogy megkülönböztesse a valódi hangmintákat a generáltaktól. A generátor folyamatosan javítja a hangok minőségét, ahogy a diszkriminátor azonosítási képessége javul.

Az ilyen generatív modellek tanításához nagy mennyiségű hangadat szükséges, például beszédhangok, énekhangok stb. Ezeket a hangmintákat a neurális hálózatok tanítása során használják fel, hogy a generátor megtanulja a hangok és beszédstruktúrák összefüggéseit. A tanított modell képes új, valódi hangokat létrehozni vagy meglévő hangokat manipulálni, ha a bemeneti mintát megfelelően módosítják.

 


Megosztás Facebookon
Megosztás Twitteren
Szólj hozzá Nincs hozzászólás
Hozzászólások mutatása

Válasz vagy komment írása

Cikkajánló