Speech2Face është një rrjet nervor i avancuar i zhvilluar nga shkencëtarët e MIT dhe i trajnuar për të njohur disa tipare të fytyrës dhe për të rindërtuar fytyrat e njerëzve thjesht duke dëgjuar tingujt e zërit të tyre.
Ju ndoshta keni dëgjuar për kamerat e inteligjencës artificiale që mund t’i njohin njerëzit vetëm duke analizuar tiparet e tyre të fytyrës, por çka nëse do të kishte një mënyrë që inteligjenca artificiale të kuptonte se si dukeni vetëm nga tingulli i zërit tuaj dhe pa e krahasuar zërin në një bazë të dhënash?
Kjo është pikërisht ajo për të cilën ka punuar një ekip shkencëtarësh në MIT dhe rezultatet e punës së tyre janë mbresëlënëse, dhe të paimagjinueshme të frikshme, nëse pyetni mendimin tonë. Ndërsa ky sistem, i quajtur Speech2Face, nuk mund të kuptojë ende tiparet e sakta të një fytyre njerëzore vetëm me zërin e tij, sigurisht që ka kapur saktë shumë detaje.
“Modeli ynë është krijuar për të zbuluar korrelacionet statistikore që ekzistojnë midis tipareve të fytyrës dhe zërave të folësve në të dhënat e trajnimit,” thanë krijuesit e Speech2Face. “Të dhënat e trajnimit që përdorim janë një koleksion videosh edukative nga YouTube dhe nuk përfaqësojnë të gjithë popullsinë botërore në mënyrë të barabartë. Prandaj, modeli, si me çdo model të mësimit të makinerive, ndikohet nga kjo shpërndarje e pabarabartë e të dhënave.
Mund të thuash shumë për një person nga mënyra se si ai flet vetë. Për shembull, ju ndoshta mund të dalloni nëse dikush është mashkull apo femër apo i ri apo i vjetër, por Speech2Face shkon përtej kësaj. Ai mund të përcaktojë me mjaft saktësi formën e hundës, mollëzave apo nofullës së dikujt vetëm me zërin e tij, sepse mënyra se si janë strukturuar hunda dhe kockat e tjera në fytyrën tonë përcakton mënyrën se si tingëllojmë!/abcnews.al