infa.lt

„Microsoft” dirbtinis intelektas imituoja bet kokį balsą išklausęs tris įrašo sekundes

12 sausio
06:50 2023

dirbtinis intelektas

„Microsoft” ekspertai pristatė „Vall-E” – dirbtinio intelekto modelį, kuris tekstą paverčia kalba ir per kelias sekundes gali nukopijuoti bet kokį balsą, įskaitant jo toną ir akustiką (pvz., kalbant telefonu). Kitaip tariant, algoritmas gali pasakyti bet ką balsu asmens, kuris to nepasakė. Šį algoritmą bendrovė jau naudoja įgarsindama audio knygas.

Tai ne pirmas dirbtinis intelektas, galintis suklastoti kitų žmonių balsus, skirtumas tik tas, kad jis daug greitesnis. Pavyzdžiui, 2017 m. Monrealio universitete sukurtam algoritmui „Lyrebird” reikėjo minutės trukmės įrašo kalbai analizuoti, o „Vall-E” užtenka trijų sekundžių.

Dirbtinis intelektas buvo apmokytas išklausęs apie 60 000 valandų anglų kalbos – daugiausia jam buvo duota klausytis garsinių knygų. „Microsoft” kūrėjai paskelbė pavyzdžių, kaip „Vall-E” bando kopijuoti žmonių balsus. Kai kuriuose iš jų mašininį balsą nuo tikrojo galima atskirti pagal neteisingą akcentavimą, o kitais atvejais skirtumas visai nepastebimas.

„Vall-E” ypač gerai atkuria originalo garsinę aplinką – jei įrašo kalba skamba taip, kaip kalba telefonu kalbantis asmuo, tai ir imitacija skambės taip pat. Be to, jis gana gerai susidoroja su akcentais, bent jau su amerikietišku, britišku ir keliais europietiškais, praneša „New Atlas”.

Kalbant apie emocijų perteikimą, rezultatai ne tokie įspūdingi. Bandymai perteikti pyktį, nuovargį, džiaugsmą ar pasibjaurėjimą, kurie yra aiškiai atpažįstami originalų balsuose, davė keistų rezultatų.

Tokios technologijos pritaikymo galimybės akivaizdžios: kiekvienas gali įgarsinti tekstinius pranešimus ar pirkinių sąrašus garsenybių balsu arba klausytis mirusių aktorių skaitomų knygų. Kitas dalykas – gali sumažėti darbo profesionaliems skaitovams ir įgarsintojams.

Dirbtinis intelektas dar nesugeba balsu perteikti visų emocijų, tačiau paprastas užduotis jis galės atlikti daug greičiau ir pigiau.

Nereikėtų pamiršti ir naujų sukčiavimo galimybių. Jei nusikaltėlis gali pavogti 3 sekundžių bet kokio balso įrašą, jam nebus sunku apgauti giminaičius arba apeiti balso atpažinimu pagrįstą apsaugą.

PAREMKITE mus savo 1,2 proc. GPM, kas jums nieko papildomai nekainuos. Ačiū labai.

        → Naujienlaiškis

Visa naujienų juosta >>

žiūrėjo 290

Žymos:

1 Atsiliepimas

  1. VŽA    -  2023-01-12, 07:13

    Jau greitu laiku iš kalėjimų močiutėms skambins jų „vaikai” ar „anūkai”, patekę į avarijas… Išpirkai reikės „jų” atstovams perduoti pinigus…

    Atsakyti į šį komentarą

Rašyti Atsiliepimą

Atšaukti atsakymą.


Taip pat skaitykite:

Naujienlaiškio Prenumerata


Paremti infa.lt 1,2 proc GPM

Apklausa

Ar pritariate, kad opozicijos kandidatai mestų burtus, katras vienas iš jų liks prezidento rinkimuose?


Rodyti rezultatus

Leidžiama ... Leidžiama ...

Žygizmundai Ukraina uber alles. Ar ne laikas tamstai Maldeikienei ir dar keletui proto žaibu psichiatrinėje...

psichas jabanas...

Čia ne prekybininkų naudai.....čia dar viena "priežastis" neatsiskaityti grynaisiais, o pereiti prie elektroninių mokėjimų. Kai...

Aplinkosaugininkai turi saugoti miškus bei gyvūnus, o ne bausti vairuotojus, kurie neišgali įsigyti naujo automobilio...

Pirmiausia išmok rašyti be klaidų, chunveibine....

US subyrėjimo laukiam nuo 1947 m. nu niekaip nesulaukiam....

tik neap siš ik iš laimės....