Vēl arvien ir ļoti vienkārši atšķirt cilvēka runasveidu no tā dēvētajām text-to-speech programmām, bet jau pavisam drīz piedzīvosim to mirkli, kad datora runāšanu nevarēs atšķirt no īsta cilvēka.

Šobrīd ir tikai divi veidi, kā tiek veidota datoru “valoda” – viens ietver milzīgu, iepriekš ierakstītu vārdu krājumu, bet otrs balstās uz vārdu elektronisku veidošanu, tomēr “balss” neskan ne tuvu īsta cilvēka balsij. Google DeepMind komanda ir izveidojusi WaveNet programmatūru, kas izmanto mākslīgo neironu tīklu runas nodrošināšanai.

WaveNet programmatūra izklausīsies pēc cilvēka, jo Google DeepMind komanda tai ir ļāvusi mācīties no dažādiem cilvēku balss ierakstiem. WaveNet programmatūra “balsi” veido no atsevišķiem, kopā saliktiem apgūto skaņu viļņiem. Tiek norādīts, ka šādā veidā WaveNet programmatūra spējot līdz minimumam samazināt atšķirību starp datorizētu “balsi” un cilvēka runas stilu. Līdz gala produktam vēl ir patālu, bet DeepMind mājaslapā vari paklausīties dažus sagatavotus robota “balss” ierakstus.

Ja rakstā pamanīji kļūdu, padod mums par to ziņu, iezīmējot ačgārno tekstu un nospiežot Ctrl+Enter. Paldies!

Reklāma
Paziņot par jaunumiem
Paziņot par
guest
3 Comments
vecākie
jaunākie novērtētākie
Inline Feedbacks
View all comments
digitalk

kad pateiks ko latviski bez citu tautību akcenta un zilbju uzsvariem, tad arī paklausīsimies.

Aleksandrs Okuņevs

Baigi ātri un daudz mācās tie neirotīkli. Bailes, kā kādu dienu tas/tie (neirotīkli?) sapratīs, ka cilvēki ir bīstami, un iznīcinās mūs…

digitalk

nebūs tik vienkārši. cilvēks, kā jebkurš evolūcijas produkts, prot piemēroties un parādīt savu izdzīvošanas spēju. ko neirotīkli varēs izdarīt, kad izrausi tiem elektrības rozeti? paši uzbūvēs pārdesmit AES un sāks bagātināt radioaktīvo rūdu?