Tuvojoties Latvijas Republikas Neatkarības atjaunošanas dienai, mūsu valsts iedzīvotāji ir aicināti piedalīties iniciatīvā “Balsu talka”. Veltot vien dažas minūtes sava laika, ikvienam ir iespēja dot vērtīgu ieguldījumu, lai modernās tehnoloģijas, piemēram, virtuālie asistenti (“Siri”, “Google Assistant”), un mākslīgais intelekts pēc iespējas drīzāk kvalitatīvi apgūtu latviešu valodu.
Lai piedalītos šajā sociāli un tehnoloģiski nozīmīgajā projektā, interesentiem ir jādodas uz tīmekļa vietni balsutalka.lv, jāizvēlas teikums un tas jāierunā. Ierunāšanai tiek piedāvāti dažādi teksti, taču par godu 4. maijam dalībniekiem būs iespēja pa teikumam ierunāt arī labi pazīstamo Annas Brigaderes pasaku lugu “Sprīdītis”. “Balsu talkas” mērķis ir apkopot daudzveidīgus latviešu valodas runas paraugus un to transkripcijas, izveidojot atvērtu un brīvi pieejamu latviešu valodas runas datu kopu vismaz 1000 stundu apjomā. Savukārt maija brīvdienās projekta īstenotāji cer, ka izdosies iegūt ne mazāk kā desmito daļu no nepieciešamā minimālā apjoma.
“Lielākā daļa latviešu valodas runas datu, ko pašlaik izmanto valodu tehnoloģiju uzņēmumi, nav brīvi pieejami. Tas kavē īstenot plašākus pētījumus un inovācijas. Lai iegūtu pēc iespējas vairāk un daudzveidīgākus runas datus, mums ir nepieciešama visas sabiedrības iesaiste. Ja jums ir mirklis brīva laika – nāciet uz balsutalka.lv un saglabājiet savu balsi latviešu valodas nākotnei,“ aicina LU Matemātikas un informātikas institūta vadošā pētniece Ilze Auziņa.
Sociālā iniciatīva “Balsu talka” turpināsies visu 2023. gadu. Tās mērķis ir iegūt dažādas balsis, tostarp ar izlokšņu iezīmēm un akcentiem. Dalībnieku vecumam, dzimumam un tautībai nav nozīmes – jo daudzveidīgāki balsu paraugi latviešu valodā, jo vērtīgāk. Līdztekus tam šī ir arī kultūrvēsturiski nozīmīga iniciatīva, jo Latvijā un diasporā ierunātie balsu paraugi tiks saglabāti un nodoti nākamajām paaudzēm.
“Pēdējo gadu laikā ir notikusi ļoti strauja virtuālo runas tehnoloģiju attīstība, taču Latvijā cilvēki mākslīgā intelekta sniegtās iespējas, piemēram, “Google” asistentu, var izmantot tikai angļu valodā. Mēs visi kopā varam situāciju mainīt! Jo vairāk runas datu kopu būs brīvi pieejamas, jo ātrāk mūsu datori un citas viedierīces “iemācīsies” latviešu valodu un tādējādi spēs vēl vairāk atvieglot mūsu ikdienu,” uzsver Latvijas atvērto tehnoloģiju asociācijas vadītājs Pēteris Jurčenko.
“Balsu talkā” paraugu vākšanai tiek izmantota starptautiski plaši pazīstamā platforma “Mozilla Common Voice”, kur balsu ieraksti tiek vākti daudzās valodās. Latviešu valodā šobrīd ierunātas ir tikai 19 stundas. Salīdzinoši igauņu valodā tās ir 55 stundas, bet lietuviešu – 26 stundas.
“Balsu talka” tiek īstenota Atveseļošanas un noturības mehānisma plāna projektā “Valodu tehnoloģiju iniciatīva”, sadarbojoties LU Matemātikas un informātikas institūtam, LU Literatūras, folkloras un mākslas institūtam, Latvijas atvērto tehnoloģiju asociācijai un UNESCO Latvijas Nacionālajai komisijai.
es pat zinu, kuri būs noņēmēju pirmajās rindās.
«Televīzijas programmām ne ES valodās turpmāk jānodrošina latviešu valodas celiņš» ziņo Delfi. rakstā ir komentārs no Baltcom, kur starp žēlabām par mazo tirgu un lielajām ierunāšanas izmaksām figurē sekojošs teksts: “daļa kanālu saturu dublēs, nodrošinot tulkojumu ar mākslīgā intelekta palīdzību, norāda kompānijas pārstāvji.”
un konvertācija notiek jau šobrīd — tekstu mehāniski, bez izteiksmes, ar nepareiziem uzsvariem un intonācijām bubina dators ar TTS (text-to-speech) moduli. subtitri no šādiem raidījumiem, protams, tiek aizvākti. šobrīd pieķertie kanāli ir Filmzone, Filmzone+, Epic Drama.
ps. ja kādam liekas, ka runas atpazīšanas datiem ar runas sintēzi ir maz sakara, tad palasiet teoriju.
Citu variantu jau nav. Ja visai izklaides drazu kaudzei gribētu piesaistīt vietējos aktierus, pirmkārt viņu nepietiks un otrkārt – viss TV gada budžets aizietu tulkošanas apmaksai. Ceru gan ka atstās variantu ar oriģinālo skaņu un pēc vajadzības ieslēdzamiem titriem latviski.
varianti būtu bijuši, ja politiskās samazgas nejauktu ar latviska satura ieviešanu. diez vai ar mehānisku tulkojumu var sasniegt sludināto “mērķis ir stiprināt latviešu valodu”. aga, protams, tūlīt, ar ieskrējienu.
Tikmēr pašu latvijieši dūšīgi pielāgo savu firmu un firmiņu nosaukumus angliski… un , jo mazāks kantorītis -jo lielāka velme globalizēties ,kaut vai nosaukuma līmenī.
Taču uzrīkojat kādu konkursu ar kādu “gadžetu”, uzreiz ierunās visas 1000 stundas!