Web Analytics
More
    Reklāma

    Ierunājot “Sprīdīša” fragmentu, 4. maijā iedzīvotāji ir aicināti palīdzēt modernajām tehnoloģijām apgūt latviešu valodu

    Jaunākie raksti

    Tuvojoties Latvijas Republikas Neatkarības atjaunošanas dienai, mūsu valsts iedzīvotāji ir aicināti piedalīties iniciatīvā “Balsu talka”. Veltot vien dažas minūtes sava laika, ikvienam ir iespēja dot vērtīgu ieguldījumu, lai modernās tehnoloģijas, piemēram, virtuālie asistenti (“Siri”, “Google Assistant”), un mākslīgais intelekts pēc iespējas drīzāk kvalitatīvi apgūtu latviešu valodu.

    Lai piedalītos šajā sociāli un tehnoloģiski nozīmīgajā projektā, interesentiem ir jādodas uz tīmekļa vietni balsutalka.lv, jāizvēlas teikums un tas jāierunā. Ierunāšanai tiek piedāvāti dažādi teksti, taču par godu 4. maijam dalībniekiem būs iespēja pa teikumam ierunāt arī labi pazīstamo Annas Brigaderes pasaku lugu “Sprīdītis”. “Balsu talkas” mērķis ir apkopot daudzveidīgus latviešu valodas runas paraugus un to transkripcijas, izveidojot atvērtu un brīvi pieejamu latviešu valodas runas datu kopu vismaz 1000 stundu apjomā. Savukārt maija brīvdienās projekta īstenotāji cer, ka izdosies iegūt ne mazāk kā desmito daļu no nepieciešamā minimālā apjoma.

    Reklāma

    “Lielākā daļa latviešu valodas runas datu, ko pašlaik izmanto valodu tehnoloģiju uzņēmumi, nav brīvi pieejami. Tas kavē īstenot plašākus pētījumus un inovācijas. Lai iegūtu pēc iespējas vairāk un daudzveidīgākus runas datus, mums ir nepieciešama visas sabiedrības iesaiste. Ja jums ir mirklis brīva laika – nāciet uz balsutalka.lv un saglabājiet savu balsi latviešu valodas nākotnei,“ aicina LU Matemātikas un informātikas institūta vadošā pētniece Ilze Auziņa.

    Sociālā iniciatīva “Balsu talka” turpināsies visu 2023. gadu. Tās mērķis ir iegūt dažādas balsis, tostarp ar izlokšņu iezīmēm un akcentiem. Dalībnieku vecumam, dzimumam un tautībai nav nozīmes – jo daudzveidīgāki balsu paraugi latviešu valodā, jo vērtīgāk.  Līdztekus tam šī ir arī kultūrvēsturiski nozīmīga iniciatīva, jo Latvijā un diasporā ierunātie balsu paraugi tiks saglabāti un nodoti nākamajām paaudzēm.

    “Pēdējo gadu laikā ir notikusi ļoti strauja virtuālo runas tehnoloģiju attīstība, taču Latvijā cilvēki mākslīgā intelekta sniegtās iespējas, piemēram, “Google” asistentu, var izmantot tikai angļu valodā. Mēs visi kopā varam situāciju mainīt! Jo vairāk runas datu kopu būs brīvi pieejamas, jo ātrāk mūsu datori un citas viedierīces “iemācīsies” latviešu valodu un tādējādi spēs vēl vairāk atvieglot mūsu ikdienu,” uzsver Latvijas atvērto tehnoloģiju asociācijas vadītājs Pēteris Jurčenko.

    “Balsu talkā” paraugu vākšanai tiek izmantota starptautiski plaši pazīstamā platforma “Mozilla Common Voice”, kur balsu ieraksti tiek vākti daudzās valodās. Latviešu valodā šobrīd ierunātas ir tikai 19 stundas. Salīdzinoši igauņu valodā tās ir 55 stundas, bet lietuviešu – 26 stundas.

    “Balsu talka” tiek īstenota Atveseļošanas un noturības mehānisma plāna projektā “Valodu tehnoloģiju iniciatīva”, sadarbojoties LU Matemātikas un informātikas institūtam, LU Literatūras, folkloras un mākslas institūtam, Latvijas atvērto tehnoloģiju asociācijai un UNESCO Latvijas Nacionālajai komisijai.

    Reklāma
    Paziņot par jaunumiem
    Paziņot par
    5 komentāri
    Inline Feedbacks
    View all comments
    digitalk
    02.05.2023 14:21

    es pat zinu, kuri būs noņēmēju pirmajās rindās.

    «Televīzijas programmām ne ES valodās turpmāk jānodrošina latviešu valodas celiņš» ziņo Delfi. rakstā ir komentārs no Baltcom, kur starp žēlabām par mazo tirgu un lielajām ierunāšanas izmaksām figurē sekojošs teksts: “daļa kanālu saturu dublēs, nodrošinot tulkojumu ar mākslīgā intelekta palīdzību, norāda kompānijas pārstāvji.”

    un konvertācija notiek jau šobrīd — tekstu mehāniski, bez izteiksmes, ar nepareiziem uzsvariem un intonācijām bubina dators ar TTS (text-to-speech) moduli. subtitri no šādiem raidījumiem, protams, tiek aizvākti. šobrīd pieķertie kanāli ir Filmzone, Filmzone+, Epic Drama.

    ps. ja kādam liekas, ka runas atpazīšanas datiem ar runas sintēzi ir maz sakara, tad palasiet teoriju.

    Krotow
    02.05.2023 15:53
    Reply to  digitalk

    Citu variantu jau nav. Ja visai izklaides drazu kaudzei gribētu piesaistīt vietējos aktierus, pirmkārt viņu nepietiks un otrkārt – viss TV gada budžets aizietu tulkošanas apmaksai. Ceru gan ka atstās variantu ar oriģinālo skaņu un pēc vajadzības ieslēdzamiem titriem latviski.

    digitalk
    03.05.2023 10:33
    Reply to  Krotow

    varianti būtu bijuši, ja politiskās samazgas nejauktu ar latviska satura ieviešanu. diez vai ar mehānisku tulkojumu var sasniegt sludināto “mērķis ir stiprināt latviešu valodu”. aga, protams, tūlīt, ar ieskrējienu.

    Parasts latvietis
    04.05.2023 16:58

    Tikmēr pašu latvijieši dūšīgi pielāgo savu firmu un firmiņu nosaukumus angliski… un , jo mazāks kantorītis -jo lielāka velme globalizēties ,kaut vai nosaukuma līmenī.

    Jānis
    04.05.2023 19:17

    Taču uzrīkojat kādu konkursu ar kādu “gadžetu”, uzreiz ierunās visas 1000 stundas!

    Reklāma