Web Analytics
More
    Reklāma

    “Tilde” publisko mākslīgā intelekta modeli Eiropas valodām – “TildeOpen LLM”

    Jaunākie raksti

    Latvijas pētnieki publicējuši pasaulē pirmo mākslīgā intelekta modeli, kurā līdzvērtīgi pārstāvētas latviešu un citas Eiropas valodas. Valodu atbalsta un drošības ziņā jaunais modelis sekmīgi konkurē ar ASV un Ķīnas tehnoloģiju milžiem. Atvērtā koda modelis TildeOpen ļauj veidot daudzveidīgus MI pakalpojumus, kas teicami darbosies arī latviešu un citās mazāk pārstāvētās valodās. Šis unikālais modelis, kura izveidi Eiropas Komisija uzticējusi Latvijas uzņēmumam Tilde, ir brīvi pieejams jebkuram interesentam.

    TildeOpen izstrāde kļuva iespējama pēc Tildes uzvaras Eiropas Komisijas konkursā Mākslīgā intelekta lielais izaicinājums (Large AI Grand Challenge), kas ļāva 12 mēnešus izmantot jaudīgāko Eiropas superdatoru LUMI Somijā. Modeļa apmācībai tika atvēlētas divi miljoni superdatora stundas. Modeli radījusi Tildes pētniecības laboratorijas zinātnieku komanda ar deviņiem zinātņu doktoriem un plašu starptautisku pētniecības pieredzi.

    Modelim TildeOpen ir 30 miljardi parametru, un tas ir apmācīts ar simtiem miljardu vārdu no visām Eiropas valodām. Latviešu valodas apmācībai izmantoti 29 miljardi vārdu, kas ir lielākais zināmais datu apjoms, kāds jebkad izmantots mākslīgā intelekta izstrādē.

    “Lietojot populāros MI modeļus latviešu valodā, redzam gramatiskas kļūdas un neveiklas frāzes, jo tie galvenokārt apmācīti angļu valodā. TildeOpen ir veidots pēc citiem principiem, lai visas Eiropas valodas tajā būtu līdzvērtīgas, tāpēc rezultāts ir daudz kvalitatīvāks,” skaidro Tildes vadītājs Artūrs Vasiļevskis.

    Pirmie testi liecina, ka latviešu valodā TildeOpen darbojas par 41% efektīvāk nekā populārais modelis LLaMA-3 un par 24% labāk nekā GPT-4o. Pielāgots tulkošanas uzdevumam, TildeOpen spēj tulkot tekstus būtiski labāk nekā salīdzināma izmēra GPT-4.1 modeļi un strādā ne sliktāk par 60 reizes lielāko supermodeli, uz kā balstās ChatGPT.

    Modelis izstrādāts saskaņā ar ES mākslīgā intelekta regulējumu un atbalsta visas 24 ES oficiālās valodas, kā arī ukraiņu un citas kandidātvalstu valodas. Atšķirībā no globālajiem modeļiem, kas parasti darbojas ASV vai Āzijas datu centros, TildeOpen var izvietot lokālos serveros vai Eiropas mākoņkrātuvēs, nodrošinot datu glabāšanu ES robežās saskaņā ar Eiropas datu aizsardzības standartiem.

    TildeOpen ir brīvi pieejams platformā Hugging Face, un to var izmantot valsts iestādes, uzņēmumi, zinātnieki un studenti, lai veidotu pielāgotus MI risinājumus – no informācijas apstrādes un klientu apkalpošanas līdz izglītības un kultūras projektiem.

    “Mūsu mērķis bija pierādīt, ka arī Latvijā iespējams radīt pasaules līmeņa mākslīgā intelekta tehnoloģijas. TildeOpen ir nozīmīgs solis pretī latviešu un citu mazāku valodu digitālajai līdztiesībai,” uzsver Vasiļevskis.

    Reklāma
    Paziņot par jaunumiem
    Paziņot par
    3 komentāri
    Kalna kaza
    04.09.2025 14:11

    Daudz droši vien pat nenojauš, cik nozīmīgs Latvijai un latviešu valodai ir šis fakts.

    Carmanis
    04.09.2025 16:01

    Beidzot! Beidzot atzīstu, esmu vecs… un man par sarežģitu!!! Lai arī aktīvi lietoju ChatGpt gan Copilot, pašā TILDEs mājaslapā nesapratu kur ko vispār tur var sākt darīt! Vārdu nav vieni vienīgi burti!!!

    Balta Kaza
    04.09.2025 17:03

    Nenojauš gan. Novecojusi 3-4 gadus veca arhitektūra, 8K konteksta logs, kas ir mūsdienās ļoti maz. Nesaprotams izmērs – ne īsti uz mājas/gāmeru GPU palaidīsi, ne īsti aģentus izmantosi ar tool cāls – ja ir rocība uz lielāku kasti. Nav veikta instrukciju trenēšana un uzvedības apmācība. Beztam viņu doķos rakstīts, valodas tika apmācību kopumā sadalītas atbilstoši to popularitātei, līdzarto LV tur ir maz. Tas viņu tests ar perplexity blakus liek krietni mazākus modeļus un testa metodika ir diezgan dīvaina. Garāžas projekts ar eiropas naudas apguvi. Jūtu līdzi valsts iestāžu darbiniekiem, kam šitas brīnums būs jālieto. Drošivien viņi uztaisīs pēcapmācību un uztaisīs savu aizvērto tulkošanas softu, bet šos parametrus no HF neviens nelietos.

    Reklāma