Ar Rīgas Tehniskās universitātes (RTU) atbalstu mākslīgā intelekta jaunuzņēmums «Asya» attīsta inovatīvu latviešu valodas rīku «Grāmatiņš», kas būtiski atvieglos kvalitatīvu tekstu veidošanu. Rīka prototipa izveidē iesaistīti studenti, bet tā trenēšanai izmantots RTU superdators.
«Asya» mērķis ir izveidot mākslīgā intelektā balstītu latviešu valodas rīku, kas automātiski atrastu un labotu gramatikas, rakstības, teikuma struktūras un stila kļūdas.
«Šobrīd pieejamie risinājumi latviešu valodai aprobežojas ar vārdu gramatikas labojumiem vai vienkāršiem pieturzīmju labojumiem, kas balstīti uz likumiem. Joprojām nav iespējams labot teikuma kļūdas saliktiem sakārtotiem teikumiem vai divdabja teicieniem. Taču ar mūsdienās pieejamajiem risinājumiem mākslīgajā intelektā šādas kļūdas ir iespējams labot,» stāsta RTU Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultātes pārstāvis Mārcis Teodors Upenieks.
«Grāmatiņš» lietotājam piedāvā ne tikai gramatikas, pareizrakstības un interpunkcijas pārbaudi, bet arī uzlabotas funkcijas, piemēram, stila ieteikumus, kontekstualizētus vārdu ieteikumus un žanra specifiskus rakstīšanas ieteikumus.
«Grāmatiņš» ir pieejams testēšanai bez maksas https://salieckomatus.lv
Rīka prototipu izstrādāja RTU Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultātes studenti. «Uzņēmums vēlējās izmantot to kompetenci, kas mākslīgā intelekta jomā jau ir izveidojusies RTU. Bija vairāki studenti, kuriem pašiem tas interesēja, tāpēc iesaistījām viņus šajā procesā,» pauž M. T. Upenieks.
Projekts implementēts «PyTorch» matemātiskajā satvarā, kas ir īpaši piemērots dziļās mašīnmācīšanās modeļu ieviešanai, un izveidotie modeļi apmācīti, izmantojot RTU HPC jeb Augstas veiktspējas skaitļošanas centra (High-Performance Computing Centre) superdatoru. Izstrādes gaitā apkopoti 64,7 miljoni vārdu no latviešu grāmatām, zinātniskajiem darbiem u.c. materiāliem, un no tiem ir uzbūvēts pamata modelis. Apmācīti vēl trīs modeļi – gramatikas, stila un interpunkcijas modelis. Tie balstīti inovatīvos Latvijā veiktos pētījumos.
«Grāmatiņš» ir izstrādāts, lai darbotos interneta pārlūkā, nodrošinot reāllaika ieteikumus, un ietver arī bezsaistes režīmu. Tā priekšrocība ir lokalizācija, mazo Eiropas valodu atbalsts, sākot ar latviešu valodu, bet pēc tam strādājot ar kaimiņvalstu un citām Eiropas valodām. Nav arī nepieciešami marķēti dati vai ekspertu klātbūtne sistēmas izstrādē, kas ir ievērojama inovācija, norāda izstrādātāji. Jaunizveidotie modeļi arī būs spējīgi darboties uz lietotāju darba stacijām, nevis tikai uz jaudīgiem serveriem, kuri aprīkoti ar GPU, ievērojami samazinot operatīvās izmaksas un uzlabojot cenu patērētājam.
Valodas rīka prototips izstrādāts Latvijas Investīciju un attīstības aģentūras Tehnoloģiju biznesa centra radītajā prototipēšanas programmā «PROTOTECH».
Nu shausmas, kāpēc krievu vārds??? Nu itkā pārveidots ar ārzemju burtiem, bet tomēr, kā tā ?? 🤣🤣🤣😁🤭🤭
Labdien!
ASYA.ai lapā pieejams skaidrojums, no kurienes šāds nosaukums ir radies:
“Asya is the short version of the name Anastasia. The name originates
from Greek and means “Resurrection”; a rising again, revival. Asya is
focused on building something new from what has been before. She
defines the new future. And, Asya is also a beautiful name like Alexa
and Siri.”
Neizskatās, ka kādam šodien interesē latviešu valoda. Mums ir mātes plates, produkti, nesam atbildību, utt. Par rakstīšanu pat labāk nerunāt, to pieprot labi ja 7% .
Un niki arī latviski ^^
… bet vajadzēja būt strāvoņiem, sāknēšanai un irnavām. tad gan būtu latviski.
Nez, kas ar “bezsaistes režīmu”? Nav interneta, nav komatu. Visu dara “salieckomatus.lv”
Kļūdas teikumos ar savrupinājumiem un vispārinošo vārdu.
“«Grāmatiņš» lietotājam piedāvā ne tikai gramatikas, pareizrakstības un interpunkcijas pārbaudi, bet arī uzlabotas funkcijas, piemēram, stila ieteikumus, kontekstualizētus vārdu ieteikumus un žanra specifiskus rakstīšanas ieteikumus.” – man izskatās, ka vismaz šobrīd viņš neko tādu nedara, tikai saliek komatus :(
Paraksta zonā liek komatu pēc frāzes “ar cieņu”. Ļoti izplatīta kļūda; žēl, ka sastopama arī šajā rīkā.