RTU studenti izstrādājuši prototipu inovatīvam un mūsdienīgam latviešu valodas rīkam

12. marts
.
.
.
Foto: pixabay.com

Rīgas Tehniskās universitātes (RTU) studenti izstrādājuši prototipu inovatīvam un mūsdienīgam latviešu valodas rīkam, kas būtiski atvieglos kvalitatīvu tekstu veidošanu visdažādāko nozaru speciālistiem, tostarp izglītības nozarē iesaistītajiem.

Projekta, kurš pēc SIA «Asya» pasūtījuma tiek īstenots Latvijas Investīciju un attīstības aģentūras Tehnoloģiju biznesa centra radītajā prototipēšanas programmā «PROTOTECH», mērķis ir izveidot mākslīgā intelektā balstītu produktu, līdzīgu kā visiem zināmais «Grammarly», kuru varētu lietot, lai automātiski atrastu un salabotu komatu, rakstības, teikuma struktūras un stila kļūdas tieši latviešu valodas tekstā. «Šobrīd pieejamie risinājumi latviešu valodai aprobežojas ar vārdu gramatikas labojumiem vai vienkāršiem pieturzīmju labojumiem, kas balstīti uz likumiem. Vēl joprojām nav iespējams pat labot teikuma kļūdas saliktiem sakārtotiem teikumiem vai divdabja teicieniem. Taču ar mūsdienās pieejamajiem risinājumiem mākslīgajā intelektā šādas kļūdas ir iespējams izlabot,» stāsta RTU Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultātes pārstāvis Mārcis Teodors Upenieks.

Līdz ar to spraudnis «Grāmatiņš» lietotājam piedāvās ne tikai gramatikas, pareizrakstības un interpunkcijas pārbaudi, bet arī uzlabotas funkcijas, piemēram, stila ieteikumus, kontekstualizētus vārdu ieteikumus un žanra specifiskus rakstīšanas ieteikumus. «Gribējām izmantot to kompetenci, kas mākslīgā intelekta jomā jau ir izveidojusies RTU. Bija vairāki studenti, kuriem pašiem tas interesēja, tāpēc vēlējāmies arī viņus iesaistīt šajā procesā,» ieceres rašanos ieskicē M. T. Upenieks. Projekts implementēts «PyTorch» matemātiskajā satvarā, kurš ir īpaši piemērots dziļās mašīnmācīšanās modeļu ieviešanai, un izveidotie modeļi apmācīti, izmantojot RTU HPC superdatoru. Izstrādes gaitā ir apkopoti 64,7 miljoni vārdu no latviešu grāmatām, zinātniskajiem darbiem u.c. materiāliem, un no tiem ir uzbūvēts pamata modelis. Papildus apmācīti vēl trīs modeļi – gramatikas, stila un interpunkcijas modelis. Modeļi balstīti uz inovatīviem, tepat Latvijā veiktiem pētījumiem, nevis uz ārējo piegādātāju risinājumiem. 

«Tā ir tieši datu rakšana lielajos valodas modeļos, kas paver mums līdz šim nebijušas iespējas, piemēram, daudzus marķējumus par kļūdām utml. mēs ģenerējam sintētiski. Ir iespējams mākslīgajam intelektam paprasīt, lai sabojā tekstu konkrētā veidā, piemēram, izlaiž burtus vai vārdus, un arī šādā veidā mēs iegūstam diezgan daudz datu. Kombinācijā ar cilvēka veiktajiem marķējumiem varam dabūt daudz labāku rezultātu daudz īsākā laika posmā,» skaidro M. T. Upenieks. Īstenojot šo projektu, sagatavotas arī zinātniskās publikācijas, piemēram, par pētījumu, kurā tika iegūta lielākā publiski pieejamā datu kopa vairāk nekā 90000 teikumu apmērā, lai noteiktu tajos pausto noskaņojumu (pozitīvs, negatīvs, cits).

 «Grāmatiņš» ir izstrādāts, lai darbotos interneta pārlūkā, nodrošinot reāllaika ieteikumus, un ietver arī bezsaistes režīmu situācijās, kad nav pieejama interneta savienojuma. Tā priekšrocība pret konkurentiem tirgū ir lokalizācija, mazo Eiropas valodu atbalsts, sākot ar latviešu valodu, bet pēc tam strādājot ar kaimiņvalstu un citām Eiropas valodām. Vēl viena priekšrocība piedāvātajam risinājumam ir tas, ka nav nepieciešami marķēti dati vai ekspertu klātbūtne sistēmas izstrādē, kas ir ievērojama inovācija, jo parasti nepieciešami lieli ieguldījumi, lai marķētu datus. Tāpat jaunizveidotie modeļi būs spējīgi darboties uz lietotāju darba stacijām, nevis tikai uz jaudīgiem serveriem, kuri aprīkoti ar GPU, tādejādi ievērojami samazinot operatīvās izmaksas un uzlabojot cenu patērētājam.

«PROTOTECH» ir Latvijas Investīciju un attīstības aģentūras Tehnoloģiju biznesa centra radīta prototipēšanas programma, kas sniedz atbalstu fiziskām un juridiskām personām zinātņietilpīgu tehnoloģiju produktu vai pakalpojumu prototipu izstrādē un attīstībā, sadarbojoties ar vadošajām Latvijas augstskolām – RTU, Latvijas Universitāti un Rīgas Stradiņa universitāti. Projekts tiek īstenots Norvēģijas finanšu instrumenta 2014. – 2021. gada perioda programmā «Uzņēmējdarbības attīstība, inovācijas un mazie un vidējie uzņēmumi». Šī prototipa izstrādei saņemts grants 15 tūkst. eiro apmērā.

Strādājam kopā konkurētspējīgai Eiropai!

RTU studenti izstrādājuši prototipu inovatīvam un mūsdienīgam latviešu valodas rīkam

Informācija par rakstu

Raksta autors

RTU Sabiedrisko attiecību departaments

Publikācijas datums

12. marts plkst. 16:44

Līdzīgi raksti

Universitāte

Jaunumi