Visa informacija

Švietimo ir mokslo terminų žodynas sudarytas 2010–2012 m. vykdant Lietuvos mokslo tarybos finansuotą projektą „Švietimo ir mokslo terminų automatinis identifikavimas“ (ŠIMTAI 2) (sutarties nr. LIT-2-44).

Šiame mokslo taikomojo pobūdžio ir daugialypės paskirties projekte analizuota, kaip automatiškai atpažinti ir apibrėžti terminus iš specialiojo tekstyno. Projekte siekta sukurti tokius įrankius ir tokią metodologiją, kurie leistų automatizuoti terminų atpažinimo ir apibrėžimo procesą, taip pat atskleistų realią tų terminų vartoseną švietimo bei mokslo tekstuose.

Svarbiausi projekto tikslai:

  1. sukurti ir išbandyti automatinio terminų atpažinimo lietuvių kalbos tekstyne metodologiją kaip naują terminijos tvarkybos instrumentą,
  2. sukurti specialųjį švietimo ir mokslo politikos tekstyną, kuris sudarytų bazę šių sričių terminijai norminti,
  3. specialiojo tekstyno pagrindu parengti aiškinamąjį švietimo ir mokslo terminų žodyną lietuvių kalba ir šios srities ontologiją.

 

Švietimo ir mokslo terminų žodynas sudarytas naudojant 4 mln. žodžių apimties tekstyno duomenis. Tekstynas (angl. corpus) – elektroninę formą turinčių tekstų rinkinys, dažniausiai sudarytas pagal reprezentatyvumo kriterijus, kad kuo geriau atspindėtų kalbą ar jos atmainą. Švietimo ir mokslo tekstyną sudaro tokios tematikos tekstai: mokslinių tyrimų politika, aukštojo mokslo politika, tęstinio mokymosi politika, profesinio rengimo politika. Tekstyną sudaro Lietuvos institucijų parengti dokumentai, ES dokumentai, kiti verstiniai tekstai.

Šiame žodyne pateikti terminai iš švietimo ir mokslo tekstyno nustatyti automatiškai naudojant VDU Kompiuterinės lingvistikos centre sukurtą programą. Joje naudotos lingvistinės taisyklės, kuriose nurodyta, kokių kalbos dalių junginiai ar žodžių formos analizuotini, t. y. ieškota tam tikros struktūros terminų, pvz., būdvardis ir daiktavardis (aukštasis mokslas); daiktavardžio kilmininkas ir daiktavardis (bakalauro studijos); būdvardis, daiktavardžio kilmininkas ir daiktavardis (jaunesnysis mokslo darbuotojas) ir pan.

Tarp automatiškai nustatytų terminų, vadinamų galimais terminais, pateko daug ne terminų, todėl galimų terminų sąrašą peržiūrėjo terminologai. Iš pradinio 11 tūkst. galimų terminų sąrašo liko 780 švietimo ir mokslo terminų. Iš šio sąrašo nuspręsta išsamiau išanalizuoti apie 300 terminų. Apibrėžti tam tikrų grupių terminai: terminai su žodžiu akademinis (pvz.: akademinė laisvė, akademinė etika, akademinė valanda), su žodžiu darbas (pvz.: diplominis darbas, namų darbas, savarankiškas darbas), su žodžiu išsilavinimas (pvz.: universitetinis išsilavinimas, bendrasis išsilavinimas, aukštasis išsilavinimas), su žodžiu švietimas (pvz.: švietimo teikėjas, suaugusiųjų švietimas, neformalusis švietimas) ir t. t.; taip pat apibrėžti ir keli dažnai vartojami vienažodžiai terminai: studentas, mokslininkas, universitetas ir kt.

Projekte „Švietimo ir mokslo terminų automatinis identifikavimas“ (ŠIMTAI 2), kurio vienas iš rezultatų yra švietimo ir mokslo terminų žodynas, siekta pritaikyti tekstynų lingvistikos metodus automatizuojant terminų nustatymą, terminų apibrėžimą. Iš tekstyno pusiau automatiškai buvo išrinkti duomenys, kuriais remiantis buvo formuluojamos terminų apibrėžtys, parenkami tipiškiausi to termino vartosenos pavyzdžiai. Ne visi analizuoti terminai pateko į žodyną, nes pastebėta, kad kai kuriems terminams apibrėžti nepakako pusiau automatiškai iš švietimo ir mokslo tekstyno nustatytų duomenų arba tie duomenys buvo neišsamūs. Atkreiptinas dėmesys, kad žodyne pateiktų terminų apibrėžtys suformuluotos remiantis būtent tekstyno duomenimis, todėl gali šiek tiek skirtis nuo įprastos vartosenos, nuo kituose šaltiniuose pateiktų apibrėžčių.

Prie daugumos žodyne pateiktų terminų nurodyti atitikmenys anglų, vokiečių ir prancūzų kalbomis. Jie rinkti iš patvirtintų apibrėžtos srities šaltinių, dokumentų, specializuotų terminų duomenų bazių, pvz.: Anglų kalbos švietimo terminų žodyno (Glossary of Educational Terms), Aiškinamojo su studijomis susijusių terminų žodyno, Der Europäische Qualifikationsrahmen für lebenslanges Lernen, EuroVoc (daugiakalbio Europos Sąjungos tezauro), LR Terminų banko ir kt.

Daugiausia remtasi Didžiosios Britanijos, Prancūzijos ir Vokietijos švietimo terminija, tačiau daugelio vertimo atitikmenų reikšmė minėtų šalių sistemos kontekste nėra visiškai tokia pati kaip originalių terminų, vartojamų Lietuvos švietimo ir mokslo terminijoje. Žodyne pateikti terminų atitikmenys užsienio kalbomis yra taikytini Lietuvos Respublikos mokslo ir švietimo sistemai ir ne visada (arba iš dalies) gali būti taikomi kitos šalies mokslo ir švietimo sistemai apibūdinti.

Prie visų terminų pateikta bent po du tipiškus vartosenos pavyzdžius, parinktus iš švietimo ir mokslo tekstyno. Šie pavyzdžiai neredaguoti, tik kai kurie šiek tiek sutrumpinti. Be pavyzdžių dar pateikti ir termino kolokatai. Tai statistiškai (pagal dažnumą) nustatomi analizuojamo termino kontekstiniai partneriai, dažnai atsiduriantys šalia termino iš kairės ir dešinės pusės. Pirmieji vadinami kairiaisiais kolokatais, antrieji – dešiniaisiais kolokatais. Kairieji ir dešinieji kolokatai su analizuojamu terminu ne visada sudaro pilnus bei taisyklingus junginius, nes apskaičiuojami remiantis statistika.

Dešinėje termino kortelėje pateiktas to termino konkordansas. Tai visų pasirinkto termino gramatinių formų vartojimo atvejai iš tekstyno, pateikti vienos eilutės kontekste (konkordanso eilutė dažniausiai apima daugiau negu vieną sakinį), o žodžių formos išrikiuotos pagal abėcėlę. Konkordansas paprastai analizuojamas skaitant jį pirmiausia vertikaliai, nes tik taip išryškėja tipiška termino vartosena. Analizuojamas terminas pateiktas konkordanso eilutės viduryje, jis yra paryškintas. Analizuojamam terminui iš kairės ir iš dešinės nurodyta maždaug po 50 simbolių konkordanso ištraukos. Norint pamatyti ilgesnę konkordanso ištrauką (maždaug po 150 simbolių iš kairės ir dešinės), reikia paspausti ant konkordanso eilutės gale esančio pliuso ženklo.

Švietimo ir mokslo terminų žodyną sudarė Agnė Bielinskienė, Loic Boizou, Gintarė Grigonytė, Jolanta Kovalevskaitė, Irena Markievicz, Erika Rimkutė, Andrius Utka, Giedrius Viliūnas. Žodyno svetainę sukūrė UAB „Fotonija“.

Jūsų komentarų, pasiūlymų dėl žodyno laukiame adresu e.rimkute(ETA)hmf.vdu.lt.

 

© Vytauto Didžiojo universiteto Kompiuterinės lingvistikos centras, 2013
| Joomla 3 Templates Joomlaskins