Laste kõne elektroonne korpus RusLAPSED

Liikmed ülikoolist:

Olga Burdakova, Liudmila Nikolaeva, Jelena Nõmm, Deniss Ruder
üliõpilased Galina Ostroverhhova, Alina Lemeševskaja, Adam Alidibirov, Aleksei Krõmski, Daria Gruzdeva, Tatiana Bulatova

Uuritavad probleemid:

Elektroonne korpus RusLAPSED on esimene 2- kuni 18-aastaste Eesti venekeelsete laste suulise kõne ja kirjaliku teksti korpus. Korpuse aluseks on suulise kõne häälsalvestiste ning koolieelikute ja kooliealiste laste suulise kõne ja kirjaliku teksti salvestiste litereerimine, mida regulaarselt tehakse kolledžis alates 2005. aastast. Töö elektroonilise korpusega algas 2019. aastal sügisel. Loodav lastekõne korpus on mitmeotstarbeline,dünaamiline (st perioodiliselt uuendatakse ja seetõttu maht suureneb), tähistatud (indekseeritud, annoteeritud), täistekstidega. Korpuse tekstid on maksimaalse täieliku keelevälise märgistusega — teave lapse kohta (sugu, vanus salvestamise ajal, info hariduse ja kasvamise tingimuste kohta (klassi tüüp / lasteaia rühm / õppekava tüüp), pere kohta (Eestis eeldatav viibimise aeg, suhtluskeel peres, laste arv perekonnas), lingvistiline märgistus — teksti iseloomustus kõne vormi järgi (suuline/ kirjalik), kõne eriliigi järgi (monoloog / dialoog / polüloog), kõne tüübi järgi (reproduktiivne / produktiivne / produktiivne-reproduktiivne), teksti stiili, teema ja žanri kohta (igapäevane vestlus, vestlus mängus, vastamine tunnis, telefonikõne, majapidamis- /koolimärkmed, sms, päevik, õnnitluskaart, kiri, ajaveebi sissekanne jne). Iga teksti sõnavorm on maksimaalselt täieliku morfoloogilise märgistusega, mis näitab kõrvalekaldeid kirjandusstandardi normidest.

On välja töötatud kasutajate allkorpuste loomise süsteem kõikide sotsiolingvistilise märgenduse parameetrite järgi (sh õppimise mudel), mis võimaldab otsida vene-eesti bilingvaalide (kes õpivad eesti õppekeelega koolis või keelekümblusklassides) koostatud tekste. 2022. a projekti „Arvutisüsteem kakskeelsete laste suulises ja kirjalikus kõnes tehtavate vigade analüüsiks ja soovituste koostamiseks kõne arendamise, propedeutika ja korrektsiooni eesmärgil (laste kõne korpuse RusLAPSED materjalide põhjal)“ käigus lahendati järgmised ülesanded:

  • On loodud vene-eesti bilingvaalide suulise ja kirjaliku kõne allkorpus (neljas Eesti maakonnas (Ida-Viru, Lääne-Viru, Tartu, Harju) on loodud partnerkoolide võrgustik, kus kogutakse kakskeelsete õpilaste tekste korpuse täiendamiseks. Praegusel hetkel kuulub võrgustikku 11 kooli.
  • On välja töötatud korpuse rakenduse „Normist kõrvalekallete analüsaator“ kontseptsioon. Välja on töötatud originaalne süsteem normist kõrvalekalde esinemise sageduse ja normist kõrvalekalde tüüpilisuse väljaarvutamiseks, et koostada järjestatud loendid keelenormist kõrvalekallete kohta.
  • On loodud korpuse rakenduse „Normist kõrvalekallete analüsaator“ prototüüp, mis reastab automaatrežiimis normist kõrvalekalded terves korpuses või kasutaja esitatud allkorpuses. Kõrvalekallete analüsaator võimaldab: analüüsida normist kõrvalekaldeid, võttes arvesse automaatset märgendust või käsitsi märgendust; analüüsida normist kõrvalekaldeid, võttes arvesse kaalukoefitsienti või ilma selleta; reastada kõrvalekallete loend kõrvalekallete keskmise sageduse või kõrvalekallete tüüpilisuse järgi; vaadata täies mahus konkordantsi iga kõrvalekalde kohta ja ka laiemalt teksti kohta, mis sisaldab normist kõrvalekallet; vaadata normist kõrvalekalletega sõnade loendeid; vaadata metoodilisi soovitusi normist kõrvalekalde ennetamiseks ja vastava kõrvalekalde parandamiseks.

Korpus RusLAPSED asub hetkel TÜ sisevõrgus. 31.01.2024, peale aprobeerimist tehakse korpus kättesaadavaks ka väljaspool TÜ sisevõrku.

Projekti eesmärk on luua mugav vahend, mis võimaldab

  • onto- ja sotsiolingvistidele korraldada onto- ja sotsiolingvistilisi uuringuid, Eestis elavate venekeelsete laste kõne põhjal, võttes arvesse perekasvatuse spetsiifikat, välismaist keskkonda ning koolieelse ja kooliõppe eripära;
  • logopeedidel ja õpetajatel koostada korpuse tekstide põhjal metoodilisi harjutusi.

Töörühma esinemised konverentsidel ja seminaridel:

  • Olga Burdakova, Jelena Nõmm, Liudmila Nikolaeva. Отражение результатов взаимодействия языков в корпусе детской речи RusLAPSED (на материале эстонско-русского языкового контактирования). ESTO-RUSSICA X (04.11.2022, Tartu)
  • Olga Burdakova, Jelena Nõmm, Liudmila Nikolaeva. Подкорпус речи русско-эстонских билингвов в корпусе детской речи RusLAPSED: отражение фактов взаимодействия языков. Uralo-Indogermanica (15.10.2022, Narva)
  • Olga Burdakova, Jelena Nõmm, Liudmila Nikolaeva. Подкорпус речи учеников-билингвов в корпусе детской речи RusLAPSED: проблемы отражения устной речи и квалификации ошибок. Vene keel või vene keeled Balti riikides: korpuse loomise probleemist (16.09.2022, Tallinn)
  • Olga Burdakova, Jelena Nõmm, Liudmila Nikolaeva. Подкорпус речи русско-эстонских билингвов в корпусе детской речи RusLAPSED: к проблеме создания анализатора ошибок. XXIII. pedagoogiline konverents "Mitmekeelsus lapse arengus" (26.08.2022, Narva)
  • Olga Burdakova, Liudmila Nikolaeva, Darja Bojetskaja, Viktoria Issakova, Anna Matochkina. Laste kõne elektroonne korpus RusLAPSED: hetkeseis ja arenguperspektiivid. XXII pedagoogiline konverents "Mitmekeelse hariduse arengusuunad Eestis" (25.–26.08.2021, Narva)
  • Olga Burdakova, Liudmila Nikolaeva, Darja Bojetskaja, Viktoria Issakova, Anna Matochkina. О понятиях «репрезентативность» и «сбалансированность» корпуса детской речи (на материале корпуса детской речи RusLAPSED). ESTO-RUSSICA, 8 (27.11.2020, Tartu)

Publikatsioonid:

  • Burdakova, Olga; Nikolaeva, Liudmila; Nõmm, Jelena (2022). Подкорпус речи учеников билингвов (русско-эстонский билингвизм) в корпусе детской речи RusLAPSED: проблемы отражения устной речи и квалификации ошибок. Русский язык или русские языки в странах Балтии: к проблеме создания корпуса. Таллиннский университет. Институт гуманитарных наук. Таллинн, 16–17 сентября 2022 года. Тезисы докладов. Tallinn, lk 7–6.
  • Burdakova, Olga; Nõmm, Jelena; Nikolaeva, Liudmila (2022). Подкорпус речи русско-эстонских билингвов в корпусе детской речи RusLAPSED: отражение фактов взаимодействия языков. Uralo-indogermanica IV: Abstracts. Narva, lk 17–18.
  • Burdakova, Olga; Nikolaeva, Liudmila; Boetskaja, Darja; Issakova, Viktoria; Matochkina, Anna (2020). К проблеме репрезентативности корпуса детской речи (на материале корпуса детской речи RusLAPSED). URALO-INDOGERMANICA IV. Abstracts. Narva, pp. 6–7.

 

Teised õpetajakoolituse teadusrakud

Foto on dekoratiivne

Mare Kitsnik: eestikeelsele õppele üleminekut toetav õppevara – kuidas tagada kvaliteet?

Tartu Ülikooli Narva kolledži õppejõud

Pedagoogiline konverets

Pedagogicumi kevadine suurseminar 27.-28. märts 2024

Pedagogicumi kevadine suurseminar Kubijal 27.-28. märtsil 2023.