Darja Lavõgina
Vikipeedia on eesti keeleruumis kõige kättesaadavam infoallikas: 2025. aasta novembri seisuga sisaldas see üle 255 000 vaba juurdepääsuga artikli. See on tavaliselt esimene ja mõnikord ka ainus koht, kust lugeja saab süstematiseeritud teadusteemalist infot emakeeles.
Vikipeedia artiklite kvaliteet on paraku ebaühtlane. See asjaolu muudab lugejaid eestikeelse Vikipeedia suhtes kriitiliseks ning teisalt vähendab ka teadlaste motivatsiooni sinna panustada. Kuidas saavad lugeja ise hinnata Vikipeedia sissekannete teaduspõhisust? Milliste raskustega puutuvad kokku loodusteadustest ja meditsiinist kirjutavad vikipedistid? Milliste nippidega saab seda entsüklopeediat mõtestatumalt kasutada ja arendada?

Vikipeedia matemaatikaportaalis esile tõstetud pilt Mandelbroti fraktalist. Prantsuse-ameerika matemaatiku järgi nime saanud fraktal on hulk punkte, mis moodustavad keeruka tasapinna; äärejoone, mis moodustab murru. Iga uus fraktali suurendusaste toob esile hulgaliselt uusi koopiaid varem nähtud kujutisest. WOLFGANG BEYER / WIKIPEDIA
Vikipeedia infoallikana: konkurents tehisaruga
Eelmisel aastal leidis vikipedistide jõulupeol Tartus kõlapinna noore kolleegi tähelepanek, et tänapäeval on internetikasutajal lihtsam küsida infot ChatGPT käest, kui teha korralik otsing Vikipeedias. Tehniliselt on see ilmselt tõepoolest lihtsam, ent omaette küsimus on, kas lihtsus (loe: pinnapealsus) peaks olema teabeotsingul esmatähtis. Paraku on tehisarule (AI) omane nähtus, mida tuntakse hallutsineerimisena. See tähendab, et päringule vastates võib AI sujuvalt ümber lülituda „õpitud“ info väljastamiselt „uue“ ehk reaalsusega ebakõlas oleva info loomisele. Hallutsineerimise põimitus näiliselt pädevasse konteksti võib segadusse ajada ka kogenud eksperdid – nii et isegi juhul, kui lugeja püüab teadlikult allikakriitiline olla, võib olla paras katsumus teha õigel ajal kindlaks suurte keelemudelite viperusi.
Mille poolest siis Vikipeedia parem on? Vikipeedias on artikli puhul igale lugejale nähtavad kolm olulist parameetrit.
1. Viidete olemasolu teksti järel. Viidete valik on muidugi artikli autori vaba voli. Mõnikord kajastavad teemat arusaadavamalt hoopis õpikud, andmebaasid või õigusaktid, kuid teaduslikult pädev autor leiab kindlasti ka mõne relevantse teadusartikli, millele viidata. Loomulikult võiks eraldi arutleda selle üle, kas iga teaduslik publikatsioon on tingimata kvaliteetne, kuid loodusteaduste ja meditsiini puhul võib ennekõike pidada usaldusväärseks näiteks neid viiteid, mille vormingus on lühend PMID. See näitab artikli vastavust rahvusvahelise andmebaasi PubMed standarditele.
2. Artikli ajalugu. See on lingina näha lehekülje paremas ülaservas. Iga teaduslikkusele pretendeeriv tekst võiks olla vähegi retsenseeritud: teksti on kriitiliselt üle vaadanud nii autor kui ka keegi kasutajatest. Tegelikult jääb igast parandusest ilusti jälg maha. Ajaloo põhjal saab otsustada ka selle üle, kas artiklit on märgatud ajakohastada, sest teadus on paratamatult dünaamiline, arusaamad võivad ajapikku muutuda ja teavet tekib kogu aeg juurde.
3. Artikli arutelu, mis on lingina näha lehekülje vasakus ülaservas. Iga artikli puhul ei ole see link aktiivne, aga kui on, tasub seda nii mõnigi kord tähelepanelikumalt uurida. Ingliskeelse Vikipeedia alaosast „Talk“ võib leida üsna suuri koolkondadevahelisi sõnalahinguid. Eestikeelses Vikipeedias on selliseid tuliseid sõnelusi tavaliselt vähem, aga vaidlusi tekib ikka – nii vormi kui ka sisu pärast. Taas: kollektiivne looming on olemuslikult usaldusväärsem kui üksikisiku arvamus.
Kui vikiartikli taga on esitatud korralikult lingitud infoallikate loetelu teadusartiklite kohta, artikli ajaloos kajastuvad asjalikud täiendused ning aruteluosa sisaldab täpsustavat diskussiooni, siis suure tõenäosusega on artikkel usaldusväärne. Paraku ei nõua tüüpiline kasutaja ChatGPT-lt kehtivate viidete loetelu. Ka värskendused, mida tehakse suurte keelemudelite korral selle kasutajate sisendi alusel, võivad muuta mudelite sisulise soorituse hoopis viletsamaks.
Seejuures ei taha ma tehisarul põhinevaid lahendusi üldsegi halvustada. Avalikult kättesaadavad suured keelemudelid on üsna sobilikud näiteks tekstimustandite koostamiseks või ideekorjeks, kuid sedagi pigem inglise keeles. Eestikeelne erialane terminoloogia lonkab enamikul AI-dest väga häirivalt.
Emakeelne terminoloogia ja teaduse populariseerimine: kas sisu „meigib senssi“?
Anglitsisme tungib eesti keelde ilmselt kõigis valdkondades, see avaldub ka teaduse keelepruugis. Noored teadushuvilised ammutavad olulise osa oma maailmapildist ingliskeelsete allikate kaudu (alates päris mõistlikust Veritasiumi kanalist YouTube’is ja lõpetades viraalselt levivate TikToki videotega, mille algallikaid ei õnnestugi kindlaks teha), kogenud kalad eelistavad juurdunud laborislängi. Anglitsismide saak, mis meenub näiteks sel aastal ülikooli sisseastumiskomisjoni töö põhjal, sisaldab „revolutsiooni“ (mõeldi pöörlemist, mitte ühiskondlik-ajaloolist sündmust), „materiaalteadust“ („materjaliteaduse“ asemel) ja „silikooni“ (kuigi eksisteerib eestikeelse mõistena ja tähistab siloksaanil põhinevat polümeeri, on ekslikult kasutusel ka räni tähenduses). Leidub ka mõisteid, mille tähendusväli on meedia mõjutusel nihkumas nii eesti kui ka inglise keeleruumis: näiteks sõna „orgaaniline“ kasutatakse maheda tähenduses (olen korduvalt näinud üliõpilaskandidaatide silmis suurt imestust, kui juhin tähelepanu asjaolule, et mõni putukatõrjevahend on keemilise struktuuri poolest kohe kindlasti orgaaniline aine).
Anglitsismidest on raske hoiduda ka vikipedistidel, kuid enda kogemuse põhjal siiski väidan, et kvaliteetselt koostatud ja hästi retsenseeritud vikiartikkel sisaldab vähem terminoloogilisi vigu kui näiteks AI tõlgitud ingliskeelne tekst. Niisuguseid pooltooreid tõlkeid tuleb paraku üsna sageli ette meediaväljaannete teadusuudistes (samas on kahtlemata tore, et ajakirjandus püüab edastada päevakajalisi teadusteemasid).
Eravestlustest selgub, et Eesti kõrgkoolides on hulgaliselt õppejõude, kes on siiralt mures emakeele kvaliteedi pärast. Miks ei võiks Vikipeediasse jõuda rohkem ka nende spetsialistide koostatud õppematerjale, mis on kohandatud vikiartikliteks? Ise olen püüdnud viimase kolme aasta jooksul teha iga oma loengukursuse kohta vähemalt ühe artikli. Ahoi, kolleegid! Äkki sobib teie grandiprojektides kohustusliku „dissemination activity“ ehk teadustulemuste üldsusele tutvustamise alla ka Vikipeediasse panustamine?

Artikli autor Darja Lavõgina (pildil vasakul) võitis Vikipeedia 2024. aasta terminivõistluse. Auhinna andis talle kätte Vikipeedia eestvedaja Ivo Kruusamägi. Foto: OLARI PILNIK / WIKIPEDIA
Proovikivid: infomullidest kogukonnani
2025. aasta novembri alguses oli eestikeelse Vikipeedia esilehe näidikute seas number 1305: nii mitu kaastöölist oli panustanud Vikipeedia toimimisse 30 päeva jooksul. Võiks ju arvata, et üle tuhande entusiasti kollektiivne suutlikkus on suur ja ekspertiis katab kõik olulised valdkonnad ära, kuid siiski teeb muret asjaolu, et suurem osa sellest seltskonnast jääb kuust kuusse samaks. Enamgi veel, kui filtreerida 1305-st välja need kasutajad, kes on teinud vähemalt 10 muudatust, siis kahaneb arv 172 peale, aga üle saja muudatuse teinuid oli vaid 32. Ometi on eestikeelses Vikipeedias loodud kõik eeldused teksti redigeerimiseks võimalikult lihtsalt ja kiirelt. Kui praegune Vikipeedia on ideaalist kaugel ja „kohati ikka üsna vigane“, nagu olen nii mõnegi akadeemilise tuttava suust kuulnud, kas siis selle täiustamine ei võiks igaühe südameasi olla?
Soome-ugri olemusliku tagasihoidlikkuse taustal saab Vikipeedia arendamisel komistuskiviks kindlasti ka liigne enesekriitilisus. Näiteks nooremad üliõpilased, kes on tegelikult näinud suurt vaeva lõputööde kallal, kipuvad arvama, et teema avalikuks tutvustamiseks jääb teadmistest siiski vajaka.
Sama mündi teine pool on nähtus, mida tuntakse inglise keeles kui knowledge overconfidence. See tähendab, et laia kõlapinda leidnud teemade puhul kipuvad oma teadmisi teemast hindama paremaks ja väljendama valjemini need isikud, kelle tegelik teadmistase on pigem madal.
Teadlasest vikipedisti elu teeb keeruliseks ka paradoks, et puuduvad mõõdikud, mille alusel saaks hinnata, millisest artiklist tunneb publik kõige rohkem puudust. Saame jälgida praeguste artiklite kasutamist, loendada puuduvaid ristviiteid (punased lingid), ent kõik need näitajad on piiratud sama infomulli seintega. Veebientsüklopeedia jätkusuutlik arendamine nõuab senisest märksa jõudsamat panustamiskultuuri, et ühtaegu saaks hinnata publiku huvi ja kujundada teaduspõhist teadmispagasit.
Lõpetan selle kirjutise ühe tuntud, väidetavalt Aafrika päritolu vanasõnaga: lapse kasvatamiseks on vaja kogu küla. Ehk on emakeelse entsüklopeedia kasvatamiseks vaja kogu Eestit?
Darja Lavõgina (1986) on Tartu ülikooli bioorgaanilise keemia kaasprofessor ja vikipedist alates 2022. aastast.
Artikkel ilmus ajakirja Horisont 6/2025 numbris.