Rūta Marcinkevičienė
LIETUVIŲ KALBOS KOLOKACIJOS
Monografija
Vytauto Didžiojo universitetas Kaunas, 2010
Monografij...
343 downloads
1148 Views
2MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Rūta Marcinkevičienė
LIETUVIŲ KALBOS KOLOKACIJOS
Monografija
Vytauto Didžiojo universitetas Kaunas, 2010
Monografija apsvarstyta ir rekomenduota publikuoti Vytauto Didžiojo universiteto Humanitarinių mokslų fakulteto Lietuvių kalbos katedros posėdyje 2010 10 12 (protololo Nr. 6-2) ir Humanitarinių mokslų fakulteto tarybos posėdyje 2010 11 15 (protokolo Nr. 7-5).
Recenzavo: prof. habil. dr. Aurelija Usonienė prof. habil. dr. Giedrius Subačius
ISBN 978-9955-12-656-0
© Rūta Marcinkevičienė, 2010 © Vytauto Didžiojo universitetas, 2010
TURINYS Pratarmė ...................................................................................................................5 1 dalis. TEORINIAI IR METODOLOGINIAI PAMATAI ........................ 9 1.1. TEKSTYNAI IR JŲ TAIKYMAS ..........................................................10 1.1.1. Tekstyno samprata ir vertė ...........................................................11 1.1.1.1. Tekstynų tipai ...................................................................12 1.1.1.2. Lietuvių kalbos tekstynai .................................................22 1.1.2. Tekstynų analizės priemonės ir produktai .................................26 1.1.2.1. Žodžių ir žodžių formų sąrašai.......................................29 1.1.2.2. Konkordansai ...................................................................32 1.1.2.3. Konkordanso analizė .......................................................34 1.2. TEKSTYNŲ LINGVISTIKOS ESMĖ IR PRASMĖ .......................... 52 1.2.1. Tekstynų lingvistikos statusas .....................................................52 1.2.2. Tekstynų lingvistikos ypatumai ...................................................53 1.2.3. Tekstynų lingvistika ir kitos kalbos teorijos ...............................56 1.2.4. Teorinės tekstynų lingvistikos nuostatos ....................................60 1.2.4.1. Kalbos fraziškumo principas ..........................................60 1.2.4.2. Išplėstinis reikšmės vienetas ...........................................62 1.2.4.3. Desemantizacija ................................................................64 1.2.4.4. Leksikos ir gramatikos vienovė ......................................66 1.3. KOLOKACIJOS SAMPRATA .............................................................. 70 1.3.1. Stabiliųjų žodžių junginių tyrinėjimų istorija ir aspektai .........70 1.3.1.1. Stabiliųjų žodžių junginių tyrimo istorija ....................71 1.3.1.2. Šiandienis požiūris į kolokaciją ......................................88 1.3.1.3. Kolokacijos ir metaforos..................................................92 1.3.1.3.1. Kognityvinės metaforos samprata .................92 1.3.1.3.2. Kolokacijų metaforos ......................................95 1.3.1.3.3. Atminties junglumo tyrimas ....................... 100 1.3.1.3.4. Atminties metaforos ..................................... 113 1.3.2. Kolokacijos ir frazeologija ......................................................... 116 1.3.2.1. Tradicinė frazeologijos samprata ................................ 117 1.3.2.2. Stabiliųjų žodžių junginių vardai ................................ 120 1.3.2.3. Frazeologijos centras ir paribiai .................................. 123 1.3.2.4. Kryžiažodžių frazeologija............................................. 125 1.3.2.4.1. Kultūros ir istorijos nulemti stabilūs žodžių junginiai ............................................ 127 1.3.2.4.2. Kalbos specifikos sąlygota frazeologija ...... 130
2 dalis. LIETUVIŲ KALBOS KOLOKACIJŲ ŽODYNAS ..................... 139 2.1. KOLOKACIJOS IR NATŪRALIOSIOS KALBOS APDOROJIMAS................................................................................... 140 2.1.1. Dažniausi kolokacijų išgavimo būdai ...................................... 144 2.1.1.1. Abipusės informacijos įvertis (Mutual Information score) ........................................... 147 2.1.1.2. T įvertis ........................................................................... 151 2.1.1.3. Dice įvertis ...................................................................... 153 2.1.1.4. Žodžių traukos tekste įvertis (gravity counts) ............ 155 2.2. LIETUVIŲ KALBOS DAIKTAVARDINIŲ FRAZIŲ ŽODYNO YPATUMAI....................................................... 161 2.2.1. Kolokacijų atkarpų transformavimas į frazes ......................... 163 2.2.2. Leksiniai-gramatiniai lietuvių kalbos kolokacijų modeliai ... 166 2.2.3. Leksinės-semantinės lietuvių kalbos kolokacijų ypatybės .... 174 2.2.3.1. Lietuvių kalbos kolokacijų metaforos ......................... 177 2.2.3.1.1. Struktūrinės metaforos ................................ 182 2.2.3.1.2. Ontologinės metaforos................................. 185 2.2.3.1.3. Erdvinės metaforos ....................................... 189 2.2.3.2. Kolokacijų frazeologija ................................................. 193 2.3. APIBENDINAMOSIOS PASTABOS ................................................ 197 Collocations of the Lithuanian Language ....................................................... 198 Literatūra ............................................................................................................. 199
PRATARMĖ Tekstynai ir tekstynų lingvistika (TL) įgyja vis didesnę reikšmę ir pritaikymą šiandienėje informacinėje visuomenėje, nes kalbos technologijos yra informacinių technologijų šerdis, o šios bus svarbiausios XXI a. pramonei. Be natūraliosios kalbos technologijų didžiuma informacijos liktų netvarkyta ir nesuprasta. Globaliai informacinei visuomenei reikia daugiakalbių technologijų, kad kalbų barjerai nekliudytų informacijos srautui. Kompiuterizuotos, informacinėms technologijoms pritaikytos kalbos tampa informacinės visuomenės preke, gal net įrankiu galingųjų rankose jiems žaidžiant išteklių globalizavimo, o kartu ir informacijos kontrolės žaidimus. Kalbos ekspertai mano, kad kalba turi specialią vietą tarp kitų komunikacinių sistemų, ji yra grynai žmogiška ir tik ji garantuoja visavertį žmonių bendravimą. Kitos specialios ženklų sistemos – piešiniai, grafikai, schemos, lentelės, galiausiai visos dirbtinės kalbos – yra antrinės, išvestinės iš natūraliosios kalbos, struktūriškai priklausomos nuo kalbos, nors ir neturi linijinio, laiku ir erdve besitęsiančio pavidalo kaip kalba. Žmonėms geriausia informaciją kurti, kaupti ir perteikti žmonių kalbos tekstu, kad ir koks sudėtingas, painus, daugiaplanis ir daugiaprasmis būtų informacijos perdavimo būdas. Mat kalba, tiek sakytinė, tiek rašytinė, evoliucionavo kartu su visuomene, todėl viskas joje kaip ir gamtoje yra reikalinga. Šiandieniam kompiuteriui suprantama tik sterili ir ganėtinai primityvi, be dviprasmybių, neaiškumų kalba, bet tokia ji neleis perduoti naujų idėjų, o gal net ir neleis joms atsirasti. Čia tiktų prisiminti garsiąją George Orwello utopiją 1984-ieji ir joje aprašytą kalbos (pa)prastinimo būdą, garantuojantį politinį lojalumą, bet visiškai atimantį galimybę mąstyti. Todėl informacinių technologijų kūrėjų tikslas turėtų būti kuo mažiau apriboti savo kalbą bendraujant su kompiuteriu. Iš čia plaukia vienas didžiausių TL iššūkių informacinėms technologijoms – priversti kompiuterį suprasti ir apdoroti natūralios žmonių kalbos tekstą. Kodėl mašininio vertimo sistemos neverčia paprasto teksto? Todėl, kad natūrali žmonių kalba sunkiai perprantama, į ją sunku įsiskverbti. Viskas daroma, kad tik būtų išvengta autentiško kasdienės kalbos teksto, prieš verčiant jis paprastinamas, naudojamos ribotos (sublanguages) ir
5
R ū t a M arc i n k e v i č i e n ė. L I E T U V I Ų K A L B O S K O LO K A C I J O S
valdomos (controlled languages) kalbos, nukreiptos į kompiuterį, o ne į žmogų. Bet ir tai nepadeda. Kompiuteriai nemoka elgtis su natūralios kalbos tekstu, vidine jo struktūra – tik su jį papildančiomis pažymomis. Tačiau yra pagrindo manyti, kad kompiuteris gali aprėpti kalbą, tik reikia deramai ją ištirti. Čia gali padėti TL, tiekdama patikimus kalbos aprašus – žodynus ir gramatikas bei naujus analizės metodus. Anot Johno Sinclairio, mašina gali suprasti kalbą ganėtinai aiškiai ir lanksčiai panaudoti šį savo supratimą daugeliui tikslų. Bet kokios pastangos šia linkme yra svarbios, nes atpildas tikrai didžiulis: tereikia įsivaizduoti galimybę bendrauti su kompiuteriu savo gimtąja kalba, ne per meniu ir/ar pagalbos funkcijas. Žmogaus ir mašinos bendravimas taip, kad būtų patogu žmogui, o ne kompiuteriui, jo gimtąja, natūralia, nė kiek neapribota kalba (human-oriented information services) ir laikomas didžiausiu informacinės visuomenės privalumu. Klaidinga manyti, kad kalbinės žinios, reikalingos kalbos technologijoms, jau yra. Visa daugiau nei 2000 metų istoriją turinti kalbotyra skirta žmogui, todėl kompiuteriui būtinas žinias reikia pradėti rinkti nuo nulio. Žinių apie kalbą galima įgyti iš kalbinių resursų – tekstynų, žodynų, leksinių duomenų bazių; tik taip galima gauti kitokio pobūdžio kalbos aprašų, geriau tinkančių mašinoms, o ne žmonėms. Tradicinė lingvistika čia nedaug ką gali pasiūlyti, o kelių dešimtmečių bandymai susieti ją su kompiuterio galimybėmis baigėsi nesėkme, nes modeliai buvo kuriami neįvertinus kalbos vartosenos faktų, empirinių duomenų. Tekstynų lingvistų manymu, natūraliosios kalbos apdorojimo modeliai tik tiek tinka programiniams įrankiams konstruoti, kiek atitinka vartoseną. Vienas pačių ryškiausių ir akivaizdžiausių kalbos vartosenos faktų – išmatuojamas ir statiškai įvertinamas kai kurių žodžių polinkis būti vartojamiems drauge ir sudaryti stabilius junginius, vadinamus kolokacijomis. Vartosenos tyrimai šiandien dar nėra tokie, kokių reikėtų kalbos technologijoms kurti, nes ir patys tekstynai, ir TL dar labai jauni. Bet turint galvoje informacinių technologijų raidos tempus, galima manyti, kad tekstynai per keletą metų visiškai pasikeis. Jie bus sudarinėjami automatiškai, o duomenys vartotojams bus pateikiami patikimais automatiniais įnagiais. Tekstyno dydis bet kuriuo tikslu jį tyrinėjant, taps didelė vertybė, nes išryškins dažnus vartosenos modelius. Didelių tekstynų tyrimo pasekmės gali būti nenuspėjamos. Jau dabar aišku, kad reikės
6
P R ATA R M Ė
naujų drąsių hipotezių paaiškinti kalbos struktūrai ir modeliams, išryškėjusiems tik iš tekstynų, taigi tradicinių lingvistų visai nepastebėtiems ir neaptartiems. Tad iš TL laukiama kalbos informacinių technologijų kūrimui būtinų revoliucinių idėjų. Ir tekstynų, ir kompiuterinė lingvistika yra tarpdalykinė veiklos sritis. Čia susiduria dviejų skirtingų mokslų atstovų – kalbininkų ir informatikų – požiūris į kalbą. Jų prieštaras labai vaizdžiai nusakė J. Sinclairis, įvardijęs informacinių technologijų kūrimą majonezo problema. Norint pagaminti majonezą, reikia, lėtai sukant kiaušinio trynį ir po truputį į jį lašinant aliejų, sumaišyti šiuos du sandus. Jei kiaušinis bus per šaltas, oras per drėgnas ar aliejus lašinamas per greitai, abu produktai nesusimaišys, ir viską reikės pradėti iš naujo. Majonezo metafora įvardijamos informacinių technologijų sudedamosios dalys – kalba ir informacija. Žmonių kalbos gynėjai, paprastai kalbininkai, mano, kad kalba yra kiaušinio trynys, o informacija – aliejus. Aliejus turi būti tinkamai įsuktas į trynį, t. y. išreikštas tekstu, kad atsirastų majonezas. Kadangi kompiuteris tėra pagalbinė priemonė, nereikia leisti jam diktuoti sąlygų, kaip informacija turi būti apdorojama ir laikoma, kokia turi būti kalba, kad jis ją suprastų. Kitaip mano informatikai: kalba, anot jų, tėra vienas informacijos tvarkymo būdas, beje, labai keblus, nelogiškas ir netvarkingas, o iš kompiuterinių pozicijų žiūrint, dar ir neefektyvus, dėl to bando pateikti kalbą papildomai struktūruotą pažymomis ar anotacijomis. Jie tai daro nepastebėdami įgimtos, vidinės kalbos struktūros, todėl apgaubia tekstą savu aiškinamuoju apvalkalu. Taigi jiems informacija yra kiaušinis, o kalba tik įsiterpia į jį. Suprantama, kad abu požiūriai negali būti suderinami, kitaip majonezo sandai atsiskirs – informatikoje kils sumaištis. Arba mes priimame skaitmeninės informacijos standartus, pagal kuriuos kalbai tenka tik nesvarbi vieta, ji užkišama į kamputį, arba mes, kalbininkai, metame iššūkį šiam modeliui ir parodome natūralios kalbos vartojimo privalumus, o svarbiausia – kad ji, nors ir ne be trūkumų, yra patikima priemonė informacijai kurti, saugoti ir perduoti. Bet tam reikia argumentų, ir ne tik jų, dar labiau reikia naujų metodų, kurie pranoktų metodus, atmetamiems kalbos žmogiškumą, taigi pačią jos esmę. Gyvename skaitmeninėje eroje, kur bet kas gali būti perteikta skaitmeniniu pavidalu, idealiu kompiuteriui apdoroti, nes gaunamos
7
R ū t a M arc i n k e v i č i e n ė. L I E T U V I Ų K A L B O S K O LO K A C I J O S
paprastos struktūros, be jokių neaiškumų ar dviprasmybių ir kitų galvos skausmų, kuriuos kalba kelia informatikams, mėginantiems kompiuterizuoti kalbą. Tad kyla pavojus, kad tie patys žmonės, kurie pateikia puikius informacijos perdavimo ir apdorojimo įrankius, tokius kaip tekstinis redaktorius, hipertekstas ir internetas, gali užimti mūsų, lingvistų, vietą ir kalbinius modelius pakeisti informaciniais. Tai paveiktų visą kompiuteriuose vartojamą kalbą: vertimą, informacijos gavimą, dokumentų klasifikavimą, leksikografiją ir net kalbos mokymą. Tokio pertvarkymo poveikis kalbai gali būti nenuspėjamas. J. Sinclairis mato tik dvi alternatyvas: arba mes, remdamiesi tekstynais, juose išryškėjusią vidinę kalbos struktūrą pateiksime žmonių kalbos technologams, arba mūsų paslaugų bus atsisakyta, tik nuo to niekam nebus geriau. Kalbininkai turėtų siekti sugrąžinti pasitikėjimą žmonių kalba kaip svarbiausia komunikacijos priemone ne tik tarp žmonių, bet ir tarp žmogaus ir kompiuterio. J. Sinclairis primena, kad viena svarbiausių žmogaus teisių – teisė į žmonių kalbą, net ir bendraujant su kompiuteriu, taigi kompiuterius reikia taikyti prie žmogaus, o ne atvirkščiai. Ir štai čia tekstynų lingvistika, derinama su kitų mokslų metodais, gali būti labai pravarti.
8
1dalis TEORINIAI IR METODOLOGINIAI PAMATAI
Paskutinieji XX a. dešimtmečiai pasižymėjo itin sparčia informacinių technologijų raida, padariusia perversmą moksle ir kasdieniame gyvenime. Neaplenkė ji ir daugiau nei du tūkstančius metų turinčio mokslo – kalbotyros. Ištobulėję kompiuteriai leido sukaupti didelius tekstų kiekius ir jų analizei taikyti naujus metodus. Palaipsniui kiekybė virto kokybe – ėmė rastis nauja paradigma, leidžianti visai kitaip pažvelgti į kalbą, laikomą viena būdingiausių žmogaus ypatybių, pačia žmogiškumo esme. Viena tos paradigmos dalių – tekstynai, iš jų gaunami išvestiniai dariniai kaip antai dažniniai žodžių sąrašai, atskirų žodžių konkordansai ir kolokacijos bei jų pagrindu atsiradusi nauja, tik kelių dešimčių metų senumo kalbotyros šaka – tekstynų lingvistika – ir yra šio darbo objektas.
9
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
1.1. TEKSTYNAI IR JŲ TAIKYMAS Tekstynu vadintinas toks tekstų rinkinys, ganėtinai didelis matuojant pagal šių dienų kompiuterinių technologijų galimybes ir sudarytas ne dėl kokio specialaus tyrimo, o nepriklausomai nuo jo panaudojimo tikslų. Tai baigtinis ar tęstinis elektroninių tekstų rinkinys, sudarytas taip, kad kuo geriau atspindėtų kalbą ar jos atmainą. Taigi dydis ir bendras pobūdis arba reprezentatyvumas, be savaime suprantamos šioms dienoms elektroninės formos, yra pagrindiniai tekstyno bruožai. Tačiau įsigilinus į tekstynų tipus, paaiškėja kur kas didesnė ir prieštaringesnė tekstyno požymių įvairovė, jų painiojimas su dideliais tekstų archyvais ar tekstinėmis duomenų bazėmis. Tad parankiausia būtų tekstyną apibūdinti klasifikuojant pagal tipus, skiriamus jų dydžio, tęstinumo, reprezentatyvumo, papildomo apdorojimo, t. y. kodavimo ir anotavimo, jį sudarančių tekstų pobūdžio bei vartojamų kalbų aspektu. Tyrimams buvo naudotas bendrojo pobūdžio lietuvių kalbos tekstynas, skirtas kuo įvairesnėms jo vartotojų reikmėms, t. y. Vytauto Didžiojo universiteto Dabartinės lietuvių kalbos tekstynas. Jis buvo sumanytas kaip „didelis, neanotuotas ir nekoduotas, į skaitytoją orientuotas, daugiausiai ištisų periodikos ir knygų tekstų, daugiau bendro pobūdžio nei specialus, didelės temų ir kitokios (leidinių pobūdžio, dažnumo, leidimo vietos, autorių lyties, amžiaus, kilmės) įvairovės autentiškos rašytinės lietuvių kalbos tekstynas“ (Marcinkevičienė 1997c: 77). Tyrimų metu tekstyno apimtis kito nuo 40 iki 60 milijonų žodžių, vėliau pasiekė 100 milijonų žodžių ribą. Programiniai įrankiai yra neatskiriama tekstyno dalis, todėl darbo su tekstynu ypatumai nulemti automatinės analizės rezultatų: kokius duomenis gauname panaudoję vieną ar kitą įrankį, kaip juos toliau panaudojame saviems tyrimo tikslams. Tačiau pirmiau nei dėl naudotinų įrankių ar jais gautų įvairių produktų – žodžių, žodžių formų sąrašų, konkordansų, kolokacijų – reikia apsispręsti dėl tekstyno naudojimo principo ir masto. Čia galimas dvejopas požiūris: tekstyne galima ieškoti pavyzdžių pačių įvairiausių kalbos vienetų distribucijai tirti tuomet, kai probleminiai analizės klausimai bei pirminės hipotezės kyla iš kitų
10
1. 1. T E K S T Y N A I I R J Ų TA I K Y M A S
nei tekstynų lingvistika kalbotyros ar kitokių mokslų sričių. Tuo atveju turime reikalą su tekstynais paremta (corpus-based approach) analize. Kadangi šiuo atveju tekstynu gali būti remiamasi fragmentiškai, iš jo renkami tik atskiri įdomūs ir vertingi pavyzdžiai, tai paprastai naudojamasi tekstyno konkordavimo programa, iš kurios gautas konkordansas ir teikia reikalingą informaciją. Kitas naudojimosi tekstynu būdas priklauso išimtinai TL ir yra vadinamas tekstyno inspiruota (corpus-driven approach) analize, kurios esmė – kelti tyrimo klausimus ir formuluoti hipotezes remiantis tekstyno medžiaga, ankstesne jo analize. Šiuo atveju tekstynas naudojamas išsamiai, pagal vadinamąjį nuodugniosios analizės principą (a principle of total accountability), kai būtina aptarti visas konkordanso eilutes, išrinkti visas kolokacijas, apibudinti visus rastus tiriamojo kalbos vieneto vartosenos pavyzdžius. Šio principo savo darbuose laikosi visi tekstynų lingvistai ir šio darbo autorė.
1.1.1. Tekstyno samprata ir vertė Anglosaksiškuose kraštuose dabar labai madinga kone viską, kas prieš keletą metų buvo laikoma duomenimis, vadinti tekstynu (corpus). Bet koks, kad ir pats mažiausias, tekstų, turinčių elektroninę formą, rinkinys, yra tekstynas. Iš tiesų tekstynu, anot J. Sinclairio vadintinas tik „...toks tekstų rinkinys, kuris yra pakankamai didelis, matuojant pagal šių dienų kompiuterinių technologijų galimybes, ir sudarytas ne dėl kokio specialaus tyrimo, bet nepriklausomai nuo jo panaudojimo tikslų1“ (Sinclair 1999a: 33). Tony McEnery nurodo net tris šio žodžio reikšmes. Pati bendriausia reikšmė yra ‘bet koks tekstų rinkinys’, dažniausia – ‘elektroninių tekstų rinkinys’, o griežčiausia, terminologiškiausia – ‘baigtinis elektroninių tekstų rinkinys, sudarytas taip, kad kuo geriau atspindėtų kalbą ar jos atmainą’ (McEnery et al. 1996: 177). Taigi dydis ir bendras pobūdis arba reprezentatyvumas be savaime suprantamos šioms dienoms elektroninės formos nurodomi kaip pagrindiniai tekstyno bruožai. Tačiau įsigilinus į tekstynų tipus paaiškėja kur kas didesnė ir prieštaringesnė tekstyno požymių įvairovė, jų painiojimas su dideliais tekstų archyvais ar tekstinėmis duomenų bazėmis (Kennedy 1998: 3). Tad parankiausia būtų tekstyną apibūdinti lyginant jį su tekstu bei klasifikuojant pagal tipus.
11
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
Kas gi sieja tekstyną su tekstu ir skiria jį nuo teksto? Bendra jiems tik tai, kad tekstynas sudarytas iš tekstų. Tekstyno ir ilgo teksto apimtys gali sutapti, tad svarbu ne dydis. Svarbu skirtinga teksto ir tekstyno struktūra. Tekstą prasminga analizuoti visą ištisai, jis turi struktūrą: pradžią, vidurį ir pabaigą, yra daugiau ar mažiau rišlus, vientisas. Tekstynas kaip tekstų rinkinys jau reikalauja visai kitokios tyrimo metodikos, tekstyno niekas ištisai neskaito ir taip nuodugniai kaip teksto netyrinėja. Tekstynas neturi struktūros, tik sandarą, jo pradžia ar pabaiga yra dirbtinės, nesvarbu, kur kokį tekstą dėsi. Tekstyno esmė ta, kad jo neverta ir neįmanoma tirti tiesiogiai, skaityti taip, kaip teksto – tik su programinėmis priemonėmis, įvairiais įrankiais. Taigi esminė teksto ir tekstyno skirtybė – ne sandara, ne kalbų kiekis, net ne dydis ar reprezentatyvumas, o su kompiliacine tekstyno prigimtimi susijusi jo tyrimo metodologija (Sinclair 2000a, Tognini-Bonelli 2000). Ja ir derėtų papildyti apibrėžimą tekstyno, suprantamo kaip didelio reprezentatyvių elektroninių tekstų rinkinio, naudojamo su specialia programine įranga. Apžvelgti konkrečius tekstynus šiandien tikrai sunku, jų yra daug ir įvairių. Tekstynų lingvistikos vadovėliuose jie pateikiami jau ištisomis kartomis (Kennedy 1998: 23–57). Komerciniai tekstynai, jų analizės įrankiai bei naujausi internetiniai kalbos ištekliai (tekstynai, archyvai, leksikonai, duomenų bazės ir programinė įranga) išvardyti ir anotuoti Douglaso Biberio ir kt. (Biber et al. 1998: 281–287). Be abejo, tobulėjant technologijoms tekstynai randasi ir keičiasi greitai ir smarkiai, todėl kur kas prasmingiau tekstynus aptarti ne individualiai, o pagal jų tipus.
1.1.1.1. Tekstynų tipai Tekstynų šiandien esama daug ir įvairių. Kad ir kokie įvairūs jie būtų, visų pirma skirtini į dvi grupes pagal tai, ar konkreti jų rūšis laikoma tinkama, ar ne. Kitaip sakant, yra tokių tekstynų tipų, dėl kurių tinkamumo ar netinkamumo nesibaigia diskusijos. Karštai ginčijamasi dėl tekstyno dydžio, būtinybės nuolat jį papildyti bei anotuoti, ypač dėl reprezentatyvumo, svarstoma, kurie tekstynai geresni: maži ar dideli, baigtiniai ar tęstiniai, koduoti, anotuoti ar švarūs, gryni, reprezentatyvūs ar oportunistiniai. Dėl kitų tekstynų tipų diskusijų nekyla – nors ir labai besiskiriantys savo pobūdžiu, reikalingi ir vieni, ir kiti, nelygu
12
1. 1. T E K S T Y N A I I R J Ų TA I K Y M A S
darbo tikslai ir objektas. Tokie yra bendrojo pobūdžio ir specialieji, sakytinės ir rašytinės kalbos, vienakalbiai ir paralelūs bei palyginamieji, senųjų raštų ir dabartinės kalbos tekstynai. Čia jie ir bus aptarti problemiškumo tvarka. Pirmieji tekstynai, atsiradę XX a. septintajame dešimtmetyje, iš šiandienos pozicijų žiūrint buvo labai nedideli – vos vieno milijono žodžių apimties. Šiandien kai kurie tekstynai jau artėja prie pusės bilijono ribos, ir čia ne pabaiga, nes, atsiradus internetui, tekstynų augimo tempai pasidarė kur kas spartesni. Visai nesunku atskiriems individams su gana galingu personaliniu kompiuteriu sukaupti įspūdingą tekstų kiekį. Nesunku, bet ar verta? Taigi kokie tekstynai geresni – maži ar dideli. Kai kurie tekstynai yra maži iš prigimties, pavyzdžiui, senųjų raštų, taip pat mirusių kalbų rašto paminklų, atskirų autorių – V. Šekspyro, A. Puškino, ar net atskirų kūrinių, sakykim, Šventojo Rašto. Jų nepadidinsi, jie ir liks ribotos apimties. Bet kai kalbama, kad ir kitiems, šiandieninės kalbos tekstynams, pakanka apimties, kad juose yra visa reikiama informacija, – tai jau negerai, mano J. Sinclairis. Anot jo, mažumas – ne dorybė, o ribotumas, nes maži tekstynai nėra tokie patys kaip ir dideli, tik kitos apimties (Sinclair 2000a). Tekstyno tekstų kiekis lemia ne tik jo kiekybę, bet ir kokybę. Vieno milijono žodžių apimties tekstyne nuo 40 iki 50 % žodžių formų pasirodo tik vieną kartą, o polisemiškų žodžių yra pavartota tik pusė reikšmių. Bet kuriam kalbos vienetui aprašyti reikia mažiausiai dviejų jo pavartojimo atvejų, tad analizei lieka tik pusė tekstyno. O kiek kartų žodis turi būti pavartotas, kad išryškėtų kolokaciniai jo modeliai, reikšmių vartosenos ypatumai, morfologinės charakteristikos? Todėl maži ar sąlyginai maži tekstynai naudojami dažniems, paprastai gramatiniams vienetams tirti. Leksikai tirti, juolab leksikografijai, reikia didelių tekstynų (Biber et al. 1998: 22–23). Jei kam yra tekę tirti tą patį leksinį vienetą dideliame ir žymiai mažesniame tekstyne, tas žino dar vieną didelio tekstyno privalumą: jame išryškėja dėsningumų, kurių niekaip nepasimato mažame. Anglų kalbos daiktavardžio mind analizė parodė, kad mažame tekstyne aptinkami kone visi svarbiausi žodžio vartosenos modeliai, tačiau jame matyti tik įvairovė, pavieniai ar bent negausūs jų pasireiškimo būdai. Atskirų modelių vartosenos dažnumas, taigi ir bendrosios tendencijos, išryškėja tik iš didelio tekstyno (Marcinkevičienė 2000a).
13
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
Dideli tekstynai turi ne tik privalumų, bet ir trūkumų. Jie yra priklausomi nuo kompiuterių galingumo ir programų kokybės. O nuo tekstyno dydžio priklauso ir tekstų apdorojimo laikas, ir kiti su technologijomis susiję dalykai (plačiau apie darbo su tekstynais keblumus žr. Faccinetti 1998). Net palyginti greitai ir sėkmingai gavus iš didelio tekstyno reikiamą informaciją būna labai sunku susidoroti su sunkiai aprėpiama jos apimtimi. Graeme Kennedy rašo, jog 1000 konkordanso eilučių yra riba, kurios negali peržengti leksikografas, jei nori aprėpti, atsiminti ir sutvarkyti vienos leksemos vartosenos atvejus. Daroma išvada, kad nėra prasmės didinti tekstyno, jei darosi neįmanoma dirbti su jo duomenimis (Kennedy 1998: 67–68). G. Kennedy nuomonė visai priešinga J. Sinclairio – šiam net 10–20 milijonų žodžių apimties tekstų rinkinys gali būti naudingas tik kaip mažas bendrojo tipo tekstynas, bet tikrai nepakankamas kalbos visumai aprašyti (Sinclair 2000a). G. Kennedy savo ruožtu teigia, kad „milžiniškas tekstynas nebūtinai atspindi ir reprezentuoja kalbą ar kurią nors jos atmainą geriau nei mažas tekstynas. Šioje tekstynų raidos pakopoje mes tiesiog nežinome, kokio dydžio turi būti tekstynas, kad tenkintų bendro pobūdžio ar specialius tikslus. Todėl užuot akcentavę tekstyno dydį, tekstynų sudarytojai ir tyrėjai verčiau atsižvelgtų į tekstyno kokybę, kuri yra lygiai taip pat svarbi.“. (Kennedy 1998: 67–68). Neneigiant tekstyno kokybės, t. y. jo tekstų įvairovės ir reprezentatyvumo svarbos, galima pasakyti, kad iš dviejų gana kruopščiai sudarytų tekstynų didesnis visada bus geresnis, nes tik jis parodys tipišką net ir rečiau vartojamų kalbos vienetų vartoseną. O susitvarkyti su dideliais turimų duomenų kiekiais gali padėti geras jų statistinės atrankos principas ar speciali programinė įranga, pavyzdžiui, leidžianti leksikografui manipuliuoti konkordanso eilutėmis. Žodyno rengimo automatizavimas, prasidėjęs nuo elektroninio tekstyno, turėtų būti tęsiamas per visus darbo etapus: duomenų atranką, jų analizę bei tos analizės rezultatus, saugomus tam skirtose duomenų bazėse. Kita išeitis – turėti kelių dydžių ir kelių tipų tekstynus: mažiausią apie 1 milijono žodžių, gramatiškai anotuotą, skirtą gramatinei ir kitokiai (pavyzdžiui, dažnai vartojamų leksemų) analizei, kuriai nereikia daug leksinių vienetų, jis gali būti ir ne ištisų tekstų, bet imčių. Didesnis, apie 10 milijonų žodžių apimties tekstynas, minimaliai koduotas, preciziškai
14
1. 1. T E K S T Y N A I I R J Ų TA I K Y M A S
atrinktais tekstais, galėtų tikti daugialypei analizei ir kalbos vienetų paieškai, kuriai ne taip svarbu bendras kalbos vaizdas, tik atskirų jos vienetų vartosenos ypatumai. Toliau – labai didelis, apie 100 milijonų ir daugiau žodžių tekstynas, vartojamas tuomet, kai reikia patikimos statistikos, kolokacinių ir gramatinių vartosenos modelių, išryškėjančių tik iš didelio pavartojimo kiekio, bei retų leksinių vienetų. Galiausiai dar galima turėti netvarkytų tekstų archyvą, iš kurio pagal poreikius į visus kitus tekstynus keliami jau pagal bendrus principus sutvarkyti tekstai. Galima tik sutikti su G. Kennedy, kad tekstyno dydį būtina derinti su jo šaltinių įvairove, o šiaip tekstyno dydis turi būti adekvatus naudojimosi juo tikslui (Kennedy 1998: 68). Su tekstyno dydžiu susijęs jo tęstinumas, dar kitaip vadinamas dinamiškumu. Pagal šį požymį skiriami baigtiniai ir tęstiniai ar statiniai ir dinaminiai tekstynai (Kennedy’s dynimic vs. Sinclair’s monitor corpora). Baigtiniai ar statiniai tekstynai kaip momentinės fotografijos parodo kalbos vaizdą tam tikru metu. Jie gali būti pravartūs lyginami su panašiais tik kitu laiku ar kitai kalbai, dialektui, kalbos atmainai sukonstruotais tekstynais. Statiški gali būti tiek maži, tiek dideli tekstynai. Tęstiniai, nuolat slenkantys ir besikeičiantys tekstynai taip pat gali būti įvairaus dydžio, nors paprastai esti dideli. Juose įtaisyti filtrai leidžia iš didelio naujų tekstų kiekio atsirinkti tik naujus kalbos faktus. Tęstiniai tekstynai paprastai būna ištisų tekstų, o ne tekstinių imčių, dėl to dažnai nėra subalansuoti. Anot J. Sinclairio, šių tekstynų dydis atstoja imčių tekstyno subalansuotumą kaip svarbiausią tekstyno sandaros principą, didelis tekstų kiekis savaime sudaro sąlygas didesnei kalbos vienetų vartojimo įvairovei (Sinclair 1991: 61). Toks tekstynų sudarymo būdas per brangus individams ar akademinėms institucijoms, tęstinius tekstynus gali rengti tik turtingos firmos ar dideli konsorciumai. Tęstiniai megabaitinės apimties tekstynai ypač vertingi leksikografams ir kalbos raidos tyrinėtojams. Nuo pat tekstynų atsiradimo buvo siekima rengti juos subalansuotus, sudarytus iš įvairių šaltinių pagal aiškius atrankos principus, kad tekstyne lyg veidrodyje atsispindėtų kalba ar mažesnė jos dalis (Atkins et al. 1992, Sinclair 1991: 13–20, McEnery et al. 1996: 21–24). Tik vėliau, atsiradus dideliems kompiuterinių tekstų kiekiams paplito tokie tekstynai, į kuriuos buvo dedami visi gauti, dėl autorių teisių ar kokių kitų priežasčių lengviau prieinami tekstai. Taip atsirado „oportunistinių“ ir
15
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
balansuotų reprezentatyvių tekstynų priešprieša, kurios pageidautinas narys yra reprezentatyvus tekstynas. Teorinių pasvarstymų apie tekstynų reprezentatyvumą esama įvairių (Biber 1993, Čermàk 1995, Kennedy 1998: 62–66 ir daugelio kitų). Šalia tekstyno šaltinių įvairovės ir tekstų balanso jis minimas todėl, kad balansas pasiekiamas ne lygiomis dalimis iš įvairių šaltinių imant tekstus, pavyzdžiui, sakytinius ir rašytinius, bet nustatant jų proporcijas pagal esminius kriterijus. O tų kriterijų taip pat esama pačių įvairiausių. Della Summers, pateikdama įvairių atrankos principų ir kriterijų apžvalgą, nurodo tokius: elitiškumas, kai pagal literatūrinius ar akademinius kriterijus atrenkami vertingiausi ir įtakingiausi tekstai, skaitomumas, dėl kurio tekstynuose dominuoja publicistika ir bestseleriai, demografiniai rodikliai, pagal kuriuos siekiama kuo didesnės demografinės tekstų autorių įvairovės, prieinamumas – galimybė lengvai gauti tekstus, įvairios lingvistinės specifikacijos, tokios kaip tekstų tipai, žanrai, stiliai ir pan. Čia priklauso ir subjektyvūs tekstyno rengėjų sprendimai apie tekstų tipiškumą, atsitiktinės atrankos principas, o galiausiai visų šių kriterijų derinys, paprastai vadinamas pragmatiniu sprendimu (Summers 1991, cituota iš Kennedy 1996: 63–64). Kalbant apie reprezentatyvumą visų pirma kyla klausimas, ką tekstynas turi atspindėti. Labai bendras ir abstraktus pasakymas, kad jis turi atspindėti kalbą ar jos įvairovę, yra visai neinformatyvus. Kalba yra tokia sudėtinga ir daugialypė, sudaryta iš tokios didelės atmainų įvairovės, kad, norint ją atspindėti, reikia kalbėti konkrečiau. Vienas būdų tai padaryti – apimti visas keturias kalbos vartojimo sritis: aktyviąją, t. y. jos produkavimą – kalbėjimą ir rašymą, ir pasyviąją – klausymą ir skaitymą. Be to, kalba dar skirasi pagal bet kurios iš nurodytųjų sričių vartotojų kiekį. Šis rodiklis taip pat yra svarbus, nes tekstyne turėtų būti kuo platesniu mastu vartojama kalba, idealiu atveju ne vieno rašytojo ar kalbėtojo, skirta vienam skaitytojui ar klausytojui, bet daugelio rašytojų daugeliui skaitytojų skirti tekstai. Atsižvelgdamas į kalbos siuntėjų ir priėmėjų kiekybinį santykį Františekas Čermàkas siūlo skirti aštuonias kalbos vartojimo galimybes, kai, žvelgiant iš aktyvios kalbos vartosenos pozicijų a) daugelis rašytojų rašo daugeliui skaitytojų, b) daugelis rašytojų rašo keletui skaitytojų, c) keli rašytojai rašo daugeliui skaitytojų, d) keli rašytojai rašo keliems
16
1. 1. T E K S T Y N A I I R J Ų TA I K Y M A S
skaitytojams. Žvelgiant iš pasyvios kalbos vartosenos pozicijų taip pat galima nurodyti keturias galimybes, kai e) daug skaitytojų skaito tekstus, parašytus daugelio rašytojų, f) daug skaitytojų skaito tekstus, parašytus keleto rašytojų, g) mažai skaitytojų skaito tekstus, parašytus daugelio arba h) kelių rašytojų (Čermàk 1997: 192). Taigi esminis kriterijus, F. Čermàko nuomone, yra paremtas aktyviąja ir pasyviąja kalbos vartosena. Atitinkamomis jų proporcijomis remiantis ir sudaryti danų ir čekų kalbų tekstynai. Čia būtina pridurti, kad nors teorinėje literatūroje ir nurodama daug tekstų atrankos kriterijų bei tekstyno sudarymo principų, tačiau praktikoje daugelis reprezentatyviais laikomų tekstynų iš tiesų nėra sudaryti pagal aiškius reprezentatyvumo kriterijus. Tekstynų aprašuose pateikiamos tik įvairių tekstų rūšių proporcijos, o ne jas lėmę atrankos principai (ten pat). Išimtis čia yra čekų kalbos tekstynas, sudarytas tik pagal pasyviosios kalbos vartosenos, t. y. skaitomumo ir klausomumo principus. Realiai šiandieniai tekstynai labiau skiriasi ne pagal kalbos produkavimą ar pasyvų vartojimą, bet pagal kitą kriterijų: sakytinės – rašytinės jos dalių santykį. Pirmieji tekstynai buvo išimtinai rašytinės kalbos, jie dominuoja ir iki šiol, nes yra žymiai pigiau parengiami. Tačiau savaime suprantama, kad individas daugiau kalba nei rašo, antra vertus, parašytą tekstą perskaito kur kas daugiau žmonių nei išgirsta kalbą. Tad niekas gerai nė nežino, kokiu santykiu derėtų tekstyne pateikti sakytinę ir rašytinę kalbos atmainas, o ką jau sakyti apie smulkesnius šių dviejų komponentus. Teisi buvo G. Kennedy sakydama, kad tekstyno reprezentatyvumo klausimas yra sunkiai išsprendžiamas, kadangi reprezentatyvumas yra nuomonės reikalas, jo galima laikytis tik iš dalies (Kennedy 1998: 62). Norint nustatyti realią kalbos vartoseną, kuri, beje, dėl technologijų pažangos labai smarkiai kinta, būtini sociologiniai tyrimai. D. Biberis siūlo remtis teorija, pagal kurią būtų galima nustatyti įtraukiamų tekstų kiekį, jų atranką, imčių dydį, be to, ir tą žmonių sluoksnį, kurio kalbą norima atspindėti tuo tekstynu, taigi remtis socialiniuose moksluose naudojamais reprezentavimo metodais (Biber 1993). Jais nesiremiant tegalima tenkintis minimaliais tekstų atrankos kriterijais, kuriuos rašytinės kalbos atveju dar 1991 m. nurodė J. Sinclairis. Jo siūlymu, minimalūs tekstų atrankos kriterijai turėtų apimti bent jau grožinę – negrožinę literatūrą, kitu aspektu – knygas, žurnalus ar laikraščius, formalius ir ne tik
17
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
formalius tekstus; be to, pageidautina kuo didesnė autorių įvairovė pagal amžių, lytį ir kilmę (Sinclair 1991: 20). Tekstynų sudarymo praktika rodo, kad oportunistiniai ir reprezentatyvūs tekstynai ne tik neprieštarauja vieni kitiems, bet yra susiję kaip du skirtingi tekstyno sudarymo etapai. G. Kennedy teigia, kad yra trys svarbiausi tekstyno rengimo etapai: sandaros numatymas, tekstų gavimas ir jų kodavimas ar anotavimas, tačiau kur kas dažniau tekstyno rengimas prasideda nuo antrojo etapo, taigi nuo oportunistinio tekstų archyvo kūrimo, iš kurio pagal tam tikras proporcijas vėliau atrenkami tekstai (Kennedy 1998: 70, taip pat žr. Čermàk 1997: 189). Kaip jau minėta, tekstyno reprezentatyvumą gali nulemti ir jo dydis. Kokio dydžio turi būti tekstynas, kad be specialios atrankos, būdamas oportunistinis jis būtų ir reprezentatyvus? Be abejo, didelis, nes net ir 30 milijonų žodžių apimties tekstynas yra mažas, palyginti su tuo tekstų kiekiu, iš kurių jis yra atrinktas. Tekstyno reprezentatyvumas yra sunkiau pasiekiamas nei patikrinamas. Norint patikrinti tekstyno reprezentatyvumą, reikia su juo padirbėti, o ne projektuoti apimtis spekuliatyviai, todėl D. Biberis siūlo sudaryti bandomąjį tekstynėlį pagal pasirinktas proporcijas, o paskui žiūrėti, ar jos atitinka norimus tikslus (Biber 1993). Kitą būdą patikrinti ne tiek tekstyno reprezentatyvumą, kiek jo įvairovę nurodė G. Kennedy. Tai gerai žinomas teksto ar tekstyno žodžių įvairovę rodantis santykis tarp visų ir skirtingų žodžių (type-token ratio) (Kennedy 1998: 66–70). Galų gale, anot Jameso Fillmoro, viskas vis vien atsiremia į intuiciją, nes būtent ja matuojamas tekstyno reprezentatyvumas – jei aš žinau kokį dalyką egzistuojant kalboje, tai jis turi atsispindėti ir tekstyne (Fillmore 1992: 38). Jei ne viską, kas rūpi, randi testyne, vadinasi, jį reikia didinti, kad ir koks reprezentatyvus jis būtų. Paskutinis kriterijus – daug diskusijų keliantys tekstynų tipai yra anotuoti bei koduoti ir neanotuoti tekstynai. Žinia, tekstynas tyrinėjamas netiesiogiai, su programiniais įrankiais. Esama kelių rūšių netiesioginio priėjimo prie teksto ir kartu kelių rūšių jo apdorojimo programų. Vienos jų nekeičia teksto, tik pateikia tekstyno analizės rezultatus: įvairią statistiką, konkordansus ir pan. Kitoms priklauso įvairios pažymos ir anotacijos, pridedamos prie teksto jo formatavimo ar analizės labui. Teksto žymėjimas, arba kodavimas, atsirado tekstynų gyvavimo
18
1. 1. T E K S T Y N A I I R J Ų TA I K Y M A S
pradžioje dėl to, kad senieji kompiuteriai nesugebėjo apdoroti teksto kaip teksto, bet mokėjo atpažinti pažymas. Taip formatavimo pažymų sistema (mark-up languages) padėjo perkelti tekstus iš vienos mašinos į kitą. Palaipsniui ji apėmė vis daugiau ir įvairesnių kalbos aspektų, netgi tekstų turinys buvo įspraustas į griežtus pažymų rėmus. Dabartinės technologijos leidžia apdoroti tekstus jau be pažymų sistemos. Bet senoji praktika išliko. Šiandienė formatavimo pažymų sistema apima formaliuosius teksto struktūros elementus: nuorodas apie rašytinio teksto citatas, sąrašus, vardo raidžių ar kitokias santrumpas, akronimus, knygų įžangas ir priedus, skyrius, atskirų teksto dalių ir kitokius pavadinimus, tikrinius vardus. Sakytinės kalbos atveju galima žymėti, t. y. koduoti, pokalbio eiliškumą, pertraukinėjimus, kalbėjimą vienu metu, tarmines formas, pauzes, negarsią, beveik negirdimą kalbą (plačiau apie tai žr. Kennedy 1998: 84) Kaip matyti iš šio neilgo išvardijimo, teksto kodavimas labiau susijęs su struktūriniais elementais, tačiau apima ir interpretacijos atvejus, kai pažymos vietą ir pobūdį lemia subjektyvi tyrėjo nuomonė. Dar daugiau interpretacijos esama gramatinėse anotacijose, nes paprastai jos remiasi tradicine, daugeliu atveju subjektyvia nuomone ir susitarimu paremta gramatika (consensus grammar). Gavęs gramatiškai anotuotą tekstą kompiuteris netikrina gramatinių kategorijų, bet priima jas tokias, kokios jos yra, taigi ir analizės rezultatai daugeliu atvejų yra iš anksto nulemti. Paradoksalu tai, kad struktūrinė tekstyno analizė aprėpia iki tekstynų buvusios lingvistikos projekciją į tekstyno duomenis. Anot J. Sinclairio, nė viena iš tos lingvistikos prielaidų ir aksiomų negalima pasitikėti, nes turimos analizės priemonės ir metodai labai ribojo tradicinę lingvistiką (Sinclair 2000a). Tekstyno anotavimas yra netikęs dėl to, kad kompiuteris dirba su pažymomis ir ignoruoja pačią kalbą, jei tekstas yra žymėtas. Taigi jei žymime tekstyną, vėliau tiriame savąsias pažymas, o ne pačią kalbą. Ten, kur tinka, pažymos gali padėti analizei, bet kur kas dažniau – jai pakenkti. Be to, pažymos pažeidžia teksto vientisumą, jos yra žmogaus intervencija į tekstą. Pažymos sudaromos pagal tam tikrus analitinius modelius, o šie savo ruožtu yra pavaldūs atskiroms teorijoms, tik per jas žvelgiama į tekstyno kalbą; viskas, kas nesužymėta, yra prarandama, nepastebima. Taip autorius apsaugomas nuo netikėtumų, jis nemato nieko, ko nenorėjo matyti.
19
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
Teorijos, kuriomis remiasi įvairūs žymėjimai, yra netobulos, be to, jos nukreipia mūsų dėmesį viena linkme ir riboja mūsų mąstymą. Dar viena anotacijų yda – tekstas perkraunamas pažymų, jį sunkiau perdirbti, nes apimtis patrigubėja ar padidėja dar daugiau kartų. Visus šiuos ir panašius argumentus prieš tekstynų anotavimą išsako lingvistai, o ne informatikai, be to, tie lingvistai, kurie naudoja tekstynus ne tiek iš senų teorijų kylančioms hipotezėms tikrinti, bet naujoms hipotezėms, išryškėjančioms iš darbo su dideliais tekstų masyvais, kurti. Tekstynų inspiruota lingvistika nesiremia anotuotais tekstais, propaguoja gryno teksto politiką ir programinius instrumentus, kurie dirba su grynu tekstu, o ne su jo anotacijomis, nes tik iš tokio teksto išryškėja nauji modeliai, galėję pražūti pažymomis užterštame tekste (Sinclair 1991: 21). Be abejo, anotacijos labai palengvina paiešką ir bet kokią lingvistinę tekstyno analizę, jei tik nėra klaidinančios. Iš tų tekstynų tipų, dėl kurių tikslingumo nediskutuojama, visų pirma minėtini bendrieji bei specialūs tekstynai. Bendrieji skirti ne kokiai vieno tipo, o daugialypei analizei, juos gana sunku parengti, juoba padaryti subalansuotus ir reprezentatyvius, nes bendrojo tekstyno adresatas yra visai neaiškus. Specialieji tekstynai šiuo atveju paprastesni, nes kuo aiškesnis tikslas, kuriam reikia tekstyno, tuo lengviau numatyti jo sandarą. Specialieji tekstynai skiriasi pagal du požymius: pagal tikslus, kam tekstynas skirtas, ir pagal tekstyne esančių tekstų pobūdį. Iš pirmosios grupės geriausiai žinomi kalbos mokymo tekstynai, iš antrosios – mokinių (learner’s corpus) ir vaikų kalbos tekstynai. Pastarieji sudaryti arba iš transkribuotų vaikų kalbos įrašų, taigi iš esmės priklauso sakytinių tekstynų grupei, arba iš studentų ir moksleivių rašinių. Jie skirti psicholingvistinėms bei edukologinėms kalbos išmokimo studijoms, o mokantis užsienio kalbos dar gali būti vertingi ir gimtosios bei užsienio kalbų interferencijai tirti. Švietėjiški, arba kalbos mokymui naudojami tekstynai, yra autentiškų tekstų rinkiniai, pagal poreikius ir mokymo programą atrenkami iš įvairių šaltinių. Juos gali sudarinėti ir kalbos mokytojai, ir studentai, be to, jie gali būti papildyti elektroniniais žodynais, žinynais, pratimų rinkiniais ir specialia programine įranga, leidžiančia dirbti su mokytoju ir savarankiškai (Meyer et al. 2000). Pagal tekstyne esančių tekstų pobūdį gali būti pačių įvairiausių teminių ar žanrinių tekstynų, kurie gali būti autonomiški ar įeiti į didesnį
20
1. 1. T E K S T Y N A I I R J Ų TA I K Y M A S
bendrojo pobūdžio tekstyną. Kadangi didžiuma tekstynų iki šiol yra rašytinės kalbos, tai sakytinės kalbos tekstynus ar sudedamąsias sakytinės kalbos dalis rašytinės kalbos tekstynuose su tam tikromis išlygomis būtų galima priskirti specialiesiems tekstynams. Tolydžio populiarėjantys sakytinės kalbos tekstynai nuo rašytinės kalbos tekstynų skiriasi ne tik užrašymo forma, transkribcija bei specialiomis pažymomis, bet ir žanrais, šnekos atrankos principais ir pan. Daugelis jų be grafinio vaizdo dar turi ir pirminį garsinį pavidalą, idealiu atveju suderintą su raštu. Prie specialiųjų tekstynų galėtų būti priskirti ir senųjų raštų, arba istoriniai, tekstynai, sudarantys ryškią opoziciją dominuojantiems dabartinės kalbos tekstynams. Didžiausia jų dorybė yra ta, kad mažai kam buvę prieinami seniai rašyti tekstai, įgavę elektroninį pavidalą, tarsi atgyja naujai vartosenai. Didelę atskirą tekstynų grupę sudaro kelių kalbų tekstynai, apimantys kelias kalbas nuo dviejų iki neriboto kiekio. Paralelius tekstynus sudaro originalo ir vertimo tekstai, sulygiuoti papastraipiui ar net pasakiniui. Paralelinimo darbą šiandien atlieka gausios, gana efektyvios, įvairiais principais sudarytos automatinio paralelinimo programos, kurių sulygiuotus tekstus žmogui tereikia tik šiek tiek pakoreguoti (Oakes et al. 2000, Simard et al. 2000, McEnery et al. 2000). Paralelūs tekstynai yra nepakeičiama priemonė kalboms mokyti (Barlow 2000, Peters 2000), vertimo ekvivalentams gauti (Danielsson et al. 2000, Pearson 2000) bei kalboms lyginti (Johansson et al. 2000, Schmied et al. 2000). Jie sudaro pavyzdžiais pagrįstų mašininio vertimo sistemų pagrindą, yra vartojami įvairiuose vertėjams skirtuose programiniuose paketuose kaip šaltinis jau anksčiau verstoms teksto atkarpoms gauti. Esama ir kitokio tipo keliakalbių tekstynų, sudarytų ne iš originalo ir vertimo tekstų, o iš originalių dviejų ar daugiau kalbų tekstų, į tekstyną sudėtų pagal tuos pačius atrankos kriterijus ir tekstyno komponavimo principus, idealiu atveju – ir pagal panašų turinį, bendras abiem ar kelioms kalboms temas. Tai – palyginamieji tekstynai, iš pradžių naudoti dažniausiai kontrastyvinės lingvistikos tikslams, o dabar taikomi ir vertimo ekvivalentams rinkti, terminų ar kitų leksinių vienetų vartosenai tirti, kultūrai, atsispindinčiai kalboje, tyrinėti ir dar daugeliui kitų tikslų. Palyginamųjų ar paralelių tekstynų kūrimas buvo ne vieno tarptautinio projekto tikslas.
21
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
1.1.1.2. Lietuvių kalbos tekstynai Lietuvių kalbos tekstynų radimosi pradžia derėtų laikyti L. Grumadienės ir V. Žilinskienės parengtą 1 200 000 žodžių dabartinės šnekamosios lietuvių kalbos tekstyną, imčių pagrindu sudarytą iš XX a. pabaigos viešai paskelbtų keturių pagrindinių stilių tekstų (Grumadienė ir kt. 1997 v-viii). Tekstynas buvo lemuotas, o jo pagrindu išleisti keli žodynai, iš kurių svarbiausi – Atgalinis dabartinės lietuvių kalbos žodynas ir Dažninis dabartinės rašomosios lietuvių kalbos žodynas. Pats tekstynas viešam naudojimui neprieinamas, todėl negalima komentuoti kitų nei minėtame šaltinyje nurodytų jo savybių. Leksikografijos tikslu kompiuterizuojami senieji raštai (Ambrazas ir kt. 1998) galėtų būti laikomi istoriniu lietuvių kalbos tekstynu. Specialiaisiais nedidelės apimties tekstynais taip pat su tam tikromis išlygomis būtų galima vadinti moksliniam darbui, dažniausiai disertacijoms, sudarytus tekstų rinkinius, pavyzdžiui, vaikų kalbos (Savickienė 1999), internetinių pokalbių svetainių (Ryklienė 2000) ir visus kitus, parengtus turint specialų tyrimo tikslą ir naudojamus tik jų sudarytojų. Čia reikia pasakyti, kad surinkti elektroniniai tekstai, plačiai imant, dažnai būna vertingesni nei vienu kuriuo aspektu atlikta ir publikuota jų analizė, nes kiti tyrinėtojai ar leksikografai praktikai gali pritaikyti juos savo reikmėms (Ambrazas ir kt. 1998: 200). Viešu ir visiems prieinamu bendrojo pobūdžio lietuvių kalbos tekstynu, skirtu kuo įvairesnėms jo vartotojų reikmėms, laikytinas Vytauto Didžiojo universiteto Dabartinės lietuvių kalbos tekstynas. Jis buvo sumanytas kaip „…didelis, nenotuotas ir nekoduotas, į skaitytoją orientuotas, daugiausiai ištisų periodikos ir knygų tekstų, daugiau bendro pobūdžio nei specialus, didelės temų ir kitokios (leidinių pobūdžio, dažnumo, leidimo vietos, autorių lyties, amžiaus, kilmės) įvairovės autentiškos rašytinės lietuvių kalbos tekstynas“ (Marcinkevičienė 1997: 77). Toks jis ir yra, dabar jau pasiekęs 100 milijonų žodžių apimties ribą ir toliau palaipsniui didinamas tekstynas. Juo galima naudotis visu arba viena ar iškart keliomis jo sudėtinėmis dalimis: periodikos, sudarytos iš bendrųjų ir specialių leidiniųjų, bei neperiodikos (grožinės ir negrožinės literatūros knygų bei dokumentų rinkinių) tekstynėliais (žr. VDU Kompiuterinės lingvistikos centro interneto svatainę http://donelaitis.vdu.lt).
22
1. 1. T E K S T Y N A I I R J Ų TA I K Y M A S
Vytauto Didžiojo universiteto Dabartinės lietuvių kalbos tekstynas laikomas subalansuotu, nes iš turimo be abribojimų gautų tekstų archyvo į tekstyną pagal pasirinktas proporcijas perkeliama tik dalis tekstų. Tekstų atranką riboja ne tik pasirinktas tekstyno tipas (įeina tik nepriklausomybės laikotarpio originaliosios, neverstinės kalbos tekstai), bet ir leidybos tendencijos. Šiuo metu 70 % visų tekstų sudaro periodinių ir 26 % neperiodinių leidinių medžiaga. Likę procentai skirti atskiram verstinės literatūros tekstynėliui. Tekstyną žadama įvairinti keliomis kryptimis. Visų pirma jame reikia atskiro sakytinės kalbos tekstynėlio, kad būtų galima palyginti sakytinės ir rašomosios kalbos ypatumus, nes turimo Lietuvos Respublikos Seimo posėdžių protokolai toli gražu neatspindi visos gyvosios kalbos įvairovės. Jau dabar į tekstyną atskiru vienetu įeina ir toliau vis įtraukiama verstinė literatūra, nes rengiamasi kurti didesnės apimties paralelų tekstyną. O kol bus pridėti originalo ir su vertimais suparalelinti tekstai, verstinę lietuviškąją literatūrą galima naudoti ir tirti kaip atskirą verstinės kalbos tipą (Utka 1999). Trečia tekstyno plėtimo ir įvairinimo kryptis, be sakytinės ir verstinės, būtų internetinės kalbos tekstai, sudarantys nuolat sparčiai augančią mūsų kalbos vartosenos dalį. Taigi Vytauto Didžiojo universiteto Dabartinės lietuvių kalbos tekstynas yra ir toliau bus gana įvairus. Įvairus ir subalansuotas, bet ar reprezentatyvus? Į šį klausimą atsakyti tikrai sunku, nes nėra aišku, kokie kriterijai turi būti pasirenkami tekstyno sandarai lemti: kalbos elitiškumas ar demokratiškumas, leidyba ar skaityba, tipiškumas ar specifika. Ką tekstynas turi reprezentuoti – stilius, registrus, temas, žanrus, demografines rašytojų skirtybes? Viską iš karto ar kai ką pasirinktinai? Pasakymas, kad tekstynas turi atspindėti šiandienę lietuvių kalbą, nieko nesako, nes yra labai abstraktus. Norint bent kiek aiškiau įsivaizduoti tą idealųjį atspindimą objektą, reikėtų labai patikimos sociologinės apklausos duomenų, iš kurių paaiškėtų: a) kiek ir kokios kalbos (ar kalbų) šiandien Lietuvoje vartojama, b) kiek klausoma, skaitoma, kalbama ir rašoma, c) kas skaitoma ir kas rašoma ar leidžiama, d) iš kur ir kokiais kanalais kalba pasiekia ausį, e) su kuo ir kokiomis komunikacijos priemonėmis bendraujama, f) kaip pasiskirsto Lietuvos visuomenė pagal vartojamos kalbos ir atskirų jos atmainų ypatumus – ir dar į daugelį kitų. Tik turint tokius duomenis būtų galima bandyti rengti reprezentatyvų tekstyną, o kol kas reikia tenkintis
23
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
kuo didesne tekstyno apimtimi ir įvairove, tikintis, kad tie du rodikliai kompensuos žinių apie šiandienę mūsų kalbą stygių. Baigiant lietuviškųjų tekstynų apžvalgą reikia trumpai paminėti kelis kitus nedidelius, bet svarbius VDU Kompiuterinės lingvistikos centre parengtus tekstynėlius. Visų pirma tai lietuviškojo Šventojo Rašto vertimo lemuotas elektroninis tekstas ir jo pagrindu sudaryta konkordacija bei svarbiausiųjų žodžių sąvadas (plačiau žr. Marcinkevičienė 1999a), kuriam labai stinga tekstų originalo kalbomis, bei dviejų filosofinės ir grožinės literatūros kūrinių – Platono Valstybė ir G. Orwello 1984-ieji – vertimai suparalelinti su originalo ir dar daugelio kitų vertimo kalbų tekstais (žr. East meets West, CD-ROM). VDU Tarpkultūrinės komunikacijos ir daugiakalbystės tyrimų centre yra parengti ir viešai prieinami keturi tekstynai. Sakytinės lietuvių kalbos tekstynas – tai spontaninės ir iš anksto paruoštos lietuvių kalbos garso įrašai: monologų, dialogų ir polilogų, vykstančių tiesiogiai arba telefonu privačioje, pusiau viešoje ar viešoje erdvėse, transkribuoti ir morfologiškai anotuoti CHILDES programa. Tekstyno apimtis – daugiau nei 200 tūkstančių morfologiškai anotuotų žodžių. Į jį panašus Šnekamosios lietuvių kalbos tekstynas, kuriame daugiau nei 40 tūkstančių žodžių apimties garso įrašų, transkribuotų ir morfologiškai anotuotų ta pačia programa, spontaninių dialogų ir polilogų, vykstančių privačioje ar pusiau viešoje erdvėse). Vaikų kalbai skirtas Lietuvių vaikų ilgalaikio stebėjimo duomenų tekstynas. Tai 1994–2008 m. ilgalaikio stebėjimo metodu sukaupti lietuvių vaikų ir tėvų pokalbių įrašai, transkribuoti ir morfologiškai anotuoti minėta programa. Tekstyno apimtis – apie 350 tūkstančių morfologiškai anotuotų žodžių. Ikimokyklinio ir mokyklinio amžiaus vaikų kalbos tekstyną sudaro daugiau nei 120 tūkstančių morfologiškai anotuotų žodžių įrašų, kurie buvo sukaupti ilgalaikio stebėjimo ir pusiau eksperimentiniu metodais tiriant priešmokyklinio amžiaus vaikų kalbą: monologus ir dialogus. Jie taip pat buvo transkribuoti ir morfologiškai anotuoti CHILDES programa. Visi tekstynai laisvai pasiekiami internete adresu http://ltcourses.vdu.lt/. Atskirai minėtinas Vilniaus universitete parengtas 9 milijonų žodžių apimties Lietuvių mokslo kalbos tekstynas (http://coralit.lt/) bei Lietuvių kalbos institute sukaupti leksiniai lietuvių kalbos ištekliai (plačiau apie
24
1. 1. T E K S T Y N A I I R J Ų TA I K Y M A S
pastarųjų dvidešimties metų lietuvių kalbos išteklių ir technologijų kūrimo rezultatus žr. Marcinkevičienė 2009, 2010). Kokių gi dar tekstynų tipų labai reikėtų turėti lietuvių kalba? Galima nurodyti keletą: bendrojo pobūdžio ir specialiosios literatūros paralelių tekstynų, iš kurių būtų galima rinkti vertimo atitikmenis ir rengti dvikalbius bendruosius ir atskirų sričių terminų žodynus (Marcinkevičienė 2000b), palyginamuosius, sudarytus pagal kitų kalbų tekstynų pavyzdį, kuriuos būtų galima taikyti kontrastinei kelių kalbų analizei, bei sakytinės kalbos, turinčius ir garsinį, ir transkribuotą pavidalą. Taigi, norint paruošti sąlygas lietuvių kalbai kompiuterizuoti, darbo dar yra daug. Darbui su VDU Kompiuterinės lingvistikos centre esančiais lietuvių kalbos tekstynais naudojama kelių tipų programinė įranga: universali, nuo kalbos nepriklausanti ir specialiai pritaikyta lietuvių kalbai. Universalus yra Liverpulio universiteto profesoriaus Mike’o Scotto parengtas programinių įrankių paketas WordSmith Tools, leidžiantis dirbti su palyginti dideliu, tačiau ribotos apimties tekstu ar tekstynu, naudojant įvairialypę statistiką ir jos pagrindu generuotus visų ar prasminių žodžių bei kolokatų sąrašus, konkordansus bei kolokatų medžius, išrenkantis vertimo atitikmenis iš paralelių tekstų ir pan. (Scott 1997). Ši programa pritaikyta tik personaliniam kompiuteriui, o internetinį VDU tekstyno variantą aptarnaujanti programa CUE (Corpus Universal Examiner) teikia kiek menkesnes paieškos galimybes (žr. VDU Kompiuterinės lingvistikos centro interneto svetainę http://donelaitis.vdu.lt), nors ir aprėpia kur kas didesnį tekstų kiekį. Jos autorius – Oliveris Masonas iš Birminghamo universiteto (Mason 1996). Dar būtinai reikėtų kelių specialiai lietuvių kalbai parengtų įrankių: programos, leidžiančios atsisakyti netinkančių Lemuoklio interpretacijų homonimijos ar daugiareikšmiškumo atveju, kad būtų galima vienrareikšmiškai anotuoti tekstą kalbos dalimis ar ir kitomis morfologinėmis ypatybėmis. Kitas svarbus uždavinys – parengti sintaksinės analizės priemonę – parserį, be kurio neveiks net ir pati paprasčiausia mašininio vertimo sistema. Galima bandyti šiuos įrankius įsigyti iš laisvai gaunamų ar nusipirkti ir po to bandyti pritaikyti lietuvių kalbai. Bet kiek rodo kitų šalių patirtis, tam esama nemenkų kliuvinių: įvairūs siūlomų programų trūkumai, tikslios dokumentacijos stygius, neatitaikomos platformos ir standatai, kūrėjų nenoras ar negalėjimas jų palaikyti, o galiausiai tai, kad
25
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
didžiumos jų pagrindas – visai kitokio tipo kalba nei lietuvių, t. y. anglų kalba. Todėl trūkstamas programas reikia pasigaminti patiems, niekas už mus to nepadarys, nes negalime privilioti svetimšalių programuotojų nei savosios rinkos dydžiu, nei kalbos populiarumu.
1.1.2. Tekstynų analizės priemonės ir produktai Tekstynų analizės priemonės, įvairios programos ir įrankiai, nors ir neatskiriama, bet dažnai nutylima tekstynų dalis. Tai ypač pasakytina apie lingvistus, kurie mieliau aptaria darbo su tekstynais eigą ir rezultatus nei programines priemones. O jos yra labai svarbios, nes lemia darbo spartą ir kokybę. Aptarti darbui su tekstynais reikalingus instrumentus (software or lingware tools) nėra paprasta ne vien todėl, kad jų esama daug ir įvairių, bet dar ir dėl sunkiai apibrėžiamo jų statuso. Taigi ką galima laikyti instrumentu? Ar juo galima laikyti programavimo kalbas, jei jos, pavyzdžiui, kaip sed ir awk, leidžia legviau programuoti ženklų virtinėlių apdorojimo procedūras arba SGML (Standard General Markup Language) ženklinimo priemones, kurios žymi teksto bibliografiją, struktūrą ir dar kai ką, pavyzdžiui, jo žodžių gramatines kategorijas, t. y. kalbos dalis (Erjavec 1995: 40)? Drauge su tekstiniais resursais pateikiamuose įrankių sąrašuose tokių nerasi (Biber et al. 1998: 285–286). Ar galima įrankiais laikyti tikrąsias kompiuterinės lingvistikos sistemas – dideles ir sudėtingas, atliekančias teksto morfologinę analizę, generuojančias leksikonus, t. y. kompiuterinius žodynus ir pan.? Galiausiai, ar įrankiu laikytina įvairialypė teksto statistika, tokia kaip teksto ilgis, skaičiuojant pagal ženklų, žodžių ir žodžių formų (visų tekstą sudarančių ir skirtingų) bei sakinių kiekį? Prie jos priklauso ir įvairių testų pagrindu gauti žodžių ir žodžių formų, lemų, prasminių žodžių ar kolokatų dažniniai sąrašai. Į šiuos klausimus vargu ar rasime atsakymą tekstynų ar kompiuterinės lingvistikos literatūroje, kurioje prototipiniais laikomi šie darbui su tekstais, bet nebūtinai tekstynais, skirti įrankiai: teksto lemavimo, žymėjimo ar anotavimo bei analizės programos, atitinkamai – lemuokliai (lemmatisers), žymekliai (taggers) ir parseriai (parsers). Šie įrankiai išvardyti jų atsiradimo ir panaudojimo tekstui apdoroti tvarka. Visų pirma grynas tekstas lemuojamas – išvestinės jo žodžių formos grupuojamos į pagrindines ar antraštines (tikriau, prie išvestinių
26
1. 1. T E K S T Y N A I I R J Ų TA I K Y M A S
formų prirašomi antraštiniai jų pavidalai), po to keleriopas lemas turintys atvejai (pavyzdžiui, žodžio forma laimės gali būti sulemuota ir kaip laimė, ir kaip laimėti, plačiau žr. Zinkevičius 2000) išaiškinami. Tam reikalui turi būti sukurta speciali programa ar įrankis, angliškai vadinamas disambiguator, pamorfemiui išvertus reiškiantis ‘nudviprasmintuvą’, o pats procesas – ambiguity resolution, t. y. dviprasmybės, o dažniau – gramatinės ar semantinės daugiaprasmybės išaiškinimą. Ši programa apžvelgia neaiškios formos kontekstą ir pagal jį nustato labiausiai tikėtiną lemą. Ji ir tampa morfologine tos žodžio formos anotacija arba žyme. Pačios įprasčiausios ir dažniausiai vartojamos – kalbos dalis nusakančios žymės (part-of-speech tags), nors gali būti nurodytos ir tikslesnės morfologinės kategorijos. Bet tekstyno anotavimas neapsiriboja vien morfologija, todėl dar esama sintaksinių, semantinių, nusakančių skirtingas daugiareikšmio žodžio reikšmes, ir net tekstinių ar diskursinių žymių. Po anotavimo eina sudėtingiausias teksto apdorojimo etapas – sintaksinė analizė, kurią sudaro sintaksinius ryšius vaizduojančio medžio kūrimas kiekvienam teksto sakiniui (apie čekų kalbos sintaksinę analizę žr. Hajič et al. 1997). Ji atliekama su parseriu. Esama ir dar sudėtingesnių darbo su tekstu etapų bei juos atitinkančių priemonių: teksto generavimo, vertimo, santraukų automatinio rengimo sistemų, bet jos jau nebe tekstynų, o kompiuterinės lingvistikos sritis. Tekstų lemavimo, anotavimo ir sintaksinės analizės programos, taip pat ir įvairios statistinės priemonės – sąrašų bei konkordansų generavimo, tekstų paralelinimo, kolokacijų paieškos ir kiti čia nesuminėti įrankiai (plačiau apie kai kuriuos iš jų žr. Utka 2000) leidžia prie tekstynų kaupti jų palydovus – dažninius žodžių sąrašus, leksines duomenų bazes, kompiuterinius leksikonus, kontekstinius arba kolokacijų žodynus, sintaksinių medžių bankus ir panašius iš tekstynų gautus produktus. Jie vertingi ir patys savaime, ir kaip sudedamoji dalis įvairių programinių paketų ar sudėtingesnių sistemų, kad ir mašininio vertimo. O šios savo ruožtu gali būti sukurtos tiek statistiniu tikimybiniu, tiek ir taisyklių metodu. Metodas čia toks svarbus, kad dažnai nurodomas įrankio pavadinime, pavyzdžiui, tikimybinis žymeklis (probabilistic tagger). Statistiniai įrankiai yra spartesni, patikimesni ir efektyvesni nei taisyklių pagrindu parengtieji, jų efektyvumas siekia 96 %. Kalbininkų jie vertinami tuo labiau, kuo mažiau siejasi su subjektyvia, nuo atskirų teorijų
27
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
priklausančia interpretacija ir gali dirbti su minimaliai ar visai neanotuotu tekstu. Programiniai įrankiai – neatskiriama tekstyno dalis, todėl darbo su tekstynu ypatumai yra nulemti automatinės analizės rezultatų: kokius duomenis gauname panaudoję vieną ar kitą įrankį, kaip juos toliau naudojame savo tyrimo tikslams. Tačiau pirmiau nei dėl naudotinų įrankių ar jais gautų įvairių produktų – žodžių, žodžių formų sąrašų, konkordansų, kolokatų medžių – reikia apsispręsti dėl tekstyno naudojimo principo ir masto. Čia galimas dvejopas požiūris: tekstyne galima ieškoti pavyzdžių pačių įvairiausių kalbos vienetų distribucijai tirti tuomet, kai probleminiai analizės klausimai ir pirminės hipotezės kyla iš kitų nei TL kalbotyros ar kitokių mokslų sričių. Tuo atveju turime reikalą su tekstynais paremta (corpus-based approach) analize. Kadangi šiuo atveju tekstynu gali būti naudojamasi fragmentiškai, iš jo renkami tik atskiri įdomūs ir vertingi pavyzdžiai, paprastai naudojamasi tekstyno konkordavimo programa, iš kurios gauto konkordanso ir atsirenkama reikalinga informacija. Kitas naudojimo tekstynu būdas išimtinai priklauso TL ir yra vadinamas tekstyno inspiruota (corpus-driven approach) analize, kurios esmė – kelti tyrimo klausimus ir formuluoti hipotezes remiantis tekstyno medžiaga, ankstesne jo analize. Šiuo atveju tekstynas naudojamas išsamiai, pagal Charleso Jameso Fillmore (1992: 39) įvardytą nuodugnios analizės principą (a principle of total accountability), kai būtina aptarti visas konkordanso eilutes, visus rastus tiriamojo kalbos vieneto vartosenos pavyzdžius. Šio principo savo darbuose laikosi visi tekstynų lingvistai. Būtina pasakyti, kad tekstyno naudojimosi principas, ar jis TL hipotezių šaltinis, ar tik kitokių hipotezių tikrinimo vieta, bei jo naudojimo mastas nebūtinai turi sutapti. Nuodugnios analizės principas gali būti taikomas ir tekstynais paremtai analizei, o TL hipotezės tikrinamos naudojant atrankinius tekstyno duomenų naudojimo metodus. Darbo su tekstynu ypatumus be konkrečių įrankių ir naudojimosi principo dar lemia ir trečiasis veiksnys – tekstyno tipas. Vienaip bus dirbama su vienos kalbos, kitaip su dvikalbiais ar daugiakalbiais tekstynais, vienaip su koduotais ir/ar anotuotais, kitaip su gryno teksto tekstynais. Kitos tekstynų savybės, tokios kaip dydis, reprezentatyvumas, kalbos tipas (sakytinė ar rašytinė) bei tekstų pobūdis, neturi lemiamos
28
1. 1. T E K S T Y N A I I R J Ų TA I K Y M A S
reikšmės darbui su tekstynu – tik to darbo rezultatams. Tad toliau bus aptariama darbo su žodžių ir žodžių formų sąrašais bei konkordansais ypatumai neanotuotame lietuvių kalbos tekstyne.
1.1.2.1. Žodžių ir žodžių formų sąrašai Pats paprasčiausias ir istoriškai pats pirmasis statistinio tekstų apdirbimo rezultatas – dažniniai žodžių ar žodžių formų sąrašai, iki tekstynų buvusioje eroje žinomi dažninių žodynų vardu (plg. lietuviškieji dažniniai žodynai). Šiandien, kai kompiuterinės technologijos teikia puikias galimybes greitai ir iš bet kokio dydžio ir pobūdžio tekstyno generuoti dažninį žodžių sąrašą, tinkantį pačioms įvairiausioms taikomojo pobūdžio leksikografų, informatikų reikmėms bei visokių mokslo šakų fundamentaliesiems tyrimams, tokie žodynai, ypač popieriniu pavidalu, nebeleidžiami. Esama dviejų tipų dažninių sąrašų: žodžių formų arba, tikriau pasakius, nekaitomų žodžių ir kaitomų žodžių formų, ir lemų, arba antraštinių žodžių, sąrašų (dar galima nurodyti abėcėlinius dažnio žodynus bei tuos dažnio žodynus, kuriuose žodžiai išrikiuoti pirmojo pasirodymo tekste tvarka, bet laikytini pirmųjų dviejų atmainomis ir neaptarinėtini, plačiau žr. Sinclair 1991: 30–32). Toliau trumpumo dėlei ir laikantis tarptautinės konvencijos, nes juk ir tekstynų apimtis įvardijama milijonais žodžių, nors turima omenyje nekaitomi žodžiai ir žodžių formos, – šie sąrašai atitinkamai bus vadinami žodžių ir lemų sąrašais. Žodžių sąrašai gaunami sujungus ir dažnumų tvarka išrikiavus nekaitomus žodžius ir identiškas kaitomų žodžių formas. Lemų sąrašai randasi dviem būdais: paprastai jie generuojami iš morfologiškai anotuoto tekstyno (Grumadienė ir kt. 1997), nors gali būti rengiami ir neanotuoto tekstyno pagrindu parengus nekaitomų žodžių ir žodžių formų sąrašą ir po to jį sulemavus. Abiejų tipų sąrašai turi savų privalumų ir trūkumų. Žodžių formų sąrašuose išsaugoma vertinga informacija apie skirtingą atskirų to paties žodžio morfologinių formų dažnį, o lemų sąrašuose ši informacija dingsta. Tačiau lemų sąrašai paprastai yra trumpesni ir dėl to parankesni tuomet, kai pakanka žinoti tik skirtingų lemų vartojimo dažnį.
29
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
Tiek nekaitomų žodžių ir kaitomų žodžių formų, tiek ir lemų sąrašai atspindi esmines ir, kaip manoma, universalias statistines žodžių vartojimo tendencijas. Nustatyta, kad bet kurioje kalboje yra labai nedaug žodžių, kurie vartojami labai dažnai, ir daug retai vartojamų žodžių. Paprastai apie pusę dažninio sąrašo žodžių sudaro vienkarčiai atskirų jų formų pavartojimo atvejai. Jie nėra įdomūs tiriant tekstyną jame esančių dėsningumų aspektu, todėl daugelis tyrėjų jų atsisako net dirbdami ir su mažais, vieno milijono žodžių apimties tekstynais. Lietuvių kalbos tekstyno duomenys patvirtina bendras statistines tendencijas. Iš 60 milijonų žodžių tekstyno buvo gautas 1,2 milijono žodžių ilgio dažninis nekaitomų žodžių ir kaitomų žodžių formų sąrašas. Santykis tarp viso tekstyno žodžių kiekio, t. y. jo apimties, ir skirtingų žodžių kiekio (type token ratio) rodo tekstyno žodingumą, leksinę jo įvairovę. Šis statistinis rodiklis paprastai taikomas atskirų autorių tekstams, bet lygiai taip pat sėkmingai juo galima matuoti atskirų tekstyno dalių ir jo viso žodingumą. Dažniniame sąraše žodžių ir jų formų dažnumas pasiskirsto labai netolygiai. 45,54 % visų sąrašo žodžių, t. y. beveik pusė sąrašo, vartojami tik 1 kartą, tokie žodžių pavartojimo atvejai tesudaro 1,04 % visos tekstyno žodžių vartosenos dalies. Tarpinę vietą užima žodžiai ir jų formos, pavartotos nuo 2 iki 1 000 kartų (žr. 1 lentelę). Patys dažniausi žodžiai ir žodžių formos pavartota daugiau nei 1 000 kartų, bet jų susidaro vos pusė procento visų dažninio sąrašo formų. Tokia nedidelė žodžių ir jų formų dalis aprėpia 65 % visos vartosenos, kitaip sakant, nedidelis dažnai kartojamų žodžių kiekis apima daugiau nei pusę tekstyno ploto. Šis žodžių formų kiekio ir jų vartosenos dalies santykis vaizdžiai atsispindi 1 pav. 1 lentelė. Nekaitomų žodžių bei kaitomų žodžių formų vartojimo dažnumas tekstyne Žodžių dažnumas > 10000 1000–9999 100–999 10–99 2–9 1
30
Žodžių formų dalis 0,04 % 0,47 % 3,25 % 9,45 % 36,08 % 45,54 %
Vartosenos dalis 37,36 % 27,33 % 21,24 % 9,94 % 3,09 % 1,04 %
1. 1. T E K S T Y N A I I R J Ų TA I K Y M A S
1 pav. kreivė parodo, kokį vidutinį pavartojimų skaičių atitinka tam tikra sąrašo dalis (procentais). Ji buvo gauta visą sąrašo ilgį padalijus į 100 lygių dalių (horizontalioji ašis), po to buvo skaičiuojamas žodžių pasikartojimo vidurkis kiekvienai daliai (vertikalioji ašis). Ant pačios kreivės nurodyti pavartojimo kartai. Nors visa kreivė ir netelpa į grafiką, bet matoma jos dalis aiškiai rodo, kokia palyginti nedidelė ir tolygiai besikeičianti yra tarpinė, t. y. vidutiniškai dažnai vartojamų žodžių, dalis. Dominuoja itin dažni ir itin reti žodžiai ar jų formos. ,
1 pav. Vidutinis nekaitomų žodžių ir kaitomų žodžių formų vartojimo dažnumas
Tokie dažniniai sąrašai, nelygu iš kokio dydžio ir kokio pobūdžio tekstyno generuojami, gali turėti labai įvairialypę paskirtį. Sudaryti iš nelemuoto tekstyno, gali būti naudojami informatikoje kaip pagrindas statistinei raidžių, jų derinių, žodžių ir jų formų analizei. Dažninį sąrašą galima naudoti dalimis, pavyzdžiui, atsirinkti jo pradžioje esančius tarnybinius ir kitus savarankiškos leksinės reikšmės neturinčius žodžius (stop-words), pasitikrinti tiriamojo žodžio formų dažnumus, jų vietas bendrame sąraše ir kaimynus, t. y. tos pačios dažnumų kategorijos žodžius. Dažniniai sąrašai yra conditio sine qua non rengiant žodynus, nes tik remiantis žodžių dažnumu galima atlikti pirminę žodžių atranką. Trumpesni lemų sąrašai čia labiau tinka už ilgus nelemuotų žodžių
31
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
formų sąrašus, bet ir pastarieji gali būti pravartūs. Juos naudojant galima apsiriboti tam tikru žodžių formų dažniu atsisakius retesnių pavartojimo atvejų, nes dažnas žodis, kad ir nedaug formų turėtų, vis vien pagal kurią nors pateks į viršutinę, t. y. dažnųjų formų, sąrašo dalį. Nelemuotas sąrašas, kaip ir lemuotas, gali būti naudojamas sociopolitinei analizei, nes iš žodžių vartojimo dažnumo galima spręsti apie daugelį visuomenės gyvenimo dalykų. Tai ypač akivaizdu, kai lyginami keli tokie sąrašai: arba a) tos pačios kalbos ir to paties tęstinio tekstyno, bet sudaryti skirtingu metu, kad išryškėtų vėliau padažnėję žodžiai, arba b) skirtingų tekstynų ar skirtingų kalbų. Lyginami sąrašai turėtų remtis tekstynais, sudarytais panašiais principais, kad duomenys būtų patikimi. Dar vienas dažninių sąrašų tipas, sudarytas lyginimo pagrindu, – prasminių žodžių sąrašas (key-word list), iš kurio išryškėja dažnesni nei tikėtina konkretaus teksto ar mažesnės tekstyno dalies žodžiai. Lyginant viso, pageidautina kuo didesnio, tekstyno ir nedidelės jo dalies žodžių vartojimo dažnumus, į pirmą vietą iškyla mažesniosios jo dalies tipiški žodžiai, o visame tekstyne dažni žodžiai nueina į antrą planą. Taip galima pamatyti žodžius, nusakančius tiriamojo teksto ar tekstų temą. Nelemuotas sąrašas, koks jis bebūtų – visų žodžių ar tik prasminių, yra informatyvesnis, nes, pavyzdžiui, Dažniniame dabarties rašomosios lietuvių kalbos žodyne pateikta lema Lietuva nepaaiškina leksemos vartojimo dažnumo, o nelemuotame saraše dažniausia jos forma Lietuvos leidžia manyti, kad tokį didelį jos dažnį lėmė vartojimas įvairiuose pavadinimuose: Lietuvos Respublikos Seimas. Taigi ir iš nelemuoto tekstyno sudarytas žodžių sąrašas gali būti pravartus, o jei reikia, gali būti lemuojamas.
1.1.2.2. Konkordansai Dar 1991 m. pasirodžiusioje monografijoje „Tekstynas, konkordansas, kolokacija“ J. Sinclairis siūlė atskiros leksemos tyrimo tekstyne procedūrą. Visų pirma generuojamas konkordansas, t. y. gaunami visi atskirų leksemos formų vartojimo atvejai minimaliame vienos eilutės kontekste, žodžių formos išrikiuojamos dažnumo tvarka. Po to eilutės trumpinamos, paliekama tik su tiriamąją forma susiję žodžiai. Anglų kalboje optimalus žodžių kiekis į kairę ir į dešinę nuo tiriamosios formos –
32
1. 1. T E K S T Y N A I I R J Ų TA I K Y M A S
penki žodžiai. Šie žodžiai visame konkordanse traktuojami kaip tekstas, kuriam generuojamas žodžių dažnumų sąrašas. Taip gaunami mažėjančio dažnio tvarka išrikiuoti visi tiriamojo žodžio konteksto partneriai. Šis sąrašas trumpinamas, paprastai atsisakoma paskutiniojo jo dešimtadalio, mat reti, vienkarčiai junglumo partneriai nėra įdomūs, neatspindi tipiškos vartosenos atvejų. Likusiai sąrašo daliai skaičiuojamas svarbos koeficientas tiriamojo žodžio atžvilgiu: lyginamas jo dažnumas visame tekstyne ir duotajame konkordanse. Taip visame tekstyne dažnai vartojami žodžiai nusileidžia į sąrašo galą, o specifiniai, tik tam konkordansui būdingi, – pakyla į viršų. Pagal kolokatų tipiškumą konkordanso eilutės perrikiuojamos taip, kad tiriamojo žodžio junginiai su jam būdingiausiais kolokatais atsidurtų viršuje. Tuo automatinė konkordanso analizė baigiasi ir prasideda lingvisto darbas: surasti tipiškas frazes, sintaksines struktūras, atskirų daugiareikšmių žodžio reikšmių vartojimo atvejus ir pan. (Sinclair 1991: 105–106). 1996 m. pasirodžiusiame straipsnyje „Reikšmės vieneto paieškos“, kuriame analizuojami kelių žodžių ir žodžių junginių konkordansai, į pirmą vietą iškeliamas ne dažninis žodžių sąrašas, o pats konkordansas, tiesa, nedidelis. Jis analizuojamas iš eilės pagal visas leksemų pozicijas į kairę nuo tiriamojo žodžio, pradedant nuo artimiausio, pirmojo iš kairės. Aptarus dažniausių šią poziciją užimančių leksemų gramatiką ir semantiką judama tolyn į kairę, kol apžvelgiamas visas artimasis penkių pozicijų kontekstas, nustatomos išplėstinio leksinio vieneto leksinės, gramatinės, semantinės ir pragmatinės savybės (plačiau apie jas žr. Tognini-Bonelli 2000). Čia dažnumai nurodomi tik kiekvienai atskirą poziciją užimančiai leksemai. Taigi labiau remiamasi glausta konkordanso analize, į dažnumus atsižvelgiant tik atskirais vartosenos atvejais, pavyzdžiui, naked eye analizės atveju nurodoma, kad pirmas iš kairės apytiksliai 95 % visų vartojimo atvejų yra žymimasis artikelis the (Sinclair 1996: 85). Suprantama, anglų kalbai, esančiai visai kitos struktūros nei lietuvių kalba, tinka savi darbo su konkordansu metodai. Kur kas griežtesnė žodžių tvarka sakinyje, žymiai mažesnė žodžio gramatinių formų įvairovė, labiau sustabarėjusi žodžių junginio ar frazės struktūra lemia kitokią darbo eigą. Tad lietuvių kalbos konkordansai analizuojami kiek kitaip, čia ir bus pateikta vienos leksemos analizės eiga ir rezultatai.
33
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
1.1.2.3. Konkordanso analizė Darbui su konkordansu iliustruoti pasirinkta nedažnai vartojama leksema apatija, kad būtų galima atlikti išsamią analizę ir aptarti visus jos vartojimo atvejus, kurių 60 milijonų žodžių tekstyne buvo rasta 268. Nedažnas žodis pasirinktas ir dėl kitos priežasties: rūpėjo pasižiūrėti, ar ir rečiau vartojamų leksemų ryšiai su kontekstu tokie pat svarbūs jų semantikai. Darbo su apatijos konkordansu seka buvo tokia: iš pat pradžių konkordansas buvo išvalytas – nutrinti su tiriamuoju žodžiu nesusiję konkordanso eilutės galai, kitų sakinių nei to, kuriam priklauso tiriamasis žodis, pabaigos ir pradžios. Ši operacija nėra būtina ir dideliam konkordansui sunkiai pritaikoma, tačiau ją atlikus gaunami tikslesni ir švaresni dažniniai sąrašai. Antrajam etapui buvo naudojama tekstų analizės programa Word Smith Tools. Ja iš išvalyto konkordaso buvo sudaryti du žodžių sąrašai: dažninis visų konkordanso žodžių sąrašas ir dažninis prasminių žodžių sąrašas. Dažniniame sąraše buvo 1447 žodžiai – tokia viso tiriamojo konkordanso apimtis. Iš jų 1130 žodžių pavartota tik vieną kartą, 176 žodžiai – du kartus, 87 žodžiai – tris kartus ir t. t. Kaip matome, konkordanso žodžių vartojimo dažnumo dinamika labai panaši į teksto ar tekstyno, tik vienkarčių žodžių formų pavartojimo atvejų konkordanse yra kur kas daugiau nei tekstyne, net 78 % (plg. tekstyne – 45,54 %). Be to, didesnis skirtumas tarp retai ir dažnai vartojamų žodžių formų: dažniausias žodis ir vartojamas 141, apatija – 124 (čia įeina formaliai sutampantys vardininkas ir įnagininkas), apatijos – 58, apatiją – 54 kartus, po to dažnumo kreivė staiga krinta žemyn ir šešioliktas pagal dažnumą žodis apatijai jau tevartojamas tik 10 kartų. Tarp dešimties dažniausiai šiame konkordanse vartojamų žodžių patenka keturi dažniausi apatijos linksniai: vardininkas, galininkas, kilmininkas ir naudininkas. Šiuos konkordanso žodžių vartojimo skirtumus nesunku paaiškinti, nes konkordansas juk nėra tekstas – jis sudarytas išrenkant visus tiriamojo žodžio vartosenos atvejus, tad jie, drauge su keliais kitais itin dažnais žodžiais, ir sudaro kreivės viršūnę. Tarp jos ir vienkarčių žodžių formų yra nedidelis sąrašo intervalas (tarp 16 ir 317 žodžio iš eilės), kuriame ir reikia ieškoti
34
1. 1. T E K S T Y N A I I R J Ų TA I K Y M A S
apatijos kolokatų. O jų, net ir atmetus tarnybinius žodžius, įvardžius ir skaitvardžius, veiksmažodžio būti formas, būta daug ir įvairių. Toliau pateiktos prasminių žodžiu formos, pavartotos nuo dešimties iki dviejų kartų. gali 10, apimti 9, visuomenės 9, apima 8, Lietuvoje 8, silpnumas 8, kartais 7, lietuvos 7, bendras 6, depresija 6, nuovargis 6, pradeda 6, žmonės 6, apatijoje 5, apėmė 5, depresijos 5, vilties 5, požymiai 5, sukelia 5, visiška 5, abejingumas 4, aistros 4, būdinga 4, jausmas 4, metų 4, nuotaika 4, nuovargį 4, pasireiškia 4, piliečiai 4, pilietinės 4, skausmas 4, sukelti 4, svarbiausia, 4, viltį 4, žmonėms 4, žmones 4, anoreksija 3, apimtas 3, asmens 3, tsirado 3, dažnai 3, depresiją 3, galvos 3, giliausią 3, gyvenimo 3, iliuzijos 3, ima 3, išjudinti 3, įvaro 3, kartu 3, kitiems 3, koma 3, nebegali 3, negali 3, nenoras 3, nepasitikėjimas 3, nerimas 3, neviltis 3, nežabotos 3, nori 3, nuobodulys 3, pasiduoti 3, piliečius 3, pilietinė 3, politinių 3, politinės 3, rinkimų 3, slėgė 3, širdį 3, tautos 3, vakarų 3, virsti 3, visiškas 3, visuotinė 3, žmogaus 3. Prasminių žodžių dažninis sąrašas kur kas trumpesnis, jį sudaro tik 41 žodis, nuo paties dažniausio apatijos iki išjudinti, pavartoto tris kartus. Prasminių žodžių sąraše nebelieka tarnybinių žodžių – visuose be išimties tekstuose dažnų ir semantiškai neinformatyvių. Palyginimui pateiktas visas apatijos konkordanso prasminių žodžių sąrašas, iš kurio paaiškėja, kad visi prasminio sąrašo žodžiai yra ir dažniniame sąraše, bet ne atvirkščiai. apatija 124, apatijos 58, apatiją 54, apatijai 10, nusivylimas 13, apimti 9, silpnumas 8, apatijoje 5, apima 8, depresija 6, nuovargis 6, nepasitikėjimas 3, depresijos 5, anoreksija 3, požymiai 5, įvaro 3, visiška 5, koma 3, nežabotos 3, pilietinės 4, apėmė 5, nuovargį 4, abejingumas 4, bendras 6, nevilties 5, giliausią 3, nuobodulys 3, pilietinė 3, visuomenės 9, žmonių 15, iliuzijos 3, depresiją 3, pasireiškia 4, sukelia 5, visuotinė 3, nenoras 3, aistros 4, būdinga 4, slėgė 3, išjudinti 3. Kyla klausimas, kaip pritaikyti šuos sąrašus žodžio reikšmės analizei. Patys savaime jie yra informatyvūs tik tiek, kad nurodo tiriamojo žodžio atskirų formų vartojimo dažnumus ir dažniausius minimaliame jo kontekste esančius junglumo partnerius, tiek absoliučiai, tiek ir santykinai, palyginus su viso tekstyno kontekstu. Šiuos junglumo partnerius galima laikyti kolokatais ir iš jų semantikos susidaryti tik bendrą ir labai
35
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
apytikrį vaizdą apie apatijos konteksto temas, nes žodžių tarpusavio ryšių sąrašai neparodo. Taigi galima sakyti, kad apatija vartojama šalia kitų emocines būsenas ar ligos simptomus reiškiančių daiktavardžių, pavyzdžiui, nusivylimas, silpnumas, depresija, anoreksija, ir pan., su jais besijungiančių veiksmažodžių, pavyzdžiui, apima, sukelia, pasireiškia, slėgė ir pan. Šiuose sąrašuose dar galima įžvelgti ir visuomeninį, politinį kontekstų pobūdį: pilietinę, politinę, tautos, rinkimų ir pan. Tolesnėje analizėje dažniniai sąrašai buvo naudoti dviem atvejais: visų pirma skirstant visą konkordansą pagal atskirus apatijos linksnius, o vėliau tikslinantis pavienių jos kolokatų vartojimo dažnumus. Taigi konkordanso eilutės su konkrečiais kolokatais buvo skiriamos apatijos linksnių formų viduje, o ne visame konkordanse. Suvokiant formos ir reikšmės sąsajas, visas konkordansas buvo suskirstytas į penkias dalis pagal linksnių formas: apatija, apatijai, apatiją, apatijoje, apatijos. Atliekant šį darbą buvo atsisakyta kompiuterio neteisingai šiai leksemai priskirtos Apatijaus soboro vartosenos. Čia reikia pasakyti, kad iš tekstyno renkant leksemas pagal šaknį, kaip šiuo atveju apatij*, paprastai pakliūva kur kas daugiau panašių leksemų. Pavyzdžiui, sudarant minties konkordansą pagal mint* paklius mintolas, mintuvai, minti ir pan. Šiuo atveju atsirado tik viena nereikalinga konkordanso eilutė. Be to, buvo ištrintos ir identiškos besidubliuojančios eilutės, kurių visada pasitaiko arba dėl programos kaltės, arba dėl iš skirtingų šaltinių suplaukusių vienodų tekstų, pavyzdžiui, vienodų Eltos ar BNS agentūrų pranešimų daugelyje laikraščių. Antrasis etapas – atskirti homonimiškas linksnių formas. Kadangi apatija yra vienaskaitinis daiktavardis, sutapo tik vienaskaitos vardininko ir įnagininko formos. Jei analizei būtume pasirinkę ambiciją, dar būtų reikėję rankomis išrūšiuoti identiškas daugiskaitos vardininko ir vienaskaitos kilmininko formas. Linksnių sinkretizmas – nemenkas kliuvinys, jei norima dirbti su atskiromis daiktavardžių formomis, todėl būtina nors iš dalies automatizuoti šį rūšiavimo procesą. 2 lentelė. Apatijos linksnių formų pasiskirstymas konkordanse Vard. 110
36
Kilm. 58
Naud. 10
Gal. 54
Įnag. 14
Viet. 6
1. 1. T E K S T Y N A I I R J Ų TA I K Y M A S
Visas darbinis konkordansas be netinkamų ir pasikartojančių eilučių, kurių buvo rasta 16, sudaro 252 apatijos vartojimo atvejus. Linksniai, kaip matyti iš 2 lentelės, vartojami labai netolygiai: dominuoja vardininkas, tarpinę padėtį užima kilmininkas ir galininkas, rečiau vartojami naudininkas, įnagininkas ir vietininkas. Apskritai kalbant apie linksnių vartojimo dinamiką kitų, ir vienaskaita, ir daugiskaita vartojamų, daiktavardžių analizės atvejais, reikia pasakyti, kad labai aiškiai skiriasi trys vartosenos tipai: dažna, paprastai kelis šimtus atvejų apimanti atskirų linksnių vartosena, vidutinė kelių dešimčių ir reta kelių vienetų ar net ir visai tekstyne nerastų linksnių vartosena. Palyginimui pateikiame kitų 10 abstrakčiųjų daiktavardžių linksnių vartojimo proporcijas Vytauto Didžiojo universiteto Dabartinės lietuvių kalbos tekstyne. 3 lentelė. Kitų daiktavardžių linksnių vartojimo dinamika tekstyne (procentais) žodis aistra liūdesys noras žinia valia patirtis melas propaganda darbas
V. V. 12,8 26 30 6,62 15,2 25,84 37,15 36
V. K. 8,8 29 13 4,76 28,7 26,85 32,24 37
V. N. 1,7 2 1 0,35 14,9 0,27 1,15 8,6
V. G. 7,9 17 22 3,95 19,15 27,0 14,07 11
V. Į. 3,7 25 13 1,2 17,68 19,46 9,66 6,9
Viet. D. V. 0,1 33 1 4 3,15 21,68 2,49 0,05 0,49 0,82 0,8 -
D. K. 16,8 10 27,3 1,80 -
D. N. 2,8 1 3,12 0,33 -
D. G. 11,8 5 13,1 1,89 1,15 -
D. Į. 0,3 1 12,1 0,98 -
Viet 0,3 0,02 2,63 0,16 -
9,38 33,89 2,97 16,25 1,93 3,15 6,01 10,85 1,96 7,710 1,7 1,14
Jei dirbama ne su visu konkordansu, o atsirenkamos tik kai kurios jo eilutės, pavyzdžiui, kas trečia, kas dešimta ar pan., kai kurių linksnių vartosenos atvejų darbiniame konkordanse gali iš viso nepasitaikyti. Taip atsitiko su daiktavardžiu darbas: kai iš viso 90 000 eilučių jo konkordanso buvo atsirinkta tik kas dešimta, nepateko vienaskaitos įnagininkas, daugiskaitos kilmininkas, galininkas ir vietininkas. Toliau dirbama su kiekvienos linksnio formos failu atskirai, gilinantis į vartosenos ypatumus, klasifikuojant konkordanso eilutes pagal gramatinį, leksinį ar semantinį tiriamojo žodžio konteksto panašumą. Tiriamajam daiktavardžiui labai svarbus veiksmažodis, o kartais viena
37
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
konkordanso eilutė jo neaprėpia, jis nepatenka į ekrano lange matomą eilutės dalį. Tokiu atveju galima grįžti į visą tekstyną ir, pakartojus konkrečią per trumpos eilutės paiešką, gauti kur kas ilgesnį 1 000 ženklų kontekstą. Galima tokių eilučių ir visai atsisakyti arba naudoti jas kitiems, arčiau tiriamojo žodžio esantiems junglumo partneriams, pavyzdžiui, būdvardžiams, kitiems daiktavardžiams gauti. Dažnai veiksmažodis nepakliūva į eilutę dėl ilgo vienarūšių sakinio dalių vardijimo, kurioms aprašyti ir galima naudoti šias defektyvias konkordanso eilutes. Nuo likusio konkordanso paranku atskirti ir a) antrinės nominacijos atvejus, kai tiriami žodžiai eina pavadinimais ir vardais (žr. 2 eilutę), b) žodžių junginių forma turinčius tekstų pavadinimus (žr. 1 eilutę) bei c) šiaip trumpus sakinius, kurių predikatas suvokiamas iš konteksto (žr. 8 ir 11 eilutes). Defektyvių apatijos vienaskaitos vardininko eilučių sąrašas: 1. Alfonsas Pilka. Rinkimų išvakarėse: aistros ir apatija 2. Po jų grojo pusiau šiaulietiška, pusiau vilnietiška „Apatija“. 3. pirmo numerio redakcijos žody. Nusiminimas, nepasitikėjimas vienas kitu, apatija ir nuobodulys. Skirtumą tarp šių dviejų pamokų lemia asmenybės 4. žmonių izoliacija, susvetimėjimas, tapatumų praradimas, diskriminacija, apatija ir t. t. Nacionalizmas tarytum pasaulietinė moderniųjų laikų religija 5. asepsiniai pleuritas, pneumonija, perikarditas, didelis bendras silpnumas, apatija, apetito stoka, troškulys, galvos ir galūnių skausmas, šleikštulys, 6. vaikams, tiek suaugusiems: bloga nuotaika, savęs nevertinimas, kaltės jausmas, apatija, bendravimo sunkumai, suicidinės (savižudiškos) mintys. 7. nenoras, nerimas, iliuzijos, nerealizuoti jausmai, hormonų audros ir vėl apatija. Nyku, kai visa tai susimezga į vieną kamuolį. O kur dar prikišamai 8. Pasakymas: pats nežino, ko nori! – tiko man kaip niekam kitam. Jaunatviška apatija. Pastangų bergždumas. Pasaulinis liūdesys didžiojo Weltschmerz’o pa 9. ir gudrumas, skurdas ir išlaidumas, pasiutęs linksmumas ir persisotinusio apatija... Toks lidinys dabar įžengė į Europą, braunasi ir sustos tik prie
38
1. 1. T E K S T Y N A I I R J Ų TA I K Y M A S
10. sakomybės jausmo, nesugebėjimas savarankiškai mąstyti ir dirbti, visiška apatija... viso to priežastis yra sovietinis fizinis ir dvasinis genocidas 11. amų. Ji įėjo į savo kambarį, lėtu judesiu numetė nuo savęs paltą. Visiška apatija ir abejingumas. Gilinantis į kiekvienos linksnio formos vartoseną, buvo ieškoma dažniausiai pasikartojančių konteksto elementų, kokie jie bebūtų – žodžiai, žodžių grupės, gramatinės konstrukcijos ar kas kita, taip atskirti tipiški elementai nuo netipiškų. Toliau ir aptarsime kiekvienos apatijos linksnio formos vartojimo ypatumus atskirai, ieškodami tipiškų ir pasikartojačių, su atskiro linksnio forma susijusių vartosenos modelių. Predikatiniu ryšiu susiję apatijos kolokatai Vardininko konkordanse, žiūrint sintaksinio apatijos vaidmens, išryškėjo dvi didelės grupės. Vienoje jų apatija vartojama su veiksmažodžiais, kitoje – su predikatiniais daiktavardžiais, būdvardžiais ar dalyviais. Kai apatija, eidama sakinio veiksniu, vartojama su veiksmažodžiais, t. y. sudaro subjektinius junginius, visų pirma į akis krinta pati didžiausia 20 eilučių ‘apėmimo’ veiksmažodžių grupė: 1. Širdyje šiandien taip tuščia. Mane vėl apima melancholija, apatija. 2. kitą čečėnų bruožą – optimizmą. Jis teigia, kad čečėnų negali apimti apatija. 3. pačiai kabintis į gyvenimą, siekti savo tikslo, nors ir ją kartais apima apatija. 4. Virgą apėmė visiška apatija. Kitą dieną ji pragulėjo bendrabučio kambarėlyje, 5. užmokestis sumažėjo 2–3 kartus. Todėl didžiąją gyventojų dalį apėmė apatija. 6. Juos gali apimti depresija, apatija, visiškas neveiklumas. Be to, Mėnulio 7. Bet kurį socialinį sluoksnį gali apimti apatija, tačiau mūsų, karių, jokiu būdu. Žvalgantis į didesnį šios neabejotinos kolokacijos apatija apima kontekstą, kokių nors reguliarumų nepastebėta. Apatija gali apimti tiek pavienius asmenis, tuomet vartojamos savybinių įvardžių formos, tiek ir platesnius gyventojų sluoksnius, plg. piliečius, didžiąją gyventojų dalį, didžiąją dalį visuomenės, bet kurį socialinį sluoksnį. Tiriamasis
39
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
daiktavardis paprastai vartojamas be pažyminio, tik vienu atveju pavartotas stiprinamasis žodis visiška, kitu – socialinė, su juo besijungiantis veiksmažodis gali eiti įvairiomis formomis: apima, apėmė, apimtų, apimti, apims. Be abejo, tolesnio nei vienas kolokatas konteksto ar kolokatų formų įvairovei tirti reikia kur kas didesnio konkordanso, kuriame galėtų labiau išryškėti galimi vartosenos dėsningumai. Kitos su subjektinių junginių apatija einančios veiksmažodžių grupės jau susideda nebe iš vieno, o iš kelių sinonimiškų veiksmažodžių, tai 13 vartojimo atvejų su kitais veiksmo pradžios veiksmažodžiais – apimti sinonimais (apniks, ateina, atsirado, pasijuto, pasireiškia, prasideda, užeina, užgriuvo), 11 ‘varginimo’ (gali apsunkinti, griaužia, ima kankinti, pakirto jėga, slėgs, slėgė, vargino, žlugdo), 6 ‘viešpatavimo’ (vyrauja, viešpatauja, užvaldo) ir 5 ‘augimo’ (augo, didėja, padidės, sustiprėjo) veiksmažodžiais. Atskirą grupę sudaro dar 10 įvairios reikšmės veiksmažodžių, pavyzdžiui, ataušinti, jaustis, grėsti, patikti, nykti, pakeisti, skatinti, virsti, tvyroti. Apibendrinant su apatijos vardininku vartojamų veiksmažodžių semantiką galima pasakyti, kad apatija dažnai vartojama su dažniausiai vartojamu veiksmažodžiu apimti bei jam sinonimiškais veiksmo pradžios, t. y. apatijos ‘atsiradimo’ veiksmažodžiais, jos stiprėjimą bei vyravimą žyminčiais nekonotuotais ir neigiamą jos poveikį įvardijančiais konotuotais ‘varginimo’ veiksmažodžiais. Kitaip sakant, apatija yra tas, kas apima, auga ir užvaldo ir slegia žmogų, žmones ar tautą. Pastaroji apatijos vartosena išryškėja iš tranzityvinių veiksmažodžių valdomų objektų semantikos, pavyzdžiui, apatija ir kitos blogybės toliau graužia žmogaus ir valstybės pagrindus. Drauge su netranzityviniais veiksmažodžiais einantis lokatyvas žymi tokias apatijos paplitimo vietas: kraštą, miestą, kaimus ir miestelius, dažnai minima Lietuva, pavyzdžiui, Lietuvoje viešpatauja nusivylimas, apatija. Dvejopą – asmeninę ir visuomeninę – apatijos paplitimo sferą nurodo ir nedažni su apatijos vardininku einantys būdvardžiai: be jau minėtų visiška, socialinė dar ir pilietinė, politinė. Antras stambus apatijos vardininko vartosenos sintaksinis modelis apima tuos dvipusės sąsajos ryšiu susijusius kopuliatyvinius junginius (Labutis 1998: 62), kai apatija eina a) tarinio vardine dalimi arba b) veiksniu, kurio sudurtinį tarinį sudaro dalyviai, būdvardžiai, daiktavardžiai. Kitaip sakant, šiais modeliais nurodoma, kas ir kokia yra apatija.
40
1. 1. T E K S T Y N A I I R J Ų TA I K Y M A S
a) vienas pagrindinių šių rinkimų bruožų yra didėjanti pilietinė apatija; Dekompensuotos acidozės simptomai yra bendras silpnumas, mieguistumas, apatija, galvos skausmas, soporas; Politinė apatija – irgi praeities paveldas; O apatija – natūrali reakcija į perdėtą jaudinimąsi; Reakcija į tai yra apatija arba radikalėjimas; Šių metų apklausos parodė, kad nusivylimas ir apatija tapo pačia didžiausia mūsų nelaime; b) jaučiama visuotinė apatija; kalta visuotinė apatija; jaunimui vis labiau būdingas socialinis infantilizmas, socialinė apatija; kam naudinga apatija, tautos nusivylimas; Pabrėžiamas daugelio žmonių nusivylimas ir slegianti apatija; Juk dabar įsivyravusi tokia apatija; į atvirą tautinį nihilizmą perauganti pilietinė apatija. Šių modelių viduje ryškesnių leksinių ar semantinių tendencijų, atskirų žodžių dažnesnių pasikartojimo atvejų nepastebėta, čia vartojami dalyviai atkartoja pirmojo modelio veiksmažodžius – įsivyravusi, perauganti, slegianti, būdinga, jaučiama, pažyminiais einantys būdvardžiai yra tie patys – socialinė, pilietunė, politinė, visuotinė. Taigi iš esmės 24 eilučių konkordansas pakartojo tas pačias leksines ir semantines subjektinės apatijos veiksmažodinio konteksto (bendra apimtis – 65 eilutės) ypatybes, besiskiriančias daugiausiai gramatine raiška. Kilmininko konkordanse (58 eilutės) taip pat išryškėjo keli ryškesni tiriamojo žodžio vartosenos ypatumai, visų pirma – atributiniai junginiai su daiktavardžiais – 20 eilučių, kuriuose apatija eina kilmininko linksniu dvižodžiame ar ir didesnės apimties žodžių junginyje: apatijos ir beprasmybės išgyvenimų, bendrai apatijos ir indiferentiškumo nuotaikai, apatijos ir įtarumo pritvinkusios atmosferos, apatijos ir motyvacijos stokos, apatijos ir nusivylimo maršką, politinės apatijos ir pasyvumo metų, apatijos ir pavargimo laikais, abejingumo ir apatijos jūra, didžiausios politinės apatijos laikotarpiu, apatijos ledai, pilietinės apatijos luobu, apatijos nirvano bangose, visoje Lietuvoje dominuojančią apatijos nuotaiką, pilietinės apatijos požymių, melancholiškas apatijos vėjas, apatijos, abejingumo, nevilties būseną, apatijos, depresijos, nusivylimo požymia, iš apatijos liūno. Čia, kitaip nei vardininko linksniu vartojamai apatijai, nebereikia viso sakinio modelio, užtenka žodžių junginio, o svarbiausias yra tiesiogiai su apatija susijęs daiktavardis – požymiai, būsena, laikai, etc. Dar svarbūs apatijos pažymimieji žodžiai, pavyzdžiui, didžiausios
41
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
politinės apatijos laikotarpis bei kiti žodžių sąjungos, t. y. vardijimo nariai, paprastai apatijos sinonimai arba kohiponimai: depresija, nusivylimas, abejingumas, neviltis, pasyvumas, pavargimas, įtarumas, indiferentiškumas, etc. Pastarieji išryškėja iš visais linksniais vartojamos apatijos ir yra vienas tipiškiausių šio žodžio vartojimo kontekstų. Kalbant apie šių daiktavardinių žodžių junginių semantiką būtina nurodyti dvi pagrindinio daiktavardžio reikšmių grupes: tiesioginės ir perkeltinės reikšmės daiktavardžius. Pirmieji nurodo laiką, požymius bei apatijos hiperonimus: būseną, nuotaiką, išgyvenimus, antrieji, metaforiniai, yra labai įvairūs: ledai, luobas, marška, jūra, bangos, liūnas, vėjas. Pirmieji trys junginio daiktavardžiai nurodo bendrą apatijos – kaustančio ar dengiančio apvalkalo metaforą, plg.: praplėšdami Lietuvą apgaubusią apatijos maršką, o pastarieji, išskyrus vėją, žymi apatijos – vandens metaforą. Kitas struktūrinis kilmininko vartosenos vienetas – atributiniai apatijos junginiai su dalyviu (11 eilučių) apimtas/a, kur apatija eina pažymimuoju žodžiu, o ne pažyminiu, gramatiškai reikalaujančiu kilmininko linksnio, bet semantiškai tik pakartojančiu vardininko vartoseną su apimti: Kraštas apimtas depresijos, apatijos, nevilties alkoholizmo; Bet ar ji patikės, apimta tų kompleksų, apatijos ir pesimizmo; Žmonės pradeda prarasti viltį, yra apimti apatijos, labai išsekę emociškai. Trečias apatijos kilmininko vartosenos modelis – objektinio junginio prielinksninė iš konstrukcija (8 eilutės), vartojama su dviem metaforinių veiksmažodžių grupėmis, suponuojančiomis ‘apatijos – miego’ (pažadinti miesto visuomenę, išjudinti žmones, atbusti, atsibusti) ir ‘apatijos – nelaisvės’ (vaduotis, išsivaduoti) metaforas. Tarp 18 įvairių arba neklasifikuotų konkordanso eilučių galima rasti dėl gramatinių linksnio valdymo priežasčių atsiradusius objektinius apatijos vartosenos atvejus, nesudarančius atskirų semantinių grupių. Čia priklauso a) prielinksninės konstrukcijos su dėl, nuo, prie, tarp, b) kilmininko reikalaujantys veiksmažodžiai prisidėti, atsikratyti bei c) neiginiai neturėtų skatinti ir pan. Naudininko konkordansas yra nedidelis, tik 10 eilučių, ir 8 iš jų – nepasiduoti, pasiduoti vartojimo atvejai: paragino Lietuvos žmones ir svetur gyvenančius lietuvius nepasiduoti apatijai; pranašavo pavasarį, gaivino viltį, neleido pasiduoti visiškai apatijai. Čia ir vėl regime gra-
42
1. 1. T E K S T Y N A I I R J Ų TA I K Y M A S
matinio linksnių valdymo atvejį, o veiksmažodis, nors šalia kitų apatijos linksnių ir neaptinkamas, tačiau semantiškai nėra unikalus, nes kartoja jau vardininke ir kilmininke rastą ‘apatijos – nelaisvės’ metaforą, plg.: išsivaduoti iš apatijos, apatija užvaldo. Galininko konkordansas (54 eilutės) pasižymi trimis aiškiais veiksmažodžių, kurių papildiniu eina apatija, tipais: tai ‘puolimo į apatiją’, ‘apatijos sukėlimo’ ir ‘apatijos pašalinimo’ veiksmažodžiai. Iš ‘puolimo’ veiksmažodžių patys dažniausi yra grimzti, pavartotas 3 kartus, pulti – 2 kartus ir patekti, įslysti, kristi po vieną kartą: Po truputį grimzdau į siaubingą apatiją; Bet juk ir jaunas puola į apatiją; Ir taip jis įslysta į pasyvumą, į šalinimąsi ir apatiją; Mieželaitis buvo puolęs į dar didesnę apatiją. 17 ‘apatijos sukėlimo’ veiksmažodžių grupės nariai pasiskirsto taip: sukelti – 8 kartai, stumti – 3, gramzdinti – 2, atnešti, paskleisti, paskatinti, varyti – po 1 kartą: Nepasitikėjimas stumia į apatiją; Juoda ir tamsiai pilka didina mieguistumą, sukelia apatiją; be galo sunki padėtis stumia į neviltį, apatiją; Ilgai trunkantis skausmas gali sukelti apatiją, depresiją, miego sutrikimus; Tas nusimanymas gramzdino jį į apatiją ir slėgė poetinius jo vaizduotės polėkius. Priešingos reikšmės ‘apatijos pašalinimo’ veiksmažodžiai (7 eilutės) yra leksiškai įvairūs, tik vienas jų – pašalinti – pavartotas 2 kartus, o kiti įvairuoja: Galbūt tatai ir išblaškė jį apėmusią apatiją; vitaminai, šalinantys apatiją, nuovargį, nemigą; Šalin apatiją, neveiklumą, oblomovščiną, nuovargį, apatiją ir nežinia iš kur atsiradusį irzlumą kaip ranka nuims. 17 eilučių grupę sudaro įvairios semantikos veiksmažodžiai, jie plačiai vartojami įvairiuose kontekstuose ir tipiškų bei dažnų junginių su tiriamuoju žodžiu nesudaro: paaiškinti, vertinti, pakeisti, jausti, išgyventi, spręsti apie/iš, atspindėti. Įnagininko konkordansas (14 eilučių) leksiškai ir semantiškai labai įvairus, jungiamas tik linksnio formos ir sintaksinės objektinių junginių semantikos, todėl čia plačiau neaptariamas, tik iliustruojamas: Ji pasireiškia apatija, depresija, kartais – agresijos plyksniais; pasaulio abejingumas Čečėnijai gali virsti apatija; Tai problema, kuri tiesiogiai susijusi su žmonių socialine apatija, dorovine degradacija, politiniu stabilumu ir pan.; kaltina išsivadavusius iš totalitarizmo valstybių piliečius abejingumu ir apatija; Apsivylimu ir apatija pripildo jojo širdį, kuri po to svajoti nebegali.
43
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
Vietininko konkordansas (7 eilutės), nors ir nedidelis, bet panašiai kaip ir naudininko, sudarytas iš vieno žodžio skęsti vartojimo atvejų. Vieną kartą pavartotas merdėti, kurį galima laikyti skęsti sinonimu: Lietuvos žmonės šiandien skęsta varge, apatijoje ir alkoholyje; Tada mūsų visuomenė nemerdėtų visiškoje apatijoje, depresijoje; Tie, kurie skendi apatijoje, ko gero, tokie ir išeis į pensiją, – nepatenkinti, neprisitaikę. Aptariant atskirų apatijos linksnių vartoseną buvo ieškoma tiesioginiu sintaksiniu ryšiu su tiriamuoju žodžiu susijusių kontekstinių partnerių, bandoma nustatyti, ar yra koks ryšys tarp apatijos linksnių ir artimiausių jos kolokatų semantikos. Kadangi daiktavardžiui būtiniausi yra veiksmažodžiai bei predikatiškai vartojami dalyviai, būdvardžiai ir kiti daiktavardžiai, tai jie pirmiausiai ir buvo tirti bei klasifikuoti. Čia išryškėjo kelių linksnių ir veiksmažodinių kolokatų sąsajos: su gausiausiu apatijos vardininko linksniu einantys veiksmažodžiai sudarė keturias semantines grupeles, iš kurių dažniausi ir leksiškai įvairiausi buvo veiksmo pradžios veiksmažodžiai. Vienas jų – apimti, yra neabejotinai svarbiausias apatijos kolokatas. Objektinė apatijos vartosena taip pat pasižymėjo trimis ryškiomis semantinėmis veiksmažodžių grupėmis. Iš rečiau vartojamų apatijos linksnių tik naudininkas ir vietininkas išsiskyrė tipiška leksine veiksmažodžių raiška, kiti – naudininkas ir kilmininkas – pasirodė gana margi, išskyrus daiktavardinius žodžių junginius su apatijos kilmininku, sudarančius monolitišką atributinių junginių vartosenos tipą. Apskritai imant galima teigti, kad apatijos linksnių formos yra valdomos su ja einančių tiesioginiu ryšiu susijusių žodžių, todėl skirtingų kalbos dalių net ir bendrašakniai kolokatai diktuoja skirtingas linksnio formas, plg.: apatija apima – apimtas apatijos; apatija jaučiasi – jaučia apatiją – apatija yra jaučiama – nepasiduoti visur jaučiamai apatijai. Kitaip sakant, tarp apatijos linksnio formos ir jos kolokatų semantikos nėra tvirto ryšio, nes lemia gramatika. Antra vertus, išryškėja ir akivaizdi leksinė bei semantinė atskirų linksnių kolokatų raiška, todėl tiriant leksemas naudinga išlaikyti su jų formomis susijusią konkordanso struktūrą. Toks yra svarbiausias darbo su lietuvių kalbos tekstyno medžiaga ypatumas. Be būtinųjų predikatinių junglumo partnerių apatija dar turi ir papildomų, kuriuos taip pat verta aptarti siejant su atskiromis linksnių formomis ir taip bandant atrasti jų vartosenos koreliacijas, jei tokių būtų.
44
1. 1. T E K S T Y N A I I R J Ų TA I K Y M A S
Tai visų pirma pažymimaisiais žodžiais einantys būdvardžiai, dalyviai, savybiniai įvardžiai ir daiktavardžiai. Jie buvo trumpai paminėti aptariant patį dažniausią vardininko linksnį. Šiuo linksniu vartojamos apatijos dažniausiu pažyminiu eina visiška, kolokuojanti su apėmė, taigi jau galima įžvelgti trinarę kolokaciją apėmė visiška apatija. Po kelis kartus vartojama visuotinė, pilietinė, po kartą – visuomenės, piliečių, žmonių; jaunatviška, didelė, tam tikra, socialinės, politinė; persisotinusio, slegianti, didėjanti. Savybiniai įvardžiai šioje ir kitų linksnių pozicijose yra reti ir įvairūs. Iš viso apatijos prepozicijoje žodžių buvo pavartota palyginti nedaug – tik 25 kartus iš bendro 110 konkordanso eilučių skaičiaus. Kilmininku vartojamą apatiją pažymi dalis tų pačių (žmonių, visuomenės, pilietinės) ir kai kurie kiti daiktavardžiai, būdvardžiai, dalyviai: tautos, kaimo, vidaus; atsainios, giliausios, vidinės, smarkiai įsigalėjusios letarginės, šiurpios protą stingdančios, nykios, tragiškos; prislėgtas, apimtas (13 kartų), dominuojančios, apėmusios. Nedidelio naudininko konkordanso pažyminiai negausūs, jie kolokuoja su nepasiduoti: pilietinei ir politinei, visiškai, kraštą apėmusiai, žiemos apatijai. Galininkas prie anksčiau minėtų pažyminių žmonių, piliečių, visuomenės, politinės, apėmusios, dar leidžia pridurti nemalonią, siaubingą, buką, dar didesnę, kūrybinę, giliausią apatiją. Likę du reti linksniai nurodo socialinę, dvasinę ir visišką apatiją. Iš pateiktų pavyzdžių galima daryti išvadą, kad pažyminiais einantys žodžiai nekoreliuoja su linksnių formomis, atskirai kalbant apie linksnius – jie gana įvairūs, o bendrai – pasikartojantys. Tačiau pastebėta, jog pažymimieji žodžiai dažniai vartojami prielinksninėse konstrukcijose ir beveik visai nevartojami, kai apatija eina kaip vienas vardijimo elementas. Jei kalbėtume apie jų semantiką, galėtume skirti kelias grupes. Vieną sudaro platesnį apatijos mastą įvardijantys žodžiai: visuomenės, piliečių, žmonių, visuotinė, pilietinė, politinė, socialinė, tautos, kaimo, kraštą apėmusi, kitai, antonimiškai grupei priklausytų keli žodžiai: vidaus, vidinė, dvasinė. Trečiąją grupę sudaro vertinamieji neigiamos konotacijos žodžiais, kuriais nusakomas apatijos dydis – didelė, dar didesnė, didėjanti, dominuojanti, bei poveikis – tragiška, nemaloni, siaubinga, buka, giliausia, letarginė, šiurpi, slegianti. Bene labiausiai apatijos vardininko kontekste, jei žiūrėsime ne predikatinių junglumo partnerių, išryškėja labai dažni vardijimo elementai arba koordinaciniu ryšiu susieta nesavarankiškoji žodžių sąjunga
45
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
(Balkevičius 1998: 43–44), kurios vienu elementu ir eina apatija. Šalia einantys kiti vardijimo elementai yra labai dažnai ir tipiškas tiriamojo žodžio kontekstas, kur kas tipiškesnis nei pažyminys. Vardijimo tiriamajame kontekste esama daug ir įvairaus. Visų pirma, nesavarankiškos žodžių sąjungos pasireiškimus galima skirstyti pagal jų narių skaičių, o šių gali būti nuo dviejų iki aštuonių. Toliau pateikti bemaž visi konkordanse rasti vardijimo atvejai, suskirstyti pagal vardijimo elementų kiekį. Dvinariai: V. aistros ir apatija; apatija ir nusivylimas politine veikla; visiška apatija ir abejingumas; apatija bei išsisėmimas (ir fizinis, ir dvasinis); nyko jo apatija ir rezignacija; didėja žmonių apatija ir abejingumas rinkimams; visuotinis nusivylimas ir apatija; apatija ir neviltis; plintanti apatija bei prisitaikymas; didžiausia rezignacija ir apatija; apatija ir nusivylimas; apima melancholija, apatija; pradeda imti nuobodulys, apatija; apima apatija, kamuoja nepaaiškinamas nuovargis; abejingumas bei apatija; socialinis infantilizmas, socialinė apatija; kam naudinga apatija, tautos nusivylimas; nusivylimas ir slegianti apatija; nusivylimas ir apatija; K. apatijos ir bejėgiškumo; apatijos ir pesimizmo; gelbsti nuo depresijos ir apatijos; iš apatijos ir pilietinio nihilizmo; susvetimėjimo, apatijos ir beprasmybės išgyvenimų; susvetimėjimo, apatijos ir beprasmybės išgyvenimų; apatijos ir nusivylimo maršką; po lietuviškos kantrybės ir pilietinės apatijos luobu; N. nepasiduoti nevilčiai ir apatijai; G. jausti dvasinę tuštumą, apatiją; sukelia piktą dantų griežimą ar apatiją; visuomenės nepasitenkinimą ir apatiją; apatiją ir smukimą; In. apsivylimu ir apatija; „klusnumu“ ir „dvasine apatija“; virsti neveiklumu ir apatija; abejingumu ir apatija; V. apatijoje, depresijoje. Trinariai: V. nedarbas, nusivylimas, apatija; didėja apatija, įtarumas, dėmesio ir globos poreikis; sustiprėjo apatija ir visuomeninis nihilizmas, netikėjimas rytdiena; gali apimti depresija, apatija, visiškas neveiklumas; Lietuvoje viešpatauja nusivylimas, apatija, ciniškas nusistatymas prieš politines partijas ir politikus; tautoje vyrauja apatija, nusivylimas ir beviltiškumas; nusiminimas, nepasitikėjimas vienas kitu, apatija; Beviltiškumas, pasimetimas, socialinė apatija; apetitas prapuola, skonis sugenda, apatija apima; K. apimta tų kompleksų, apatijos ir pesimizmo; nemažtančios sumaišties, apatijos ir pavargimo laikais; abejonių, abejingumo ir apatijos jūra; didžiausių negandų, juodos nevilties, nykios apatijos laikais; apatijos, abejingumo, nevilties būseną; tragiškos apatijos, depre-
46
1. 1. T E K S T Y N A I I R J Ų TA I K Y M A S
sijos, nusivylimo požymiai; N. mažiau pasiduodama liūdesiui, beviltiškumui, apatijai; G. įslysta į pasyvumą, į šalinimąsi ir apatiją; grimzdama į nuobodulį, apatiją, sąstingį; sąmyšį, apatiją ir nusivylimą; apatiją, depresiją, miego sutrikimus; nepasitikėjimą, neapykantą ir politinę apatiją; nuovargį, apatiją ir nežinia iš kur atsiradusį irzlumą; apatiją, nuovargį, nemigą; šalin apatiją, neveiklumą, „oblomovščiną! “; Įn. pasireiškia apatija, depresija, kartais – agresijos plyksniais; su žmonių socialine apatija, dorovine degradacija, politiniu nestabilumu ir pan.; V. skęsta varge, apatijoje ir alkoholyje. Keturnariai: V. nykuma ir liūdesys, nuovargis ir apatija; iškart pajuntate, jog suprastėjo savijauta, ima stigti energijos, apima apatija, o gydytojų patarimai negelbsti; visiškas skurdas, prisitaikymas, pesimizmas ir apatija; šaltkrėtys, prakaitavimas, prasta savijauta, apatija; apatija, silpnumas, virškinamojo trakto, regėjimo sutrikimai ir pan.; K. kupini liguistos neurastenijos, dvasios anemijos, vidaus apatijos, bajorijos atodūsių; ankstyvo nuovargio, apatijos, melancholijos, nesulaikomai bėgančių metų graudesio; panacėja nuo nuovargio, vištakumo, apatijos, pervargimo; depresijos, sielvarto, įsiūčio ar apatijos „apsėsta“; depresijos, apatijos, nevilties, alkoholizmo; baimės, apatijos, nuolankumo ir prisitaikymo; G. Kaip vertinate Lietuvos piliečius apėmusį nusivylimą, apatiją, nesidomėjimą valstybėje vykstančiais procesais, perspektyva. Penkianariai: žmonių izoliacija, susvetimėjimas, tapatumų praradimas, diskriminacija, apatija ir t. t.; vėliau ligonį ima kankinti didžiulis nuovargis, nemiga, apatija, bejėgiškumas, atsiranda polinkis į pesimizmą ir depresiją; alkoholizmas, nuskalstamumas, korupcija, apatija ir kitos blogybės; pasireiškia hepatomegalija, anoreksija, apatija, traukuliai, koma; bendras silpnumas, mieguistumas, apatija, galvos skausmas, soporas. Šešianariai: bloga nuotaika, savęs nevertinimas, kaltės jausmas, apatija, bendravimo sunkumai, suicidinės (savižudiškos) mintys; apatija, nenoras, nerimas, iliuzijos, nerealizuoti jausmai, hormonų audros. Septynianariai: V. būdinga apatija, apetito stoka, šleikštulys, vėmimas, galvos skausmas, mieguistumas; G. emocinių reakcijų: entuziazmą, apatiją, pyktį, pritarimą, pasitenkinimą, abejingumą, susidomėjimą bei kt. Aštuonianariai: V. būdinga vėmimas, bendras silpnumas, troškulys, edemos, apatija, stuporas, hipotermija, koma; G. sušvelninti nervinę įtampą, nerimą, depresiją, baimę, apatiją, stresą, nuotaikos svyravimus.
47
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
Kaip matyti iš pavyzdžių, dažniausios yra dvinarės, trinarės ir keturnarės žodžių sąjungos, nors esama ir ilgesnių išvardijimų. Vardijimo ilgis tiesiog proporcingas vartojamų linksnių kiekiui. Dvinariai ir trinariai junginiai apima visus linksnius, keturnariai tik tris, o visi likusieji – tik vieną arba du linksnius. Vardijimo ilgis susijęs ir su tekstų tipu bei stiliumi. Ilgesni nei penkianariai žodžių junginiai būdingi moksliniam stiliui, specialiosios, ypač medicininės, literatūros tekstams. Tarp koordinacijos ryšiu susijusių nepriklausomo žodžių sąjungos elementų egzistuoja ne tiek sintagminiai, kiek paradigminiai santykiai. Čia galima rasti antonimų (aistros ir apatija; dantų griežimas ir apatija), bet dominuoja sinonimai – ir sisteminiai, ir kontekstiniai (apatija ir smukimas; apatija ir klusnumas; socialinis infantilizmas ir socialinė apatija). Sisteminių sinonimų čia itin gausu, įvairiuose tekstuose aptinkami vardijimai yra neišsenkantis jų šaltinis. Apatijos sinonimais galėtų būti laikomi šie daiktavardžiai, išrikiuoti jų vartojimo dažnumo tvarka: nusivylimas, abejingumas, neviltis, depresija, nuobodulys, neveiklumas, bejėgiškumas, nepasitenkinimas, pesimizmas, beviltiškumas, rezignacija, prisitaikymas, melancholija, nihilizmas, liūdesys, nuovargis, etc. Ilgesniuose vardijimuose tarp elementų susiklosto jau nebe sinoniminiai, o kohiponiminiai santykiai, nes apatija drauge su kitais daiktavardžiais reiškia ligos simptomus, emocines reakcijas, asmenines ydas ar visuotines negandas: nedarbas, nusivylimas, apatija skatina girtauti, o tai – visos tautos rykštė; apetitas prapuola, skonis sugenda, apatija apima; bendras silpnumas, mieguistumas, apatija, galvos skausmas, soporas. Jei žiūrėtume, kaip nepriklausomos žodžių sąjungos kontekstas atskleidžia apatijos reikšmę, galėtume įžvelgti dvejopo tipo kontekstus. Panašiai kaip ir apatijos pažyminiai bei jos turėtojai, vardijimo elementai nurodo asmeninę ir visuomeninę plotmę, žmogaus ir žmonių grupės apatiją. Pirmoji savo ruožtu taip pat gali būti dvejopa: pasireiškianti tik kaip tam tikra būsena ar kaip vienas iš ligos simptomų. Taigi apatija, nors ir monosemiška leksema, nėra vienalytės vartosenos. Jos vartojimas specialiuosiuose medicinos tekstuose, politinėje bei meninėje publicistikoje lemia ir termininę, ir laisvesnę, abstraktesnę apatijos reikšmę. Darbas su konkordansu apima du etapus: jo analizę ir skaidymą į sudedamąsias dalis, t. y. eilučių grupes pagal tiriamojo žodžio morfologines formas (apatijos linksnius), o jų viduje – pagal sintaksinius
48
1. 1. T E K S T Y N A I I R J Ų TA I K Y M A S
modelius (daiktavardiniai žodžių junginiai su apatijos kilmininku, prielinksninės kontrukcijos su apatija, subjektinė, objektinė ir predikatinė apatijos vartosena). Analizuojant dar giliau, žiūrima kiekvieno sintaksinio modelio narių leksinės raiškos ir semantikos, pagal tai skiriamos kolokatų grupės. Kitas etapas – sintezė, tiriamojo žodžio vartosenos požymių ir ypatybių apibendrinimas, labai priklausanti nuo darbo su tekstynu tikslų. Vienu atveju tyrimo tikslas – atlikti leksemos semantinės struktūros analizę ir suteikti jai žodyninio straipsnio pavidalą aiškinamajame, specialiajame junglumo ar dvikalbiame vertimo žodyne, kitu atveju gali rūpėti tiriamuoju žodžiu reiškiamos sąvokos apmatai, išryškėjantys iš leksemos vartosenos ypatumų. Šie konkordanso analizės tikslai yra taikomojo praktinio pobūdžio, tačiau tyrėjai gali turėti ir grynai teorinių tikslų – patikrinti turimą hipotezę ar suformuluoti naują. Kad ir koks būtų darbo tikslas, jam reikia didelio reprezentatyvaus tekstyno, kad duomenys būtų patikimi. Be abejo, begalinis duomenų kiekis gali išgąsdinti ir kelti neviltį, bet, anot Bethės Levins ir kolegų (1997), jei su juo susitvarkai, rezultatai paprastai buna puikūs (Levins et al. 1997). Lietuvių kalbos specifika lemia darbo su tekstynu ypatumus: fleksinė jos prigimtis reikalaute reikalauja atsižvelgti į jos žodžių, ypač centrinių, tiriamųjų, formas, o laisva žodžių tvarka sakinyje neleidžia susikoncentruoti tik į kelias kontekstinių partnerių pozicijas tiriamojo žodžio atžvilgiu – būtina atsižvelgti į visus sakinio narius. Šios abi savybės smarkiai padidina tiriamųjų kalbos vienetų ir jų kolokatų gramatinę įvairovę bei sintaksinę distribuciją, o tai savo ruožtu užmaskuoja bei formų įvairovėje ištirpdo leksinius, semantinius, gramatinius bei pragmatinius žodžių vartosenos ypatumus, t. y. kolokacijas, koligacijas, semantinius prioritetus bei pragmatinę vertę (žr. Sinclair 1996). Griežtos žodžių tvarkos analitinėje anglų kalboje jie išryškėja žymiai greičiau, jiems aptikti užtenka paprastesnių programinių priemonių. Jas pritaikę lietuvių kalbai ne visada gauname trokštamą rezultatą. Štai žodžio paieška tekstyne pagal jo šaknį nepavyks, jei skirtingoms to žodžio formoms būdinga šaknies balsių kaita, pavyzdžiui, likti, lieka; o jo kolokatų paieška pagal poziciją tiriamojo žodžio atžvilgiu ar jų gramatinę formą taip pat nebus sėkminga, nes, kaip matyti iš apatijos analizės, dažniausi apimt* šaknies kolokatai gali atsidurti ir visai šalia apatijos,
49
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
tiek iš kairės, tiek ir iš dešinės: apatija apima, apimtas apatijos, ir kelių žodžių atstumu: apimtas didelės nevilties ir visiškos apatijos. Be to, jie gali įgyti gana didelę gramatinių formų įvairovę: apimti, apima, apėmė, apimtas, apėmusią, apimta, apėmusi, apėmusią, apėmusiai, apėmusios, apimtą, apimtus. Šios ir kitos lietuvių kalbos ypatybės labai apsunkina darbą su tekstynu. O jo reikia didelio, kad per tokią formų gausą ir įvairovę geriau išryškėtų pasikartojantys modeliai ir jų vienetai. Darbas su dideliu konkordansu, gautu iš didelio tekstyno, neįmanomas be specialių programinių priemonių, o reikalingiausios iš jų – konkordanso eilutes klasifikuojančio įrankio, kaip tik ir nėra, tad tenka pasitenkinti bendrų, darbui su tekstais skirtų programų teikiamomis galimybėmis. Mat konkordanso eilutė – sutrumpinta ar ne – yra svarbiausias kalbinės konkordanso analizės vienetas. Iš tekstyno ar konkordanso gauti įvairių rūšių dažniniai žodžių sąrašai tėra tik pagalbinė priemonė žodžių vartosenai tirti, nes juose neatsispindi žodžių ryšiai, į juos, jei pagrindu imamas didesnis kontekstas, gali patekti ir visai su tiriamuoju žodžiu nesusiję žodžiai. To stengiamasi išvengti kuriant kolokacijų tinklus, kuriuose centrinio žodžio kolokatai susieti su savais, o pastarieji – su savais kontekstiniais partneriais (Williams 1998). Tačiau ir prasminiu bei gramatiniu ryšiu susiję kelių pakopų kolokatai dar neparodo viso konteksto, jo įvairovės ir turtingumo, ypač jei reikia apimti ir tiriamojo žodžio pragamatiką. Sakykim, iš viso tekstyno dažninio žodžių sąrašo, ypač jei lyginame kelis chonologinius jo variantus, gali paaiškėti vienu ar kitu metu padažnėję žodžiai, bet paimti pavieniai, izoliuoti nuo konteksto jie nedaug ką tepasako. Žodžių junginiai jau kur kas informatyvesni, pavyzdžiui, vienas dažniausių daiktavardžių – darbas, o jei imsime patį dažniausią jo linksnį – kilmininką, dažniausias kolokatas, 2000 m. duomenimis, bus darbo birža. Jei prisiminsime sovietmetį, tai net ir neturėdami to meto tekstyno, galėsime pasakyti, kad dažniausi darbo kolokatai buvo darbo žmogus / žmonės, darbo liaudis. Bet ir paskiri žodžių junginiai nedaug teatskleis konotacijos, kuri paaiškėja tik iš platesnio konteksto. Štai būdvardis karštas – kai eina su tautybių pavadinimais, dažniausiai randamas su dviem iš jų: karštas lietuvis ir karštas gruzinas. Ir tik platesnio konteksto analizė rodo, kad lietuvio karštumas tapatinamas su jo patriotiškumu, o gruzino – su seksualumu. Panašiai ir aistra, publicistikos
50
1. 1. T E K S T Y N A I I R J Ų TA I K Y M A S
tekstyne 60 % visų vartojimo atvejų vartojama politiniuose kontekstuose, o dažniausia kolokacija – verda politinės aistros. Tokių dalykų negalima pamatyti iš atskirais žodžiais suskaidyto konkordanso. Tad kol kas jokios programinės priemonės negali pavaduoti tyrėjo intuicijos, jei tik ji taikoma duomenų, mūsų atveju konkordanso eilučių, analizei, o ne jų atrankai (plačiau apie intuicijos – vaidmenį tekstynų lingvistikoje). Taigi galima daryti išvadą: darbui su tekstynu reikia įvairių įrankių ir jų generuojamų produktų, be jų neapsieisi, bet jie yra tuo geresni, kuo mažiau pažeidžia ir pertvarko kalbą. Čia buvo pateikti tik keli labai paprasti tekstyno analizės būdai ir produktai, kurie gali pasirodyti netinkami turinčiam kitokių poreikių ir tikslų. Todėl tekstyno analizės modelį kiekvienam reikia susikurti pačiam, o čia jau niekaip neapsieisi be įžvalgumo, intuicijos ir genialumo pamatyti paprastus, bet nedideliame tekstų kiekyje nepastebimus dalykus. Ne be reikalo J. Sinclairis tvirtina: kalba atrodo visaip kitaip, kai vienoje jos vietoje yra labai daug (asmeninė korespondencija).
51
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
1.2. TEKSTYNŲ LINGVISTIKOS ESMĖ IR PRASMĖ Dėl TL naujumo ir svarbos šiandienei kalbotyrai ir kitiems su ja susijusiems mokslams ar praktinės veiklos sritims abejonės nekyla. Tik ėmus kalbėti apie apie jos statusą ir svarstyti, kas ji – naujas metodas, metodologija ar savarankišką teoriją kurianti kalbotyros šaka, kyla aršios diskusijos. Taigi kas yra tekstynų lingvistika: naujas tradicinės lingvistikos metodas ar savarankiška lingvistikos teorija, visai nauja paradigma. Kaip teigia Doris Schoenefeld, požiūriai skiriasi nuo visiškai atmetamo TL savarankiškumo iki TL skelbimo visai naujos kalbos filosofija (Schoenefeld 1999). Čia ir apžvelgsime įvairius TL statutą įtvirtinančius ar paneigiančius argumentus.
1.2.1. Tekstynų lingvistikos statusas Pirmosios TL esmę apibendrinančios monografijos autoriai į klausimą, ar TL yra lingvistikos šaka, ar tik metodologija, atsako dvejopai: ir taip, ir ne. Ji nėra tokia pat šaka kaip sintaksė ar semantika, nes šios šakos aprašo tam tikrą kalbos aspektą. TL yra daugiau metodologija nei šaka, nes ji gali būti panaudojama daugelio tradicinių lingvistikos šakų tyrimams, bet neturi tokios autonomijos ir aiškiai apibrėžto kalbos vieneto, kuris būtų jos išskirtinės analizės objektas (McEnery et al. 1996: 2). Kiti vėlesnių studijų autoriai palaiko šią mintį, kad negalima TL vadinti visiškai nauja ir atskira lingvistikos šaka. Lingvistams visada reikėjo šaltinių teorijoms apie kalbos prigimtį, sandarą, struktūrą ir funkcijas kaip pagrindo parodyti realų kalbos vartosenos vaizdą. Įvairiu metu tokiais kalbinių duomenų šaltiniais buvo intuicija ar introspekcija, eksperimentų ar apklausų būdu gauta informacija ir, žinoma, įprastiniu stebėjimo būdu gauti kalbos aprašai. TL atveju duomenys tiesiogiai gaunami iš tekstų (Kennedy 1998: 7). Taigi tekstynais paremta analizė laikytina papildančia tradicinės analizės būdus, ir jokiu būdu ne vieninteliu teisingu metodu. D. Biberis nurodo, jog tyrimui, atliekamam remiantis tekstynais, klausimai dažniausiai kyla iš visai kitokio pobūdžio
52
1. 2. T E K S T Y N Ų L I N G V I S T I K O S E S M Ė I R P R A S M Ė
kalbotyros pakraipų: pirmesnės struktūrinės kalbos analizės, įvairių teorijų, intuicijos ir dar daugelio kitų (Biber et al. 1998: 10). Kalbant apie TL statusą, laikomasi nuostatos, kad „…nors tekstynas ir gali būti nauja mokslinių tyrimų sritis, apimanti ir naują metodologiją, bet tekstynų naudojimas pats savaime dar neduoda pagrindo naujai ar savarankiškai kalbotyros šakai. Tikriau, tekstynų lingvistika yra iš esmės deskriptyvioji kalbotyra, kuriai naudojamos naujos technologijos“ (Kennedy 1998: 268). Čia reikia pridurti, kad deskriptyvioji kalbotyra, be to, kad teikė pagrindą žodynams ir gramatikoms, visada pati veikė ir buvo veikiama teorinės lingvistikos. Tad būtų labai keista, jei technologijų revoliucija, tokios apimties kaip kompiuterių atsiradimas ir stebėtinai greita jų pažanga, nebūtų iš esmės paveikusi kalbotyros. Taigi galima teigti, jog tekstyno naudojimas nėra nesuderinamas su bet kuria lingvistikos teorija, o TL rūpi tie patys dalykai kaip ir visai kalbotyrai: kalbos ir atskirų jos vienetų prigimtis, struktūra, funkcijos, vartosena, kalbos išmokimas, jos reiškinių įvairovė ir raida. Nors ir papildžiusi naujais metodais įvairias tradicines kalbotyros šakas, TL įgavo didesnę autonomiją labiau koncentruodamasi į leksikologiją ir leksinę gramatiką, o ne į sintaksę. TL naudoja įsigalėjusias mokslinio tyrimo procedūras, apimančias stebėjimą, analizę, teorijos kūrimą bei vėlesnį jos tikrinimą, ir taip suteikia kalbos aprašui naują, jos vienetų distribucija pagrįstą požiūrį (Kennedy 1998: 271). Kuo gi TL papildo ir paįvairina kitų šakų ar kitų mokslų metodus? Į šį klausimą galima atsakyti tik aptikus TL šaknis, visus jos ypatumus ir skirtybes.
1.2.2. Tekstynų lingvistikos ypatumai TL šaknys slypi empirizme, J. Firtho kontekstualizmo tradicijoje, kuriai itin svarbus kalbos ryšys su visa komunikacine situacija, nekalbiniu kontekstu, lemiančiu kalbos tikroviškumo, natūralumo svarbą, iš čia kyla tiriamosios kalbos autentiškumo reikalavimai, poreikis tirti tik realiai kieno nors tikromis aplinkybėmis pasakytą kalbą (Sinclair 1991: 3–6, 36). Iki TL pasirodymo autentiškos kalbos analizė dominavo sociolingvistų darbuose (Marcinkevičienė 1994), nors ir ne taip plačiai, kaip atsiradus tekstynams. Būdama indukcinė, į konkrečius tekstus ir juose
53
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
esančius vartosenos pavyzdžius nukreipta mokslo šaka, TL sugrąžino akademinius tyrinėjimus prie tikrosios kalbos, nes remiantis racionalistine tradicija kalba buvo tiriama apsieinant be tekstų, tiesiog kuriama idealioji kalba einant nuo teorijos prie ją iliustruojančių pavyzdžių, kuriant lingvistinius modelius bei kalbos teorijas, kurias vėliau buvo bandoma pritempti prie realios kalbos (Beaugrande 1999: 241). TL atveju kalbos stebėjimas, tyrimas, neparemtas išankstinėmis nuostatomis, imamas pagrindu teorijoms kurti, o ne atvirkščiai. Čia verta prisiminti sosiūriškąją kalbos ir šnekos dichotomiją. Nuo Ferdinando de Saussure‘o bendrosios lingvistikos laikų, šią idėją palaikant Noamui Chomsky‘ui, buvo manoma, kad šnekos neįmanoma tirti kaip pernelyg heretogeniškos. Giluminė struktūra, baziniai sakiniai, loginė forma, mentalinė reprezentacija, taigi idealybė, buvo teorinės lingvistikos objektas, realią kalbą pakeičianti idealia. O pati lingvistika, anot L. Hjelmslevo (nuoroda iš Beaugrande 1999: 244), negali būti patikrinta, remiantis egzistuojančiais tekstais ir kalbomis. Kalba yra virtualioji, arba potencialioji, sistema, o tekstas – aktualioji, TL kaip tik jas ir sieja. Tų ryšių be didelių tekstynų nenustatysi, todėl tradicinė lingvistika negali būti apkaltinta juos pražiūrėjusi, nes neturėjo tam jokių galimybių. TL lemta susieti šneką su kalba, kompetenciją su atliktimi, kitaip sakant, vartosena (competence versus performance). TL novatoriškumą ir galimybes lemia naujosios technologijos, leidžiančios tirti iki šiol neaprėptus grandiozinius kalbos masyvus, atlikti kiekybinę jų analizę, be kurios nebuvo galima pastebėti daugelio reguliarumų, nes kalbą tyrę atskiri žmonės neaprėpė didelės kalbos faktų gausos. Kompiuteriai ir kompiuterinės technologijos atvėrė naujas galimybes, parodė dažnumus, reguliarius kalbos vartosenos modelius. Taigi kompiuteriai ne tik palengvino tyrimą, bet suteikė jam visai naują kokybę, atvėrė naujas tyrimo perspektyvas (Leech 1992). D. Biberis, tyrinėjantis associacijų modelius (association patterns), atspindinčius kiekybinius ryšius ir atskleidžiančius, kaip, kokiu mastu kalbos vienetai nulemti konteksto, parodo, kokia svarbi TL yra ir kokybinė, ne vien kiekybinė analizė, nes paprastai kiekybiniai duomenys vertinami kokybiniu, t. y. funkciniu, aspektu (Biber et al. 1998: 4) Į atsiradusius tekstynus TL priešaušryje imta žiūrėti kaip į didelius pažįstamos informacijos kiekius ir tik vėliau susigriebta, kad drauge su
54
1. 2. T E K S T Y N Ų L I N G V I S T I K O S E S M Ė I R P R A S M Ė
pakitusiu iš tekstynų gaunamu informacijos kiekiu pakito ir jos kokybė. Tik teorijos, kurios nepripažįsta atgalinio tekstyno duomenų teikiamo ryšio, neigia, jog didesnis kalbos vartosenos aprašų kiekis negali pakeisti jų kokybės. Todėl J. Sinclairis siūlo pamiršti senas teorines nuostatas ir ieškoti tekstynuose naujų kategorijų, žvelgiant į juos kuo atviresnėmis akimis ir be jokių išankstinių nuostatų, kurių, deja, neįmanoma visai išvengti. Mat stebėjimą nuo pat pradžių nulemia teorija, nors ir labai neaiški, paremta interpretacijos (Sinclair 1997). Iš tekstynų išryškėjusi kokybiškai nauja kalbinė informacija lėmė dvejopo tekstynų naudojimo ir kartu dvilypės TL atsiradimą. Nuo pat atsiradimo pradžios tekstynai naudojami tik reikiamiems pavyzdžiams rinkti ir jau egzistuojančioms kalbos teorijoms iliustruoti arba šiek tiek pakoreguoti. Tokiai analizei, vadinamai tekstynais paremtu tyrimu (corpus-based approach), užtenka ir mažų tekstynų. Tačiau dabar tekstynus imta naudoti kur kas radikaliau, TL iš esmės kvestionuoja esamas teorijas ir kalbos tyrimo metodus. Kai hipotezės keliamos, teorijos kuriamos ir verifikuojamos iš pat pradžių pasirėmus tekstynų medžiaga, jų duomenų analize, turime reikalą su tekstynu nulemtu / inspiruotu tyrimu (corpus-driven approach) (Tognini-Bonelli 1996: 69). Tokiam tyrimui reikia itin didelių tekstynų, iš kurių išryškėtų kalbos vienetų vartojimo dėsningumai, bet tik tekstynų inspiruoti tyrimai atveria naujas TL ir jos taikymo kompiuterinei lingvistikai galimybes. Labai svarbu turėti tokius tekstynus, kurie pasakytų apie kalbą kur kas daugiau nei apie ją buvo iki šiol žinoma. Tekstynų lingvistika, kurios esmę ir sudaro tekstynų inspiruota kalbos analizė, leidžia pradėti tirti kalbą iš pat pradžių, atsisakius išankstinių nuostatų ir žinių, sukauptų per daugelį metų. Gal todėl prieš tekstynų duomenis, akivaizdžiai prieštaraujančius egzistuojančioms teorijoms, yra nusiteikę tradiciniais metodais dirbantys senosios kartos kalbininkai, ir ne tik jie. Tarp kalbos technologų taip pat yra įsivyravusi nuomonė, jog apie kalbą jau viską žinome, belieka tik mūsų žinias perduoti kompiuteriui. J. Sinclairis prognozuoja, kad TL gali apversti aukštyn kojom visą tradicinę lingvistiką (Sinclair 2000b). Galima manyti, jog TL kol kas dar netapo nauja kalbos teorija tik dėl to, kad iki šiol ji buvo labiau tekstynais paremta, o ne tekstynų inspiruota, nors, kaip teigia D. Schoenefeld, TL yra daugiau nei vien metodologija (Schoenefeld 1999: 140).
55
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
1.2.3. Tekstynų lingvistika ir kitos kalbos teorijos TL atsirado kaip metodinė priešprieša transformacinei generatyvinei gramatikai, kaip statistikos ir introspekcijos metodų priešprieša, vėliau atskleidusi ir jų derinimo galimybės. T. McEnery, pateikdamas plačią ankstyviosios TL apžvalgą, nurodo, kad iš esmės ji skyrėsi ne tik empyrizmu ir racionalizmu, bet ir tuo, kaip abiejų krypčių atstovai supranta kalbotyros tikslą. Generatyvinės gramatikos tikslu laikomas žmogaus gebėjimo kalbėti, jo kalbinės kompetencijos modelio sukūrimas. Tad N. Chomsky‘o manymu, tekstynais besiremiantys lingvistai bando modeliuoti ne tai, ko reikia kalbos teorijai, t. y. jos atliktį, vartoseną. Anot jo, lingvistikos tikslas nėra išvardyti ir aprašyti vartosenos reiškinius, o tirti introspekciją ir paaiškinti kalbinę kompetenciją kaip taisyklių ir gramatinių apribojimų visumą. Empirinė bazė kalbos aprašui yra gimtakalbių intuicija ir introspekcija paremti sprendimai apie atskirų sakinių gramatiškumą. Tačiau šios teorijos visai nedomino net gramatiškų sakinių autentiškumas ir tai, ar jie tokie kalboje realiai vartojami. N. Chomsky klausė: kam ieškoti duomenų tekstyne, jei juos galima rasti savo galvoje. Anot jo, net jei ir laikytume išvardijimą ir aprašymą kalbotyros tikslu, jis būtų nepasiekiamas, nes kalba nėra baigtinė, kaip nėra baigtinis galimų sakinių kiekis. Todėl riboto dydžio tekstynas negali duoti patikimo visos kalbos vaizdo. Be to, negalima apsieiti be introspekcijos kaip metodo, nes be jo bus neįmanoma kalboje aptikti negramatiškas ir daugiaprasmes struktūras (McEnery et al. 1996: 10). Žvelgiant iš TL pocizijų taip pat galima nurodyti kalbos faktus, niekaip neaptinkamus savistabos metodais ar vien tik kalbos jausmu – tai kalbos vienetų vartojimo dažnumas. Ir ne tik jis. D. Biberis teigia, kad žmonės yra linkę pastebėti nepaprastus, išskirtinius kalbos vartojimo atvejus ir nematyti įprastinių, dažnų (Biber et al. 1998: 3). J. Sinclairis taip pat ne viename darbe rašė apie intuityviai nesuvokiamus dažnai vartojamų žodžių desemantizacijos procesus, neapčiuopiamus dažniausius vartosenos modelius ir nepastebimas dažniausias poliseminių žodžių reikšmes. Todėl gimtakalbio turimas kalbos jausmas laikomas nepakankamu metodu kalbai tirti, o pastarųjų metų TL darbuose gausu gramatikų ir žodynų kritikos, rašytų remiantis šiuo metodu (Salkie 2000, Barlow 2000 ir kiti).
56
1. 2. T E K S T Y N Ų L I N G V I S T I K O S E S M Ė I R P R A S M Ė
Bandydami išlikti objektyvūs, šių dviejų metodų gretintojai nurodo jų abiejų ydas. T. McEnery rašo: „Jei tekstynų lingvistas dažnai gali pasirodyti esąs turimų duomenų vergas, tai tekstynais nesiremiantis lingvistas gali būti laikomas savo vaizduotės įnorių nelaisvėje“ (McEnery et al. 1996: 13). G. Kennedy ir kai kurie kiti kalbininkai, išbandę TL metodus, bando suderinti abu metodus ir teigia, jog vienas nepaneigia kito, tik papildo. Nors N. Chomsky‘o pasekėjai ir atmeta tikimybinius kalbos vartosenos modelius, jie yra labai vertingi, ypač kompiuterinei lingvistikai. O kalbą galima aprašyti ir kaip sistemą, kurią mes vartojame, ir kaip naudojimosi ta sistema ypatybes, kitaip sakant, ir kaip galimybę, ir kaip tikimybę. Pirmasis požiūris atitiktų generatyvistų, antrasis – tekstynų lingvistų poreikius (Kennedy 1998: 270). T. McEnery teisingai nurodo, kad ir dabar TL yra ir turi būti introspekcijos ir tekstynų duomenų analizės sąveika, pagrįsta automatinių ir natūralių metodų sąmaiša (Mc Enery et al. 1996: 13). Apie būtinybę derinti kelis metodus, dirbant su tekstynų duomenimis, ir neapsiriboti vien tik statistika kalba ir kai kurie kiti žymūs lingvistai. J. Svartvik pažymi, kad tekstynai leidžia jų vartotojams, net ir nebūnant gimtakalbiais, gauti duomenų, pakartotinai jais pasinaudoti, palyginti skirtingus tyrimus, tirti kalbą įvairiu laiku ir įvairiais registrais, – o šito neleidžia padaryti jokie kiti metodai, juo labiau introspekcija. Be to, tekstynai tinka bet kokioms teorinėms hipotezėms tikrinti. Tačiau J. Svartvik pasisako prieš tekstyno naudojimą vien remiantis statistiniais programiniais įrankiais, be jokios žmogiškos intuicijos, laikant jį vien tik statistinių tyrimų objektu (Svartvik 1992: 7). Panašiai mano ir Ch. J. Fillmore. Remdamasis savo patirtimi, jis taip apibūdino intuicijos ir tekstyno duomenų santykį: „…kiekvienas tekstynas, kuriuo tik naudojausi, kad ir koks mažas jis būtų, atskleidė tokių faktų apie kalbą, kurių niekaip kitaip nebūčiau sužinojęs“ (Fillmore 1992: 35). Antra vertus, jis mano, kad joks tekstynas, nors ir didelis jis būtų, negali parodyti visko, kas yra kalboje. Galiausiai daro išvadą: jei tekstynas kada nors išvirs į tokią šaką, kuriai nebereikės intuicijos ir ja paremtos tekstyno duomenų interpretacijos bei kognityvinės interpretatoriaus patirties, jo kaip gimtakalbio analizatoriaus intervencijos, jei viskas bus paremta tik statistika ir automatine analize, TL taps neįdomi.
57
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
TL neapibrėžia savo teorinių ištakų, iššskyrus tą, kad ji priklauso J. Firtho lingvistinei mokyklai, taigi europietiškajam kontekstualizmui, todėl lingvistai bando rasti tokį modelį, kuris apimtų ne tik kalbos vartoseną, bet ir jos teoriją, ir taip papildytų TL priskiriamą teorinės disciplinos stygių. Vienas tokių modelių – kognityvizmas. D. Schoenefeld įtikinamai parodo, kaip TL aptarti kalbos reiškiniai gali būti įterpti į kognityvinį kalbos supratimą ir jo paaiškinti. Pavyzdžiui, ji nurodo, kad Ronaldo W. Langackerio gramatinis modelis, suvokiamas kaip įprastinių kalbinių vienetų struktūra (structured inventory of conventional linguistic units) siejasi su J. Sinclairio kalbos fraziškumo principu. Be to, jo tvirtinimas, jog žodynas ir gramatika taip pereina vienas į kitą, kad bet kokia skiriamoji jų linija yra arbitrali, siejasi su J. Sinclairio leksinės gramatikos samprata. Taip pat ir leksinių vienetų desemantizacija, tik pavadinta kitais vardais, aptariama kognityvistų darbuose. Apie ją kalbėdami ir vieni, ir kiti prieina panašias išvadas, skirtumas tik tas, kad TL atstovai remiasi dideliais pavyzdžių kiekiais ir pradeda nuo apačios, t. y. nuo duomenų. Bet ir jie jaučia poreikį apibendrinti, o ne vien aprašyti analizuojaną reiškinį. Sememos leksinių reikšmių sąsajų analizė irgi panaši į radialinį žodžio reikšmių modelį bei Ch. J. Fillmore‘o freimų semantikos modelį, o jo inicijuotas freimneto projektas geriausiai jungia kognityvinę ir tekstynų lingvistikas (plg. Schoenefeld 1999). TL ir kognityvizmo ryšiai dar akivaizdesni, kai imame lyginti George’o Lakoffo išsamiai aptartos kalbinės metaforos (dead metaphor) ir kolokacijos esmę. Kalbinė metafora, būdama kasdienės kalbos savastis ir mūsų mąstymo būdas, niekur kitur taip lengvai neaptinkama kaip tarp abstrakcijas įvardijančių žodžių kolokacijų. Taigi kolokacijos yra pats geriausias metaforų šaltinis, o kognityvinė jų analizė – geriausias būdas sąvokoms tirti (Marcinkevičienė 1994, 1999b, 2000, Maciejauskaitė 2000, Vaičenonienė 2000). Taigi TL ir kognityvizmas yra lingvistinės minties mokyklos, naudingai papildančios viena kitą, tik TL prasideda nuo duomenų analizės, bet empiriniams duomenims interpretuoti jai vis vien prisireikia intuicijos, kognityvizmas labiau remiasi intuicija ir tik nedideliu kiekiu autentiškų duomenų. Abiem atvejais išryškėja, kad introspekcijos bei intuicijos lingvistikoje atsisakyti negalima.
58
1. 2. T E K S T Y N Ų L I N G V I S T I K O S E S M Ė I R P R A S M Ė
Kitas modelis, su kuriuo sietina ir siejama TL, yra valentingumo teorija. TL tiria bet kokių kalbos vienetų, ne tik žodžių, juo labiau ne vien predikatinių žodžių distribuciją, paprastai vadinamą kontekstu, kuri vėliau nėra apibendrinama pagal vieną bendrą modelį, pavyzdžiui, trimis valentingumo lygiais: loginiu semantiniu, gramatiniu (sintaksiniu, morfosintaksiniu) ir leksiniu semantiniu (Jakaitienė 1988: 61, Sližienė 1994: 16). J. Sinclairio pasiūlyti žodžio vartosenos analizės lygmenys su tam tikromis išlygomis galėtų būti palyginti su valentingumo lygmenimis: kolokacijos atitiktų leksinio semantinio valentingumo leksinę, o semantinė pirmenybė – semantinę dalį, koligacijos – gramatinį valentingumą. Tačiau šis modelis nėra toks visuotinis kaip valentingumo modelis, be to, jame labai aiškiai išeities tašku laikomas leksinis, o ne loginis semantinis junglumas. Abiem modeliams bendra – gramatinei tiriamojo žodžio konteksto raiškai skiriamas dėmesys, kitaip sakant, leksikos ir gramatikos vienovė. TL galėtų labai sėmingai papildyti valentingumo teoriją ir atskirų žodžių analizę, mano manymu, silpniausioje jos grandyje – leksinio valentingumo, kitaip sakant, tiriant semantinę dermę (Jakaitienė 1988: 70–72). Pradėjus nuo loginių semantinių partnerių kiekio ir pobūdžio tyrimo, vėliau nesunkiai atliekama, nors ir ne itin gausiais pavyzdžiais paremta, gramatinė analizė. Valentingumo nustatymo metodologija leksiniame semantiniame lygmenyje apsiriboja tik bendrosiomis junglumo tendencijomis: nurodoma, kokių semantinių klasių (ar atskiri) žodžiai gali būti tiriamųjų predikatinių žodžių partnerių pozicijose. Tačiau tokių apibendrintų nuorodų nepakanka, nes dažnai jungtis gali tik vienas, o ne kitas tos pačios leksinės semantinės grupės narys, plg.: matome plika, bet ne nuoga akimi (nors kūnas gali būti ir plikas, ir nuogas), vartojame raminamuosius vaistus, tačiau agresyviems psichiniams ligoniams yra velkami tramdomieji, o ne raminamieji marškiniai. Nors šie būdvardžiai ir yra sinonimai, bet nurodytuose junginiuose jie negali pakeisti vienas kito. Lietuvių kalbos veiksmažodžių junglumo tyrėja N. Sližienė nurodo: „Leksinis valentingumas lemia visą veiksmažodžio leksinę aplinką, arba leksinę distribuciją, o jo valentiniai palydovai sudaro tik jos dalį: tai tie žodžiai bei jų formos, kurių reikalauja veiksmažodžio reikšmė ir kurie sudaro sakinio branduolį. Aprašant veiksmažodžių junglumą, leksinis
59
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
valentingumas tik tiek yra aktualus, kiek jis susijęs su veiksmažodžių valentiniais palydovais“ (Sližienė 1994: 29). Ji siūlo nurodyti tik labai ribotą leksinį palydovo realizavimą drauge su konkretesne veiksmažodžių reikšme, pavyzdžiui, plauti, mazgoti galima rankas, indus, drabužius, grindis ir daugelį kitų dalykų, o skalbti galima tik skalbinius. Kitaip sakant, aprašant veiksmažodžio reikšmę siūloma apsiriboti nurodžius, kokių semantinių klasių žodžiai gali būti veiksmažodžio valentiniais palydovais. Tačiau tokiu atveju būtų aprašoma tik labai bendra veiksmažodžio reikšmė, todėl čia pat tvirtinama: „Norint nustatyti veiksmažodžių individualią leksinę reikšmę, semantinio valentingumo analizės nepakanka; tam reikalinga detali leksinio valentingumo, visos veiksmažodžio distribucijos analizė“ (Sližienė 1994: 46). Būtent čia ir galėtų praversti tekstynų lingvistika.
1.2.4. Teorinės tekstynų lingvistikos nuostatos TL statuso aptarimas rodo dar nepakankamą jos atstovų indėlį į kalbotyros aruodą, garantuojantį atskiros kalbotyros šakos su sava teorija vietą, tačiau ir vien tik metodologija TL jau nebepavadinsi, – jos postuluojami dalykai apie kalbos esmę ir sandarą toli peržengia metodo ribas. Kokios gi svarbiausios TL teorinės nuostatos, leidžiančios visai naujai pažvelgti į kelis tūkstantmečius tyrinėtą kalbą? Atsiradusios tekstynų analizės pagrindu, jos sudaro sunkiai skaidomą visumą ir tik dėl paprastumo čia pateiktos labiau akcentuojant kai kuriuos šios visumos momentus, būtent: 1. kalbos idiomiškumo principą, 2. išplėstinį reikšmės vienetą, 3. deleksikalizaciją, 4. turinio bei formos vienovę. TL teorines nuostatas suformulavo ir tyrinėjimais pagrindė TL kaip teorinės disciplinos pradininkas J. Sinclairis, tad čia daugiausiai ir remiamasi jo darbais ir formuluotėmis (Sinclair 1996, 1999a, 1999b be minėtų kitų darbų).
1.2.4.1. Kalbos fraziškumo principas Aiškindamas, kaip tekste ir tekstu kuriama reikšmė, J. Sinclairis nurodo du būdus: vienas jų vadinamas atskirų žodžių, kitas – gatavų ar pusiau gatavų frazių pasirinkimo principu. Pirmasis principas yra
60
1. 2. T E K S T Y N Ų L I N G V I S T I K O S E S M Ė I R P R A S M Ė
tradicinis gramatikų, ypač transformacinės generatyvinės gramatikos atstovų, kalbos generavimo modelis. Pagal jį sakinys ir tekstas įsivaizduojamas kaip tam tikra struktūra, pilna kiaurymių, kurias vėliau užpildo leksemos, tenkinančios gramatinius apribojimus. Nors ir manoma, kad kalba generuojama iš karto keliais lygmenimis, ir kiekvienu atveju vyksta gana sudėtinga jos vienetų atranka, tačiau is esmės šis modelis gana paprastas: visų pirma generuojamos gramatinės struktūros, o vėliau jos papildomos leksiniais vienetais. Išimtinais atvejais leksiniais vienetais eina vieną bendrą reikšmę turintys sustabarėję žodžių junginiai – idiomos. J. Sinclairio manymu, šis atskirų leksemų gramatinio jungimo į sakinį principas nepaaiškina daugelio kalbos vartosenos atvejų. Kalbos vienetų atranką ir bendrą jų vartoseną tam tikru laipsniu lemia mus supančio pasaulio sąranga. Dalykai, suderinami nekalbinėje tikrovėje, turi didesnę galimybę būti drauge minimi ir kalboje, taigi tikrove galima paaiškinti kai kuriuos kalbos vienetų vartosenos dėsningumus. Tačiau atmetus tokį paaiškinimą turinčius atvejus, tekste dar lieka daug žodžių, kurių ėjimas drauge neturi nieko bendra su tikrove. Tiesa, dalį tokios vartosenos atvejų galima paaiškinti stiliaus, registro, žanro ar kitaip socialiai nulemta atranka. Bet atmetus net ir tuos atvejus, dar lieka daug tik kalbos fraziškumo principu paaiškinamų vartosenos atvejų. Fraziškumo principo esmė (čia reikia pasakyti, kad idioma suprantama plačiąja prasme kaip bet koks dažnai drauge einantis žodžių junginys, nebūtinai sustabarėjęs tiek, kad būtų semantiškai nedalomas į savarankiškos reikšmės komponentus) yra ta, kad bet kuris kalbos vartotojas turi didelį kiekį gatavų ar pusiau gatavų frazių – atskirų pasirinkimo atvejų, kurių pagrindu konstruoja sakinį ir didesnes už jį teksto atkarpas. Šie daugiau ar mažiau apstabarėję žodžių junginiai suvokiant ar tyrinėjant kalbą paprastai išryškėja tik iš didelio panašių vartosenos atvejų kiekio, nes: a) daugelio tokių frazių apimtis labai įvairi, nuo dviejų iki septynių ar ir daugiau žodžių, b) labai neryškios frazės ribos, paribyje galimà kur kas didesnė leksemų įvairovė nei centre, c) atskiri frazės elementai gali leksiškai įvairuoti ir frazės viduje, d) frazės žodžių tvarka gali kisti, e) nors ir galimà gramatinė frazės elementų raiškos įvairovė, dažniausiai dominuoja viena jos elementų gramatinė forma, f) daugelio frazių kontekstas yra gana fiksuotas, t. y. visa frazė turi kelis dažnus
61
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
junglumo partnerius, g) daugeliui frazių būdinga tam tikra semantinė aplinka, specifinis vienus ar kitus dalykus žymintis kontekstas (žr. anglų kalbos terminą semantic preference). Anot J. Sinclairio, fraziškumo principas dominuoja, o atskirų žodžių pasirinkimo principas jį tik papildo. Vis dėlto, nors jie drauge ir neveikia, o tik papildo vienas kitą, jų galiojimo ribos tekste nėra aiškios. Vieno ar kito principo dominavimą lemia teksto stilius, žanras, registras, tema ir net socialinis jo kontekstas. Juo oficialesnis stilius, tuo labiau sustabarėjusi kalba. Matuojant pagal kitą skalę: juo labiau apgalvotas, iš anksto rengtas tekstas, tuo daugiau jame bus atskirų žodžių, o ne pusiau gatavų frazių. Šiuo atžvilgiu spontaniški sakytinės kalbos tekstai turi kur kas daugiau frazių nei rašytiniai, jei tik jie nepriklauso oficialiajam stiliui. Tekstynų analizė įtikinamai parodė, kad labai didelė dalis – apytiksliai apie 80 % teksto – kuriama parenkant ne pavienius ir izoliuotus leksinius kalbos vienetus, o didesnes ar mažesnes jų grupes, turinčias tam tikrą gramatinę struktūrą. Tas pasakytina ne tik apie idiomas, iš seno traktuojamas kaip nedalomą vienetą, bet ir apie didesnę leksinę ir gramatinę įvairovę galinčias turėti, mažiau už idiomas sustabarėjusias kolokacijas, sudarančias labai didelę kalbos apyvartos dalį. Kolokacijos ir yra pati konkrečiausia kalbos fraziškumo principo apraiška.
1.2.4.2. Išplėstinis reikšmės vienetas Tradicinėje kalbotyroje centriniai kalbos vienetai buvo žodis ir sakinys. Nors tiek dėl vieno, tiek dėl kito apibrėžimo daug diskutuota ir iš principo nesutarta, ką laikyti žodžiu ar sakiniu vienos ar kelių giminiškų kalbų atveju (o ką jau besakyti apie tipologiškai ir geneologiškai skirtingas kalbas), tačiau šis neapibrėžtumas nekliudė žodžiu ir sakiniu, tarsi dviem kertiniais stulpais, remtis kalbų analizėje. TL parodė, kad kur kas realesnis kalbos sandaros vienetas yra tarpinis darinys tarp žodžio ir sakinio, t. y. leksinis vienetas, dažniau nesutampantis nei sutampantis su žodžiu (Sinclair 1996: 114). Taigi kalbos analizėje sintaksei tenka ne pats svarbiausias vaidmuo. Naujasis kompozicinis vienetas yra reikšmės, funkcijos ir struktūros kompleksas, nors tekstas ir galimà to vieneto raiškos įvairovė dažnai tą vienovę maskuoja. Tokia pozicija prieštarauja atomistiniam gramatikų modeliui.
62
1. 2. T E K S T Y N Ų L I N G V I S T I K O S E S M Ė I R P R A S M Ė
Žodžio kaip centrinio reikšmės vieneto ribomis buvo suabejota išryškėjus kalbos fraziškumo tendencijoms ir atsiradus naujam tyrimo objektui – kolokacijai, kuri apibrėžiama kaip įprastinis tam tikrų leksemų vartojimas drauge (Crystal 1991). Semantiniu aspektu kolokaciją galima apibūdinti kaip bendrą žodžių vartoseną, padedančią sukurti reikšmę, kuri nėra paprasta visų žodžio reikšmių suma. Iš pradžių į akis krinta fiksuota struktūra ir reguliari vartosena, vėliau – jų lankstumas ir variantiškumas, o paskiausiai – kūrybingas jų išplėtimas ir adaptavimas, pasitaikantis kur kas dažniau nei įprastinė, prototipinė jų forma. Kita išplėstinių kalbos vienetų savybė – sustabarėjimo apraiškos ne tik kolokacijos viduje, bet ir išorėje. Kai kurie sudėtiniai leksiniai vienetai turi fiksuotą leksinę ir gramatinę aplinką, dažnus drauge einančius leksinius vienetus, be to dar ir pragmatinį platesnio konteksto bendrumą. (Sinclair 1996). Todėl šiandien kalbama apie keturis išplėstinio reikšmės vieneto realizavimo lygmenis: t leksinį – kolokaciją, apimančią artimiausią kontekstą, t gramatinį – koligaciją, t. y. gramatinę kolokacijos raišką, t semantinį – bendrą semantinį artimųjų ar ir tolesnių kolokatų lauką, t pragmatinį – semantinę prozodiją, vertinamuosius konteksto elementus. Dviejų pastarųjų – semantinio ir pragmatinio – lygmenų priskyrimas išplėstiniam reikšmės vienetui dalykas yra palyginti naujas, be to, reikalaujantis tyrinėtojo įžvalgos ir nemenkų laiko sąnaudų, todėl daugiau taikomas atskiriems leksinių vienetams tirti ir aprašyti (žr. TogniniBonelli 2000). Kolokaciją galima išgauti automatinėmis priemonėmis, ji akivaizdesnė, formalesnė, labiau apčiuopiama. Gal todėl per pastarajį dešimtmetį kolokacijų tyrimas taip išpopuliarėjo, kad kolokacija tapo vos ne dažniausiai kartojamu žodžiu TL darbuose ir tyrinėjimų objektu. Galima manyti, kad tokį šio kalbos vieneto patrauklumą lėmė ne tik tekstynų ir kompiuterių teikiamos tyrimo galimybės, ne tik kolokacijų svarba kasdienėje kalbos vartosenoje, bet ir liberalus jų suvokimas, leidžiantis įžvelgti vis naujų, vis kitokių naujojo kalbos vieneto bruožų. Tą liudija ir kolokacijos supratimo ir apibrėžimų įvairovė (plačiau apie tai žr. Marcinkevičienė 1995, 1999). Pati kolokacija, kaip ir ją pavadinantis lingvistikos terminas, yra tokia neapibrėžta, kad kas kaip nori, tas
63
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
taip ir brėžia jos supratimo ribas (Čermàk 1998, Van der Meer 1998). Čia galima įžvelgti tam tikrą tolydžio sudėtingėjančią jos aiškinimo tendenciją, prasidėjusią nuo paties paprasčiausio J. Sinclairio apibrėžimo, kuriame akcentuojamas tik žodžių ėjimas drauge, per savaime suprantamus kolokacijai keliamus prasmingumo ir gramatiškumo reikalavimus prie bent dviejų nominatyvinių žodžių normos, netrivialumo, tam tikro formos stabilumo ir kai kurių kitų. Kalbant apie reikšmės dalykus, kolokacija ir čia užima tarpinę padėtį tarp autonomiškos žodžio reikšmės ir bendros visai frazei reikšmės. Kolokaciją sudarantys žodžiai iš esmės lieka nepriklausomi, bet tarpusavyje susiję, nes kuriant kalbą parenkami kaip atskiras vienetas. Kolokacijas paprastai sudaro dažnai vartojami žodžiai, tik labai nedidelė jų dalis anglų kalboje gali būti vartojama nepriklausomai nuo konteksto. Kiti savo reikšmę įgyja tik kontekste, o paimti atskirai esti pernelyg abstraktūs, semantiškai neraiškūs, deleksikalizavęsi (Sinclair 1998).
1.2.4.3. Desemantizacija Desemantizacija yra procesas, kurio metu leksema netenka pirminės savo vertės, bet įgyja kitą funkciją ir reikšmę didesnės apimties leksiniame vienete. Šis semantinis tankis sumažėja, kai išnyksta ribos tarp leksinio vieneto ir jo aplinkos, kai kolokacijos ir/ar kolokacijos paprastą reikšmės vienetą verčia išplėstiniu, t. y. tokiu, kurio viso funkcija skiriasi nuo sudedamųjų jo dalių funkcijos (Tognini-Bonelli 2000). Anot J. Sinclairio, didžiąją teksto dalį sudaro dažni žodžiai, vartojami dažnuose modeliuos arba nežymiai įvairuojančiuose tų modelių variantuose, daugelis dažnų žodžių neturi nepriklausomos reikšmės, bet yra daugiažodžių modelių komponentai. To tradicinės gramatikos modeliai neatskleidžia. Šiandienėje anglų kalboje išryškėja tendencija dažnai vartojamiems žodžiams turėti priklausomas arba sietines reikšmes, kurias paprastai būna sunku aptikti, o aptikus – įvardyti ir paaiškinti. Dažnu atveju esame priversti kalbėti apie vartosenos ypatumus, o ne visateises reikšmes, pavyzdžiui, ta / šia / tokia / tam tikra prasme. Ši tendencija gali būti įvardyta kaip progresuojanti desemantizacija. Viename iš ankstyvųjų savo darbų J. Sinclairis nurodo įdomų ir atskiro tyrimo vertą faktą, neminimą vėlesniuose jo darbuose: dažniausių
64
1. 2. T E K S T Y N Ų L I N G V I S T I K O S E S M Ė I R P R A S M Ė
žodžių dažniausios reikšmės nėra aptinkamos vadovaujantis introspekcija ar kalbos jausmu, iš čia kyla problema – kodėl mūsų intuicija ir vartojimo dažnumas nesutampa. Jei pagrindine žodžių reikšme laikysime tą, kuri pirma ateina į galvą daugeliui žmonių, ji tikrai nesutaps su dažniausia tekstyno reikšme. J. Sinclairio siūloma hipotezė: pagrindinė reikšmė yra pati dažniausia iš nepriklausomų ar nesietinių reikšmių. Jei ta hipotezė pasitvirtintų, paaiškėtų neatitiktis tarp to, kas žmonių laikoma pagrindine žodžio reikšme, ir dažniausios tekstyne aptinkamos reikšmės (Sinclair 1991: 100). Deleksikalizuotą žodyną J. Sinclairis (1996: 112–116) vadina „tuščiuoju leksikonu“ (empty lexicon) ir priešina terminams, kurie neprisitaiko prie savo leksinės aplinkos, yra tokie pat izoliuoti ir autonomiški kaip sakiniai, o jų frazeologijai nuolat gresia pavojus virsti mokslinės kalbos klišėmis. Visai kitoks kasdienės kalbos žodynas, nuolat atsinaujinantis sudarydamas naujus žodžių junginius ir kūrybiškai prisitaikydamas prie naujų situacijų. Taigi J. Sinclairis skiria du bet kurios kalbos žodžių ir žodžių junginių tipus: terminiškuosius (nebūtinai visada sutampančius su terminais tikrąja to žodžio reikšme) ir tuščiuosius. Pirmieji turi fiksuotas, autonomiškas ir aiškiai viena nuo kitos besiskiriančias reikšmes, antrųjų reikšmės išryškėja tik tekste iš artimesnio ar tolesnio konteksto elementų, kurių reikšmės susilieja į vieną visumą. Kitaip sakant, išeities tašku laikydamas dvejopą kalbos konstravimo mechanizmą, J. Sinclairis ir žodyne įžvelgia šį mechanizmą atitinkančias tendencijas: leksinių leksikos vienetų autonomiją ir deleksikalizuotų priklausomybę nuo konteksto, ėjimą drauge su kitais vienetais, bendrą reikšmę ir funkciją tekste. Reikšmė čia suprantama kaip leksinio vieneto funkcija kontekste. Įdomu tai, kad, remdamasis paskutiniųjų tyrimų duomenimis, J. Sinclairis daro išvadą, jog dažnų žodžių negalima priskirti jokiai žodžių klasei, t. y. kalbos daliai. Jie turi tik kai kuriuos vienos ar kelių kalbos dalių požymių, o šiaip išsiskiria unikaliais vartosenos modeliais. Taigi galima manyti, kad desemantizuoti žodžiai kartu yra ir degramatikalizuoti, vartojami kur kas netaisyklingiau nei rečiau vartojamos, bet tipiškos, autonomišką reikšmę turinčios leksemos. Kadangi suabstraktėję ir autonomišką reikšmę praradę yra dažniausiai kalboje vartojami žodžiai, J. Sinclairis daro išvadą, jog pati kalbos šerdis netaisyklinga ir unikali,
65
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
neįspraudžiama nei į gramatikos, nei į semantikos taisyklių rėmus – juk ne be reikalo patys dažniausi anglų kalbos veiksmažodžiai priklauso netaisyklingųjų grupei (Sinclair 1999c).
1.2.4.4. Leksikos ir gramatikos vienovė Kalbėdamas apie dvi svarbiausias kalbos sudedamasias dalis, kurių sąveikoje kuriama reikšmė, J. Sinclairis vartoja terminą „leksinė gramatika“ (Sinclair 2000b). Nuo senų laikų jos buvo atskirtos ir apibrėžiamos: viena jų, gramatika, tam tikrų dėsningumų visuma, o kita, leksika, kaip chaotiška, labai smarkiai įvairuojanti, apibendrinimams sunkiai pasiduodanti kalbos struktūros sudedamoji dalis. Daugeliu savo darbų J. Sinclairis įtikinamai įrodo tokios dichotomijos nepagrįstumą ir keliamą pavojų, skaidant kalbą į sudedamąsias dalis, prarasti visumos vaizdą ir jame matomus modelius. Šią dichotomoją labiausiai griauna kompiuterių suteikta galimybė analizuoti didelius tekstų kiekius ir aptikti bei ištirti leksinės raiškos dėsningumus (lexical patterns), išryškėjančius iš plika akimi neapžvelgiamos labai didelės konkrečių apraiškų įvairovės. Leksikos ir gramatikos atskyrimas suponuoja reikšmės ir struktūros skirtybes. Nuo F. de Saussure’o laiko suvokiant kalbą kaip vertikaliųjų – paradigminių ir horizontaliųjų – sintagminių ryšių vienovę, struktūra buvo labiau siejama su sintagminiais, o reikšmė – su paradigminiais ryšiais. Kadangi abu kalbos ryšių tipus sunku suvokti iš karto, tyrinėtojai paprastai orientuodavosi labiau į vieną ar į kitą, o tai lėmė minėtąjį struktūros ir reikšmės arba gramatikos ir leksikos atskyrimą, pirmenybę teikiant pirmajam. Įsigalėjusi nuomonė, jog kalbos struktūra, sintagminis jos modelis yra pirmapradis darinys konstruojant sakinį. Jos atvertose vietose vėliau iš paradigminės ašies pagal reikšmę parenkami leksiniai vienetai, užpildantys jiems skirtas sintagminės kalbos struktūros ertmes. Taigi reikšmė beveik išimtinai paliekama paradigmatikai. Tekstynų lingvistikoje daroma prielaida, kad reikšmė kalboje kuriama abiejose jos dimensijose – ir paradigminėje, ir sintagminėje, todėl negalima reikšmės atkirti nuo struktūros, turinio nuo formos. Iš čia kyla poreikis keisti kalbotyros terminus taip, kad jie neklaidintų vartotojų ir atpindėtų šiandienį kalbos esmės suvokimą, taigi kalbėti ne apie leksiką
66
1. 2. T E K S T Y N Ų L I N G V I S T I K O S E S M Ė I R P R A S M Ė
ir gramatiką, o apie leksinę gramatiką, t. y. tokią kalbos tyrimų sritį, kurioje abiem aspektams būtų skirtas vienodas dėmesys. Leksikos ir gramatikos vienovę rodo ir kai kurių kategorijų, pavyzdžiui, neigimo ar modalumo, raiškoje ryškesnė jų leksikalizacija nei gramatikalizacija. Apskritai, J. Sinclairis kvestionuoja ne vienos gramatinės kategorijos esmę ir parodo galimas prieštaras: gramatiškai neigiamą formą, bet semantiškai teigiamą sakinio reikšmę, skaičiaus kategoriją, kuri dažnai žymi visai ne skaičių, laiko kategoriją, žyminčią ne laiką (Sinclair 2000). Jis įtikinamai parodo: kol mes analizės labui skirsime kalbą į leksiką ir gramatiką, tol negalėsime sujungti jų į visumą. Ryškiausias pavyzdys – kalbos dalių kategorijos. Žmonės nesunkiai atskirus žodžius priskiria kalbos dalių klasėms, tačiau kompiuteris, negalėdamas to padaryti, parodė, kokios neapibrėžtos ir arbitralios yra šios kategorijos, kaip nepakanka morfologinės informacijos skirstant žodžius į kalbos dalis, kaip būtina papildyti ją sintaksine. Šį poreikį žymi ir kompiuterinės lingvistikos terminų raida: anksčiau vartotą terminą „žymėjimas kalbos dalimis“ (part-of-speech tagging) dabar pakeitė „morfosintaksinis žymėjimas“ (morphosyntactic tagging). Kitas pavyzdys – leksinės reikšmės ir formaliosios jos raiškos sąsajos. Viename iš labiausiai cituojamų darbų J. Sinclairis teigia, jog kiekviena atskira morfologinė žodžio forma yra potencialiai unikalus leksinis vienetas (Sinclair 1991: 8). Jungdami įvairias morfologines formas į vieną antraštinę, t. y. lemuodami žodį, suniveliuojame skirtybes, pažeidžiame turinio ir formos sąsajas, nes juk visai neaišku, kaip reikšmė pasiskirsto tarp lemos ir jos formų. Beje, čia keliamas klausimas, kokią formą turėtų turėti lema, ir siūloma lema laikyti dažniausiai vartojamą žodžio formą (Sinclair 1991: 41). Tradiciškai yra kitaip, lema laikoma kartais vartosenoje ir visai neaptinkama žodžio forma, pavyzdžiui, lietuvių kalboje abejas, abejonės sinonimas, arba omenis, atminties sinonimas, tekstyne aptinkami tik viena iš neantraštinių savo formų: be (jokio) abejo, turėti omenyje. Leksinių vienetų ir sintaksinių struktūrų pasirinkimas koreliuoja, jie tikrai nėra nepriklausomi vienas nuo kito. Apskritai, kompiuteriui gali būti kur kas sunkiau suprasti kalbą todėl, kad remiamasi neteisingomis teorijomis, suskaidančiomis kalbą į tokias dalis, iš kurių vėliau neįmanoma generuoti visumos. J. Sinclairio manymu, kompiuteriniam kalbos suvokimui skirtą teoriją reikėtų
67
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
pradėti nuo leksinės raiškos dėsningumų, kurie iki šiol kalbotyros istorijoje buvo ignoruoti, ir sujungti juos su tuo, kas jau gerai ištirta ir žinoma apie gramatinius dėsningumus. Kitaip sakant, reikia naujų teorijų, kurios galėtų atsirasti iš tekstynų inspiruotos lingvistikos hipotezių. Postuluojamą formos ir turinio vienovę J. Sinclairis pritaiko plačiau informacijos perdavimo modeliui ir kritikuoja tradicinį komunikacijos modelį, pasireiškiantį per kanalo metaforą, pagal kurią turinys tarsi įdedamas į pranešimą, t. y. užkoduojamas siuntėjo ir atkoduojamas priėmėjo. Kalba yra iš esmės interaktyvi, priklausoma nuo jos vartotojų, tas pats pranešimas skirtingiems asmenims reikš skirtingus dalykus, todėl prielaida apie objektyvų ir visiems bendrą žinojimą yra mitas. Kalba, forma, pavidalas – neatskiriama pranešimo, perteikiamos informacijos dalis, lygiai taip pat svarbi kaip ir jos turinys. Postuluodama išvardytuosius kalbos analizės principus, TL atmeta iki šiol dominavusias ir dabar dar įsigalėjusias nuostatas, kad: t kalba pagal savo prigimtį yra daugiaprasmė, tekstai – pilni dviprasmybių; t žodis yra svarbiausias reikšmės turėtojas; t visi reikšminiai kalbos modeliai gali būti išskaidyti į sintaksinius ir semantinius; t forma ir turinys gali kisti nepriklausomai vienas nuo kito, nors ir yra susiję; t labai abstrahuodamasi nuo konkrečių kalbos apraiškų sintaksė gali aprašyti jos esmę (Sinclair 1998a: 6). Šios teorinės nuostatos susiformavo kaip didelių tekstynų analizės išdava, pastebėjus ir ištyrus tuos dėsningumus, kurių nebuvo įmanoma aptikti iki tol naudotais metodais. TL nėra vien kiekybiškai geresnė lingvistika, ji atskleidžia tokių dalykų, kokių be tekstynų niekas ir nebūtų manęs ieškoti. Kaip tvirtina G. Kennedy, TL pradmenyse „esminis posūkis metodologijoje, susijusiose su tekstynų lingvistika, yra atsiradęs ne iš teorijos, bet iš to, ką atskleidė dideli tekstynai“ (Kennedy 1998:10). Jiems išsikristalizuoti reikėjo laiko ir daugelio žmonių pastangų – tekstynų, J. Sinclairio atliktos analizės atveju – beveik 300 milijonų žodžių šiandien turinčio Anglų kalbos banko, visos šiuo tekstynu pagrindu parengtos Cobuild’o žodynų serijos, įvairių projektų ir mokslo darbų. Panašūs darbai buvo dirbami ir kitur Europoje bei už jos ribų, iš jų ir
68
1. 2. T E K S T Y N Ų L I N G V I S T I K O S E S M Ė I R P R A S M Ė
susiformavo nauja mokslo šaka – tekstynų lingvistika. Kokias konkrečios veiklos sritis ji apima? TL apima tris visiškai skirtingas veiklos sritis: tekstynų sudarymą, įnagių jų analizei kūrimą (paprastai paliekamą kompiuterinei lingvistikai) ir tekstynais pagrįstą deskriptyvinę lingvistiką, tiriančią kalbos vienetų distribucijos ypatumus. Ketvirtoji veiklos sritis, išplaukianti iš trečiosios, – tekstynais pagrįsto kalbos aprašo praktinis taikymas kalbos mokymo(si), natūraliosios kalbos apdorojimo, šnekos atpažinimo, mašininio vertimo ir kitoms panašioms reikmėms. Taip pamažu įsigali tekstynų inspiruota lingvistika. Remiantis šiuo TL raidą atspindinčiu konkrečiu pavyzdžiu galima daryti išvadą: iš grynai praktinės, su taikomojo pobūdžio veikla (leksikografija ir kalbų mokymu) susijusios disciplinos TL virsta savą kalbos teoriją kuriančia mokslo šaka.
69
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
1.3. KOLOKACIJOS SAMPRATA Šiandienėje kalbotyroje teksto atsiradimas aiškinamas dvejopai: žodžių (open-choice) ir frazeologinių junginių parinkimu. Vienu atveju tekstui imamas tik tas žodis, kuris tinka gramatiškai. Vis dėlto šis modelis ne visai tinkamas: kartais reikia kito aiškinimo, pagal kurį, kuriant tekstą, iš karto pasirenkama ne vienas, o du ar daugiau žodžių. Šis principas remiasi seniai įrodytu faktu, jog kalboje esama daug pusiau gatavų frazių (Sinclair 1991: 109–121). Jas, arba leksines sintagmas, priimta vadinti kolokacijomis (collocations – lot. colloco iš con ir locare) ir apibrėžti kaip „įprastinį tam tikrų leksemų vartojimą drauge“ (Crystal 1991: 62), „įprastines žodžių asociacijas kalboje su kitais sakinio žodžiais“ (Robins 1989: 65). Kolokacijos nuo sintaksinio žodžių junginio skiriasi tuo, kad apima kai kuriuos leksinius vienetus ir jų reikšmės santykius, o ne morfologines žodžių klases ir jų nulemtą sakinio struktūrą (Jackson 1988: 96). Kalbėtojai pripranta prie drauge vartojamų žodžių, nesvarbu, kuriai kalbos daliai jie priklausytų ir kokius gramatinius ryšius reikštų (Robins 1989: 65). Kolokacijos užima tarpinę padėtį tarp laisvųjų ir frazeologinių žodžių junginių, nuo pirmųjų skiriasi dažnesnių vartojimu drauge, didesniu sustabarėjimu, o nuo pastarųjų – iš atskirų jų dėmenų tiesiogiai išvedama reikšme. Šios pastovios žodžių samplaikos (Jono Palionio 1985: 220 terminas) yra leksikologų ir leksikografų tyrimo objektas bei priemonė aprašyti tam tikrų žodžių reikšmes. Čia ir bus bandyta pateikti istorinę kolokacijų analizės apžvalgą, tyrimo aspektų bei interpretacijų įvairovę Vakaruose ir Rytuose todėl, kad būtų lengviau tirti šį reiškinį lietuvių kalboje.
1.3.1. Stabiliųjų žodžių junginių tyrinėjimų istorija ir aspektai Kolokacijos – palyginti naujas, tik kompiuterinės kalbos analizės ir tekstynų lingvistikos eroje aptiktas ir taip pavadintas kalbos reiškinys, tačiau jis egzistuoja nuo seno ir yra aptartas lingvistų, vadinusių šį reiškinį kitais vardais. Net ir tie tyrėjai, kurie vartoja kolokacijos terminą,
70
1 .3. K O LO K A C I J O S S A M P R ATA
supranta ir apibrėžia jo turinį labai įvairiai. Taigi kolokacijos samprata nėra nusistovėjusi, aišku tik viena – šis kalbos vartosenos faktas patenka į platesnę stabiliųjų žodžių junginių kategoriją. Norint suvokti kolokacijos vietą joje, o per ją ir šio reiškinio esmę, stabiliuosius junginius reikia aptarti atskirai.
1.3.1.1. Stabiliųjų žodžių junginių tyrimo istorija Kolokacija yra sintagminių leksikos ryšių apraiška, tad suvokti jos kaip tam tikro analizės objekto atsiradimą ir raidą lengviausia panagrinėjus leksinės sintagmatikos istoriją. Tai padaryti visai paprasta, nes, išskyrus Walterio Porzigo tyrimus, leksinė semantika maždaug iki septintojo dešimtmečio dėl didelės Josto Triero laukų teorijos įtakos buvo išimtinai paradigminė. Paradigminis leksemų tyrimų būdas vyravo ir vėlesniais dešimtmečiais iki pat šių dienų (žr. E. Leisio, E. Coseriu, J. Lyonso, D. A. Cruse darbus). Pirmasis dėmesį į sintagminius leksemų ryšius atkreipė W. Porzigas ir pavadino juos esminiais reikšmių ryšiais (wesenhafte Bedeutungsbeziehungen), esančiais tarp žodžių, pavyzdžiui: bellen – Hund, wiehern – Pferd, beißen – Zähne, blond – Haar. Vėliau pats autorius tokias žodžių poras siūlė vadinti minimaliais semantiniais, integruojančiais, galop – sintagminiais laukais, nes tarp žodžių yra semantinės implikacijos. Kitaip sakant, vieni leksiniai vienetai implikuojami į kitus, pavyzdžiui, į reiten – žodžių arklys, asilas, kupranugaris reikšmės, o į fahren – visų transporto priemonių pavadinimai. Tos reikšmės, įeinančios į vieną žodį, net jei ir formaliai nepasakytos, sudaro to žodžio semantinį lauką. W. Porzigas aiškiai skyrė šiuos esminius reikšmės ryšius nuo metaforos, pavyzdžiui, auf einem Balken reiten, ir leksinių samplaikų, pavyzdžiui, ein Urteil fallen (Porzig 1934: 70–97). Po W. Porzigo sintagminiais leksemų ryšiais kurį laiką nebuvo domimasi, jei nelaikysime čia tinkančia Zelligo Harriso distribucinės reikšmės teorijos. Vėliau jais susidomėjo JAV transformacinės generatyvinės gramatikos kūrėjai ir Europos struktūralistai. Šios dvi kryptys dar vadinamos atitinkamai semantine ir leksine (Lehrer 1974: 173). Apie semantinę kryptį čia nebus daug kalbama, nes jos atstovų Jerroldo J. Katzo, Jerroldo A. Fodoro, Urielo Weinreicho, Jameso D. McCawley’o darbai
71
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
aptarti gana išsamiai. Be to, semantika ten yra antrinė ir priklausoma nuo sintaksės, kaip ir valentingumo teorijoje, o kolokacijos nuo gramatikos yra ganėtinai nepriklausomos, nes gali turėti įvairialypę raišką, plg.: a strong argument, the strength of argument, he argued strongly, his argument was strengthened. Minint generatyvistus reikėtų pasakyti, kad iki 1965 m. N. Chomsky tvirtino, jog leksemų derinimas yra grynai sintaksinis. Jis nurodo tokius galimus veiksmažodžio subjekto ar objekto sintaksinius (?!) bruožus atrankos taisyklėse (selectional rules): [+ Hum], [+ Anim]. J. Katzo ir J. Fodoro 1963 m. pasiūlyti atrankos apribojimai (selectional restrictions) jau remiasi semantiniais komponentais-žymikliais (markers) ir skirtimis (distinguishers), kuriuos turi turėti gramatišką sakinį sudarantys žodžiai. U. Weinreichas ir J. McCawley, kritikuodami iš esmės negatyvią atrankos apribojimų sąvoką, siūlė keisti ją kita – perkeliamaisiais požymiais (transfer features). Jie aktyvesni, ne tokie ribojantys, be to, jais galima aiškinti ir neįprastas leksemų kombinacijas, tarp jų ir metaforas. Sakinys Peter broke the dog, J. Katzo nuomone, būtų anomalus ir nepaaiškinamas, o anot U. Weinreicho, žodžio sudaužė semantinis komponentas ‘trapus’ yra perkeliamas į šuns reikšmę, todėl sakinys gali būti suprastas taip: Petras sudaužė žaislinį (stiklinį, molinį) šuniuką. Anot semantinės krypties atstovų, žodžių ėjimą drauge lemia jų reikšmės, todėl junglumo ribas reikia nustatyti ne leksemoms, o jų reikšmių požymiams (Lehrer 1974: 173–184, Lipka 1990: 159–171, Harlow et al. 1988: 1–18). Europos struktūralistai – Eugene Coseriu, Dieteris Kastovskis, Johnas Lyonsas, Johnas Rupertas Firthas ir kiti – laikosi W. Porzigo tradicijos ir žodžių junglumą aiškina leksemų derme, nesiedami jų su sakinio struktūra ar kalbos dalimis. Chrestomatiniame straipsnyje apie leksinius solidarumus (lexical solidarities) E. Coseriu pagrindė ir patikslino W. Porzigo sintagminių laukų teoriją (Coseriu 1967: 293–303). Mat pats W. Porzigas neskyrė kalbos ar tikrovės dėsnių nulemtų semantinių implikacijų, neklasifikavo jų. E. Coseriu, remdamasis struktūrinės semantikos sąvokomis, leksinius solidarumus apibūdino kaip orientuotą santykį tarp leksemų, tokį žodžio turinio paaiškinimą, kuriame per arkileksemą, klasemą ir leksemą atsispindi kito žodžio turinys, pavyzdžiui: žodžio medis turinys įeina į kirsti reikšmę, nosis – į kumpa. Taigi leksemų solidarumas – sintagminis reiškinys, sąlygotas žodžių paradigmų,
72
1 .3. K O LO K A C I J O S S A M P R ATA
nes vienas, determinuojantis leksinis vienetas tampa kitos paradigmos determinuotosios leksemos skiriamuoju požymiu. Autoriaus pateiktam itališkam pavyzdžiui analogiškas lietuviškas pavyzdys: žodis arklys papildo spalvų paradigmą, kuria žodžių sartas, bėras ir pan. reikšmes. Pagal tai, ar determinuojančio žodžio reikšmė į determinuotojo reikšmę įeina visa, kaip ką tik minėtu arklio leksemos atveju, ar tik savo klasema (essen, trinken – apie žmones, fressen, saufen – apie gyvius), ar arkileksema (Maul – bet koks snukis, Schnauke – šuns, Schnabel – paukščio snapas). Pagal tai E. Coseriu skiria tris leksinių solidarumų tipus, kurie nėra labai svarbūs kolokacijos esmei suprasti. Kur kas svarbiau tai, kad pagal E. Coseriu duotą solidarumo sampratą, tinkančią daugeliui W. Porzigo pavyzdžių, galima atmesti kitus, netinkamus, pavyzdžiui: arklys – įvežti, arklys – parduoti, kurių vieno reikšmė neįeina į kito reikšmę nei visa, nei jos dalis. E. Coseriu atmetė ir darybiškai susijusius žodžius teisėjas – teisti, kurie priklauso ne solidarumams, o derivacijai, kadangi determinuojantis žodis patenka į determinuojamąjį ne kaip skiriamasis jo požymis, o per žodžių darybą. Solidarumo sąvoka E. Coseriu paaiškina ir metaforos atsiradimą. Ji vadinama tyčiniu nesolidarumu ir laikoma leksemų sintagminių bei paradigminių ryšių priešpriešos rezultatu, pavyzdžiui: beißen turi semantinį požymį ‘dantimis’. Kai sakome Die Kälte beißt, turime įsivaizduoti šaltį su dantimis. E. Coseriu aptaria ir leksinių solidarumų santykį su bet kokiu žodžių junginiu. Žodžių vartojimo drauge dažnumas nesutampa su leksiniu jų solidarumu, pavyzdžiui: baltas arklys gali būti vartojamas kur kas dažniau nei obuolmušis arklys, bet tik tarp pastarojo reikšmių yra implikacijos ryšys. Be to, E. Coseriu siūlo skirti kalbos ir nekalbinės tikrovės nulemtą leksemų reikšmių sąveiką. Savaip sintagminius leksemų ryšius aiškina J. Lyonsas. Jis teigia, jog sintagminės jungties tarp leksemų tvirtumą lemia atskirai paimtų žodžių galimų junginių kiekis. Junglumo atžvilgiu žodžiai sudaro ne klases, o skalę, kurios viename gale būtų būdvardžiai good, bad, vartojami beveik su bet kuriuo daiktavardžiu, o kitame – rancid, vartojamas tik su butter. Riboto junglumo žodžių reikšmių neįmanoma aptarti be jų sintagmų. Tačiau J. Lyonsas siūlo nenukrypti į kraštutinumą ir netvirtinti, kad leksemos reikšmė yra tik jos sintagminių partnerių rinkinys. Aptardamas W. Porzigo pavyzdį kick, punch, jis nurodo, jog tam pačiam
73
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
denotatui žymėti vienose kalbose, pavyzdžiui, anglų, gali būti pavartotas žodis, kitose – žodžių junginys, pavyzdžiui: prancūzų donner un coup de pied, donner un coup de poing. Palyginus kalbas dar labiau išryškėja sintagminio partnerio leksikalizavimas, reiškinys, kurį jis pavadino įkapsuliavimu (encapsulation): į anglų kalbos kick įeina with feet reikšmė. Anot J. Lyonso, sintagminio partnerio reikšmė gali patekti į žodžio reikšmę, jei jis ilgai vartojamas su ribotu partnerių kiekiu, pavyzdžiui: į drive reikšmę pateko a/the car ar by car, ir dabar šis vienas žodis vartojamas vietoj viso junginio: Will you drive or shall I (Lyons 1977: 261–267). Čia aptarti autoriai, nors ir nelaikomi leksinės pakraipos atstovais, gilinasi į žodžio reikšmę, o į sintagmatiką atsižvelgia tik tiek, kiek ji lemia leksemos reikšmę. Žodžių junginiai jiems yra tik minimalus kontekstas. Įprastinį žodžių junginį kaip atskirą tyrimo objektą atskyrė ir įvardijo J. Firthas. Jo pateiktas kolokacijos terminas ir samprata padėjo pamatus anglų leksinės sintagmatikos mokyklai. Skiriamasis šios mokyklos bruožas – bandymas atskirti leksiką, t. y. žodžių vartojimo ypatumus, nuo gramatikos ir semantikos. Kolokacijos samprata įeina į J. Firtho kontekstinę reikšmės teoriją. Svarbiausias dalykas reikšmei nusakyti jam yra kontekstas, apimantis viską: nuo garsų ir fonemų iki kalbėjimo situacijos konteksto. Reikšmę jis siūlo suvokti kaip visumą, bet tirti išsklaidžius į rūšis (modes) taip, kaip šviesa skaidoma į spalvų spektrą: į socialinį kontekstą, sintaksę, žodyną, fonologiją, fonetiką (Firth 1957: 190–215). Reikšmę turi ne tik žodžiai ar frazės, bet ir garsai bei prozodija. Kiekvieną reikšmės rūšį lemia jo funkcija aukštesniųjų lygių struktūroje. Taigi reikšmė J. Firtho teorijoje – kontekstinių ryšių kompleksas, kuriam kiekvienas kalbos lygmuo teikia savo komponentus. Kolokacinės analizės lygmuo užima tarpinę padėtį tarp situacinio ir gramatinio. Tai tokia leksemos reikšmės dalis, kuri priklauso nuo žodžių tendencijos drauge funkcionuoti tekstuose ir šnekoje, pavyzdžiui: viena iš dark reikšmės dalių yra to žodžio junglumas su night ir atvirkščiai. Reiškimas per kolokaciją (meaning by collocation), tvirtina J. Firthas, yra sintagminio lygmens abstrakcija, tiesiogiai nesusijusi su konceptualiuoju, sąvokiniu žodžių reikšmės traktavimu. Tai jis iliustruoja viena iš ass reikšmių, atsiskleidžiančia junginiuose su you silly, obstinate, stupid, awful. Dar autorius nurodo, kad young ass vartojamas dažniau negu old ass, vienaskaitos forma dažnesnė už daugiskaitos.
74
1 .3. K O LO K A C I J O S S A M P R ATA
Įprastines kolokacijas J. Firthas apibūdina kaip abipus tikėtinus žodžių junginius (mutual expectancies) tam tikroje literatūroje. Humoristiniuose anglų eilėraščiuose man dažniau vartojamas su old, lady – su young, o person – vienodai su abiem būdvardžiais. Atskirų autorių įprastinių kolokacijų analizė taip pat svarbi išskaidytos reikšmės spektrui tirti. Tuomet kolokacijų metodas padeda išryškinti dvi literatūrinės stilistikos šakas: skirtingų laiko tarpsnių bei autorinių idiosinkretizmų stilistiką. Taigi prie bendrosios reikšmės analizės schemos priduriama „kolokacinė, arba frazinė stilistika“ (Firth 1957: 212). Kadangi kiekvieną reikšmės rūšį lemia jo funkcija aukštesniųjų lygių struktūroje, ir kolokacinę reikšmę reikia tirti kalbėjimo situacijos kontekste. Tai J. Firthas padarė tirdamas XVIII a. ir XIX a. laiškus. Iš jų aiškėja, kaip dėl situacijos konteksto pakito kolokacijos, o tos, kurios išliko nepakitusios, tapo šiandienėmis klišėmis. Tačiau kolokacinę reikšmę arba, kaip dar tiksliau įvardija šis anglų filologas, reiškimą per kolokaciją reikia skirti nuo kontekstinės reikšmės, kuri yra funkcinis sakinio ryšys su situacijos ir platesnio kultūros konteksto procesais. Reikia pasakyti, kad smulkiau analizuoti J. Firtho kolokacijos sampratą būtų sunku, nes kai kurios jo raštų vietos yra neaiškios. Šį faktą nurodo ne vienas jo mokinys (Lyons 1977: 609, Gordon 1982: 114). Neapibrėžta kolokacijos apimtis, o pavyzdžiai vienur pateikiami kelių žodžių, kitur – kelių strofų ilgio. Analizuodamas A. Ch. Swinburne‘o poeziją, jis teigia, jog strofos reikšmę rodo „paralelinės gramatinės kolokacijos“, o autoriaus originalumą išryškina „žodinių kolokacijų reikšmė“. Dar kitur J. Firthas kalba apie apibendrintą reikšmę, kuri gali būti gauta iš „sinonimų, antonimų, kontrarinių ir komplementarinių žodžių porų vienoje kolokacijoje“ (Firth 1957: 197–199) Taigi, ką tikrai turėjo omenyje J. Firthas, kalbėdamas apie kolokaciją, taip ir lieka neaišku. Iš čia išvardytų sintagminės analizės būdų labiausiai paplito J. Firtho kolokacijos samprata. Gal todėl, kad ji geriausiai nusakė tokios analizės būtinumą ir natūraliai kalboje egzistuojantį vienetą, o gal todėl, kad buvo tokia neapibrėžta ir todėl talpi. Dar vieną kolokacijos populiarumo aiškinimą pateikia Leonardas Lipka: kolokacija yra neutrali sintagma, nes nepriklauso nuo žodžių klasės ir sintaksinės struktūros. Čia nesvarbu, kuris žodis yra pirminis ir vyraujantis, kuris riboja kito žodžio reikšmę. Be to, kolokacija lemia
75
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
sintagminiai leksemų ryšiai, bet nebūtinai semantiniai (Lipka 1990: 166–170). Visų pirma kolokacijos sampratą perėmė ir pagilino J. Firtho pasekėjai A. McIntoshas, Michaelis A. K. Halliday, T. F. Mitchellas, J. Sinclairis, Sidney’us Greenbaumas. A. McIntoshas tyrė žodžio junglumo apimtį (collocational range), kurią sudaro visi galimi kurios nors leksemos sintagminiai partneriai. Ta apimtis lemia, kurie junginiai yra priimtini, nors ir originalūs, o kurie – ne. Junglumo apimtis plečiasi kūrybiškai vartojant kalbą ir taikant esamų žodžių junginius naujoms sąvokoms įvardyti (McIntosh, Halliday 1966). M. Halliday, palyginti su J. Firthu, dar labiau atskiria leksiką, gramatiką ir semantiką (Halliday 1966: 148–162). Visiems gramatika nepaaiškinamiems kalbos modeliams jis siūlo taikyti semantinį, o dar dažniau – leksinį analizės lygmenį, kitaip sakant, jei ne gramatika ir semantika, tai jokiomis taisyklėmis, tik kalbos normomis grindžiama leksika. M. Halliday skiria dvi susijusias leksinio kalbos aprašo kategorijas: kolokacijas ir rinkinius (sets), apytikriai atitinkančias struktūros ir sistemos kategorijas gramatikoje. Šios dvi leksinės kategorijos turi lemiamos reikšmės skiriant homonimus nuo daugiareikšmių žodžių. Labai besiskiriančios kolokacijos rodo žodžius esant homonimus, pavyzdžiui: bank su river, trees, steep ir su money, deposit, cheque. Tuos pačius kolokatus turintys skirtingo pavidalo žodžiai, pavyzdžiui: city ir urban priklauso bendriems dažniausiems rinkinio žodžių kolokatams, sun ir moon dažniausiai priklauso tam pačiam rinkiniui. Rinkinys gali būti apibūdintas ir statistiškai, pagal vartojimą su bright, shine, hot, light. Statistinė M. Halliday analizė davė pradžią didele tekstų visuma pagrįstiems duomenų bankams, be kurių kolokacijų tyrimas šiandien neįsivaizduojamas. Šioje srityje labiausiai pasižymėjo J. Sinclairis, COBUILD žodyno, sudaryto remiantis Birminghamo universitete sukauptu tekstynu, vyriausiasis redaktorius. Galimybė tirti žodžių junglumą labai įvairiuose ir gausiuose tekstuose bei efektyviai apdoroti gautus rezultatus atvėrė vartus naujoms įžvalgoms ir vertinimams. Viena svarbiausių – neabejotinas ryšys tarp reikšmės ir struktūros kalboje. Struktūrą J. Sinclairis supranta kaip sintaksę drauge su leksika. Jų neįmanoma atskirti nuo semantikos, o reikšmės įkūnijimas kalboje yra kur kas sudėtingesnis negu mano abstrakčiosios gramatikos šalininkai
76
1 .3. K O LO K A C I J O S S A M P R ATA
(1991: 104–108). Kitas mašininės analizės rezultatas – nustatyta neatitiktis tarp intuityvaus ir statistinio kalbos vertinimo. Vartosena menkai teatsispindi kalbinėje savimonėje. Dažniausių žodžių, vartojamų dažniausiomis reikšmėmis, kalbos jausmas neiškelia į pirmą vietą, pavyzdžiui: back Collinso anglų kalbos žodyne nurodyta pirmoji reikšmė ‘nugara’ nėra labai dažna, o statistika rodo, kad dažniausiai vartojama ‘atgal’ reikšmė, žodyne pažymėta 47 numeriu (Sinclair 1991: 39, 112). Tačiau svarbiausias dalykas – akivaizdžiai išryškėjęs faktas, jog netikėtai didelę kalbos dalį sudaro pusiau gatavos frazės, kurios, kuriant tekstą, pasirenkamos kaip vienas vienetas, kaip visuma, nors jas ir galima skaidyti į segmentus, plg.: „Didžiąją teksto dalį sudaro dažni žodžiai (common words), vartojami įprastinėse konstrukcijose. Daugelis tokių žodžių neturi savarankiškos reikšmės ar reikšmių, bet yra labai įvairių daugiažodžių konstrukcijų sandai“ (Sinclair 1991: 108). Automatinė tekstų analizė lėmė kolokacijos termino paplitimą ir jį atitinkančio objekto analizės išpopuliarėjimą. Iš tradicinės leksikologijos (Jackson 1988, Cruse 1986 ir kt.) ir automatizuotų anglų kalbos leksikos studijų (Sinclair 1970, 1987, 1988, 1991, Leech 1981, Persson 1990, Kjellmer 1982, 1984, 1991) kolokacija perėjo ir į kitas kalbotyros sritis: psicholingvistiką (Aitchison 1987), leksikografiją (Benson 1986, Cowie 1986 ir kt.), kalbų lyginimą ir vertimo teoriją (Newmark 1988), žodžių darybą (Lipka 1990: 159–170) ir teksto lingvistiką (Halliday, Hasan 1976). Ypač paplitusios kolokacijos samprata pakito, įgijo naujų bruožų. Svarbiausiuosius jų verta nors trumpai aptarti. Dėl esminio kolokacijų bruožo – žodžių vartojimo drauge, nekvestionuojamo visų šį terminą vartojusių autorių, – į vieną būrį telkiasi labai daug ir įvairių žodžių junginių. Jų junglumo priežastys taip pat įvairios. Šį nuolatinį jų vartojimą drauge lemia nekalbinė tikrovė. Žodžiai vartojami kartu, nes įvardija susijusius dalykus. Tai, anot Franko R. Palmerio, trivialios kolokacijos: dog – bark, duck – quack, horse – neigh. Kalbos vartojimo situacija, stilius, registras ar teksto žanras taip pat riboja žodžių junglumą. Paprastai drauge eina tą pačią konotaciją turintys žodžiai. Bet net ir atmetus tokias kolokacijas, dar lieka daug nepaaiškintų, kalbos tradicijos, normos, konvencijos sąlygotų žodžių derinių. Kai kurie autoriai jas ir laiko tikrosiomis kolokacijomis. Tos, F. Palmerio terminais sakant, dirbtinės (artificial) kolokacijos ir yra
77
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
įdomiausios tiek teoriniu, tiek praktiniu aspektais (Palmer 1972: 192). Antra vertus, galima pasakyti, kad trivialiųjų, tikrovę atspindinčių kolokacijų atveju žodžių partnerius galima atspėti iš jų reikšmių, o dirbtinių kolokacijų žodžiai vieni iš kitų reikšmių tiesiogiai neišvedami. Riba tarp vienų ir kitų neaiški. F. Palmeris kolokacijomis laiko ir vienas, ir kitas (1976: 96). Griežčiau kalbinius ir nekalbinius žodžių junginius skiria Alanas Cruse. Nekalbinius jis laiko semantiniais ir, kaip visi generatyvistai, jų junglumą apibūdina atrankos apribojimais (selectional restrictions). Juos lemia žodžių reikšmės ir veikia per presupozicijas, pavyzdžiui: užmušti galima tik gyvą, gerti – tik skystį, girdėti – tik garsą. Kalbinių junginių požymis – kolokaciniai apribojimai (collocational restrictions) – sąlygojami ne reikšmės centro, o periferijos. Juos pažeidus, gaunamas ne absurdiškas, o tik kalbą gerai mokančių paprastai nevartojamas žodžių derinys, pavyzdžiui: Premjero stipendija yra gana didelė. Jį pataisyti galima netinkantį žodį stipendija pakeitus sinonimu ar šiaip artimos reikšmės žodžiu (Cruse 1990: 160–163). Šias kalbines kolokacijas ir turi omenyje J. Sinclairis, kalbėdamas apie kuriant tekstus vyraujantį idiomų principą (Sinclair 1991: 110). Kai kalbinės kolokacijos tiriamos tik vienoje kalboje, dažnai jos nesiskiria nuo trivialiųjų. Kalbinė jų specifika išryškėja tik verčiant ar lyginant įvairias kalbas, pavyzdžiui: a load noise – didelis (o ne garsus) triukšmas. Kolokacijų įvairovę lemia ir nevienodai patvarus jų sandų ryšys. Daugelis tyrėjų nurodo, kad kolokacija nėra griežtai apibrėžta ir aklina siena nuo laisvųjų žodžių junginių atitverta kategorija. Ji panėšėja į kontinuumą, į skalę, kurios viename gale yra visiškai sustabarėjusios, iš atminties atgaminamos frazės, turinčios stiprų asociatyvųjį sandų ryšį (ištarus vieną kolokacijos žodį į galvą ateina tik vienas ar keli galimi jo partneriai). Tokį stiprų ryšį lemia labai ribotas junglumas – paprastai vienintelis galimas partneris. Priešingame skalės gale rikiuojasi šiek tiek junglesnės, daugiau variantų galinčios turėti, ne taip aiškiai numanomų partnerių ir todėl ne tokiu stipriu ryšiu susijusios kolokacijos. Čia jos eina pramaišiui su laisvaisiais žodžių junginiais, tačiau, nors kartojamos ne gatavos, o varijuojančios, – vis tiek kuriamos tam tikruose leksiniuose rėmuose. Taigi už kolokacijų skalės ribos yra laisvieji, ribotu ir todėl dažnu junglumu nesusaistyti žodžių junginiai, o kitame – visiškai
78
1 .3. K O LO K A C I J O S S A M P R ATA
sustabarėjusios idiomos, klišės, patarlės ir priežodžiai. Vartodamas kolokacijas, žmogus dar turi tam tikrą galimybę rinktis, keisti žodžių junginio struktūrą, vartodamas idiomas – jau ne. Kai nebegalima rinktis, įvairuoti, nebelieka ir kontrasto, o su juo – ir savarankiškos sandų reikšmės. Geras desemantizuotų žodžių junginių pavyzdys yra klišės, pavyzdžiui, politikų kalboje, decisions visuomet yra difficult, discussions – useful, precedents – dangerous, progress – real, o refusals – flat (Jackson 1988: 104). Tarpinė kolokacijų vieta tarp idiomų ir laisvųjų žodžių junginių, matyt, ir lemia laipsnišką jų pobūdį. Nevienodo stiprumo kolokatų tarpusavio ryšys yra kolokacijų klasifikavimo pagrindas. Įvairūs autoriai pateikia skirtingą skalės padalų kiekį. Anna Wierzbicka tik nurodo kelis neįtikėtinumo laipsnius: „negalimas“, „mažai tikėtinas derinys“ (Wierzbicka 1987: 21–22). A. Cruse visus galimus kontekstinius leksemų ryšius suskirsto į būtinus, tikėtinus, galimus, neįtikėtinus, negalimus. Kolokacijas jis skiria dviem pirmiesiems ryšio tipams (Cruse 1986). S. Greenbaumas veiksmažodžių intensyvumą žyminčius kolokatus pagal informantų pateiktus duomenis dalija 10 % riba: iki jos eina atsitiktiniai kolokatai, už jos – pagrindiniai (Greenbaum 1970: 56–57). Čia išsamiau aptarsime Görano Kjellmerio sudarytą trijų pakopų klasifikaciją. Šis švedų anglistas, daug tyrinėjęs Browno universiteto mašininio tekstyno (Brown corpus) fiksuotas kolokacijas, skiria sustabarėjusias frazes (fossilized phrases), kiekvienas jų žodis implikuoja kitą: jei Cocker, tai Spaniel, ir atvirkščiai; jei Anno, tai Domini, ir atvirkščiai. Cituotųjų kolokacijų žodžiai numanomi abipus: iš kairės ir dešinės, bet čia įeina ir iš vienos pusės atspėjami, pavyzdžiui: Gordian knot, Morse code, Artesian well, bonsai tree. Šių frazių lengviau atspėjamas antrasis žodis: kai sakome artezinis, suprantame šulinys, kai sakome šulinys, nenumanome vieno taip artimai susijusio žodžio, jų gali būti kelios dešimtys. Iš kairės pusės atspėjamų žodžių anglų kalbos kolokacijose yra mažiau: ad infinitum, open sesame, arms akimbo. Vadinamųjų apstabarėjusių frazių (semi-fossilized phrases) skiriamasis požymis – vartojamas vienas jų žodis ir dėl to asocijuojasi su keliais kolokatais: caesarian operation – caesarian section, nodding acquaintance – nodding terms, Oedipus complex – persecution complex. Čia dešinėje pusėje vyrauja atspėjami žodžiai. Pirmųjų dviejų tipų frazes paprastai sudaro savarankiški,
79
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
pavadinantys žodžiai. Trečiasis tipas – kintamosios frazės (variable phrases) – yra pats dažniausias. Jį sudaro ir savarankiški, ir tarnybiniai žodžiai, kurių jungtis nėra labai stipri. Tekste plika akimi, neištyrus vartojimo dažnumo, jos nepastebimos, už tai sudaro esminę leksikono dalį, o mokantis kalbą išmokstamos anksčiau už sustabarėjusias. Dažniausi blokai, sudarantys kuriamą tekstą, yra šie: glass of water, in the years to come, classical music, close friend, a number of, for a change, must admit that, to apply to ir daugelis tūkstančių kitų. Reikia pridurti, kad šie frazių tipai negali būti aiškiai atskirti, jie sumišę ir susipynę. Be to, frazės klasifikuojamos tik pagal jų žodžių vartojimo drauge dažnumą, todėl čia įeina ir idiomos, ir nekalbine tikrove pagrįsti žodžių junginiai, pavyzdžiui: glass of water dažniau vartojamas nei cup of water, nes anglai paprastai geria vandenį iš stiklinių. Tačiau didžiuma frazių – kalbinės kolokacijos (Kjellmer 1991: 111–128). Dar įvairiau suprantama ir aiškinama kolokacijos struktūra: iš kokių žodžių – savarankiškų ar tarnybinių – ji gali būti sudaryta, koks jų tarpusavio ryšys. Kad esminio kolokacijų požymio – žodžių vartojimo drauge – nepakanka, išryškėjo tiriant Browno tekstyną. Vien tik mechaniškai žiūrint iš drauge vartojamų žodžių dažnumo į kolokacijas pakliūva visai atsitiktiniai žodžių junginiai: although he, todėl būtinas dar vienas kriterijus – gramatinė žodžių junginio struktūra. Tik gramatiškai susiję dažnai drauge vartojami žodžiai gali būti laikomi kolokatais. Reikalaujamas dažnumas palyginti nedidelis – gramatiškas žodžių junginys tapačia forma 1 milijono žodžių tekstų sankaupoje turi pasirodyti bent du kartus. Junginio žodžiai gali būti tiek savarankiški, tiek tarnybiniai. Atsakymą į klausimą, ar gali įeiti tarnybiniai žodžiai, ar ne, – lemia tyrimo metodai. Į automatizuotai rinktas kolokacijas jie įeina, į intuityviai atpažįstamas – ne. Iš pradžių kolokacijomis buvo laikomi tik savarankiškų žodžių junginiai, dabar jų samprata labai išsiplėtė, nes jau kalbama ir apie vien tik iš tarnybinių žodžių sudarytą kolokacinį rėmą (Renouf, Sinclair 1991: 128–145). Beje, iš pradžių buvo postuluojamas lygiavertis, abipusis kolokacijos žodžių ryšys, plg.: J. Firtho – „mutual expectancy“, F. Palmerio – „mutual determination“, A. Cruse‘o – „mutually selective“. Tačiau iš G. Kjellmerio klasifikacijos aišku, jog abipusiu ryšiu susiję gali būti tik vieną nuolatinį partnerį turintys žodžiai, o tokių yra labai nedaug, pavyz-
80
1 .3. K O LO K A C I J O S S A M P R ATA
džiui: spic and span, toil and moil. Kitų kolokacijų žodžiai nelygiaverčiai, nes vieno tikimybė pasirodyti šalia kito yra didesnė negu atvirkščiai: rancid vartojamas tik su butter, o butter – su daugeliu kitų. Tą tikimybę lemia atskirai paimtų žodžių vartojimo dažnumas. Rečiau vartojamas žodis yra labiau prisirišęs prie dažniau vartojamo negu atvirkščiai. Pagal tai J. Sinclairis skiria kylančias (upward) ir krintančias (downward) kolokacijas. Pirmosios – tai dažnesnio žodžio junginys su retesniu, pavyzdžiui: her back, antrosios – atvirkščiai stared back (Sinclair 1991: 115–116). Kai tyrimo objektas yra ne visa kolokacija, o atskirai paimto žodžio junglumas, žodžių tarpusavio ryšys nėra toks svarbus. Pasirenkamas žodis (node) ir tiriami jo partneriai (collocates), esantys tam tikru, dažniausiai 5–6 žodžių atstumu (span). Nors kolokatai gali atsidurti ir kitame sakinyje, tačiau paprastai jie būna ne toliau kaip už 4 žodžių. Patys dažniausi partneriai drauge su tiriamuoju žodžiu ir sudaro to žodžio kolokacijas. O pasirinkti galima bet kokį žodį, tačiau iki šiol daugiau tirti kalboje dažnai vartojami žodžiai. Atskirų tekstų dažnų žodžių kolokacijų rinkiniai vadinami konkordansais. Iš čia trumpai aptartų požymių kolokacija išryškėja kaip savarankiškas tyrimo objektas, tam tikras kalbos vienetas. Daug dažniau kolokacija yra tik tyrimo priemonė, o ne tikslas. Tuomet ji taikoma žodžių vartosenai ir jų reikšmei tirti. Konteksto ir reikšmės sąveikos bei santykio problema buvo ir liko karštų diskusijų objektas. Įvairiais laikais nuo vieno kraštutinumo – tvirtinimo, jog žodžių reikšmę nusako jo distribucija, – buvo metamasi į kitą ir teigiama, kad žodžio reikšmė lemia jo kontekstą (Palmer 1977, Lyons 1977, Leech 1981). Čia nesigilinsime į šią problemą, tik apibūdinsime požiūrį į kolokaciją, remdamiesi šiais prieštaringais tvirtinimais. Nors tarp dažnai kartu vartojamų žodžių reikšmių esama ryšio, tačiau teigti, jog vieno iš narių reikšmė lemia kito pasirinkimą, būtų pernelyg kategoriška, mat esama daug semantine sąveika nepaaiškinamų kolokacijų (ypač tuo atveju, jei kolokacijos apima ir tarnybinius žodžius). Dar niekas išsamiai neatsakė į klausimą, kodėl ir kaip atsiranda pastovios žodžių samplaikos. Kita vertus, kolokacija kaip tipiškas kontekstas padeda analizuoti reikšmes. Kolokacija, kaip ir visa distribucija, padeda skirti daugiareikšmio žodžio reikšmes, sinonimų reikšmių niuansus bei vartosenos ypatumus. Kolokacija pati viena labai tinka konotacijoms tirti. Pagal dažniausiai kartu einančiais būdvardžiais žymimas
81
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
teigiamas, neigiamas ar neutralias ypatybes buvo tirtos keturių angliškų žodžių – girl, boy, man, woman – kolokacijos. Analizė rėmėsi prielaida: paplitusios kolokacijos rodo leksemų referentų vertinimą. Iš tiesų paaiškėjo, kad žodžiai girl, woman skiriasi vyraujančiomis teigiamomis (mergaitės) ir neigiamomis (moters) kolokacijomis. Vyriškos lyties atstovų vertinimas taip pat skyrėsi, tik čia dažniau su neigiamų konotacijų būdvardžiais jungėsi žodis boy, su teigiamų – man. Per kolokacijas išryškėjantis požiūris, teigia autorius, atskleidžia sociolingvistines priežastis, dėl kurių teigiamos konotacijos žodžiai girl, man vartojami kur kas dažniau negu neigiamos ir išstumia pastaruosius iš kontekstų, tinkančių jiems pagal referentus (Persson 1990: 50–71). Atskirai reikia aptarti kolokacijos ir kalbinės (dar kitaip – mirusios, išblėsusios) metaforos santykį. Ir kitu – reikšmės – aspektu tiriant kolokacijas, matyti, kad jas sudaro labai įvairūs žodžiai: konkretūs ir abstraktūs, vartojami tiesioginėmis ir perkeltinėmis reikšmėmis. Kolokacijas tyrę kalbininkai reikšmės tipų paprastai nekomentuoja, jiems svarbi tik bendra įprastinė jų vartosena, tačiau iš cituojamų pavyzdžių aiškėja, kad drauge su konkrečiais tiesioginių reikšmių žodžiais eina ir abstraktūs perkeltinių reikšmių žodžių junginiai. Jie – kalbinės metaforos – aptariami ir atskirai. Tačiau tuomet dėmesys kreipiamas į jų metaforiškumą, o ne į bendrą dažną vartoseną. Vienas iš nedaugelio kolokacijas-metaforas aptaręs A. Cruse laiko jas jau nebe kolokacijomis, o idiomomis. „Kolokacijų semantinė integracija ir tarpusavio priklausomybė yra didesnė, jei vienas ar daugiau kolokacijos narių yra riboti junglumo ir jei jis vartojamas kitokia reikšme negu neutraliuose kontekstuose, pavyzdžiui: heavy drinker, a car heavy on petrol“ (Cruse 1986: 41–45). Metaforinės kolokacijos skiriasi nuo idiomų tik iš atskirų jų dėmenų suvokiama reikšme. Išverstos į kitą kalbą pažodžiui metaforos gali atrodyti keistos, bet ne absurdiškos kaip pažodinės idiomos. Šios anglosaksų lingvistų darbams skirtos apžvalgos pabaigoje reikėtų pažymėti, kad terminas kolokacija, kaip ir juo žymimas kalbos vienetas, atsirado ir kitų šalių kalbotyroje: vokiečių, prancūzų, švedų. O pačioje anglų kalboje žodis kolokacija taip paplito, kad iš termino, žyminčio įprastinį bendrą vartojimą, tapo apskritai norminį žodžių junglumą reiškiančiu žodžiu, plg.: „collocate – combine in a way in a way characteristic of language: weak collocates with tea but feeble does not,
82
1 .3. K O LO K A C I J O S S A M P R ATA
collocation – coming together, collocating of words: strong tea, heavy drinker, by accident, so as to“ (New Webster‘s Dictionary of the English Language 1988). Rytuose, Sovietų Sąjungoje, pastovių žodžių samplaikų analizės raida buvo kitokia. Jos ištakos – irgi Vakarų Europoje, o pradžia – Charley Bally pastebėti ir nuo frazeologizmų atskirti pusiau laisvi žodžių junginiai. Prancūzų lingvistas taip pat nurodė, kad tokiose frazeologinėse grupėse vieni žodžiai lemia kitų parinkimą ir reikšmę, tačiau į tų žodžių tarpusavio sąveiką nesigilino ir priskyrė jų vartosenos ypatumus kalbos tradicijai (Балли 1961: 92–95). Sekdamas juo, atskirą tarpinį žodžių junginių tipą skyrė Vladimiras Vinogradovas. Tik jis, kitaip negu Ch. Bally, samplaikose įžvelgė ne tik kalbos tradiciją, vartosenos ypatumus, bet ir vidinius kalbos dėsnius. Tačiau daugiausia V. Vinogradovą ir daugelį kitų jo pasekėjų domino pastoviųjų žodžių junginių, šliejamų prie frazeologizmų, klasifikavimo problemos (Виноградов 1973). Visai į kitą pusę, laisvųjų žodžių junginių link, buvo pastūmėta mus dominančių samplaikų analizė Maskvos lingvistų A. Žolkovskio, I. Melčiuko ir Jurijaus Apresjano sukurtame kalbos modelyje „prasmė – tekstas“. Čia teksto žodžių junglumas aiškinamas sintaksiškai susijusiuose žodžiuose pasikartojančiais semantiniais komponentais. Maskvos semantikų nuopelnas tas, kad jie sukūrė formalizuotą aprašą kelioms dešimtims sintagminių ir paradigminių žodžių ryšių tipų, jų pačių pavadintų leksinėmis žodžių funkcijomis. Leksinė funkcija – tai žodžio ar žodžių junginio X paradigminė ar sintagminė funkcija žodžiui ar jų junginiui Y. Kitaip sakant, tai abstrakti, tipinė, daugeliui žodžių būdinga reikšmė. Ji panaši į gramatinę reikšmę, bet kiekvienu atveju reiškiama kitais žodžiais. Tipiškas funkcijos pavyzdys – funkcija Magnum (labai, dideliu laipsniu). Šią funkciją turi įvairių kalbos dalių žodžiai: Magn (6pюнет) – жгучий, (дурак) – круглый, (oшибка) – грубая, (тишина) – кромешная, (дисциплина) – железная (Апресян 1974: 75). Leksinės funkcijos sudaro tarsi žodžių junglumo anketą, iš kurios paaiškėja ne tik galimi partneriai, bet ir sintaksinė bei morfologinė jų raiška. Tokie formalizuoti žodžių aprašai davė pradžią rusų kalbos junglumo žodynui (Apresjan, Меlčiuk, Žoskovskij 1973: 411–438). Tik jame, panašiai kaip ir valentingumo žodynuose, pateiktas bendras žodžių junglumas (nelaisvąjį žodžių junginį neatskiriant nuo laisvojo). Leksinės
83
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
funkcijos patogios tuo, kad gali būti taikomos bet kokiems, ne vien predikatiniams žodžiams ir kad, be sintagminių partnerių, dar nurodo ir paradigminiais ryšiais susijusius žodžius (Апресян 1974: 45–50). Išimtinai vien tik nelaisvuosius žodžių junginius yra tyrusi V. Telija (Телия 1980: 250–319). Tradiciškai ji laiko juos frazeologijos dalimi, nors ir smarkiai besiskiriančia nuo kitų frazeologinių vienetų. V. Telijos pateikta semantinė bei struktūrinė rusų kalbos nelaisvųjų žodžių junginių analizė iki šiol yra vienintelė tokia nuodugni, todėl ir aptarsime ją išsamiau. Nelaisvųjų žodžių junginių semantikos aiškinimas remiasi sietinių reikšmių samprata. Sietinių reikšmių žodžiai (cвязные значения слов), panašiai kaip idiomos, pavadina ir gali eiti ženklu tik drauge, atskirai paimti jie yra nesavarankiški. Be to, tų žodžių junginys nėra jų reikšmių suma, drauge eidami jie įgyja visai naują reikšmę (Телия 1980: 253). Nelaisvųjų žodžių junginių nariai, kitaip nei idiomos, netenka tik dalies savo savarankiškumo. Vieni junginio žodžiai yra pagrindiniai, lemiantys (опорные, ключевые). Lietuviškai juos būtų galima vadinti pamatiniais, juoba ir pati autorė žodžių junginius lygina su žodžiais-dariniais. Jie dalyvauja nominuojant tiesioginėmis, anot autorės, laisvosiomis reikšmėmis (свободные значения). Kiti žodžiai vartojami perkeltinėmis reikšmėmis, grindžiamomis pamatinių žodžių semantikos. Taigi sietinių reikšmių žodžiai yra antrinės nominacijos, arba reikšmės, perkėlimo (вторичная косвенная номинация) rezultatas. Kuo ypatinga ši reikšmės rūšis? Nuo seno įprasta skirti mažiausiai du šalutinių reikšmių tipus: šalutinės tiesioginės ir perkeltinės. Labiausiai jie skiriasi savarankiškumu. Šalutinės tiesioginės reikšmės žodžiai tikrovės reiškinius pavadina patys vieni, o jų signifikatas turi visus būtinus požymius tikrovės dalykui įvardyti. Šalutinės perkeltinės reikšmės žodžiai pavadina tik eidami drauge su kitu, pamatiniu žodžiu. Taigi šis antrinės nominacijos tipas ne atskirus žodžius, o jų junginius paverčia naujais kalbos ženklais (Телия 1980: 258). Dar šalutinės perkeltinės reikšmės nuo tiesioginių, anot V. Vinogradovo, skiriasi ribotu junglumu, jiems būdinga frazeologine aplinka ir atotrūkiu nuo kitų to paties daugiareikšmio žodžio reikšmių. Plyšys, atsiradęs daugiareikšmio žodžio reikšmių sistemoje, aiškinamas tuo, kad reikšmės perkėlimo pagrindas yra ne kuris nors
84
1 .3. K O LO K A C I J O S S A M P R ATA
pirminės reikšmės požymis, o konotacija, atsiradusi dėl nuolatinių kalbėtojams kylančių, su pirminės reikšmės denotatu susijusių asociacijų (Виноградов 1953: 12–26). Geras pavyzdys galėtų būti perkeltinės spalvų reikšmės (черная зависть, зеленaя тоска). Būtent konotacijos lemia sietinių reikšmių, dažniausiai metaforinių, atsiradimą, pobūdį ir junglumą: „Kalbinė metafora minta visuotinai paplitusiomis konotacijomis, atsispindinčiomis kalbinės bendruomenės kultūrines, istorines ir empirines asociacijas, todėl ji lengvai paplinta toje visuomenėje“ (Телия 1980: 288). Pavyzdžiui, žodžiai дружба, знакомство, связи, сотрудничество, implikuoja fizinį subjektų sąlytį, kuris įvardijamas perkeltine, sietine būdvardžio тесный reikšme, kai jis vartojamas su šiais daiktavardžiais. Taigi kolokacijos lemia žodžių junglumą, o nenorminio junglumo atvejai tik paryškina ir patikslina pamatinių žodžių konotacijas: интересы тесного кpуга лиц, bet тесные интересы; разговоры в тесном кругу, bet тесные разговоры. Panašiai mintys (мысли) rusų kalboje konotuoja svorį (легкие, тяжелые), švarą (чистые, грязные), gyvumą (пришли в голову, выскочили из головы). Trumpai tariant, nelaisvųjų žodžių junginių semantinė samprata grindžiama kategoriniu sąsajos požymiu, atspindinčiu žodžių gebėjimą jungtis tik su aiškiai apibrėžta ir ribota žodžių grupe (Телия 1980: 157). Pateikusi semantinį nelaisvųjų žodžių junginių apibrėžimą ir paaiškinusi jų atsiradimą, V. Telija toliau tik bendrais bruožais nusako jų reikšmių ypatumus. Kadangi sietinės priklausomųjų žodžių reikšmės įprasmina pamatinių žodžių konotacijas, būtent šiems autorė siūlo skirti daugiausia dėmesio, nors pati tik apsiriboja nuorodomis, kad pamatiniai žodžiai yra abstraktūs daiktavardžiai, dažniausiai reiškiantys neregimo, pojūčiais nesuvokiamo pasaulio dalykus. Kur kas išsamiau aptariama ir pagrindžiama pamatinių žodžių pirmenybė, kai jie sudaro junginius. Argumentas, o ne predikatas parenkamas pirma, jis nulemia konkretų požymį reiškiantį žodį. Šį faktą akivaizdžiai rodo sinonimų junglumo skirtumai: дружба, знакомство до гроба; тесная, прочная, крепкая, неразрывная, пламенная, нежная, верная дружба, знакомство; короткое знакомство, дружба; подрывать, нарушать, беречь, укреплять дружбу, знакомство (Телия 1980: 263). Pagrindinė visų sietinių reikšmių klasifikacija taip pat remiasi semantiniu ir funkciniu kriterijumi. Skiriamos aprašomosios, analitinės
85
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
reliacinės ir vertinamosios reikšmės pagal dvi jų tendencijas: leksinędeskriptyvinę ir analitinę-struktūrinę. Pirmoji išryškėja, kai nematomojo pasaulio abstraktams pagal analogiją suteikiami konkrečių daiktų požymiai, motyvuotai, pagal ryškias pamatinių žodžių konotacijas, parenkami konkrečią leksinę reikšmę turintys žodžiai. Ši tendencija visai suprantama, nes abstraktų pasaulis neapčiuopiamas ir nevaizdingas, jį reikia konkretinti, ypač norint perteikti subtilius reikšmės niuansus. Antroji, priešinga tendencija žymi sietinių reikšmių polinkį desemantizuotis, abstraktėti, reikšti vieną vienintelį pamatinio žodžio požymį. Būdami antriniai semantiniai predikatai ir žymėdami požymio požymį, desemantizuoti sietinių reikšmių požymiai sieja vien sintaksiškai, plg. pirmąją ir antrąją tendenciją žyminčius žodžių junginius: лелеять / иметь надежду, ввязываться / вступать в спoр. Juos lengvai galima pakeisti vienu žodžiu: cnoрить, надеяться. Autorės pateiktieji reikšmių tipai išdėstyti analitinės raidos linkme. Iš pradžių analizuojamos konkrečios deskriptyvinės sudėtinių terminų reikšmės (почечная лоханка, ушная раковна, коробка скоростей), tačiau ribojamasi nuo laisvųjų žodžių junginių su ribota referencija, dažnai vartojamų drauge dėl labai riboto vieno iš žodžių junglumo, pavyzdžiui, проселочная (о дороге), окладистая (о бороде), спертый (о воздухе). Toliau aptariamos abstraktesnės, analitiškesnės bendrųjų vardų reikšmės. Autorė teigia, jog, perkėlus reikšmę, dingsta kai kurie aprašomieji semantiniai komponentai ir sietinių reikšmių žodžiai tampa panašūs į žodžių darybos formantus. Galop analizuojami tipiški analitiški, dažniausiai veiksmažodiniai žodžių junginiai. Gramatinis V. Telijos požiūris ryškėja ir iš struktūrinio sietinių reikšmių žodžių skirstymo pagal kalbos dalis. Reikšmės ir struktūros ryšį autorė aiškina taip: „Kadangi kalbinė forma visada yra semantiškai informatyvi, tai ir nelaisvųjų žodžių junginių formalioji gramatinė pusė nėra nesvarbi formuojantis ir funkcionuojant sietinėms reikšmėms, nes ji nustato jų sintaksines pozicijas ir kartu – bendrus tikrovės įvardijimo būdus“ (Телия 1980: 288). Struktūrinis autorės požiūris dar labiau išryškėja aiškinant nelaisvųjų žodžių junginių atsiradimo priežastis. Viena svarbiausių priežasčių autorės vadinama gnoseologine, tačiau jai skiriama mažiausiai dėmesio, tik konstatuojama, kad „[...] metafora nuolat kuria nematomąjį pasaulį
86
1 .3. K O LO K A C I J O S S A M P R ATA
žodžiams, įvardijantiems predikatinę leksiką“ (Телия 1980: 279). Už poreikį pavadinti kur kas svarbesnė nelaisvųjų žodžių junginių atsiradimo priežastis, anot autorės, yra kalbos struktūra apskritai, ypač vadinamoji gramatinė metafora. Ji atsiranda gramatiškai sudaiktinus predikatus, sudaiktavardinus veiksmažodžius. Iš bendrašaknių rusų kalbos žodžių draugas, draugauti, draugystė tik pastarasis yra apaugęs sietinių reikšmių žodžiais. Taigi gramatinės metaforos pagrindas yra sintaksinė transpozicija – nominalizacija. „Nelaisvųjų žodžių junginių atsiradimas ir egzistavimas labai susijęs su jos gramatika; jei kalboje yra būdų versti veiksmažodžius ir būdvardžius į daiktavardžius, tai joje neišvengiamai atsiras nelaisvieji žodžių junginiai kaip duoklė jos gramatikai [...]“ (Телия 1980: 278). Po sintaksine transpozicija slypi reguliari gramatinė metafora, o jei tą reiškinį dar lydi ir leksinė derivacija, t. y. reikšmės perkėlimas, atsiranda leksinė gramatinė metafora. Formalus jų pavidalas – sietinių reikšmių žodžių junginiai. Veikiau struktūrinę negu semantinę žodžių junginių analizę V. Telija baigia išvada: „Sietinių reikšmių produktyvumas kalboje priklauso nuo jos struktūrinio tipo, o konkrečiai – nuo jos žodžių darnumo, nuo galimybių sudaiktavardinti, nuo analitiškumo ar sintetiškumo laipsnio“ (Телия 1980: 279). Sietines reikšmes ji visų pirma laiko kalbine, t. y. struktūrine, neišvengiamybe. Kas be ko, sietinių reikšmių žodžiai papildo ekspresyviosios leksikos išteklius, įvardija nematomųjų pasaulių reiškinius. Taigi Vakaruose ir Rytuose tiriamų pastovių žodžių samplaikų analizė skiriasi. Vakarietiškoji kolokacijos samprata apima didesnį ir įvairesnį žodžių junginių būrį: konkrečius ir abstrakčius, tiesioginių ir perkeltinių reikšmių, savarankiškus ir tarnybinius žodžius, – jei tik jie tenkina vieną sąlygą – yra nuolat vartojami drauge. Tyrėjus domina ne kolokacijos gramatinė struktūra ar vieno žodžio prioritetas, o vartojimo dažnumas ir dėl jo atsiradęs kintamo stiprumo leksinis bei semantinis ryšys. Sietinės reikšmės, analizuotos Rytuose, tėra tik perkeltinės savarankiškų žodžių reikšmės. Nors į jas įeina ir konkretūs sudėtiniai terminai, bet vyrauja abstraktūs, žmogaus psichiką ir kitus dalykus įvardijantys žodžiai, sudarantys žodžių junginio pagrindą. Čia neaptariamas besijungiančių žodžių ryšio tvirtumas, tik galimas ar negalimas junglumas ir aiški hierarchinė žodžių junginio struktūra, dėmesys gramatinei jo
87
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
sandarai. Visi šie ypatumai rodo visai kitokį požiūrį į pastovias žodžių samplaikas. Koks tyrimo aspektas, metodas ar kryptis geriausiai tiktų analizuojant lietuviškąsias samplaikas – sunku pasakyti, tačiau išmanyti reikėtų jas visas.
1.3.1.2. Šiandienis požiūris į kolokaciją Kolokacija yra vienas dažniausiai vartojamų tekstynų lingvistikos terminų, plačiai paplitęs ne tik šioje, bet kitose kalbotyros ar su ja susijusių mokslų srityse. Tačiau šio termino populiarumas susijęs su jo neapibrėžtumu, nes jis „skirtingiems žmonėms reiškia skirtingus dalykus“ (Van der Meer 1998: 315). Tad prieš pradedant taikyti šį terminą kaip įnagį praktiniams tikslams, būtina apibrėžti jį tiksliau. Nuo pat garsiojo J. Firtho posakio „you can know the word by the company it keeps“ („pasakyk, su kuo esi vartojamas, žodi, ir aš pasakysiu, kas tu“) atsiradimo ir pirmąkart jo pavartoto kolokacijos termino, kolokacijos sąvoka niekada nebuvo griežtai apibrėžta. Jos esmę sudarė „įprastinis dviejų žodžių vartojimas drauge“ (Sinclair 1996: 25). Nei kolokacijos forma, nei turinys nebuvo ribojami definicijų, nors šiaip leksinio turinio pirmenybė prieš gramatinę raišką postulavo ne vienas kolokacijos terminą vartojęs autorius. Ta pirmenybė buvo suvokta kaip kolokaciją sudarančių sąvokų gebėjimas įgyti įvairialypę kalbinę raišką, pavyzdžiui, išlikti, išliekantis, išlikdavo, išliekamumas atmintyje arba lavinti atmintį, atminties lavinimas, išlavinta ar išlavėjusi atmintis. Kalbinių formų įvairove pasižyminčių žodžių junginių laikymas kolokacijomis neužkerta kelio jomis laikyti ir sustabarėjusios formos frazių, tuo parodant, kad ne forma šiuo atveju vaidina pagrindinį vaidmenį. Kolokacijos termino neapibrėžtumą lėmė ir neaiškios kolokacijomis vadinamų žodžių junginių valdų ribos ištisinėje ir laipsniškai pasikeičiančioje skalėje: laisvieji žodžių junginiai ------------- kolokacijos ----------- idiomos Mat nusakyti, ką jau laikyti kolokacija, o ką vis dar laisvuoju žodžių junginiu iš vienos pusės, arba ką laikyti kolokacija, o ką jau idioma iš kitos pusės kiekvienu konkrečiu atveju nėra lengva. Taigi kyla savaime suprantamas klausimas, ką laikyti kolokacija? Kaip dažnai turi būti drauge vartojami žodžiai, kiek sustabarėjusi turi būti formalioji jų raiška, kad
88
1 .3. K O LO K A C I J O S S A M P R ATA
žodžių junginys būtų laikomas kolokacija? Atsakymas į šį klausimą yra svarbus ne vien teoriniu požiūriu, ne vien tik tam, kad būtų pateisintas termino kolokacija vartojimas, bet dar ir praktiniu aspektu, nes kiekvienam leksikografui svarbu žinoti, kuriuos tipiškus aprašomojo žodžio vartosenos atvejus pateikti žodyno straipsnyje. Kolokacijos kaip termino neapibrėžtumas verčia kai kuriuos kalbininkus siūlyti arba visai verstis be šio termino (Čermàk 1998: 282–283), arba susiaurinti kolokacijos sampratą. Toliau ir pateikti šio termino vartosenos apribojimai. Esama kelių būdų, padedančių nustatyti vartojamo termino reikšmę. Vienas jų – pateikti ir palyginti įvairių autorių skirtingus kolokacijos apibrėžimus, pavyzdžiui, „… leksinės kolokacijos terminas čia vartojamas specialiam, idiosinkratiškam ryšiui tarp žodžių nusakyti“ (Grefenstette 1996: 94). Tačiau įvairių, dažnai prieštaringų apibrėžimų rinkinys vargu ar padės išsiaiškinti šio termino esmę, o ką jau besakyti apie juo įvardijamą sudėtingą kalbinį reiškinį. Kitas būdas kolokacijos kaip termino reikšmei ištirti būtų – laikyti šį daiktavardį pagrindiniu žodžiu ir surinkti tipiškus jo vartojimo kontekstus, kitaip sakant, kolokacijos kolokacijas, pagal kuriuos ir būtų galima spręsti apie žodžio reikšmę. Anglų kalba parašytuose teoriniuose darbuose atributinių kolokacijos kolokatų esama daug ir įvairių: restricted, significant, regular, distinctive, typical, bound, infrequent, single, anomalous, variable. Šie pažyminiai atskleidžia kolokacijos sampratų abstraktumą bei įvairovę ir parodo, kad šis terminas vartojamas kone kiekvienam prasmingam žodžių junginiui pavadinti (Čermàk 1998: 282). Be to, pažyminiai implikuoja, jog vienos kolokacijos gali būti tipiškesnės už kitas, vadinamas vienetinėmis ar net anomaliomis. Tipiška arba reikšminga (significant) kolokacija laikoma tokia, kurios nariai drauge vartojami dažniau nei atskirai paimtas jų vartojimo dažnumas ir teksto, kuriame jie vartojami, ilgis leistų tikėtis (Sinclair 1996: 25). Trečioji termino kolokacija apibrėžimo galimybė – išvardyti ir aptarti kolokacijomis vadinamiems žodžių junginiams taikomus apribojimus. Čia ji ir bus panaudota. Kolokacijomis visų pirma laikomi prasmingi ir gramatiški žodžių junginiai. Tai conditio sine qua non, reikalavimas, kurio laikosi visi, tačiau eksplicitiškai įvardija tik kai kurie autoriai, pavyzdžiui, U. Heidas, G. Kjellmeris. Įtraukti šį reikalavimą į kolokacijoms keliamų sąlygų
89
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
sąrašą paskatino pastarųjų dešimtmečių kompiuterinės kolokacijų gavimo iš tekstyno technologijos, automatiškai randančios dažnai kartu einančių visiškai atsitiktinių ir neprasmingų žodžių derinių. Jie nėra laikomi kolokacijomis ir peržiūrint kompiuterio pateiktus sąrašus iš jų braukiami. Kolokaciją sudaro bent du nominatyviniai ir neribotas skaičius nenominatyvinių žodžių (Heid 1998: 302). Šio reikalavimo paisantys autoriai apsiriboja vadinamosiomis leksinėmis kolokacijomis, o vien iš tarnybinių žodžių sudaryti žodžių junginiai lieka už jų analizės objekto ribų. Tačiau pastarieji taip pat susilaukia kai kurių autorių dėmesio, ypač kai sudaro rėmines konstrukcijas prasminiams žodžiams įterpti (Renouf 1991, Benson 1986). Svarbiausias kolokacijas apibūdinantis požymis, kartu ir labiausiai lemiantis jų neapibrėžtumą, yra įprastinis kai kurių leksemų vartojimas drauge. Šis reikalavimas nėra pakankamas, norint kolokacijas atskirti nuo nekolokacijų, t. y. kitų žodžių junginių, kurių leksemos taip pat vartojamos drauge, pavyzdžiui, idiomų, klišių, mandagumo frazių. Todėl kai kurie kalbininkai nurodo kitus papildomus kriterijus, leidžiančius susiaurinti ir apriboti kolokacijos termino vartojimo sritį. Jie siūlo atsiriboti nuo tų dažnai kartu vartojamų žodžių, kurių junglumą yra nulėmę nekalbiniai veiksniai, t. y. tikrovėje besiderinantys dalykai, pavyzdžiui, rodyti veidą vs. rodyti dėmesį, pilkas paltas vs. pilkas gyvenimas. Tikrosios kolokacijos, kitaip nei dėl tikrovės reiškinių derėjimo padažnėję laisvieji, taigi trivialūs žodžių junginiai, yra nenusakomos, pagrindinio žodžio junglumo partneriai remiantis nekalbinės tikrovės žiniomis yra nenuspėjami. Mokantis užsienio kalbų tikrąsias kolokacijas sunkiausia išmokti, nes jos negali būti generuojamos pažodžiui verčiant iš gimtosios kalbos. O jei taip atsitinka, rezultatas yra nors ir gramatiškos, bet neįprastai skambančios frazės, plg. to love dearly – karštai (pažodžiui – hotly) mylėti. Todėl kalbų lyginimas šiuo atveju laikomas patikimu tikrųjų kolokacijų identifikavimo kriterijumi. Šios žodžių junginių skirtybės buvo pastebėtos ir kiek kitaip įvardytos generatyvistų, kurie skyrė semantinius ir leksinius leksemų junglumo apribojimus (Palmer 1981: 133–134). Semantiniai apribojimai yra universalūs ir iš anksto nuspėjami, nes atsiradę dėl žodžiais įvardytos nekalbinės tikrovės (valgomi tik valgytini, geriami – tik skysti, liečiami –
90
1 .3. K O LO K A C I J O S S A M P R ATA
tik apčiuopiami dalykai). Jų nepaisymas duoda absurdiškus, negramatiškus sakinius. Leksiniai apribojimai negali būti nuspėti iš anksto, jie neuniversalūs, o nukrypimai nuo jų vertinami ne taip kategoriškai kaip nukrypimai nuo semantinių, taigi ne pagal priimtinumo principą taip / ne, bet daugiau / mažiau. Leksiniai apribojimai, kurie ir laikytini tikrųjų kolokacijų junglumo pagrindu, yra ne griežtų taisyklių, o tendencijų reikalas. Jei spręstume pagal esamus kitų kalbų – čekų, danų, vokiečių – kolokacijų žodynus (Čermàk 1998: 287, Nimb 1996, Heid 1998), demarkacinė linija, skirianti tikrąsias ir trivialiąsias kolokacijas, arba, kitaip pasakius, leksinius ir semantinius apribojimus, daugeliu atveju sutampa su abstrakčiųjų ir konkrečiųjų daiktavardžių junglumu ir vartosena. Kolokacijos, kurių pagrindą sudaro abstraktieji daiktavardžiai, gali būti laikomos tikrosiomis, nemotyvuotomis, o pastovūs junginiai su konkrečiaisiais daiktavardžiais paprastai remiasi nekalbine tikrove ir yra trivialūs. Kaip ir galima tikėtis, dažnai kartu vartojami žodžiai paprastai, nors ne visuomet, eina tam tikra pastovia gramatine forma ir todėl kalboje egzistuoja kaip „pusiau gatavos frazės, kalbos vartojų pasirenkamos kaip atskiras kalbinis vienetas“ (Sinclair 1991: 110). Dėl formos stabilumo kolokacijos primena idiomas, bet nuo pastarųjų jas skiria didelis atskirų jos sandų prasminis savarankiškumas, o apie idiomas šito negalima pasakyti. Įprastiniai nemotyvuoto junglumo, pusiau gatavi prasmingi ir gramatiški bent dviejų prasminių žodžių junginiai pasižymi dar vienu bruožu – arbitralumu. Tiesioginio ryšio su pavadinamąja tikrove nebuvimas lemia tai, kad ne tik skirtingose kalbose to paties žodžio junglumas smarkiai skiriasi, bet net ir toje pačioje kalboje vieno kolokacijos nario negalima pakeisti kitu, jam sinonimišku, nerizikuojant, kad pasakyta frazė skambės neįprastai, pavyzdžiui, laikas eina, bėga, slenka, bet ne *žingsniuoja, skuodžia, šliaužia. Arbitralumas reiškiasi ir kolokacijų nebuvimu ten, kur jų galima tikėtis (Van der Meer 1998: 315). Taigi kolokacijomis laikytini arbitralūs įprastiniai žodžių junginiai, tiesiogiai neatspindintys nekalbinės tikrovės.
91
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
1.3.1.3. Kolokacijos ir metaforos Daugelio autorių mėgiama tema – tekstynų lingvistikos vieta kitų kalbotyros ir su ja besisiejančių mokslo šakų sistemoje. Įžengusiai į ketvirtąjį dešimtmetį tekstynų lingvistikai jau nebereikia įrodinėti savo svarbos bei metodologijos pagrįstumo, tačiau jos ryšiai su kitomis šakomis vis dar lieka neaiškūs. Be to, kyla klausimų, ar ji viena pajėgi sukurti savą kalbos teoriją, ar jos empirinė bazė turėtų paremti ir papildyti kitą teorinį kalbos modelį kuriančią šaką. Buvo siūloma, kad tokia teorinį apibendrinimą ir paaiškinimą konkretiems tekstynų lingvistikos duomenims teikiančia šaka galėtų būti kognityvinė lingvistika, arba kogitologija (Schonefeld 1999). Mat išvados, gautos apibendrinus konkrečius empirinius tekstynų lingvistikos duomenis, bei kogitologiniai kalbos funkcionavimo paaiškinimai darniai papildo vieni kitus. Šiame darbe nebus diskutuojami teoriniai tekstynų lingvistikos pagrindai, nebus bandoma patvirtinti ar paneigti jos kaip savarankiškos kalbotyros šakos statuso, o paneigus ieškoti jai prieglobsčio kitų, labiau į apibendinimus ir teorijas linkstančių kalbotyros šakų glėbyje. Šio darbo tikslas tėra tik pažymėti dar vieną galimą tekstynų ir kognityvinės lingvistikos sąlyčio tašką, jungiantį dvi kertines abiejų šių mokslo šakų sąvokas – metaforą bei kolokaciją. Abi čia bus kiek kitaip apibrėžiamos ir interpretuojamos, kad vėliau būtų galima jas pritaikyti praktiniam tikslui – atminties metaforoms iš kolokacijų gauti. Įrodinėdamas, kad reikšmės vienetai paprastai nesutampa su leksiniais vienetais ir siekia toliau nei žodžio ribos, J. Sinclairis (1996) sukūrė tekstynų analize pagrįstą reikšmės modelį. Jo esmė – reikšmė nesikoncentruoja viename žodyje, bet pasiskirsto per kelis ar/ir daugiau paprastai nuolat drauge einančių žodžių, t. y. kolokacijų. Kolokacija čia suprantama kaip įprastinis žodžio vartojimo kontekstas, dažnai drauge kartu vartojamų žodžių junginys.
1.3.1.3.1. Kognityvinės metaforos samprata Kognityvinės metaforos samprata, pateikta kogitologų, remiasi prielaida, kad metafora nėra vien tik raiškos būdas ar priemonė. Ji lemia mūsų mąstymą ir pažinimą, todėl yra konceptuali: „Metaforos kaip
92
1 .3. K O LO K A C I J O S S A M P R ATA
kalbinės raiškos būdas egzistuoja todėl, kad jų esama mūsų sąvokų sistemoje (conceptual system)“ (Lakoff 1980: 6). Pastovią kalbinę raišką įgavusios ir įprastinėmis tapusios metaforos angliškai vadinamos mirusiomis – šiuo pavadinimu nurodomas vartotojų neįsisąmonintas jų metaforiškumas (lietuviškai buvo siūlyta vadinti kalbinėmis metaforomis, pabrėžiant jų konvencionalumą bei priešybę originalioms, autorinėms arba literatūrinėms metaforoms, žr. Marcinkevičienė 1994). Būtent neįsisamonintas metaforiškumas ir lemia pažintinę jų galią, nes paprastai abstraktūs, juslėmis neapčiuopiami dalykai suvokiami remiantis konkrečiųjų dalykų patirtimi ir yra įvardijami vartojant tuos pačius konkretiesiems dalykams skirtus predikatinius žodžius. Taigi metafora laikoma kognityvine, nes ji būtina abstraktams pažinti ir konceptualizuoti. „Mūsų konceptai lemia suvokimą, veiksmus, santykius su kitais žmonėmis. Taigi konceptualioji sistema yra svarbiausias dalykas, apibūdinantis kasdieninę tikrovę. Jei mes esame teisūs, tvirtindami, jog konceptualioji sistema yra metaforiška, tai mūsų mąstymas, patirtis ir įprastiniai veiksmai yra sąlygoti metaforos“ (Lakoff 1980: 6). Dažniausiai mes nesuvokiame ir neįsisamoniname savo konceptualiosios sistemos, mąstome, kalbame, veikiame labiau ar ne taip labai automatiškai, pagal tam tikrą modelį ar schemą. Norint sužinoti, kokia ta schema, kognityvistai siūlo gilintis į kalbą. Abstraktieji, juslėmis neapčiuopiami objektai mūsų sąmonėje egzistuoja kaip konceptai, tik ne bet kokie, o, kaip rodo kognityvinė lingvistika, metaforiniai. G. Lakoffas siūlo metodą, kaip atskleisti metaforinių konceptų esmę. Reikia surinkti, daugybę konkrečių jų pasireiškimų kalboje, t. y. kalbinių metaforų. Jos ir padeda pamatyti tuos konkrečiuosius konceptus, per kuriuos suvokiami abstraktieji. Iki šių dienų populiarumo nepraradusioje monografijoje (1980) G. Lakoffas aptaria kai kuriuos anglų kalba kalbančios visuomenės metaforinius konceptus: ginčo, apibūdinamo karo terminais, laiko – pinigų, meilės – kelionės, gyvenimo – azartinio lošimo ir pan. Kognityvinės teorijos kūrėjų tikslas – parodyti pačius konceptus, jų susidarymą, struktūrą, sistemiškumą, poveikį mąstymui. Tekstynų lingvistikos metodai leidžia įgyvendinti šį tikslą naudojant kolokacijas kaip kasdienės kalbos vartojimo pagrindą, iš kurio galima gauti mirusias arba kognityvines metaforas. Kad būtų lengviau jas atpažinti, verta pasinaudoti detalesne jų klasifikacija.
93
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
G. Lakoffas kalba apie trejopas metaforas: struktūrines, erdvines ir ontologines. Viena nuo kitos jos skiriasi metaforiškumo suvokimo laipsniu. Struktūrinės metaforos bene lengviausiai atpažįstamos, nes jose tam tikri konkretaus koncepto bruožai labai aiškiai suteikiami abstrakčiajam, pavyzdžiui, vilčiai apibūdinti imamos kai kurios ugnies savybės, sakome viltis rusena, plazda, blėsta, nutvieskia, vilties kibirkštėlė įsižiebia. O pyktis, beje, ir daug kitų emocijų, nusakomas kaip skystis, nes jis užplūsta, susitvenkia, išgaruoja. Pykčio pritvinkęs žmogus gali jį išlieti. Kalbai, žodžiams suteikiama įvairių konkrečiųjų konceptų struktūra; vienas jų – siūlas, nes kalba mezgasi, rišasi, nutrūksta. Baimės koncepte vyrauja priešo įvaizdis: ji užvaldo, kankina, su ja grumiamasi, kovojama, ji įveikiama, nugalima. Ištyrę konceptų raišką žodžių junginiais matome, kad vienas abstraktusis konceptas siejamas su keliais ar dar daugiau konkrečiųjų. Didesnis apibūdinančių konceptų kiekis padeda išvengti vienpusio suvokimo, labai aiškaus abstrakto lyginimo tik su vienu konkrečiu daiktu. Labai įvairialypiai yra dažnai minimų abstraktų – minčių ir jausmų – konceptai. Štai jausmai įvardijami kaip skystis (užliejo graudulys, iš veido tryško pasitenkinimas, nugrimzdo į melancholiją, sukunkuliavo aistra, sėmėsi tvirtybės, malonumas buvo atmieštas gėdos jausmo, jausmai liejosi), kaip pavojingas žvėris (ilgai tramdytas įniršis, nežabotos aistros, širdį graužiantis pavydas, širdgėlos draskomas žmogus, suvaldyti tūžmą), kaip augalas (nerimas auga, neapykanta keroja, žmogus palūžta), kaip karštis ar ugnis (jis užsidegė aistra, užsiplieskė neapykanta, karšta meilė) ir, žinoma, kaip žmogus (meilė gimė, mirė, jo lūpomis kalbėjo neapykanta). Erdvinių metaforų metaforiškumą suvokti sunkiau. Šios metaforos įkūnija trimatį erdvės suvokimą įvairiausiose sąvokose. Vertikalusis matas gali būti pagrindas nusakyti sveikatai, nuotaikai, savijautai, kainoms, infliacijai ir dar daugeliui kitų dalykų. Judėjimu ar buvimu aukštai – žemai metaforizuojamos vertinamąjį elementą turinčios arba didesnį ar mežesnį kiekį žyminčios sąvokos. Akivaizdu, kad metaforas lemia mūsų kultūrinė ir fizinė patirtis, pastaroji ryškiausiai atsispindi erdvinėse metaforose. Štai geros savijautos, drąsos, pasitikėjimo savimi raiška turi elementą aukštyn (aukštyn galvą, neriesk nosies), nusiminimas, baimė – žemyn (krito, puolė neviltin, prislėgtas žmogus). Fizinis šių metaforų
94
1 .3. K O LO K A C I J O S S A M P R ATA
pagrindas, anot G. Lakoffo, emocinę žmogaus būseną atitinkanti tiesi ar sudribusi laikysena. Panašiai kilimas ženklina sveikatą, kritimą – ligą ar mirtį. Vertikale metaforizuota ir visuomeninė padėtis (jis kopia karjeros laiptais, aukštai kilsi, žemai krisi, aukštas rangas, visuomenės padugnės), protas ir emocijos, geri ir blogi dalykai. Net didelis ir mažas kiekis apibūdinami vertikale (kainos kyla, gyvenimo lygis krinta, numetė daug svorio). Erdvinės metaforos yra tokios esminės, kad nerastume kito būdo daugeliui jomis įvardijamų konceptų perteikti. Anot Immanuelio Kanto, būdami žmonės, negalime neprimesti savo suvokimui erdvės ir laiko rėmų. Dar sunkiau atpažįstamos vadinamosios ontologinės metaforos. Jos abstraktams suteikia objekto ar substancijos pavidalą, sudaiktina, sumedžiagina jas. Suvokus įvykius, veiksmus, idėjas kaip daiktus, palengvėja jų įžodinimas, jų savybių raiška. Taip abstraktus galima apibūdinti kaip dalykus, turinčius dydį, formą, svorį, kiekybę, vidų, išorę ir dar daugelį kitų konkrečių savybių (didelė laimė, mažas nesusipratimas, svarūs argumentai, sveikatos likučiai, minčių nuolaužos, atimti viltį, aštrus skausmas, bukas žvilgsnis, tvirtas tikėjimas, slegiantis nerimas). Sudaiktina ne vien ontologinės, bet ir daugelis struktūrinių metaforų, tačiau pastarosios remiasi konkrečiais apibūdinančiais konceptais, pavyzdžiui, pastatu, maistu, ugnimi, augalu ir pan., o ontologiškai metaforizuotą abstraktą suvokiame kaip daiktą apskritai, per vieną ar kitą jo daiktiškumą liudijančią savybę. Bendroji konceptų metaforinio suvokimo schema būtų tokia: pirmiausia abstraktas sudaiktinamas ir/ar projektuojamas erdvėje, po to jam gali būti suteikta konkretesnio koncepto struktūra.
1.3.1.3.2. Kolokacijų metaforos Kognityvinė metafora siejasi su kolokacija, nes pastaroji yra ne kas kita kaip tik konkreti kalbinė pirmosios raiška. Šiuo darbu siekiama parodyti, kad jei kam rūpi surasti kognityvinės metaforos apraiškas, geriausia tai padaryti peržvelgus pasirinkto abstrakto kolokacijas, nes būtent čia randama įprastinė ir eksplicitiška abstrakto raiška. Kogitologų darbuose, atvirkščiai, gausu implicitiškų metaforinių posakių, kuriuose kalbamasis abstraktas neįvardijamas tiesiogiai, tik implikuojamas iš
95
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
platesnio konteksto. Nors vienintelis būdas kognityvinėms metaforoms tirti yra analizuoti konkrečią kalbinę jų raišką, bet kogitologai neskiria daug dėmesio raiškos dalykams. Pagal jau nusistovėjusią tradiciją metafora iliustruojama atskirais sakiniais, atskleidžiančiais atskiros metaforos esmę, pavyzdžiui, metafora meilė yra kelionė iliustruojama Mes atsidūrėmė kryžkelėje. Per vėlu pasukti atgal (Lakoff 1980: 44; čia ir kitur vertimas mano – R. M.) Tačiau šie konkretūs sakiniai, kuriuose meilė nėra įvardyta tiesiogiai, o tik suvokta iš bendresnio konteksto, lygiai taip pat sėkmingai galėtų iliustruoti ir kitas veiklos sritis, pavyzdžiui, derybas ar emocijas (plg. Apresian 1993: 29). Taigi jei būtų susieti du požiūriai į abstrakčiųjų sąvokų įvardijimą ir vartoseną, jų analizė tikrai pagilėtų. Tekstynų lingvistikos duomenys leistų labiau atsižvelgti į konkrečią kalbinės jų raiškos formą, o kogitologija aprėptų įvairiabriaunį abstraktų turinį. Be to, metaforos, rinktos iš kolokacijų, garantuotų kogitologams taip svarbią prielaidą: kad kognityvinė metafora būtų pagrįsta ne bet kokiais, o įprastiniais kasdieninės kalbos posakiais. Čia siūloma tradicinį kogitologų dėmesio kalbinei raiškai stygių ištaisyti vartojant eksplicitiškai daiktavardžiais išreikštų abstraktų konkordansus kaip pagrindinį ir svarbiausią kognityvinių metaforų šaltinį. Prieš aptariant ir patikslinant metaforos ir kolokacijos sąvokas, būtina pasakyti, kad metafora gali būti kelių rūšių, jei žiūrėsime į kalbinės jos raiškos apimtį: 1. vienažodė metafora, pagrįsta arba a) sudurtinio žodžio morfemų deriniu, arba b) daugiareikšmio žodžio reikšmių sąveika, 2. daugiažodė metafora, išryškėjanti iš žodžių junginio. Pastaroji dar gali būti skiriama į dvi grupes pagal žodžių junginių pastovumą: a) pastoviųjų žodžių junginių, arba kolokacijų, metafora bei b) neįprastinių žodžių junginių pagrindu atsiradusi vadinamoji ad hoc metafora (Čermák 1998). Čia bus apsiribota tik iš kolokacijų išryškėjusia metafora ir tai tik tais atvejais, kur analizės objektu pasirinktas abstraktas – šiuo atveju atmintis – yra eksplicitiškai įvardytas daiktavardžiu, atsisakius veiksmažodinių atminti, atsiminti, etc. bei implicitinių, todėl automatiškai neaptinkamų jo įvardijimo atvejų, pavyzdžiui: Prieš mane vėl iškyla matyti vaizdai; Jis negalėjo atgaminti jo kalbos turinio. Tačiau ir taip apribojus analizės šaltinius, duomenų, gautų automatiškai apdorojus tekstyną, visiškai pakanka.
96
1 .3. K O LO K A C I J O S S A M P R ATA
Siekdami tiksliau apibrėžti savaip vartojamą kolokacijos terminą kai kurie autoriai dar labiau sugriežtina kolokacijoms keliamus reikalavimus. Tačiau rezultatas šiuo atveju yra priešingas – užuot patikslinę savoką, tik padaro ją dar miglotesnę, nes remiasi ne formaliaisiais, statistiniais tikimybiniais ar bent kontrastyviniais identifikavimo principais, o tik kalbos jausmu. Toks yra kolokacijų nemetaforiškumo reikalavimas. Jį propaguojantys autoriai (Van der Meer 1998: 314) siūlo kolokacijomis laikyti tik tuos žodžių junginius, kurių nariai junginyje vartojami tik tiesioginėmis reikšmėmis, ir teigia, jog tai padėsią atskirti kolokacijas nuo idiomų. Nemetaforiškumo reikalavimas atrodo nepriimtinas dėl kelių priežasčių. Visų pirma reikšmės perkėlimas yra pernelyg intuityviai suprantamas dalykas, ypač abstrakčiųjų daiktavardžių vartojimo atveju, kad galėtų būti laikomas patikimu kolokacijų nustatymo pagrindu. Antra, vartojimas vien tiesioginėmis reikšmėmis negali būti kolokacijų skyrimo pagrindu, nes taip vartojami ir trivialieji, t. y. laisvieji, žodžių junginiai. Trečia ir visų svarbiausia – jei į mūsų metaforos sampratą įtrauksime ir labai smarkiai išplitusią kalbinę metaforą, metaforinės vartosenos niekaip nepavyks pašalinti iš kolokacijomis laikytinų žodžių junginių, ypač tų, kurie įvardija mentalinius reiškinius. Kalbinės metaforos, anot G. Lakoffo, „... yra tokios natūralios ir visa apimančios, kad laikomos savaime suprantamais ir tiesioginiais mentalinių reiškinių įvardijimais. Daugeliui mūsų net nedingteli, kad čia yra metafora“ (1980: 28). Kalbinės metaforos apraiškų galima aptikti kai kurių autorių pateiktuose kolokacijų pavyzdžiuose, nors jie patys to metaforiškumo ir nenurodo, greičiau atvirkščiai, jį neigia. Štai P. Hanksas, pateikęs detalų anglų kalbos daiktavardžio enthusiasm įprastinės vartosenos modelį, tvirtina: „Vargu, ar esama metaforinių entuziazmo vartojimo atvejų“ (Hanks 1998: 153). Tačiau tarp jo pateiktų kolokacijų esama tokių kaip infectious enthusiasm, enthusiasm wanes, kuriose abstrakti entuziazmo samprata konkretinama vartojant specifines užkrečiamų ligų, dylančio mėnulio asociacijas keliančius žodžius. Taigi čia nefizinė substancija suvokiama kaip fizinė, jutimiškoji, o miglotesnė sąvoka įžodinama aiškiai, suvokiamai ir apčiuopiamai. Kitą kalbinės metaforos pasireiškimą galima rasti dar vieno autoriaus, apibrėžiančio kolokacijas tik kaip nemetaforinius žodžių
97
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
junginius, pateiktuose kolokacijų pavyzdžiuose (Van der Meer 1998: 319). Šis olandų semantikas anglų kalbos veiksmažodį perpetrate apibūdina kaip nuolat vartojamą su neigiamą konotaciją turinčiais daiktavardžiais apartheid, barbarity, destruction, error ir panašiais. Be to, jis teigia, jog imtas vartoti su neutralios reikšmės daiktavardiniu žodžių junginiu view of New York šis veiksmažodis tarsi rodo, kad Niujorko vaizdas negali būti geras dalykas. Kitaip tariant, kitų to paties žodžio kolokatų kaimynystė kelia tam tikras asociacijas, taigi metaforizuoja naująjį junglumo partnerį. Abu pateikti kalbinių metaforų pavyzdžiai, prasiskverbę į tokios metaforos nepripažįstančių autorių darbus, aiškiai rodo, kad kognityvistai buvo teisūs tvirtindami, kokia visa apimanti ir sunkiai pastebima yra kalbinė metafora. P. Hanksas ir G. Van der Meeras, neigdami kolokacijų metaforiškumą, laikosi tradicinio požiūrio į metaforą ir supranta ją tik kaip tropą, kalboje atliekantį ornamentinę paskirtį. Metaforos ir kolokacijos ryšį labai taikliai apibūdino H. Alversonas: „Kol metaforos yra šviežios, neįprastos, kol jomis kategorizuojama naujai, tol jos nereiškiamos kolokacijomis, tik kai metafora ar visa metaforų sistema nusidėvi ir miršta, ji tampa kolokacijų rinkiniu“ (1994: 57). Taigi kolokacijoms keliamas nemetaforiškumo reikalavimas, atrodo nepagrįstas ir net neįmanomas, jei metaforą suprasime plačiai: ir kaip tropą, ir kaip nusidėvėjusią, kasdienės kalbos savastimi tapusią kalbinę metaforą. Pastarųjų raišką įprastiniais posakiais, t. y. kolokacijomis, aptaria ne vienas kognityvinės lingvistikos atstovas (Lakoff 1980: 51, Kovesces 1986: 132, Alverson 1994: 41). Be to, kalbinės metaforos, aptinkamos tarp kolokacijų, yra labai įprastos, visuotinos, nuolat vartojamos, giliai įsikverbusios į žmonių sąmonę, todėl geriau nei bet kas kitas atskleidžiančios abstrakčiųjų sąvokų esmę. Nors kolokacijos ir yra geriausias metaforų šaltinis, identifikuoti metaforas nėra toks paprastas dalykas. Bandant iš kolokacijų išrinkti metaforas susiduriama su panašia problema kaip ir bandant išrinkti kolokacijas iš konkordanso, kitaip sakant, iškyla klausimas: kas yra kalbinė metafora ir kaip atskirti metaforą nuo nemetaforos. Kadangi tiesaus atsakymo į šį klausimą nepavyko rasti prieinamoje literatūroje, teko gilintis į metaforos apibrėžimą. Metafora yra viena labiausiai aptariamų temų ne tik kalbotyroje ar literatūrologijoje, bet ir kituose humanitariniuose bei socialiniuose moksluose, taigi čia
98
1 .3. K O LO K A C I J O S S A M P R ATA
leistis į rimtesnes prieštaringų idėjų apžvalgas bei vertinimus būtų neįmanoma. Todėl bus apsiribota tik trumpu kognitologų pateiktu apibrėžimu: „Metaforos esmė yra ta, kad vieni dalykai yra suprantami ir patiriami per kitus“ (Lakoff 1980: 3). Taigi metaforą, kad kaip ji būtų suprasta, visada sudaro du sandai: tas, kas suvokiama (pagrindinis subjektas, tema) ir tai, per ką suvokiama (pagalbinis subjektas, rema). Diskusijos ir nesutarimai, apibrėžiant metaforą, kyla iš skirtingai suprasto šių dviejų sandų ryšio: ar tas ryšys remiasi tik tradiciškai suprastu dviejų įvardijamųjų dalykų panašumu, ar yra grindžiamas ne esamu ar įsivaizduojamu panašumu, o kur kas bendresnio pobūdžio sąsajomis, t. y. vieno dalyko suvokimu per kitą. Be to, dar neaišku, iš kur kyla temos asociacijos su rema, kokiu pagrindu vieno dalyko ar srities požymiai panaudojami kitam apibūdinti (plg. Taylor 1990: 138). O svarbiausia, kaip sąvokų asociacijos ir ryšiai gauna vienokią ar kitokią kalbinę raišką. Skaitytojas ar klausytojas suvokia metaforą suvokęs ryšį tarp temą ir remą įvardijančių žodžių. Šis suvokimas kyla iš kalbos jausmo, kuris, savo ruožtu, remiasi žodinėmis asociacijomis. Keliažodės metaforos atveju tema apibūdinama remos srities žodžiais. Pačiu tipiškiausiu atveju abstraktų vardai vartojami drauge su konkrečiųjų daiktavardžių predikatiniais žodžiais. Jei taip, lieka neaišku, ar visi abstrakčiųjų daiktavardžių junginiai yra metaforiški, o jei ne, koks pagrindinis metaforiškumo kriterijus, kaip atskirti metaforą nuo nemetaforos. Čia siūloma metaforiškumą aiškinti pasirėmus junglumo apimties (collocational range) samprata. Temą įvardijantis žodis, mūsų atveju abstraktas atmintis, eina pagrindiniu žodžiu daugeliui kolokatų: ištrinti, išrauti, išblukti, išgaruoti, iššluoti ir kt., kurie, savo ruožtu, be atminties, turi ir kitų junglumo partnerių. Juo daugiau skirtingų junginių gali sudaryti kolokatas, tuo miglotesnė, mažiau apibrėžta yra jo reikšmė. Ir atvirkščiai, ribotą kiekį junginių sudarantys žodžiai kelia aiškias asociacijas ir taip metaforizuoja atmintį, plg., iššluoti ir pašalinti iš atminties, atminties tekstas ir atminties turinys, atmintis atšimpa ir atmintis menkėja. Pirmieji šių žodžių porų nariai laikytini metaforomis kaip ir geros ar blogos atminties sinonimai ilga, trumpa, suteikiantys atminties sąvokai ilgio matą. Taigi galima teigti, kad tik ribotą junglumo apimtį turintys kolokatai, vartojami su abstrakčios reikšmės daiktavardžiais, lemia metaforinių žodžių junginių atsiradimą.
99
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
Kalbinę metaforos raišką būtų galima paaiškinti bendrųjų kolokatų mechanizmu (metalinguistic slot sharing, plg. Montemagni 1996). Tvirtinama, kad galima nustatyti sąvokinį žodžių bendrumą lyginant jų kolokatų sąrašus. Jei du žodžiai atsiduria tame pačiame kolokatų sąraše, tarp jų esama semantinio ryšio (Dufour 1998: 112). Tas semantinis ryšys ir laikytinas metaforos pagrindu. Tik čia viską lemia junglumo apimtis. Tad jei būdvardis jautrus vartojamas ir žmogui, ir atminčiai apibūdinti, anot minėtų autorių, žmogus ir atmintis jau turi tam tikro bendrumo. Mūsų manymu, jautrus yra pernelyg junglus ir plačiai vartojamas žodis, kad galėtų perkelti vienų kolokatų požymius kitiems. Visai kas kita – užkrečiamas, vartojamas kur kas siauriau, paprastai su ligų pavadinimais, ir todėl metaforizuojantis kitą savo kolokatą – juoką. Apibrėžus ir patikslinus pagrindinius darbe vartojamus terminus, t. y. kolokaciją suprantant kaip dažnai drauge vartojamą prasmingą mažiausiai dviejų prasminių žodžių junginį, o metaforos sampratą perėmus iš kogitologijos, galima taikyti juos atminties analizei, siekiant išrinkti kolokacijas iš atminties konkordanso, t. y. pačių įvairiausių šio daiktavardžio vartojimo kontekstų, ir sudaryti tipinį junglumo modelį, taip pat išrinkti metaforas iš kolokacijų ir apibendrinti kaip metaforinę atminties sampratą.
1.3.1.3.3. Atminties junglumo tyrimas Atminties vartosena buvo tirta analizuojant 3253 eilučių konkordansą, gautą iš Vytauto Didžiojo universiteto tekstyno. Tuo metu jame buvo 55 milijonai žodžių. Konkordansas buvo sudarytas iš visų sudedamųjų tekstyno dalių pavydžius renkant pateikus sutrumpintą šaknį atmint*, kad konkordansas apimtų visas linksnių formas: atmintis, atminties, atminčiai (dėl šios formos ir teko trumpinti šaknį paieškai duotoje formoje) ir kt. Pirminį konkordansą sudarė 4642 eilučių, tačiau 1389 iš jų teko atsisakyti, nes a) tai buvo pasikartojančios eilutės, b) ieškomasis žodis buvo ne atmintis, o jos dariniai atmintinė, atminimas. Likusios konkordanso eilutės buvo trumpintos, palikus tik tiesiogiai su atmintimi susijusius žodžius, galinčius sudaryti tiek sakinį, tiek ir žodžių junginį, pavyzdžiui,
100
1 .3. K O LO K A C I J O S S A M P R ATA
nyse. Jų manymu, laimės pojūtis sukuriamas mokymosi procese, veikiant atminčiai. Taigi mokslininkai prieštarauja jų pačių anksčiau iškeltai Jų manymu, laimės pojūtis sukuriamas mokymosi procese, veikiant atminčiai. Tolesnės konkordanso analizės tikslas buvo trilypis: a) atrasti, b) išrinkti ir c) pateikti atminties kolokatus. Visi trys analizės etapai buvo ganėtinai problemiški. Kolokatų atranka buvo atlikta dirbant su kalbinės tekstų analizės programa WordSmith Tools. Ši programa pateikė bendrą tiriamojo žodžio kontekstinių partnerių, esančių imtinai per penkis žodžius nuo tiriamojo, dažnumo sąrašą bei jų pasiskirstymą per penkias pozicijas tiriamajam žodžiui iš kairės ir dešinės. Iš viso sąraše buvo 7 722 skirtingos žodžių formos, pavartotos su visomis atminties linksnių formomis nuo 838 iki vieno karto. 20 dažniausių pateikta 4 lentelėje. 4 lentelė. 20 dažniausių atminties kontekstinių partnerių – žodžių bei jų formų Kontekstinis partneris ir iš į kaip tik yra kad jo mano tai mūsų o savo su ne ar jos išliko bet buvo
Iš viso
Iš kairės
Iš dešinės
838 377 229 148 131 125 121 117 114 114 112 112 109 105 88 83 79 76 75 75
437 319 179 71 78 65 97 89 102 77 94 80 83 58 52 43 52 29 51 40
401 58 50 77 53 60 24 28 12 37 18 32 26 47 36 40 27 47 24 35
101
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
Kaip matyti iš sąrašo, patys dažniausi yra tarnybiniai žodžiai, kurie, remiantis pasirinktu kolokacijos apibrėžimu, nelaikytini atminties kolokatais. Perkėlus juos į atskirą sąrašą, liko 20 dažniausių prasminių žodžių formų – dažniausių atminties kolokatų. 5 lentelė. 20 dažniausių atminties kolokatų – žodžių formų Kontekstinis partneris yra išliko buvo tautos įstrigo žmonių turi liko istorinės šviesios išliks kompiuterio istorinė žmogaus ištrinti Lietuvos metų įsirėžė gali išlieka
Iš viso
Iš kairės
Iš dešinės
125 76 75 73 72 71 56 55 50 44 40 40 36 34 33 33 32 32 30 30
65 29 40 67 41 66 39 30 50 44 22 38 36 24 22 21 14 16 18 12
60 47 35 6 31 5 17 25 0 0 18 2 0 10 11 12 18 16 12 18
Sulemavus sąrašą, t. y. suvedus visas žodžių kaitybos formas į antraštines (tai buvo atlikta pasinaudojus V. Zinkevičiaus lietuvių kalbos žodžių lemavimo programa), sąrašas kiek pakito. 20 dažniausių prasminių žodžių pagrindinių formų arba lemų atrodo taip:
102
1 .3. K O LO K A C I J O S S A M P R ATA
6 lentelė. 20 dažniausių atminties kolokatų – lemų Kontekstinis partneris būti (iš)likti žmogus istorinis labai turėti tauta įstrigti mąstymas ilgalaikis šviesus geras vaikas kompiuteris gyvas ištrinti Lietuva metai įsirėžti galėti
Iš viso
Iš kairės
Iš dešinės
273 227 121 114 95 76 73 72 55 47 44 44 41 40 36 33 33 32 32 30
143 112 100 112 54 57 67 41 26 34 44 36 34 38 14 22 21 14 16 18
130 115 21 2 41 19 6 31 29 13 0 8 7 2 22 11 12 18 16 12
Lemuojant įvairios kaitybos formos keičiamos pagrindine, tačiau kolokatų sąraše dar lieka nemažai bendrašaknių žodžių – darinių, kuriuos taip pat vertėtų redukuoti iki pamatinio žodžio, pavyzdžiui: išliko, liekantis, pasiliko, tepalieka, išliekamumas. Taip būtų gautas grynųjų kolokuojančių šaknų sąrašas. Tačiau lemuojant ar redukuojant darinius abstrahuojamasi nuo konkrečių formų ir taip netenkama daug vertingos informacijos apie žodžio formos ir turinio sąsajas, kuri ypač svarbi, jei žodžio vartosenos aprašas naudojamas semantinei analizei bei daugiareikšmio žodžio semantinei struktūrai sudaryti. Ir nors bendrame kolokatų sąraše jie pateikti viena forma, apimančia ir kitus vartosenos atvejus (jų formoms išvardyti prireiktų daug vietos), darbe atsisakyta atminties lemavimo, o išeities tašku laikoma ne pagrindinė, o kaitybinės tiriamojo žodžio formos, t. y. atskiri šio daiktavardžio linksniai. Identifikuojant kolokatus susiduriama su keliomis problemomis. Viena jų – kur nukirsti kolokatų sąrašą, kitaip sakant, kaip dažnai žodis
103
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
viena ar keliomis savo formomis turi eiti drauge su tiriamuoju žodžiu, kad būtų laikomas kolokatu. Drauge pavartotų atvejų skaičius priklauso ir nuo tekstyno dydžio. 1 milijono žodžių apimties tekstyne jau du kartu vienas šalia kito pasirodę žodžiai yra laikomi kolokacija, o 50 kartų didesniame tekstyne, savaime suprantama, reikalavimai griežtesni: reikia, kad žodžiai drauge eitų kur kas dažniau. Apsispręsti padeda vadinamieji dažnumo slenksčiai, kurie dalija kolokatus į kelias aiškias grupes: žodžius, vartojamus tūkstančius, šimtus, dešimtis kartų ar kelis kartus. Todėl patogia sąrašo trumpinimo riba galėtų būti mažiau nei 10 kartų pavartoti žodžiai lemuotame kolokatų sąraše. Kita problema: automatiškai gautame bendrame sąraše daugelis žodžių nėra tiesiogiai susiję su tiriamuoju, taigi nėra jo kolokatai, pavyzdžiui, sakinyje Jų neišdildysi iš atminties, nes niekas niekad galutinai nepranyksta tik pirmieji du žodžiai yra tiesiogiai susiję su tiriamuoju. Čia nelabai gelbsti ir galimybė suskirstyti kolokatus pagal jų vietą pagrindinio žodžio aspektu, nes laisvos žodžių tvarkos lietuvių kalboje tiesioginiu ryšiu susiję žodžiai gali atsidurti bet kurioje pagrindinio žodžio pusėje labai nevienodu atstumu nuo jo. Atsikratyti nereikalingų sąrašo žodžių įmanoma, jei kiekvieno žodžio atveju atsakymo ieškoma konkordanse, nes tik jame išryškėja žodžių ryšiai ir priklausomybė. Taigi identifikuojant kolokatus negalima pasiklauti vien automatika, nors ji ir labai palengvina darbą. Nustačius kolokatus, reikia juos taip išrinkti iš teksto, kad vėliau, pateikus vientisiniais ar sudėtiniais žodžių junginiais, būtų aiškūs aprašomojo žodžio vartosenos ypatumai. Čia susiduriama su kolokacijos ilgio ir jos ribų nustatymo problema. Šiame kolokatų sąraše dėl trumpumo stengiamasi juos pateikti kuo labiau izoliuotus, net atsisakius galininkiniams veiksmažodžiams būtinų papildinių arba tarp veiksmažodžio ir daiktavardžio įsiterpusio pažyminiu einančio būdvardžio. Tačiau labai dažnai taip iš konteksto ištraukus atskirus kolokatus, galima gauti iškreiptą vaizdą, pavyzdžiui, vienas dažniausiai su atminties galininku vartojamų veiksmažodžių turėti paprastai yra lydimas kokio nors būdvardžio: turėti gerą, blogą, fenomenalią, puikią, prastą, etc. atmintį. Bet kuriuo atveju sakinio skaidymas į žodžių junginius sunaikina daug informacijos, todėl konkordanso eilutė visad yra informatyvesnė.
104
1 .3. K O LO K A C I J O S S A M P R ATA
Iš tekstyno susidarius aiškų vieno ar kito žodžio junglumo vaizdą, labai svarbu kuo tiksliau perteikti jo esmę, kad išryškėtų tipiškos vartosenos modelis. Esama labai įvairių būdų tą padaryti. Visi jie skiriasi konkordanso analizės gilumu bei abstrahavimo laipsniu. Pats paprasčiausias būdas vartosenos modeliui pateikti – atrinkti tipiškiausias konkordanso eilutes, plg. COBUILD Dictionary of Collocations. Jis geras tuo, kad duoda autentiškus pavyzdžius ištisais sakiniais, taigi nė kiek netransformuojama morfologinė ir sintaksinė jų struktūra. Visas darbas – atrinkti ne bet kokius, o tipiškus vartosenos atvejus, iš kurių pats skaitytojas galėtų suprasti, kada ir kaip žodis yra vartojamas. Minėtame žodyne tai daroma automatiškai atrinkus po 20 konkordanso eilučių 20 dažniausių kolokatų pailiustruoti. Į kolokatų sąrašus neįtraukiami tarnybiniai žodžiai. Toks vartosenos atspindėjimo būdas, nors ir reprezentatyvus, dėl didelės medžiagos apimties tinkamas tik elektroninei leidybai. Kolokatus galima pateikti ir kitu būdu, t. y. sąrašu, atskyrus juos nuo konteksto, suklasifikavus pagal jų svarbą aprašomajam žodžiui, morfologinius ir semantinius ypatumus, be to, atskyrus daugiareikšmio žodžio skirtingų reikšmių kolokatus. Taip gaunamas detalesnis kolotatų vaizdas, tačiau netenkama labai svarbios sintaksinės informacijos, todėl toks sąrašas tinka tik gimtakalbiams, galintiems atkurti platesnį kontekstą. Pats sąrašas nėra pakankamai reprezentatyvus. Tokie yra tradiciniai popieriniai junglumo žodynai, pavyzdžiui, BBI. Jame anglų kalbos daiktavardis memory pateiktas taip: memory n. [‘power of recalling’] 1. to jog smb.’s ~. to commit smt.to ~ 3. to slip smb.’s ~ (the date has slipped my ~) 4. to loose one’s ~ 5. an infallible; photographic; powerful; retentive; short ~ 6. (med.) long-term; shortterm;vizual ~ 7. a ~ for (a good ~ for names) 8. (to speak) from ~ 9. a lapse of ~[‘something recalled, recollection’] 10. to evoke, stir up a ~ 11. to blot out a ~ 12. bitter; dim; vague; enduring; fomd; haunting, poignant; pleasant; unpleasant ~ries [‘collective remembrance’] 13. to honor, venerate smb.’s ~ 14. a blessed, sacred ~. 15 in ~ of (to erect a memorial in smb.’s ~) 16. in living ~ 17. of blessed, sacred ~ 18. (misc.) dedicated to smb.’s ~ [‘capacity for storing information in a computer’] 19. (a) random-access; read-only ~.
Kur kas geresnis už du pirmuosius yra toks vartosenos atspindėjimo būdas, kuris leidžia ne tik išvardyti klasifikuotus kolokatus, bet ir
105
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
pateikti sintaksinius jų modelius – tipiškus junglumo pavyzdžius. Iš dalies taip aprašomi žodžiai aiškinamajame COBUILD anglų kalbos žodyne, tačiau dar geresnis tokio detalaus vartosenos modelio pavyzdys būtų jau minėtas P. Hankso anglų kalbos daiktavardžių enthusiasm ir condescension. Taigi iš esmės taip aprašyti galima tik atskirus žodžius turint kokių nors specialių tikslų. Mūsų atveju toks tikslas – remiantis dažniausiai vartojamais junginiais, atskleisti atminties metaforinės vartosenos ypatumus. Šis aprašas, jei pavyktų jį gauti pusiau automatiškai ir pritaikyti daugeliui žodžių, galėtų būti tarpinė grandis kelių etapų žodžio reikšmės tyrimo bei leksikografinio jos aprašo atkarpoje ir žaliava kitiems, nuodugnesniems ir pragmatiškiau orientuotiems aprašų tipams: tekstynas – konkordansas – tipiškos vartosenos modelis – žodyno straipsnis aiškinamajam ar junglumo žodynui, metaforinis aprašas ar kas kita. Atminties junglumo modelis pateikiamas atskirų atminties linksnių kolokatų sąrašais, kuriuose pateikti junglumo partneriai yra sudėlioti į grupes visų pirma pagal jų priklausymą kalbos daliai, o paskui kai kur dar ir pagal semantiką. Sąrašo viduje žodžiai pateikiami mažėjančio jų dažnio tvarka, vieną kartą pavartoti žodžiai dar rikiuojami ir abėcėliškai. Linksnių seka taip pat nulemta jų vartojimo dažnumo. Kilmininkas (pavartotas 1040 kartų) Atminties junginiai su veiksmažodžiu A. 48 ištrinti/išsitrinti iš ~, 48 (ne)(iš)dilti/dildyti iš ~, 13 (iš)blėsti iš ~, 12 (iš/pra)nykti/(iš/su)naikinti iš ~, 6 (at/iš)plaukti iš ~ gelmių, 4 (iš) traukti iš ~, 4 (iš)plėšti iš ~, 3 (at)aidėti iš ~, 2 (iš)stumti iš ~, 2 (pra)dingti iš ~, 2 išblukti iš ~, 2 iškristi iš ~, 2 išrauti iš ~, 2 išsibarstyti iš ~, 2 pri/ iškelti iš ~, atgaminti iš ~, išgaruoti iš ~, išmesti iš ~, išnirti iš ~, išpjauti iš ~, išpulti iš ~, išrankioti iš ~, išslysti iš ~, išsprūsti iš ~, iššluoti iš ~, naudoti iš ~, paimti iš ~, pašalinti iš ~, pažadinti iš ~, varyti iš ~, (išsi) lieti iš ~, (ne)iš/ateiti iš ~. B. 7 cituoti iš ~, 4 atkurti iš ~, 3 (pa)kartoti iš ~, 3 dainuoti ~, 3 piešti iš ~, 3 tapyti iš ~, 2 (at)pasakoti iš ~, atsakinėti iš ~, atspėti iš ~, diktuoti iš ~, dirbti iš ~, giedoti iš ~, išvardinti iš ~, kalbėti laisvai, iš ~, parašyti iš ~, skaityti iš ~, susukti iš ~, šnibždėti iš ~, užrašyti iš ~, žinoti iš ~.
106
1 .3. K O LO K A C I J O S S A M P R ATA
atminties junginiai su daiktavardžiu atskiri ~ 10 pėdsakai, 3 fazė, 3 galia, 3 laukas, 3 pėdsakai, 3 saugykla, 3 saulė, 3 sodai, 3 stoka, 3 spraga, 3 turinys, 2 akys, 2 archyvas, 2 bankas, 2 būdas, 2 blyksniai, 2 centrai, 2 diena, 2 forma, 2 galimybė, 2 įtampa, 2 klodai, 2 labirintai, 2 prasmė, 2 problemos, 2 procesai, 2 ribos, 2 skrynia, 2 svarba, 2 šiukšlynas, 2 šlifavimo staklės, 2 takai, 2 tėkmė, trumpalaikės ~ 2 užkaboriai, 2 vaizdai, 2 žaizda, 2 ženklai, akiratis, angelas, apeigos, apimtis, archajinės ~ rudimentai, artimiausioji ~ kertelė, artimiausioji erdvė, atgarsis, atitikmuo, atmaina, ąžuolynas, ąžuoliniai ~ paminklai, balsas, bazė, bažnyčia, biblioteka, blokas-dėžutė, brandus ~ atvejis, dalis, deivė, dėsniai, dėsningumai, dieviškoji ~ knyga, dinaminės ~ mikroschemos, dirgiklis, diskas, dugnas, duobė, duoklė, duomenų bankas, duženos, dvasingumas, efemeriški ~ likučiai, elektroninės ~ įranga, elementų ryšiai, esmė, ežerai, filmas, fiskalinės ~ turinys, funkcijos, gabalas, gabumai, gaida, gaivintoja, galimybės, galimybės ribos, galios ribos, gelmės, genetinės ~ dalis, genijus, gija, giluma, gilumas, gimnastika, gyvos ~ grūdai, gyvosios ~ mechanizmas, idealioji veikla, ilgalaikės ~ prigimtis, ilgalaikės ~ psichologinė struktūra, ilgalaikės ~ turinys, iliuzijų skrynia, imlumas, imuninės ~ ląstelės, ypatybės, ypatumai, įprastinis kompiuterio ~ matavimo vienetas, įrankis, įrašai, įrenginys, įspūdžiai, istorinės ~ akimirka, istorinės ~ išsklaida, istorinės ~ kriterijai, istorinės ~ leidinukai, istorinės ~ puslapiai, istorinės ~ simboliai, istorinės ~ subjektas, istorinės tautos ~ muziejus, istorinės tautos ~ pinklės, išgąlasti ~ ašmenys, išorinės ~ kaupiklis, įvairiausi ~ gabalėliai, jungtys, juosta, kaisčiai, kalba, kapavietės, kapitalas, katalogas, kaupikliai, kelias, kibirkštis, kino juosta, klajonių magija, klasta, kolektyvinės ~ aidas, kolektyvinės ~ fenomenas, kolektyvinės atminties relikvijos, kolektyvinės europietiškos ~ faktai, kompiuterinės ~ resursai, kompiuteriniai ~ tinklai, kompiuterio ~ segmentai, korys, krėslas, krislas, kristaliukai, kryžius, kruopelytė, kultūrinės ~ štampas, kultūros ~ tvermė, kurpalius, kutūrinės ~ pamatas, langutis, ląstelės, leidiniai, lietuvių kultūrinės ~ interesai, Lietuvos laisvės kovų ~ koplytstulpių ir kryžių memorialas, lygis, liudijimai, liudytojai, matas, mechanizmai, medis, memorialas, mergaitė, metafora, momentas, mūsų ~ savastis, mūza, neblėstančios ~ žiburėlis, nuotrupos, operatyvinės ~ dydis, operacijos, operatyviosios ~ sistemos, optinės ~ kortelės, padarinys, pajėgumas, parkas, parko projektas, parko teritorija, pasaulio ~
107
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
žemėlapis, paslaptys, pastangos, pavidalai, pynė, plati istorinė ~ erdvė, plazma, plotai, podėliai, poetė, pokštai, potencialas, pratybos, prieglobstis, priemonė, principai, produktas, programa, psichologija, psichologinis ~ mechanizmas, puslapis, raida, reginys, reikiamos ~ dydis, reliktas, relikvija, renginiai, rėtis, rūšys, samanynas, sandėlis, sargybiniai, sauga, saugos formos, sausgyslės, savybės, sfera, sistema, sistemos, siūlai, slapčiausios ~ kertelė, smegenų ~ lentynos, specialus ~ valdymo įtaisas, sritis, stalčiai, standartinės ~ kilobaitai, stebuklas, struktūra, subjektyviosios ~ vaizdiniai, subtilūs ~ momentai, sugebėjimai, sumaizgioti ~ raišteliai, sutrikimai, šauksmas, šulinys, šventos ~ skeveldros, šviesa, šviesios ~ spalvos, talpa, taupykla, tautos ~ gija, tautos istorinės ~ paminklas, tekstas, tema, tolumos, užkampiai, užmirštosios ~ horizontalės, vagystės, vaizdiniai, vakaras, valanda, vargana ~ skiautelė, veidrodis, veikla, veiksmas, vertė, vieškeliai, vietų globa ir apsauga, vingiai, virvės, žanro ~ sąvokos, žiedai, žymė, žvakelės, atviros ~ visuomenė. atminties junginiai su būdvardžiu A. 45 šviesios ~, 11 amžinos ~, 4 liūdnos ~, 2 geros ~, šventos ~, blogos ~ , juodos ~, kraupios ~, prakeiktos ~. B. 6 geros ~, 2 blogos ~, 2 prastos ~, detalios ~, fenomenalios ~, galingos ~ kompiuteris, ilgesnės ~, puikios ~, silpnos ~, stiprios ~, šviesios ~, trumpos ~. Vietininkas (pavartotas 815 kartų) atminty(je) junginiai su veiksmažodžiu A. 306 (iš/pa/pasi/tepa)likti ~, 39 (iš)laikyti ~, 28 būti gyvam~, 26 (iš) saugoti~, 25 būti~, 12 gyventi~, 7 (su)kaupti~, 7 nešioti(s)~, 5 (tebe)glūdėti~, 4 tilpti/(pa)talpinti~, 3 turėti~, 2 (tebe)stovėti~, 2 egzistuoti~, 2 gyvuoti~, rasti~. B. 27 (iš)kilti~, 7 (at)gaivinti~, 7 atgyti~, 4 (iš/at)plaukti~, 3 (su/pri) kelti~, 3 atgimti~, 3 išnirti~, 2 (su)žadinti~, atkurti~, (iš)busti~. C. 26 įstrigti~, 10 užsifiksuoti~, 4 įsirėžti~, 3 (su/už)rašyti~, 2 įsisprausti~, 2 įsitvirtinti~, atsirasti~, įsikurti~. D. 6 (neiš)blėsti~, 3 būti (ne)ryškiam~, 2 nušvisti~, 2 regėti~, 2 šmėkšteli/šmėsteli~, 2 šviesti~, blėsčioti~, blykstėti~, plykstėti~, sugiedroti~, sustingti~, sušmėžuoti~, šmėkščioti~, švystelėti~, švytėti~.
108
1 .3. K O LO K A C I J O S S A M P R ATA
E. 3 (su)skambėti~, (at)aidėti~, dūgzti~. F. 8 (pasi)rausti~, 5 perkratyti~, 4 ieškoti~, permesti~. G. 2 išblukti~, 2 nykti~, dingti~, dūlėti~, išblankti~, ištrinti~, tirpti~. H. 2 nukeliauti~, pasiklysti~. J. 2 susilieti~, asocijuotis~, sieti(s)~. atmintin junginiai su veiksmažodžiu 55 įstrigti~, 28 į(si)rėžti, 6 (su)grįžti~, 5 įsispausti~, 4 įrašyti~, 3 įkristi~, 3 įsmigti~, 2 gulti~, 2 dėtis~, 2 krautis~, 2 gulti~, 2 įsėsti~, įsileisti~. Vardininkas (pavartotas 604 kartus) atmintis junginiai su veiksmažodžiu A. 17 siekti, 12 (iš)likti, 10 (ne)šlubuoti, 9 (pa)blogėti, 7 (pa)gerėti, 5 veikti, 4 (nu)silpti/silpnėti, 4 grįžti, 3 padėti, 3 glūdėti, 3 sutrikti, 3 stebinti, 3 lavėti, 2 blukti, 2 (neiš)blėsti, 2 džiūgauti, 2 gyvuoti, 2 (ne)klysti, 2 mokyti. B. (ne)apgauti, (ne)byloti, (ne)egzistuoti, (ne)išdilti, (ne)išnykti, (ne) kankinti, (ne)leisti, (ne)meluoti, (ne)nuvilti, apsiblausti, atgręžti, atsigauti, atsirasti, atsiverti, atšipti, blaškytis, dalyvauti, didėti, dirbti, dūlėti, formuotis, gelbėti, gerėti, išsiskleisti, išsitrinti~, juokauti, kilti, menkėt, mirti, nebeklausyti, nuskaidrėti, nušvisti, nutrūkti, persitvarkyti, prašviesėti, rūpėti, slypėti, sukrėsti, sumažėti, sustiprėti, trauktis tolyn, užkristi, užsikirsti, žavėti. C. 14 (iš)saugoti, 6 (už)fiksuoti, 4 (at)gaivinti, 4 turėti vertę, didelę reikšmę, savybę, etc., 3 sietis, 3 remtis patirtimi, 3 leisti ką daryti, 3 (ne/ su/at)kurti, 3 būti pilnam, 3 (iš/at)plukdyti, 2 išdildyti, 2 (pa)teikti, 2 būti reikalingam, 2 liudyti, apimti, atstatyti, įsiminti, įsisavinti, išduoti, išmesti, išplėsti, išstumti, kartoti, kaupti, kuždėti, lemti, lydėti, (ne)tiekti, norėti, nugalėti, nupaveiksluoti, nurodyti, pakišti regėjimus, palaikyti, atmesti, pasiekti tam tikrą lygį, pasiūlyti atrankos principą, paskatinti, pažadinti harmoniją, perkošti, plėšti, prasimušti, pratęsti egzistavimą, prikelti, priklausyti, priminti, prisiglausti, sąlygoti, skirtis, stiprinti, sufleruoti, sulipdyti, supainioti, susilieja, tarnauti, ugdyti, užtikrinti, versti, virsti, žadėti.
109
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
atmintis junginiai su postpoziciniu būdvardžiu 12 gera, 9 trumpa, 6 puiki, 5 gyva, 4 svarbi, 3 ilga, 2 (nepa)tvari, 2 silpna, 2 prasta, 2 nesąmoninga, 2 nuostabi, apgaulinga, aštri, baisi, bergždžia, brangi, būdinga, fenomenali, fragmentiška, gilesnė, knyginė, naudinga, ne mažesnė, nebloga, objektyvi, patikima, ribota, ryški, srauni, šviesi, tvirtesnė, vientisa. atmintis junginiai su veiksmažodžio formom 4 (su)naikinta, 3 sudaryta, 3 naudojama, 3 prarasta, 3 sutrikusi, 2 išvystyta, 2 (už/į)rašyta, aktualizuojama, apiblukinta, apšviesta, atgauta, blunkanti, duota, įrengta, įsišaknijanti, išgydyta, išsaugota, ištrinta, lokalizuota, neįveikta, nuslopinta, nuvertinta, palaiminta, pažeidžiama, perkrauta, peršviečiama, prakeikta, ribota, sukoncentruota, sutalpinta, suteršta, taupoma, tiriama, treniruojama, trūkinėjanti, ugdoma, užblokuota, užgriozta, užkoduota, žalojama. atmintis junginiai su daiktavardžiu, einančiu vardine tarinio dalimi asmens charakterio bruožas, dvasinė tikrovė, gilaus šulinio dugnas, glamonė, istorija, ištikima žmona, mūzų motina, neįkainojamas turtas, pagrindinė psichikos funkcija, paprastas pėdsakų atsispaudimas, pėdsakų įsitvirtinimas, praeities dabartis, praeities sargas, prostitutė, psichikos veikimo mechanizmas, psichinio laiko grįžtamumas, refleksijos pagrindas, sietas sietuvoj, skardi bedugnė, šventa žmogaus dalis, tąsa, tobulas įrankis, trapus indas, vienintėle mano palydovė, vienintėlis kanalas, žmogaus „aš“, žmogaus puošmena. atmintis junginiai su prepoziciniu būdvardžiu 17 istorinė, 11 gera, 9 trumpalaikė, 8 ilgalaikė, 6 puiki, 5 fenomenali, 4 gyvoji, 4 trumpa, 3 genetinė, 3 kultūrinė, 3 mechaninė, 2 nuslopinta, 2 operacinė, 2 prasminė, absoliuti, antjuslinė, apgaulinga, asmeninė, baletinė, blunkanti, brangi, elektroninė, elementari, epizodinė, fiziologinė, fotografinė, gilesnė, gyva, grupinė, ilgiausia, individuali, jautri, kolektyvinė, kompiuterinė, lygiagreti, mnemotechninė, nelimituota, nevalinga, nuostabi, nutildyta, periskopinė, plėšri, prasminė loginė, radarinė, sensorinė, smerktina, sutrikusi, sutrumpėjusi, šviesi, užblokuota, vaikiška, vaizdinė.
110
1 .3. K O LO K A C I J O S S A M P R ATA
atmintis junginiai su prepoziciniu daiktavardžiu 5 tautos, 4 žmogaus, 3 vaiko, 2 blyksnio, 2 genties, 2 istorijos, 2 kompiuterio, 2 vaikų, 2 vietos, 2 žmonijos, 2 žmonių, bendrijos, bendruomenės, dainininkės, dainininko, didvyriškų žygdarbių, disko, erudito, gyvūnų, jaunystės vaizdų, kartos, kelių kartų, kešo, kultūros, kūno, laikmečio, lengvatikių, likimų, mano vaikystės, mero, prūsų tautos, senųjų laikų, senutės, sostinės, Šv. Rašto, tautos kultūros, tremties, visagalė žmogaus, žanro, žemės, žiūrovo. Galininkas (pavartotas 490 kartų) atmintį junginiai su veiksmažodžiu A. 41 įstrigti į~, 16 (su)grįžti/grąžinti į~, 11 į(si)rėžti į~, 9 į(si)rašyti į~, 8 (į/per)vesti į~, 4 patekti į~, 3 įdėti/dėtis į~, 2 (įsi)kalti į~, atidėti į~, įaugti į~, įdiegti į~, įkrauti į~, įsėsti į~, įsiėsti į~, įsikalti į~, įsikibti į~, įsikibti į~, įsikirsti į~, įspausti į~, įsprausti į~, paimti į~, pereiti į~, plūstelėti į~. B. 68 turėti (gerą, blogą, fenomenalią, puikią, etc.)~, 21 (iš)saugoti (istorinę, tautos, etc.)~, 5 išlaikyti (gera, nesunaikinta, šviesią, etc)~. C. 20 prarasti~, 5 (iš/nu)trinti~, 4 (ap/už)temdyti~, 4 (su)naikinti~, 3 atimti~, 2 paneigti~, atšipinti~, blukinti~, išdžiovinti~, iškraipyti~, įžeisti~, kėsintis į~, koneveikti~, pažeisti~, plėšyti~, prastinti~, prievartauti~, slopinti~, sutrikdyti~, užmušti~, užteršti~, užtrenkti duris į ~. D. 11 lavinti~, 10 (pa)žadinti~, 7 (pa)stiprinti~, 6 gaivinti~, 5 atgauti~, 4 (išsi)ugdyti~, 4 (pa)gerinti~, 3 (iš/pra)plėsti~, 2 apšviesti~, 2 prikelti~, aktyvinti~, atkrėsti~, atrasti~, atšviežinti~, audrinti~, gydyti~, įamžinti~, mankštinti~, nuplauti~, padaryti~ nemaria, padidinti~, pajudinti~, palikti šviesią~, patobulinti~, praturtinti~, sergėti~, skatinti~, stimuliuoti~, sukurti~, treniruoti~. E. 5 perkelti į ~, 4 (pa/su)talpinti~, 4 apkrauti~, 3 taupyti~, 2 pagerbti~, 2 suteikti~, aprėpti~, apsunkinti~, belstis į~, eksploatuoti~, formuoti~, išskirti~, kalbėti apie~, materializuoti~, nagrinėti~, naudoti~, nukreipti~, palyginti~, pasitelkti~, (pa)tikrinti~, paveikti~, perduoti~, perimti~, persiųsti~, pervesti~, prakalbinti~, prisiminti~, siekti~, sudaryti~, susikurti~, užfiksuoti,~ valdyti~, veikti~.
111
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
Įnagininkas (pavartotas 107 kartus) atmintimi junginiai su veiksmažodžiu bei neasmenuojamomis jo formomis 10 sietis su~, 6 (ne)pasikliauti~, 6 (pasi)remti/remtis~, 6 skųstis~, 6 stebėtis/stebinti~, 5 apdovanotas~, 4 (ne)pasitikėti~, 4 (pasi)naudoti~, 4 pasižymėti~, 3 grįžti~, 3 vadovauti~s, 2 susipinti su~, 2 versti/virsti~, alsuoti~, išsiskirti~, operuoti~, pagrįsti~, prisiliesti~, susidurti su~, susirišti su~. atmintimi junginiai su daiktavardžiu 4 kasos aparatas su fiskaline ~, kompiuteris su lokaline~, mašinėlė su~, plokštė su IBM vaizdine~. Naudininkas (pavartotas 89 kartus) atminčiai junginiai su daiktavardžiu 2 sąlygos ~ gaivinti, abejingumas, emblema, fotografija, ketureiliai, koncertų ciklas, skirtas Vainiūno ~, laikas, nuotrauka, pamokos, skirtos ~ lavinti, programa, skirta ~ lavinti, sentimentai, socialinių studijų rinkinys, skirtas jubiliato ~. atminčiai junginiai su veiksmažodžiu ir neasmenuojamomis jo formomis 10 nusifotografuoti~, 7 pa(si)likti ką ~, išsinešti ką ~, būti ištikimam istorinei~, ką nors turėti~, nulenkti galvą~, padalyti rožantėlius~, padovanoti nuotrauką~, pasidėti ką ~, perduoti informaciją~, pokštelėti kakton~, susilpnėjus~, turėti įtakos~, užleisti vietą~, veikiant~. Akivaizdu, kad taip sudarytas junglumo modelis atskleidžia tiriamojo daiktavardžio vartosenos partnerius ir ypatybes, tačiau nėra labai aiškiai semantiškai struktūruotas. Kitaip sakant, tai yra lingvistinis, o ne kognityvinis modelis. Pastarąjį galima sukurti aptarus iš gausios ir įvairios atminties vartosenos išryškėjusias metaforas.
112
1 .3. K O LO K A C I J O S S A M P R ATA
1.3.1.3.4. Atminties metaforos Iš atminties junginių, remiantis kognityvinės metaforos samprata, galima atrinkti pavienius šio daiktavardžio metaforinės vartosenos atvejus, o iš jų savo ruožtu sudaryti bendresnes metaforų grupes, kurios atskleistų mūsiškąjį atminties vaizdinį. Renkant ir apibendrinant metaforas nebuvo paisyta atskirų šio žodžio reikšmių ypatumų, nors akivaizdu, kad tokios kompiuterio dalies bei daikto, skirto prisiminimui reikšmėmis vartota atmintis teikia mažiausiai metaforinės vartosenos pavyzdžių. Be to, į grupes buvo jungiamos tiek dažnosios kalbinės, tiek ir retesnės literatūrinės metaforos, jei tik jos atitiko bendrąjį metaforos modelį. Toliau metaforų grupės pateikiamos didžiausio jų ryškumo tvarka. Bene ryškiausia iš visų atminties metaforų leidžia suvoktį šią žmogaus psichikos ypatybę kaip tam tikrą talpą, vietą ar buveinę, kurioje kaupiami ir saugomi patys įvairiausi dalykai: informacija, prisiminimai, įspūdžiai, epizodai, vaizdiniai. Atminties – talpos metafora įkūnijama konkrečių daiktų, jų dalių ar pastatų vardais, tad sakoma: atminties saugykla, sandėlys, podėlis, skrynia, bankas, korys, kertelė, užkampis, užkaboris, labirintai, lentyna, stalčius, skrynia, avilys. Be to, kartais, pabrėžiant vertikalųjį matą, vartojami ir kitokie daiktavardžiai: atminties šulinys, dugnas, duobė, bedugnė, giluma, gelmė. Svarbiausią atminties paskirtį nusako bei šią metaforą papildo dažni veiksmažodžiai: (iš)saugoti atmintį, ką nors (su)kaupti, išlaikyti atmintyje, krautis, dėtis, įsėsti, patalpinti į atmintį, raustis, knaisiotis, perkratyti atmintį, perkrauta atmintis, ištraukti iš atminties. Čia priklausytų ir patys dažniausi kolokatai išlikti ar būti atmintyje. O atminties – pastato metafora išryškėja iš šių pasakymų: atverti atminties langelį, užtrenkti duris į atmintį, belstis į atmintį. Tai, kas perduodama į budrios atminties saugyklą, sudaro savasties svertą. Veronika tuomet ištrauks iš savo atminties gilumų senuosius, vaikiškus jų atvaizdus. Gali būti, kad kiekvienas lietuvis atminties užkampiuose nešiojasi krūvą tam tikrų posakių… Atminties erdvė matuojama ne tik vertikaliuoju matu, kurio dažniausia apraiška yra veiksmažodis (iš)kilti, bet ir horizontalėmis, kai sakoma ilga, trumpa atmintis.
113
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
Trumpos, tik dabartį aprėpiančios atminties akiratis yra užmarštis. Pastatas, šulinys, kambarys – tai vis ribotos erdvės įvaizdžiai. Tačiau atmintis gali būti apibūdinama ir kaip beribė erdvė, žemės paviršius ar tiesiog vieta, į kurią grąžinama ar sugrįžtama. Atmintyje nukeliaujama, pasiklystama, minimos atminties tolumos, plotai, plati istorinė atminties erdvė, atminties akiratis ar laukas. Čia pritinka ir atminties keliai, takai, vieškeliai bei pasaulio atminties žemėlapis. Jūs suprantate, kad vardiju visus, esančius mano atminties artimiausioje erdvėje. Prieš kiekvienas žymesnes šventes mano atminties vieškeliais ateina šviesiausi prisiminimai. Ne mažiau ryški yra ir atminties – šviesos metafora. Šviesos, ryškumo bei regimųjų pojūčių žodžiais atmintis apibūdinama tuomet, kai norima įvardyti kai kurias jos savybes, dažniausiai įsimintų vaizdinių ryškumą ar atminties gerumą. Tuomet sakoma: atminties šviesa, saulė, blyksniai, žiburėlis, žvaigždelė, kibirkštis, neišblės iš atminties, atmintyje nušvito, šviečia, blėsčioja, blyksteli, sugiedroja, švyti, plyksteli; palikti po savęs šviesią atmintį, atmintis nušviesėja, nuskaidrėja ar panašiai. Ir atvirkščiai, apie primirštamus dalykus sakoma, jog jie atmintyje blėsta, blunka, išblanksta iš atminties arba atmintis yra užtemdoma, ji apsiblausia. Atminties ir vaizdo santykis išryškėja, kai kalbame apie regimąją, vaizdinę atmintį, atminties veidrodį, apie joje šmėkščiojančius, sužmėžuojančius pavidalus bei vaizdus. Paskutinieji atminties blyksniai baigėsi kelione į priemiestį. Žiūrėkite, vaikai, žiūrėkite, tegul neišdyla iš jūsų atminties šis vaizdas, šita minutė. Mano atminty vis blėsčioja ryškus vaizdas. Kiek rečiau nei vaizdu atmintis įžodinama garsu. Be girdimosios atminties kaip psichologinio atminties rūšies įvardijimo dar esama iš esmės tą patį reiškiančių vaizdingų posakių: atminties balsas, šauksmas, gaida; atmintyje skamba, ataidi, dūzgia ištarti žodžiai, girdėtos melodijos, atmintis gali kuždėti, sufleruoti ar būti nutildyta. atminty suskamba kunigo ir poeto Kęstučio Trimako eilutės: beregiai regi atminty šaltinio vandenis“. Erdvinį, regimąjį bei girdimąjį atminties sąvokos komponentus papildo kitas dėmuo – atminties substancija. Vartodami dažnus veiksmažodžius įstrigti, įsmigti, įsirėžti, įsikalti, įsisprausti, įsitvirtinti, įsikirsti
114
1 .3. K O LO K A C I J O S S A M P R ATA
mes jais tarsi implikuojame kietą atminties būvį, tačiau jis nėra vienintelis, priskiriamas atminčiai. Dar sakoma: iš atminties gelmių išplaukia, išsilieja, išnyra, išplukdo, nuplaukia per atmintį, iš atminties išgaruoja, atminties tėkmė. Paskui viskas buvo nuskandinta atminties gelmėse. Man atmintin įstrigo tavo akys ir šypsena. Giliai atmintin įsirėžė vienas toks skaudus lagerininkų kankinimo vaizdas. Kaip atmintis sudaiktinama, išryškėja iš vadinamųjų ontologinių metaforų, ypač dažnų, kai reikia įvardyti bet kokio abstrakto kiekį ar dalį. Mūsų tiriamojo žodžio atveju sakoma: atminties likučiai, gabalėliai, nuotrupos, krislai, duženos, skiautės, skeveldros, kruopelytės. Atmintis – daiktas metafora kitais atvejais nėra dažna, ji dar vartojama atminties kokybei reikšti. Tuomet ši metafora įgyja konkretesnę atminties – aštraus daikto raišką: aštri atmintis, išgaląsti atminties ašmenys, atminti atbunka, atšimpa. Šiai metaforai priskirtini ir itin dažni dylančią atmintį ar iš atminties dylančius, dildomus dalykus įvardijantys žodžių junginiai. Dyla iš atminties brangios akimirkos, švietusios džaugsmu ir viltimi. Tarp atminties išgaląstų ašmenų atsakymo nerasi. Kiekviena atminties kruopelytė brangi. Prie ontologinių metaforų priklausytų ir atminties – įrašo bei atminties – saito įvaizdžiai. Pirmuoju atveju itin dažni pasakymai: ištrinti, išbraukti iš atminties, sukti atminties filmą, dieviškoji atminties knyga, atminties tekstas, įrašai, istorinės atminties puslapiai, užfiksuoti, (už/į)rašyti į atmintį. Eglė įnirtingai suko atminties juostą, bene bus kur įsirašęs panašus balso tembras. Okupantai siekė istorinę ir kultūrinę krašto praeitį ištrinti iš žmonių atminties. Apie atminties saitus su kitais psichikos ar gyvenimo reiškiniais kalbama įvairiai. Visų pirma čia vartojami kasdienėje kalboje dažni veiksmažodžiai sietis, susipinti susirišti bei kiek retesni vaizdingi daiktavardžiai atminties juosta, virvės, sausgyslės, gijos, jungtys, sumazgioti raišteliai. Pastarieji minimi, kai reikia nusakyti atminties defektyvumą. Neilgai jis išgyveno poavarijos, per kurią nutrūko kai kurie jo atminties siūlai.
115
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
Tepasikaria „Agijas“ su jo atminties nesumazgiotais raišteliais. Labai dažnai abstraktai yra sužmoginami, jiems suteikiamos gyvų padarų savybės. Atminties atveju ši antropomorfinė metafora nėra labai ryški, jei neskaičiuosime dažnai vartojamų, ganėtinai desemantizuotų žodžių prikelti, žadinti, budinti, prakalbinti, žaloti atsimenamus dalykus ar pačią atmintį, kuri gali atgimti, numirti, būti atgaivinta, nemari. Ypač dažnas pasakymas yra gyvoji atmintis, skirtas nemarumui apibūdinti. O blogųjų dvasių elsgesys priklauso nuo dar gyvų atmintyje prisiminimų. Jis atstovauja žmonių dvasinei kultūrai, pagrįstai gyvąja atmintimi. Atgaivinsime mūsų jartos amputuotą istorinę atmintį. Visos čia išvardytos kognityvinės metaforos atskleidžia mūsų supratimą apie atmintį, parodo daugialypę ir įvairiapusę jos esmę, leidžia sukonkretinti kai kuriuos šios mūsų psichikos ypatybės požymius bei funkcijas. Kiek bendražmogiškas, o kiek savitas ir unikalus yra metaforinis atminties vaizdas, būtų galima pasakyti tik palyginus atminties junglumo ypatumus keliose, o dar geriau – keliolikoje kalbų. Vieno abstraktaus daiktavardžio junglumo analizė parodė galimybę sieti tekstynų lingvistikos praktiką su teorinėmis kognityvinės lingvistikos nuostatomis konkrečiam tikslui siekti, t. y. kalbinėms metaforoms iš kolokacijų gauti. Iš tokios atskirų kalbotyros šakų simbiozės laimi abi jungiamosios sritys: tekstynų lingvistikai, iki šiol stokojusiai didesnių apibendrinimų, gali atsiverti platesni kalbos teorijos horizontai, o kognityvinė lingvistika gali įgyti patikimą empirinę bazę – tekstynus bei jų pagrindu parengtus konkordansus. Šiuo konkrečiu atveju tekstynų analize paremtas metaforizacijos tendencijų tyrimas tampa kur kas patikimesnis, nes grindžiamas dažniausiai vartojamais žodžių junginiais – kolokacijomis.
1.3.2. Kolokacijos ir frazeologija Kolokacijos užima tarpinę padėtį tarp laisvųjų ir stabiliųjų žodžių junginių, o iš pastarųjų labiausiai išsiskiria frazeologija. Teigiama, kad kolokacijos yra frazeologijos paribyje, galbūt net jai priklauso. Todėl būtina aptarti lietuvių kalbos frazeologijos sampratą ir jos santykį su kolokacijomis. Tai daroma apžvelgiant lituanistų nuomones šia tema ir nagrinėjant savitą, iki šiol neanalizuotą stabiliųjų žodžių junginių šaltinį – kryžiažodžius.
116
1 .3. K O LO K A C I J O S S A M P R ATA
1.3.2.1. Tradicinė frazeologijos samprata Tradicinė frazeologijos samprata grindžiama skiriamaisiais jos narių – frazeologizmų – bruožais, labai panašiai nusakomais lietuviškuose teoriniuose ir taikomojo pobūdžio darbuose: vadovėliuose, straipsniuose, žodynų įvaduose. Frazeologizmai apibūdinami a) raiškos atžvilgiu – kaip sustabarėję, stabilūs, pastovios leksinės sudėties ir gramatinės struktūros junginiai, dėl to pastovumo atkuriami iš atminties, imami gatavi, o ne kuriami kiekvienąkart iš naujo, taigi vartojami kaip nusistovėję, įprastiniai kalbos vienetai, b) semantiniu aspektu – kaip vientisi, apibendrintos reikšmės, kiek galint nusakomi vienu žodžiu, c) vartosenos atžvilgiu – kaip turintys apibrėžtą leksinę aplinką, vadinamąją frazeologinę distribuciją, be kurios neįmanomas jų kaip frazeologizmų funkcionavimas, d) stilistiniu aspektu – kaip vaizdingi, raiškūs, atliekantys kalbos ekspresyvinimo funkciją, nes abstrakčias sąvokas įkūnija konkrečiais vaizdais (Pikčilingis 1975: 347, Paulauskas 1977: 6–7, Lipskienė 1979: 9–10, Jakaitienė 1980: 95–99, Palionis 1985: 217, Vosylytė 1985: 3, Galnaitytė ir kt. 1989: 5, Barauskaitė 1995: 60). Tiesa, skirtingi autoriai minėtus požymius pateikia skirtinga eilės tvarka, vieni (Paulauskas 1977: 6, Jakaitienė 1980: 95) į pirmą vietą iškelia reikšmės vientisumą, kiti – daugianarę, tokią kaip laisvųjų žodžių junginių raišką (Barauskaitė 1995: 60), dar kiti – vaizdingumą (Galnaitytė ir kt. 1989: 5) ar pastovumą (Vosylytė 1985: 5). Tačiau visi požymiai nurodomi kaip būtini frazeologizmui nuo nefrazeologizmo atskirti. Teigiama: jei junginys neturi vienos iš trijų ypatybių – reikšmių vientisumo, vaizdingumo, pastovumo, – jis nėra frazeologinis (Paulauskas 1977: 7). Prie nefrazeologinių, nors ir pastovių, vientisos reikšmės, bet nevaizdingų, žodžių junginių skiriami sudėtiniai terminai Rentgeno spinduliai, geležies rūda, kalio druska. Kiti panašios struktūros terminai – perkūno oželis, kiškio kopūstai, paukščių takas – laikomi ir pastoviais, ir vientisais, ir vaizdingais, taigi frazeologizmais (Paulauskas 1977). Reikia pasakyti, kad vaizdingumas – gana subjektyvus dalykas, todėl jo nevertėtų laikyti esminiu skiriamuoju požymiu. Štai J. Paulauskui „... ypač sunku įžiūrėti lyginimų vaizdingumo ypatybę“ (Paulauskas 1977: 7), o palyginimų žodyno autorė K. B. Vosylytė teigia, kad „... visi jie atkuriami iš atminties, turi daugiau ar mažiau vientisą reikšmę ir yra vaizdingi“
117
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
(Vosylytė 1985: 3). Minėtosios dvi terminų grupės skiriasi ne tiek vaizdingumu, kiek reikšmės perkėlimu, perprasminimo laipsniu, nes Rentgeno spinduliai yra tokie spinduliai, kalio druska yra tokia druska, o perkūno oželis – toks paukštis, Paukščių takas – galaktikos dalis. Be terminų, pastoviais, bet nefrazeologiniais junginiais laikomi dažnai kartojami laisvieji žodžių junginiai vasaros atostogos, brandos atestatas (beje, kai kuriuos jų J. Paulauskas nežinia kodėl laiko vaizdingais, pavyzdžiui, saugoti taiką, kosmoso užkariautojai, močiutė sengalvėlė) bei vientisos reikšmės žodžių junginiai duoti patarimą, laikyti egzaminus. Antruoju atveju frazeologiškumą taip pat lemia subjektyviai suvokiamas vaizdingumas. Panašiai į frazeologinius ar šiaip pastoviuosius žodžių junginius skiriami ir tautologiniai žodžių junginiai, pavyzdžiui, akys kaip akys, aiškių aiškiausias laikomi nefrazeologiniais, o eik eik, akis į akį – frazeologizmais; ne kartu rašomi žodžiai, pavyzdžiui, kas nors, bet kas, kažin kaip, kada ne kada taip pat nefrazeologizmai. Frazeologizmais jie tampa tik įgiję perkeltinę reikšmę ir ėmę reikšti visai kitus dalykus, pavyzdžiui, kažin kur reikšme „toli“ (Paulauskas 1977). Iš siaurai suvokto frazeologizmo reikalaujama visiško, t. y. visų jo narių, perprasminimo, todėl daliniai perprasminimo atvejai, kai tik vienas pastovaus žodžių junginio žodis tame junginyje įgyja specifinę perkeltinę reikšmę (lengvoji pramonė, sausas vynas), frazeologizmais nelaikomi. Jie nelaikomi frazeologizmais net ir tuo atveju, kai yra vaizdingi, pavyzdžiui, užmušk (t. y. niekaip) neatsimenu, ašara (t. y. labai mažai) pieno (Paulauskas 1977: 8). Tačiau klasifikuojant frazeologizmus reikšmės požiūriu pagal jų motyvuotumo laipsnį į idiomas, tropinius (metaforinius ir metoniminius), lyginamuosius frazeologizmus bei frazeologines samplaikas (Jakaitienė 1980, Barauskaitė 1995), pastariesiems perprasminimo reikalavimas netaikomas: „Frazeologinių samplaikų komponentus sieja pastovumas. Reikšmės perprasminimas, kitas svarbus tipinių frazeologizmų požymis, jiems nebūdingas“ (Barauskaitė 1995: 62). Prie samplaikų autorė priskiria tokius frazeologizmus kaip juokus krėsti, akį užmesti, kvapą gaudyti, pykčiu nesitverti ir vadina juos frazeoloidais. E. Jakaitienė (1980: 107) samplaikoms skiria dviejų tos pačios kalbos dalies (skūra ir kaulai, rytas vakaras, šleivas kreivas, trumpai drūtai) ar net
118
1 .3. K O LO K A C I J O S S A M P R ATA
tos pačios šaknies žodžių junginius (diena iš dienos, viena vienon, tiek ir tiek) bei sakinių nuotrupas su ryškiu emociniu atspalviu (kad negali reikšme „labai“, kad kokios – „visai galimas dalykas“, kur tau – reiškiant nusivylimą). Ir vienu, ir kitu atveju konstatuojama, kad frazeologinių samplaikų reikšmė labai artima jų dėmenų tiesioginėms reikšmėms, o patys junginiai laikomi frazeologijos paribiu, svyruojančiu tarp laisvųjų ir frazeologinių žodžių junginių. Taigi iš esmės susidūrus su frazeologija praplečiama jos samprata, parodomas aiškios takoskyros stygius, kai kuriems leksikografams priimtinesnė platesnė frazeologijos samprata, o specialiuose frazeologijos žodynuose pateikiama ir tokių žodžių junginių, „... kurie nėra itin vaizdingi bei raiškūs, bet kalboje dažnai vartojami <...>, pavyzdžiui: antra vertus, galų gale, verkiant reikia“ (Galnaitytė ir kt. 1989: 5). Šiame darbe siūloma praplėsti tradicinę lietuviškąją frazeologijos sampratą, įtraukus į ją įvairių tipų stabiliuosius žodžių junginius, konstrukcijas ar sakinius, nes pastovumas, sustabarėjimas, dažnas ėjimas drauge, autorės nuomone, turėtų būti laikomas pačiu svarbiausiu ir patikimiausiu požymiu. Kiti požymiai – reikšmės vientisumas, visiškas ar dalinis perprasminimas, vaizdingumas dėl sunkiai apčiuopiamo ir ganėtinai subjektyvaus pobūdžio – neturėtų būti laikomi privalomais labai dideliam stabiliosios leksikos sluoksniui. Jis gausus, dažnai vartojamas ir struktūriškai įvairus galėtų, panašiai kaip frazeologinės samplaikos, užimti kitą skalės galą. Šios skalės centre būtų visiems junginiams privalomas pastovumas ir daugianarė raiška, viename gale – reikšmės vientisumas ir visiškas perprasminimas ir su juo susijęs reikšmės nemotyvuotumas bei vaizdingumas, o kitame – dalinis perprasminimas, dalinė ar visiška motyvacija bei atspėjamumas. Prie stabiliųjų žodžių junginių, frazių ir/ar sakinių derėtų priskirti ir kitus plačiai paplitusius stabilius junginius: smulkiosios tautosakos vienetus – patarles, priežodžius, mįsles, minkles, pasakų, žaidimų, skaičiuočių, mėgdžiojimų elementus, be to, keiksmus, įvairių ritualų, apeigų, maldų žodžius, etiketo frazes ir kitas mandagybes, aforizmus, sentencijas, visiems žinomas citatas ar tų citatų aliuzijas, šūkius, perspėjimus, žodinius reklamų elementus ir šiaip visokius į ankstesnius skirsnius nepatekusius posakius, jei tik jie yra ganėtinai sustabarėję, visuotinai paplitę, atkuriami iš atminties, o trūkstamos jų grandys nesunkiai atspėjamos.
119
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
1.3.2.2. Stabiliųjų žodžių junginių vardai Kyla klausimas, kaip vienu vardu reikėtų vadinti gausius ir įvairius stabilius junginius. Lietuvių kalboje esama kelių bendro pobūdžio pavadinimų, tiesiogiai nesiejamų su frazeologija: pastovūs, sustabarėję (apstabarėję), neskaidomi žodžių junginiai ar samplaikos. Gramatikose keliažodžiai junginiai įvardijami kaip žodžių junginiai (DLKG 1994, Labutis 1998), žodžių grupės (Valeckienė 1998), frazės (LG 1997), konstrukcijos (Balkevičius 1998). Čia daugiau žiūrima struktūros nei semantikos ar vartosenos, todėl frazeologizmai neatskiriami nuo kitų, laisvųjų ar ne visai laisvų žodžių junginių. Plg. Dabartinės lietuvių kalbos gramatiką, kurioje trumpai minimi pagal reikšmę neskaidomi, sudėtiniais daiktų pavadinimais einantys prijungiamieji žodžių junginiai ir frazeologizmai (DLKG 1994: 483). Kai kurie autoriai atsižvelgia į žodžių junginių vartosenos ir semantikos ypatumus. Štai Vitas Labutis skiria a) laisvuosius žodžių junginius ir jų priešybę – b) nelaisvuosius, semantiškai neskaidomus, atsimenamus, gatavus vartojamus, žodžių junginio struktūrą turinčius idiominius frazeologizmus (knygų žiurkė, akmens ant akmens nepalikti) ir dvižodžius geografinius pavadinimus (Kuršių marios, Grįžulo ratai). Šioje klasifikacijoje nurodyti ir c) apylaisviai junginiai, kurie nuo nelaisvųjų skiriasi galimybe atidalyti jų dėmenis su pirmine kiekvieno reikšme, nors, autoriaus nuomone, tai ir neįprasta. Čia priklauso dalis neidiominių frazeologizmų, išlaikančių atskirų žodžių semantinį ryšį su pirmine reikšme (kraują lieti, ašarą varvinti), daugelis sudėtinių pavadinimų bei terminų (kalbos dalys, akcinė bendrovė, kramtomoji guma). Prie „ne visai laisvų“, taigi apylaisvių, autorius priskiria ir tuos sudėtinius junginius, kurie, anot jo, yra neišdalijami dėl vieno dėmens semantikos. Kitaip sakant, tuos, kurie pavadina vieną dalyką ar vieną objektą (Labutis 1998: 52–53). Taigi V. Labutis pateikia trinarę žodžių junginių klasifikaciją pagal žodžių junginių laisvumą arba suaugimo laipsnį. Tačiau jis apsiriboja tik žodžių junginiais, o sustabarėti linkę ir didesnės apimties, taip pat kitokios gramatinės struktūros vienetai. Jonas Balkevičius, analizuodamas predikatines konstrukcijas, skiria a) neskaidomuosius vardažodžių junginius (ir samplaikas), kuriems priklauso tikriniai vardai, mokslo terminai, frazeologizmai, metaforos, apozicinės samplaikos ir kita (Šviečiamasis amžius, vaikų darželis, mokslo
120
1 .3. K O LO K A C I J O S S A M P R ATA
reikalų prorektorius, oro slėgis, akies obuolys) ir b) neskaidomuosius veiksmažodinius junginius, t. y. frazeologizmus, kurie gali turėti ir predikatinio, ir nepredikatinio žodžių junginio pavidalą: dėjau į akį, nepilk alyvos į ugnį. Predikatiniams galima skirti sakinio struktūrą turinčius posakius. Prie neskaidomųjų autorius priskiria ir apstabarėjusius vientisos reikšmės junginius, turinčius „taip pat vientisą, kiek apstabarėjusią, bet ne perkeltinę reikšmę“ (daro tvarką, daro gėdą, daro įspūdį, eina sargybą, eina imtynių, eina už vyro) (Balkevičius 1998: 51 ir 71–72 atitinkamai). Ankščiau nurodytuose leksikologijos ir stilistikos vadovėliuose minimi jau aptarti frazeologijos sandai idiomos ir frazeologizmai, o jų paribyje – pastovios žodžių samplaikos, frazeologinės samplaikos ir frazemos. Šiuo atveju labiau gilinamasi į semantiką nei į gramatiką, neskiriami žodžių junginio ar frazės ir sakinio struktūrą atitinkantys posakiai. Specialiuosiuose žodynuose pateikiama vienu žodžiu apibendrinama frazeologija ar konkrečiau frazeologizmai, posakiai. Atrodo, kad populiarėja daugiau aprėpiantis ir mažiau įpareigojantis posakio terminas. Juo vadinami ir tradiciškai suprantami frazeologizmai (plg. Janinos Lipskienės Lietuvių kalbos somatiniai posakiai), aforizmai, sentencijos, priežodžiai, patarlės (plg. Valerijos Vaitkevičiūtės Posakių ir žodžių žodynas) labai įvairiai apibrėžiami įvairiuose šaltiniuose. Struktūriniu aspektu žvelgiant, žodyne esama sakinių (Engiamųjų genijų autoritetas auga), žodžių junginių (dėl tėvynės) ir atskirų žodžių (skaistykla), todėl galima manyti, kad posakiais autorė laiko ir sakinius, ir žodžių junginius. Kasdienėje kalboje ir periodikoje dar galima išgirsti neteiktinąjį keliažodžio junginio pavadinimą išsireiškimas, taip pat frazė ir posakis, nebrėžiant ribos tarp žodžių junginio ir sakinio. Pavyzdžiui, Jurgis Kunčinas sparnuota fraze vadina sakinį „Už laisvą Estiją mes kausimės iki paskutinio lietuvio“ (Siamo tryniai, Šiaurės Atėnai, 2001 08 11). Panašiai ir rusų kalboje sparnuotais žodžiais vadinami plačiai paplitę posakiai. Kalbotyros terminų žodyne dar minimi terminai klišė, štampas, šablonas, kuriais apibūdinami stereotipiniai, trafaretiniai pasakymai ar rašomosios kalbos konstrukcijos. Kai kuriems iš šių terminų, dažniau vartojamiems populiariojoje spaudoje nei mokslinėje literatūroje, būdinga neigiama konotacija, todėl jie ir vartojami tuomet, kai reiškiamas sustabarėjusių posakių vertinimas. Tai ypač pasakytina apie štampą, kuris apibrėžiamas kaip „netekęs ekspresyvumo, nublankęs ir nuvalkiotas
121
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
pasakymas“ (KTŽ 1990). Jei spręstume iš pateiktų pavyzdžių, šie sinonimiškai vartojami terminai aprėpia ir žodžių junginius, ir konstrukcijas, ir sakinius (Gerbiami Lietuvos žmonės, Atsakydami į Jūsų š. m. kovo 15 d. raštą Nr. 100 pranešame, kad...). Kitomis kalbomis stabilūs junginiai tradiciškai priskiriami frazeologijai ir idiomatikai. Pažymėtina, kad anglosaksų kraštuose populiaresnis idiomos terminas, apimantis ne tik tikrąsias idiomas, bet ir tropinius frazeologizmus bei palyginimus. Anglų kalboje atsiradęs, plačiai paplitęs ir kitų kalbų pasiskolintas terminas kolokacija, atitinkantis mūsiškius sustabarėjusius ar apstabarėjusius, bet nebūtinai frazeologinius junginius, skirtas visais atžvilgiais labai įvairiems dažnai kartu drauge vartojamiems keliažodžiams junginiams įvardyti. Populiarus ir plačios semantinės apimties terminas, aprėpiantis visus dažnai drauge vartojamus žodinius ir nežodinius (vaizdinius, garsinius) ženklus, ypač paplitęs JAV, yra klišė (žr. http://www.westegg.com/cliche). Būtų prasminga skirti plačiai ir neprofesionaliai suprantamus pagal struktūrą skirtingai įvardijamus posakius ir frazes, atitinkančius sakinio ir žodžių junginio sandarą. Profesionaliau, laikantis lingvistinių konvencijų, vertėtų išlaikyti tradicines idiomos ir frazeologizmo sampratas, be to, papildomai įvardyti įvairius stabiliuosius žodžių junginius: posakius, konstrukcijas ir žodžių junginius, kuriuos galima vadinti lituanistikoje jau įsitvirtinusiu terminu kolokacija. Imant plačiau, idiomos, frazeologizmai, kolokacijos ar ir kitaip įvardijami sustabarėję kalbos vienetai galėtų sudaryti frazeologiją, o posakis ir frazė galėtų pretenduoti į universalų, nevertinamąjį, pernelyg neterminologizuotą bet kokio sustabarėjusio sakinio (posakis) ar žodžių junginio (frazė) pavadinimą. Tačiau realioje, nekodifikuotoje vartosenoje terminai įsitvirtina ir paplinta pagal savus, sunkiai prognozuojamus dėsnius. Kadangi dar nėra nusistovėjusios griežtos stabiliųjų junginių įvardijimo tradicijos, šiame darbe jie vadinami taip: bendruoju atveju – stabiliais žodžių junginiais, o konkrečiau, atsižvelgiant į jų struktūrą (sustabarėjusiais, gatavais) posakiais ir frazėmis arba tiesiog žodžių junginiais. Detaliojoje klasifikacijoje dar minimos idiomos ir tradiciniai frazeologizmai, morfologinės samplaikos, kolokacijos, rėminės konstrukcijos ir kt. Pastarieji apibūdinami vėliau, pirmiau derėtų pateikti argumentus, kodėl įvairius stabilius žodžių junginius vertėtų laikyti plačiai suprastos lietuvių kalbos frazeologijos dalimi.
122
1 .3. K O LO K A C I J O S S A M P R ATA
1.3.2.3. Frazeologijos centras ir paribiai Naujosios informacinės technologijos, elektroniniai tekstynai drauge su juos aptarnaujančia programine įranga ir jų analizė įtikinamai parodė, kad kalba konstruojama ir suvokiama pagal vadinamąjį fraziškumo principą. Pagal šį principą kalbą sudaro didelis kiekis gatavų ar pusiau gatavų frazių, iš kurių kuriami sakiniai ar ir didesnės teksto atkarpos. Anot J. Sinclairio (1996, 1999), fraziškumo principas dominuoja, stabilūs junginiai sudaro kur kas didesnę tekstų dalį nei atskirai parinkti žodžiai ir laisvieji žodžių junginiai. Šį teiginį pagrindė ir psicholingvistai, kurie yra nustatę, jog gatavoms frazėms pavartoti savo kalboje ar suvokti kito kalboje užtenka kur kas trumpesnio laiko tarpo nei pavieniams į gramatines struktūras sudėliotiems žodžiams (Nattinger et al. 1992: 17). Pripažinus fraziškumo principą, plačiai ir įvairiai suvoktas dažnai drauge vartojamų žodžių junginys, vadinamoji kolokacija, tapo itin populiariu tyrimų ir leksikografinių aprašų objektu (lietuviškai apie tai žr. Marcinkevičienė 1995, 2000). Šie daugiau ar mažiau stabilūs žodžių junginiai suvokiant ar tyrinėjant kalbą paprastai išryškėja tik iš panašių vartosenos atvejų daugybės, nes daugelio tokių frazių labai įvairi apimtis, neryškios ribos (paribyje yra kur kas didesnė leksemų įvairovė nei centre), leksiškai ir gramatiškai įvairuojantys sandai frazės viduje, kintama žodžių tvarka ir ganėtinai įvairuojantis kontekstas, kitaip sakant, šie dalykai apsunkina tiek automatinę, tiek neautomatinę kolokacijų paiešką ir apdorojimą. Taigi tekstynuose dominuoja nors ir įvairialypės, bet dažnos kolokacijos, o ne kur kas stabilesni, bet reti tikrieji frazeologizmai. Collins Cobuild Dictionary of Idioms rengėjams prisireikė labai didelio tekstyno, nes 10 milijonų žodžių apimties tekstyne nebuvo rasta net trečdalio į žodyną vėliau iš didesnio tekstyno įtrauktų idiomų. Pačios dažniausios idiomos vidutiniškai pasirodo kartą kas 2 milijonus žodžių (Moon 1995: V). Tą pačią problemą, matyt, pajuto ir Mokyklinio lietuvių–rusų kalbų frazeologijos žodyno rengėjai, nes žodyno įvade prisipažino, kad „kai kurie pavyzdžiai sukurti žodyno sudarytojų“ (Galnaitytė ir kt. 1989: 5). Didžioji dalis tradicinių frazeologizmų ne tik vartojama palyginti retai, bet ir daugelio gimtakalbių iš vis nesuprantama. Tuo galima įsitikinti juos apklausus, apklausai
123
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
panaudojus aiškinamuosiuose bei specialiuosiuose frazeologijos žodynuose pateiktus frazeologizmus. Naująją, realiai vartojamą frazeologiją sudaro kitokie, ne tokie vaizdingi ir/ar perprasminti žodžių junginiai. Dar vienas argumentas už plačiąją frazeologijos sampratą – kitos kalbos jau seniai į frazeologijos valdas yra įsileidusios vadinamąsias pusidiomes (semi-idioms) ir kitus daugianarius stabilius žodžių junginius. Ypač dažnai tai daroma kalbos mokymo tikslais, kai reikia pateikti ne tik kalbos struktūros, bet ir vartosenos aprašus, išmokyti svetimkalbius teisingai vartoti leksinius vienetus. Čia gatavos ar pusiau gatavos frazės, vadinamoji pusfabrikatinė kalba (prefabricated speech), labai tinka. Populiariojoje anglų kalboje taikomosios lingvistikos atstovai (Nattinger et al. 1992) įžvelgia kelis stabilių žodžių junginių tipus: a) tradicines neatspėjamos reikšmės idiomas (tokias kaip to kick the bucket reikšme ‘mirti’) ir prie jų besišliejančias klišes, sustabarėjimo laipsniu prilygstančias idiomoms, bet besiskiriančias apimtimi bei motyvuotumu (there’s no doubt about it, have a nice day) ir b) nekanonines frazes (non-canonical phrases), neturinčias griežtos įprastinės gramatinės struktūros, kur kas variantiškesnes nei klišės ir idiomos (by and large, off with his head, waste not, want not). Dar skiriamos paprastosios kolokacijos, apibrėžiamos kaip tokių žodžių junginiai, kurių nariai drauge vartojami dažniau nei tikėtina, ir leksinės frazės (lexical phrases), t. y. tokios kolokacijas, kurios atlieka pragmatinę funkciją (Nattinger et al. 1992: 32–36). Leksinės frazės yra tokie formos ir funkcijos junginiai, kurie apima tris kalbos lygmenis: leksiką, gramatiką ir pragmatiką. Jos gali būti įvairios apimties, įprastinės ar neįprastos sintaksinės struktūros, ganėtinai kintamos ir todėl lanksčiai prisitaikančios prie konteksto, tačiau ganėtinai stabilios ir todėl atpažįstamos. Joms priklauso a) vadinamieji daugianariai žodžiai (polywords), atliekantys apibendrinimo, nuostabos, siejimo ir kitas funkcijas (in a nutshell, what on earth, for that matter), b) institucionalizuoti posakiai (institutionalized expressions) – patarlės, aforizmai, mandagumo frazės, citatos, aliuzijos, jei tik jos atlieka pragmatinę funkciją (there you go reiškia pritarimą, have a nice day – atsisveikinimą, be that as it may – sutikimą) bei c) rėminės frazės ar konstrukcijos (phrasal constraints), turinčios pastovią ir kintamąją dalį, pavyzdžiui, kreipiniai ir atsisveikinimai laiškuose (dear..., see you ..., a ... ago). Taigi pagrindinis visos pusfabrikačių kalbos skiriamasis požymis
124
1 .3. K O LO K A C I J O S S A M P R ATA
yra stabilumas, o specifinis skiriamasis leksinių frazių požymis – pragmatinė jų funkcija. Čekų lingvistai ir leksikografai vartoja terminus frazema ir idioma, o jais pavadinamus vienetus apibrėžia pirmiausia kaip pastovų ir nedalomą žodžių junginį, kurio bent vienas narys vartojamas perkeltine reikšme, taigi perprasmintas, o visas junginys dažnai yra vaizdingas. Idioma nuo frazemos panašiai kaip idioma nuo frazeologizmo skiriasi perprasminimo ir sustabarėjimo laipsniu. Slovnik česke frazeologie a idiomatiky palyginimams, veiksmažodiniams ir neveiksmažodiniams posakiams skirti keturi tomai. Įdomu tai, kad frazeologijai priskiriami abstrakčiųjų daiktavardžių junginiai su veiksmažodžiais, vaidinami kvazifrazėmis, plg. delat / prokazovat nekomu milosti (condescend to assist someone) (SČFI 1994: 26–29). Tai tipiškos kolokacijos, pagal mūsų tradiciją frazeologijai nepriklausančios. Mūsų leksikografai, versdami plačiai suprantamų frazeologizmų žodynus į lietuvių kalbą, yra priversti taikytis prie originalo kalboje paplitusios frazeologijos sampratos. Štai Anglų–lietuvių kalbų kasdienių frazeologizmų žodyno lietuviškosios dalies rengėjų pratarmėje konstatuojama, kad „autorius frazeologizmus supranta labai plačiai, bet daugiausia iškelia tokių pasakymų, kurie gali neatrodyti tikri frazeologizmai, tačiau tiksli jų vartosena kelia nemaža sunkumų“ (Katiliūtė ir kt. 1999: 9). Žodyno autorius Martinas H. Manseris taip pat pripažįsta aprašomųjų frazeologizmų savitumą (čia daugiausia įeina šnekamosios kalbos posakių, atliekančių tam tikrą funkciją šnekoje, taigi leksinių frazių) ir faktą, jog daugeliui gimtakalbių jie nepastebimi, vartojami iš įpročio ir inercijos (Manser 1999: 5). Kalbos mokovui tokie posakiai ar frazės bei paprasčiausi žodžių junginiai ir jų samplaikos yra būtini kaip kalbinės konvencijos, kalbos ritualo dalis. Taip išryškėja dar viena stabilaus žodžių junginio dimensija – jie turi kalbinę specifiką, iškylančią tik lyginant kelias kalbas. Vienos kalbos kontekste šie junginiai sunkiau identifikuojami.
1.3.2.4. Kryžiažodžių frazeologija Kyla klausimas, ką laikyti netradicine plačiai suvoktos lietuviškosios frazeologijos dalimi ir kaip vadinti jai priklausančius stabilius žodžių junginius. Jei svarbiausia šio sluoksnio skirtimi kalbos kūrimo procese
125
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
laikysime sustabarėjimą ar stabilumą, suvokiant kalbą stabilumas tampa atspėjamumu. Kitaip sakant, jei kas pradeda sakyti mums žinomą posakį ar frazę, mes galime ją užbaigti ar įterpti trūkstamas grandis. Šiuo stabilių žodžių junginių dalinio spėjimo principu remiasi palyginti neseniai atsiradusi ir labai paplitusi kryžiažodžių rūšis, vadinamieji panoraminiai kryžiažodžiai. Juose gausu nebaigtų žodžių junginių, frazių ir posakių su trūkstamais žodžiais, pažymėtais daugtaškiais pradžioje, viduryje ar pabaigoje. Spėjamiems žodžiams įrašyti yra skirti kryžiažodžio langeliai, kurie padeda orientuotis, nes nurodo trūkstamo žodžio ilgį ir, jei teisingai išpręstos kitos užduotys, kelias to žodžio raides. Bet labiau nei kryžiažodžio struktūra spėjimas remiasi kalbos mokėjimu ir atmintimi, todėl šios panoraminių kryžiažodžių užduotys labai tinka vartosenos konvencijai tirti. Tyrimui buvo panaudoti 178 specialūs kryžiažodžiams skirti žurnalai Aha, Bingo, Dvylika, Oho, Manija, Panorama, Pramoga, Ringas su teisingai išspręstais kryžiažodžiais, kurių kiekviename žurnale buvo nuo kelių iki keliolikos. Iš viso buvo surinkta apie 1 000 spėjamųjų posakių, kurių nemažai kartojosi, ėjo iš vieno kryžiažodžio į kitą. Visa aptariamųjų posakių visuma laikytina daugumai girdėtų, žinomų ir mokamų frazių rinkiniu, šiandienio žmogaus suprantamų ir dažnai vartojamų kalbos vienetų kolekcija. Jei kam dalis stabiliųjų žodžių junginių ir nebūtų žinoma, nuolat kartojamos jos tikrai tapo kryžiažodžių mėgėjų kalbos savastimi. Drauge su kitoms kryžiažodžių užduotims spręsti reikalingomis žiniomis ji atskleidžia šiandienio žmogaus mentalitetą, todėl yra vertinga ir tyrinėtina ne tik kalbiniu, bet ir sociologiniu, kognityviniu, psichologiniu ar kitu aspektu. Stabiliųjų posakių ar frazių įvairovė kryžiažodžiuose itin didelė, jų skalė apima mažai kintančias, prie konteksto pritaikomas patarles ir priežodžius, tradicinius frazeologizmus, etiketo frazes, tikslias citatas, sentencijas kitomis kalbomis (dažniausiai lotynų) ir vadinamąsias kolokacijas, dėl riboto žodžių junglumo atsiradusius posakius ir beveik laisvus žodžių junginius, kurių vieną ar kitą elementą galima atspėti ne tiek pagal žodžių vartosenos ypatumus, kiek pagal aiškią, kitais junginio žodžiais nusakomą situaciją. Pateikiami stabilūs kalbos vienetai yra įvairios apimties, gramatinės sandaros, vartojimo sferos. Čia jie klasifikuojami ir aprašomi pagal kelis požymius: a) sustabarėjimo
126
1 .3. K O LO K A C I J O S S A M P R ATA
laipsnį, išreiškiamą variantiškumu, t. y. pagal tai, ar spėjamasis žodis yra vienintelė, ar viena iš kelių, ar tik labiausiai tikėtina galimybė. Lengviausiai atspėjami ir nuo konteksto nepriklausomi yra labiausiai sustabarėjusių ir nekintančių posakių elementai, kitaip sakant, tie, kurie iš atminties atkuriami gatavi. Po jų eina variantiškesni sakiniai, frazės ar žodžių junginiai, na, o apylaisvių žodžių junginių trūkstami žodžiai yra tik labiausiai tikėtini. Juos atspėti padeda logika ir nekalbinės situacijos išmanymas. Kiti klasifikavimo požymiai – b) žodžių junginio ar sakinio struktūra ir c) stabilaus žodžių junginio atsiradimo priežastis – kalbos savastis ar nekalbinė tikrovė. Pagal pastarąjį kriterijų skiriamos dvi pagrindinės klasifikacijos grupės: kultūros ir istorijos nulemti ir kalbos specifikos sąlygoti žodžių junginiai. Smulkiausios klasifikacijos padalos įvardijamos pagal ryškiausią jų požymį: semantinį, gramatinį ar dar kitokį.
1.3.2.4.1. Kultūros ir istorijos nulemti stabilūs žodžių junginiai Čia priklauso sustabarėjusios frazės ar posakiai, vienaip ar kitaip susiję su nekalbine tikrove, kurių stabilumas yra nulemtas kultūros istorijos, religijos, literatūros ir tautosakos, žiniasklaidos faktų. Jie įsimenami ir vėliau iš atminties atgaminami daugiau dėl kultūrinės nei dėl kalbinės konvencijos. Kryžiažodžių priežodžiai ir patarlės sudaro bene didžiausią stabiliųjų posakių dalį, spėjimui pateikiami bet kurie jų žodžiai. Mūsų skalėje patarlės ir priežodžiai priklauso prie stabiliausių, paprastai gramatinę sakinio formą turinčių posakių. Kryžiažodžiuose pateikiama jų visuma galėtų būti įdomi tyrinėtojams šiandienio jų paplitimo aspektu. Toliau pateikiama po kelis kartus pasikartojančios patarlės ir priežodžiai. Čia ir kitur skliaustuose nurodomi spėtini žodžiai: pigią mėsą šunys (ėda); (moki) žodį, žinai kelią; juokiasi puodas, (kad) katilas juodas; šuns (balsas) į dangų neina; savoj (šaly) pranašu nebūsi; (bėda) bėdą veja; šuo ir (kariamas) pripranta; (ar) vienas šuo margas; dėl (tos) skylės visi tylės; nėra namų (be) dūmų; (balon) puolęs sausas nekelsi; (su) siūlu atrasi kamuolį; (arti) bažnyčia, toli Dievas; (kad) katės lotų, šunų nereiktų; kiekviena pušis savo šilui (ošia); (žilė) galvon, velnias uodegon.
127
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
Kiti smulkiosios tautosakos elementai: a) vaikų žaidimų nuotrupos: (tam) davė, (tam) davė, tam neliko; pele, pele, (pas) ką žiedas žydi; b) mįslės ar jų nuotrupos: (šonas) šyla, (šonas) šąla; dvi (sesės) per kalnelį nesueina; kabo (kabikas), tupi tupikas; du bėga, du (veja); c) būrimas ramune (myli nemyli); d) dainelių žodžiai: (du) gaideliai; (ėsk), karvute, žalią šieną; (barė) Jonas katinėlį; e) pasakų frazės ar vardai: (avinėli), pasipurtyk; (Sezamai), atsiverk; (už) devynių jūrų, (už) devynių marių; kaip (tarė), taip padarė; trečias brolis (Jonas); lapė (snapė); (kiškis) piškis skeltalūpis; musė vilko (pusė); kur buvęs, kur (nebuvęs); liko tik nagai ir (ragai); f) vaikų kalbos posakiai: ar atnešei kiškio (pyrago)? Nukrito arba pagavo (zuikį). Pagal sustabarėjimo laipsnį čia dar priklausytų g) maldų žodžiai: atleisk mums mūsų (kaltes); Tėve mūsų, kuris (esi) danguje ir kiti sakiniai iš krikščioniškų apeigų ir katekizmo: tik (tark) žodį ir mano siela pasveiks; netark Dievo (vardo) be reikalo. Nekaitoma ir sentencijos, apibūdinamosios frazės ir panašūs svetimų kalbų posakiai: persona (non) grata; (ad) rem; (post) factum; (va) bank; (ad) multos annos; (in) vogue; (in) vino veritas; (Alma) Mater; (homo) sapiens; made (in) USA; (post) factum; (salem) aleikum; (Ave) vita; (quo) vadis? arba jų atitikmenys lietuvių kalba: (alfa) ir omega; (Sodoma) ir Gomora. Nemažą gatavų frazių fondo dalį sudaro žinomi literatūros ir meno kūrinių – romanų, filmų, eilių, dainų pavadinimai, pačių kūrinių citatos: (kam) skambina varpai; (katinas), kuris mėgo vaikščioti vienas, su (kuo) valgyta druska; (tas) beprotiškas pasaulis; (vien) saulės negana; (ir) aš mažas buvau; (atėjau), pamačiau, nugalėjau; būti (ar) nebūti; (ateina) genijai ir vėl išnyksta; (kol) jaunas, o broli, sėk pasėlio grūdą; ne tau, (Martynai), mėlynas dangus; (te) visad šviečia saulė; (dar) širdyje ne sutema; (karti), (karti), degtinė (karti); (būna) dienų lyg tyčia; (myliu), noriu, negaliu; vai, (žiba) žiburėlis; (nei) čia buvo, nei čia ką; ašara Dievo (aky).
Čia galėtų priklausyti ir kryžiažodžiuose neaptikto gerai žinomų tekstų dalinio citavimo, aliuzijų ar persakymo pavyzdžiai. Populiarūs kryžiažodžiuose raiškūs radijo ir televizijos laidų pavadinimai: (be) tabu; tai (bent) šeimynėlė; slaptoji (kamera); (svetimo) skausmo nebūna; (dar) ne vakaras; (gamta) – visų namai; (už) kampo.
128
1 .3. K O LO K A C I J O S S A M P R ATA
Sustabarėti linkusios ir plačiai paplitusios reklamų frazės ar ištisi sakiniai. Sunku pasakyti, ar jos įsitvirtins ir išliks ilgesniam laikui, bet jau bent tol, kol gaminys reklamuojamas, jos žinomos daugeliui kalbos vartotojų, todėl atskiri jų elementai nesunkiai atspėjami: (tik) tak ir tik dvi kalorijos; (išbandyk) savo laimę; vasara – kelionių (metas); mes matome (abi) pasaulio puses; žaisk ir (laimėk); (pirk) prekę lietuvišką. Prie reklamų šliejasi dažnai jose vartojami žinomi aforizmai ar aforizmus primenantys posakiai: (laikas) – geriausias gydytojas; jaunystė – (kvailystė); meilėje kaip kare – viskas (galima); mylimo (kūno) turi būti daug; (viltis) – kvailių motina; (meilė) – ne seilė. Riboto variantiškumo yra ir a) mandagumo frazės: (lik) sveikas; (viso) gero; linkėjimas valgančiam (gero) apetito; linkėjimas dirbančiam (padėk) Dieve; kiti įprastiniai kalbos etiketo posakiai b) linkėjimai, raginimai: (auk) didutis, būk gerutis; (dar) po vieną; (į) sveikatą; dar išgerkim (po) taurelę; c) perspėjimai: (stot), teismas eina; (atsargiai), piktas šuo; (stok) šausiu; (šalin) iš kelio; dink man iš (akių); nestovėk man (ant) kelio; nesimaišyk (po) kojom. Lietuviškieji keiksmai pateikiami kryžiažodžiuose kaip stabilūs: eik (po) velnių; (po) šimts pypkių arba kintančio antrojo dėmens posakiai: (kad) tave kur galas; (kad) tave kur kelmai / velniai / griausmas. Tradiciniai frazeologizmai ir idiomos, dažniausiai somatiniai, kitaip nei anksčiau išvardyti kalbos vienetai, paprastai pateikiami viena sustabarėjusia forma, nors kai kurie jų elementai kinta pagal kontekstą. Plg. įklimpęs (iki) ausų gali būti ir įklimpusi, įklimpo, įklimpau. Spėjimui pateikiami arba tarnybiniai, arba prasminiai jų žodžiai: liko tik (oda) ir kaulai; (abu) labu tokiu; tai (va) kur šuo pakastas; tamsu, nors pirštu į akį (durk); po manęs nors ir (tvanas); tik (per) mano lavoną; įgriso iki (gyvo) kaulo; devintas (vanduo) nuo kisieliaus; (iš) pirmų lūpų; (kita) medalio pusė.
Šiek tiek variantiškesni, bet vis vien sustabarėję yra populiarieji palyginimai: gudrus kaip (lapė); tyli (it) žuvis; (gali) kaip katė; skausmą kaip (ranka) nuėmė; (sveikas) kaip ridikas; (auga) kaip ant mielių; sėdi (lyg) ant adatų; tvirtas kaip (uola); (liko) it musę kandęs; (kaip) iš dangaus nukritęs; kvailas kaip bato (aulas).
129
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
1.3.2.4.2. Kalbos specifikos sąlygota frazeologija Pateikti stabilūs posakiai ir frazės, sudarančios kultūros ir istorijos nulemtą konvencinės lietuvių kalbos vartosenos dalį, iš esmės remiasi visiško atgaminimo, citavimo principu. Jie yra ne tiek kalbos ypatumų nulemta, kiek gyvenimo būdo ir kultūros sąlygota kalbos savastis. Toliau pateikti žodžių junginiai, labiau priklausantys nuo pačios kalbos, o ne nuo kultūros ar istorijos. Visus juos sąlygiškai galima pavadinti kolokacijomis, t. y. įprastiniais, pastoviais žodžių junginiais (plačiau apie kolokacijas žr. Marcinkevičienė 1995, 1999), nors jie ir apima labai didelę struktūrinę, semantinę ir pragmatinę įvairovę. Kolokacijos čia bus pristatomos pagal jų sustabarėjimo laipsnį ir iš jo plaukiantį variantiškumą, vieno žodžio junglumo ir asociatyvinio ryšio su kitu stiprumą. Tvirčiausiu ryšiu susijusių žodžių grupę sudaro visada drauge vartojamos ir vieno žodžio funkciją atliekančios įvairioms kalbos dalims priklausančios samplaikos, vadinamos morfologinėmis samplaikomis. Kryžiažodžiuose kai kada jos pateikiamos su platesniu kontekstu, palengvinančiu spėjimą. Joms priklauso a) samplaikinės dalelytės: vos tik, vien tik (tai); b) prieveiksmiai ir prieveiksminės kontrukcijos: vos ne (vos), šiaip (sau), kur ne (kur), (be) galo, (be) perstojo, (be) reikalo, (be) tabu, (iš) pradžių, (iš) tikrųjų, dėl (visa) ko (reikšme atsargumo dėlei); čia pat; c) parodomieji įvardžiai su pabrėžiamuoju pats: susirinko tie (patys) žmonės, (tais) pačiais metais, pats (sau) šeimininkas, (ta) pati melodija, viską sutvarkysiu (aš) pati; d) neapibrėžiamieji įvardžiai: čia dar (kai) ko trūksta, ne (bet) kas jai patinka; e) aukščiausiojo laipsnio prieveiksmiai: (mažų) mažiausiai; f) įterptiniai žodžių junginiai: (duos) Dievas, sulauksim šimto metų; taip (tyčia) (vartojamas susitarimui reikšti vaikams žaidžiant); (mano) manymu; (tarp) mūsų mergaičių; negana (to); (toli) gražu; g) jaustukai: (va) taip, (štai) kaip, (tai) bent, še (tau), (ts), patylėk. Kiek kitokio pobūdžio, tačiau prie morfologinių samplaikų derantys yra ir kryžiažodžiuose pateikiami sudurtinius laikus sudarantys žodžių junginiai: Ar (esi) buvęs Latvijoje? Apibendrintą reikšmę turi ir vienažodžiams kalbos vienetams prilygsta ir kai kurie tautologiniai žodžių junginiai: senut (senutėlis); (neis) nė varu varomas; (sakyk) jam nesakęs; (duos) neduos, bet žada;
130
1 .3. K O LO K A C I J O S S A M P R ATA
(lauk), kol sulauksi; (šovė), bet prašovė; kiek jam (duosi) – vis negana ir negana. Jie nevienodos kilmės, paskirties ir nevienodo sustabarėjimo laipsnio, tačiau panašūs vienu atžvilgiu – yra nesunkiai atspėjami. Morfologinės samplaikos priklauso vienai kalbos arba sakinio daliai, o kitos kolokacijos yra variantiškesnės ir priklauso sakinių arba žodžių junginių kategorijai. Stabiliausiais laikytini įvairūs posakiai, kuriems būdinga dvinarė rėminė paralelioji konstrukcija. Jie galėtų būti pavadinti sintaksinėmis paralelėmis: kiek (reiks), tiek ir bus; tu man, aš (tau); (nei) tu žinai, nei ką; (ko) norėjai, tą gavai; kiek (yra), tiek ir užtenka; kaip tu (man), taip aš tau; (su) kuo turiu, (su) tuo duriu; (kuo) toliau, tuo gražiau; kuo (tolyn), tuo blogyn; kas (bus), tą ir krikštysim; (tol), kol gyvas būsiu; (kas) bus, tas bus; (nei) šis, nei tas; kur (tu), ten ir aš; nuo – (iki); (nei) šitas, (nei) kitas.
Daliai jų būdinga ne tik rėminė konstrukcija, bet ir rimas: tu (sakai), tu žinai; ko (klausi), to negausi; bus laikas, bus ir (vaikas); (kol) laikai, tol ir vaikai; atėjo neprašytas, išėjo (nevarytas); (kiti) metai, (kiti) lapai; atiduos, (kada) lazda žaliuos; po savo stogu visaip (patogu); atšilo oras, pakilo (noras); gyvenimas (toks) mažytis, kad nėra ko varžytis.
Dialoginėms frazeologinėms samplaikoms priskirtinos įvairios šnekamosios kalbos sakinių nuotrupos, sudarančios neskaidomą junginį ir atliekančios pragmatinę funkciją. Tokiomis frazėmis reiškiama nuostaba, pasipiktinimas, abejonė, pasibaisėjimas, grasinimas, nuolaida ir panašūs dalykai: (ir) sugalvok tu man; (bijok) tu Dievo; (aš) tau parodysiu; eik tu (sau); (eik) jau (eik); tu (tik) pažiūrėk; geriau (nė) neklausk; (to) dar betrūko; ką tu (sau) manai? (to) dar nebuvo; (baisu) net pagalvoti; (na) jau (na); kur jau (ten); nė už (ką); (nieku) gyvu; ar (tau) galvoj negerai? ir kad man (nė) mur mur; (ką) žmonės pasakys; (kiek) kartų tau sakiau; (tas) tau lengvai nepraeis; (kas) tau darbo? (na), palauk; gal tau galvoj negerai? nenori – kaip sau (nori); nenori – nereikia; (mat) jį galas; (bala) tavęs nematė; tuščia (jų); (bala) žino.
Šios samplaikos ribojasi su daugiažodžiais jaustukais (žr. morfologines samplaikas), joms kaip ir tradiciniams frazeologizmams būdingas
131
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
nedalomumas, perprasminimas, o jų pragmatinei reikšmei suprasti labai svarbi intonacija. Kiti kasdienės kalbos posakiai ar frazės gali būti išskaidomi į savarankišką reikšmę turinčius komponentus, kurių dalis junginyje vartojama perkeltinėmis reikšmėmis, todėl visas posakis yra raiškus, vaizdingas, frazeologizuotas: darbų galo (nematyti); (degu) iš gėdos; (iki) vestuvių užgis; (ne) piniguose laimė; kur (du) – tai ne vienas; nusileisk (ant) žemės; (tik) miręs pailsėsi; (mirsi), o darbų nebaigsi; (tam) ir dantys, kad kramtytum; ieško, (ko) nepametęs; (akim) nemato, ausim negirdi; (tyli) ausis suglaudęs; (mirk) iš juoko; tu man nervus (ėdi); išsižiojo ir neteko (žado); netekau (amo) iš nuostabos; jūs mane (varote) iš proto; aš tave (miniu) geru žodžiu; kodėl tu (paistai) tokius niekus; (du) amžius negyvensi; (pataikė) į dešimtuką; bėga, (net) žemė dunda; dirba (net) išraudęs.
Nors kryžiažodžiuose stabilūs posakiai paprastai pateikiami sakinio forma, tačiau tik dalis jų yra sustabarėję visa apimtimi, kaip darbų galo nematyti, ne piniguose laimė, iki vestuvių užgis. Kitų nekaitoma tėra tik šerdis, paprastai daiktavardis ir su juo besijungiantis veiksmažodis, kurį galima vartoti viena, keliomis ir visomis įmanomomis formomis. Viena būtojo laiko trečiojo asmens forma paprastai vartojamas posakis pataikė į dešimtuką, nors galima ir pirmojo asmens vartosena: pataikiau, pataikėme į dešimtuką. Daugiau kaitybinių variantų turi veiksmažodžiai posakiuose varyti iš proto, geru žodžiu minėti, žado netekti ir kai kurie kiti. Galbūt siekiant autentiškos vartosenos, kuri palengvintų spėjimą, dalis frazeologizuotų posakių kryžiažodžiuose vartojami liepiamosios nuosakos forma: pasipustyk (padus) ir mauk iš čia; (patirk) tai savo paties kailiu; (palik) mane ramybėje; (dėk) centą prie cento; ieškok ir (rasi); (be) reikalo nepraverk burnos; klausyk, ką seni žmonės (sako); nebūk (sau) priešas; daryk kaip (galima), o ne kaip norima; niekada daugiau (taip) nedaryk; žiūrėk (tik) neapsirik; (niekados) nesakyk ne; (kad) pradėjai, tai ir baik; jauskis kaip (namie).
Kitą gana sąlygiškai skiriamą stabiliųjų posakių grupę galėtų sudaryti iš pirmo žvilgsnio paprasti posakiai, atspindintys kasdienes situacijas ir nūdienos realijas. Čia jie vadinami kasdieniais posakiais:
132
1 .3. K O LO K A C I J O S S A M P R ATA
pakėlė šampano (taures); ten (tikras) pragaras; velionio (asmenybė) nenustatyta; pradėkim (viską) iš pradžių; na, (klok) visas naujienas; puodelyje neliko (nė) lašo; kova pačiame (įkarštyje); jis vos (laikėsi) ant kojų; iškrito bloga (korta); darbo – tik (spėk) suktis; (savaime) suprantamas dalykas; laiko turiu į (valias); arklys stojasi (piestu); (imk) mane į žmonas; šis žmogus (su) charakteriu.
Šių posakių lietuviškoji kalbinė specifika, atsiradusi dėl veiksmažodžio ir daiktavardžio derinių, išryškėja tik kitų kalbų fone, mat artimas lietuviškajam posakiui, o juo labiau pažodinis vertimas čia neįmanomas, plg., gerk (iki) dugno angliškai skambėtų bottoms up. Dar labiau iš konteksto galima išskirti jau nebe posakius, nors kryžiažodžiuose jie ir pateikiami sakinio forma, bet žodžių junginius, atitinkančius tipiškos kolokacijos sampratą. Čia dėl trumpumo jie pateikti veiksmažodžiui antraštine bendraties forma (spėjimui paprastai pateikiama kuri nors kita veiksmažodžio forma, nes daiktavardis geriau implikuoja savo junglumo partnerį): skusti bulves; semti samčiu; sagstytis sagas; sekti pasaką; vyti šalin blogas mintis; atkakliai siekti tikslo; tenkinti vaiko užgaidas; tęsti tėvo darbus; sėdėti kalėjime; žudikus susodinti už grotų; įteikti notą; valyti dantis; sekti paskui; kloti patalą; šauti duoną į krosnį; pase uždėti vizą; dyžti batus; padangėje sukti ratus; sukti akis į šoną; nubausti pinigine bauda.
Išvardytos kolokacijos yra objektinės. Esama ir subjektinių, kurias geriau pateikti kaip kryžiažodžiuose, t. y. esamojo ar būtojo laiko forma: įsisiurbė (erkė); šaltis (žnaibo) ausis; čiurlena mažas (upelis); (tvenkiasi) lietaus debesys; putoja (alus); jam (sukako) 30 metų; ištiko trauminis (šokas); išsipildė visi (norai); nusikalto, dabar (stos) prieš teismą; pasigirdo (aštri) kritika; užplūdo šilti (jausmai); (kamuoja) nemiga; išsigandus namuose kilo (panika); višta (deda) kiaušinius; vėjas (pučia); vėjas plaukus (kedena).
Veiksmažodžio junginiuose su prieveiksmiu spėjimui pateikiamas pastarasis, nes jis nuo veiksmažodžio labiau priklausomas, plg: labai (smarkiai) supykti; (gailiai) verkti; (skaudžiai) gelti (apie uodus). Kolokacijų, kitaip nei ilgesnių posakių, partnerius atspėti padeda tik vienas arba du žodžiai (ir, žinoma, spėjamam žodžiui paliktų
133
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
langelių skaičius), taigi kur kas trumpesnis nei anksčiau cituotų posakių ir sakinių kontekstas. Taip yra todėl, kad kai kurių žodžių junglumas yra ribotas, pavyzdžiui, nemiga gali tik kankinti arba kamuoti, patalą galima tik kloti arba taisyti, o puodas gali virti, bėgti, svilti, sudegti, todėl norimam kolokatui implikuoti prisireikė platesnio konteksto. Juo ribotesnis kolokato junglumas (virti ar bėgti gali daug kas, o svilti tik puodas, košė ar dar koks kitas maistas), tuo stabilesnė kolokacija. Juo stabilesnė kolokacija, tuo lengviau atspėti vieną jos narį, paprastai mažiau junglų. Štai s(aulė) šviečia arba žeme ridinėjasi. Pirmasis veiksmažodis yra kur kas junglesnis už daiktavardį (šviesti gali daug kas, o saulė tik tekėti, leistis, užgęsti, šviesti, kilti, krypti vakarop) todėl spėjimui pateikiama mažiau junglaus daiktavardžio pirmoji raidė. Antruoju atveju turime sustabarėjusią vienakryptę, t. y. iš vienos pusės numanomą, kolokaciją, nes žodžių junginys žeme ridinėtis paprastai vartojamas kalbant apie saulę. Taigi kolokacijoms priklauso nevienodai stabilūs junginiai. Čia, sekant G. Kjellmeriu (Kjellmer 1991), bus laikomasi trinarės kolokacijų gradacijos ir skiriamos sustabarėjusios, apstabarėjusios ir kintamosios frazės, besusiliejančios su laisvaisiais žodžių junginiais. Tik kitaip nei G. Kjellmerio schemoje sustabarėjusioms frazėms taikomi ne tokie griežti reikalavimai: pakanka, kad bent vienas frazės narys aiškiai implikuotų kitą, nebūtinai kiekvienas. Atitinkamai laisvesnės yra ir apstabarėjusios frazės. Sustabarėjusioms skirtinos dvinarės kolokacijos, susietos jungiamuoju ryšiu, kurių vienas narys stipriai implikuoja kitą kaip labiausiai tikėtina galimybė: budelis ir (auka); (savi) ir svetimi; Elzasas ir (Lotaringija); flora ir fauna; pinigai ar (gyvybė) (tamsioje alėjoje); taip ir/arba (ne); nei didelė, nei (maža); (iksas) ir igrekas; geografinė platuma ir (ilguma); (kūjis) ir pjautuvas; strategija ir (taktika); veiksmas, lygus (atoveikai); lietuvius vežė ir (trėmė) Sibiran; jis – vyras, ji – (moteris); (šokom) ir dainavom visą vakarą; vaikas (kosti) ir sloguoja; kas geriau: (imti) ar duoti; geriau (kitam) duoti, nei kito prašyti; ryt (poryt) – šiom dienom; aš ir (tu); jis ir (ji).
Esama ir trinarių kolokacijų, reiškiančių baigtinį vardijamųjų elementų skaičių: vandenyje, žemėje ir (ore); vakar, šiandien, (rytoj); taip
134
1 .3. K O LO K A C I J O S S A M P R ATA
buvo, yra ir (bus); pragaras, skaistykla ir (rojus). Kai kurie žodžiai gali turėti du maždaug to paties dažnumo kolokatus: (švari, gali būti ir nešvari) sąžinė; (dalinis, g. b. ir visiškas) saulės užtemimas; (beržų, g. b. ir klevų) sula; (romėniški, g. b. ir arabiški) skaitmenys. Kitų žodžių junginių nariai atspėjami dėl pasikartojančių semantinių komponentų, todėl galėtų būti vadinami pertekliniais. Pateiktame junginio naryje esantis bendras semantinis komponentas signalizuoja kitą narį: (sek) paskui mane (nors gali būti eik paskui mane); mes (kylam) vis aukštyn (nors gali būti mes lipam vis aukštyn); pats laikas grįžti (namo); lauke šalta, įsileisk (vidun); dirbkime (visi) drauge; pasiliko (visam) laikui; (eik), iš kur atėjęs; jam staiga (parūpo) mano reikalai; (niekaip) negaliu šito suprasti. Daiktavardinės frazės pagal jas sudarančių žodžių junglumą galėtų būti priskiriamos tiek sustabarėjusioms, tiek apstabarėjusioms kolokacijoms. Pirmosioms priklausytų tos kolokacijos, kurių bent vienas narys stipriai implikuoja kitą, nes paprastai tik su juo ir yra vartojamas: Pitagoro (teorema); brolių Grimų (pasaka); (avarinis) išėjimas; tikimybių (teorija); Brailio (raštas); troleibusų (depas); plūktinė (asla); kramtomoji (guma); Kauno sporto (halė); (pikti) kėslai; aušta (rytas); skrandžio (opa); (musė) cėcė; (meilė) iš pirmo žvilgsnio.
Apstabarėjusioms kolokacijoms priskirtinos tos daiktavardinės frazės, kurių nariai abiem ar viena kryptimi ne taip stipriai implikuoja vienas kitą: duonos (riekė), pikų (dama), pelno (mokestis), todėl galima didesnė junglumo partnerių pasirinkimo laisvė nei tik iš vieno ar dviejų kolokatų: stiprus vėjo (gūsis); (gamtiniai) ištekliai; bagažo saugojimo (kamera); polka su (ragučiais); (rasinė) diskriminacija; kiliminė (danga); siūlo (galas); namo (stogas); genealoginis (medis); skaistybės (diržas); čigonų (taboras); (raina) katė; (saulės) zuikutis; (kova) dėl būvio; aktų (salė); cinkuota (skarda); ristas (žirgas); triumfo (arka); laikinoji (sostinė); landšaftinis (draustinis); kritinė (pastaba); priverstinė (pravaikšta); (pilvo) vergas; šovinių (apkaba); vynuogių (kekė); žalia (korta) – šansas gyventi JAV; (opus) klausimas (reikšme svarbus).
Prie apstabarėjusių kolokacijų skirtini ir tie kryžiažodžių sakiniai, kurių trūkstamam nariui atspėti būtinai reikia daugiau nei vieno nario, tikslinančio trūkstamo kolokato vartojimo aplinkybes. Jei kolokatą
135
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
implikuoja tik vienas junginio žodis, pavyzdžiui, čiurlena (upelis), asociatyvusis ryšys tarp žodžių yra toks stiprus, kad galima teigti, jog platesnio junglumo žodis įeina į siauresnio junglumo žodžio reikšmę. Dažnai ši semantinė priklausomybė nurodoma ir žodyninėse definicijose ar pavyzdžiuose, plg.: zylioti – 1. gyliuoti (apie gyvulius), atbraila – išsikišimas, užlenkimas, karnizas: skrybėlės, krosnies atbraila (DLKŽ 2000). Tačiau tik palyginti nedaugelis pavienių žodžių aiškiai implikuoja savo junglumo partnerius. Kur kas dažniau prisireikia kelių žodžių, kurių kiekvienas sumažina pasirenkamųjų kolokatų skaičių. Štai veido galima jungti su tam tikru skaičiumi daiktavardžių (masažas, spalva, paraudimas ir pan.), riebus,-i – taip pat gali būti daug kas, tačiau sujungus šių dviejų daiktavardžių junglumus, trečiojo kolokato spėjimas žymiai palengvėja – didžiausia tikimybė, kad riebi veido bus oda. Toliau pateikti kiti apstabarėjusių kolokacijų pavyzdžiai: jis tiksliai (vykdo) mano nurodymus; tuoj jis (pakeis) pokalbio temą; reikia (įdėti) daug darbo; už savo klaidas brangiai (mokame); (kovok) už savo teises; vaiką (supa) lopšyje; ar (skiri) juodą nuo balto? (batas) spaudžia koją; puolas (svilo), kol ugniagesiai nukėlė; užėjo šilti (orai); užsimezgė įdomus (pokalbis); (palik) mane ramybėje; viskas eina per(niek); dirbu dviem (etatais).
Reikiamą kolokatą implikuoja papildomas daiktavardinio žodžių junginio narys: didelė kopūsto (galva); aštri šerno (iltis); platus prekių (asortimentas); plenarinis Seimo (posėdis); supinta stora (kasa); tiksli gimimo (data); pašlijusi šalies (ekonomika); paskutinis (mados) klyksmas; kova iki paskutinio kraujo (lašo); (karinės) oro pajėgos; jo didelis, tiesiog žvėriškas (apetitas); sužalota krūtinės (ląsta); (dama) su kamelijomis; ties leistina (riba); ilgo nuotolio (bėgimas); bet kuriuo paros (metu); žmogus (prie) pinigo; parduotas (iš) varžytynių; desertui – (plakta) grietinėlė; pasidalykite per (pusę); vandens (iki) kelių.
Kai kada galimi ir kitokie nei kryžiažodžių sudarytojų numatyti ir spėjimui pateikiami kolokatai, bet pateiktieji yra dažnesni, aktualesni šių dienų gyvenime: (aukštyn) kojom; muilo (opera); (orų) prognozė; darbo (drausmė); gūdi (naktis); geležinė (valia); (tautos) išrinktieji; galvijų (banda); spalvų
136
1 .3. K O LO K A C I J O S S A M P R ATA
(gama); Žalgirio (mūšis); negyvenama (sala); (savas) kampas; kapo (duobė); lapės (ola); Seimo (narys); namų (ūkis); spygliuota (viela); dantų (pasta); stiklo (tara); (pigi) prekė; bobų (vasara); lietuvių kalbos (gramatika); (istorinė) klaida (plg. padaryta (grubi) klaida); Berlyno (siena); nelaimės (auka); stalo (koja); prietaisų (skalė); laiko (relė); žemės (renta); proto (bokštas).
Trūkstamąjį kolokacijos narį šiose ir kitose kolokacijose implikuoja ne tik esamo nario ar narių semantika, bet ir gramatinė forma, nes sustabarėjusioms frazėms dažnai būdinga ir stabili gramatika. Štai vienaskaitinė būdvardžio perlinė forma implikuoja kolokatą (vonia), o daugiskaita perlinės – (kruopos). Panašiai ir fizinė (negalia), bet fizinės (jėgos), tramdomieji (marškiniai), bet tramdomas (juokas). Šios kolokacijos ribojasi su kintamosiomis frazėmis ar net laisvaisiais žodžių junginiais, todėl negalima nubrėžti aiškios ribos tarp skirtingo sustabrėjimo laipsnio kolokacijų, plg.: kaip (yra), taip gerai; vienaip (sako), kitaip daro; vyras (vyrui) nelygu; (tai) manęs neliečia; už (save) neatsakau; (nieko) gero nesitikiu; (pagal) darbą ir užmokestis; buvo (eita) ne tuo keliu; (to) buvo galima tikėtis; užeik (nors) trumpam; daryk, kaip (nori); kas tu (man), kad nurodinėtum; toks jau mano (likimas); kiekvienas turi savo (stilių).
Du paskutiniai posakiai, nors ir dažni, tačiau ganėtinai laisvi, nes vietoj likimo gali būti pavartotas bet koks kitas abstraktus daiktavardis – sprendimas, požiūris, nusistatymas ir pan. Taip pat vietoj stiliaus gali būti nuomonė, požiūris ar dar kaip nors kitaip. Vadinasi, ryšį tarp žodžių čia lemia ne kas kita kaip tik dažnesnė vartosena, ne semantika, ne leksinė dermė ar kalbos junglumo dėsniai. Toliausiame skalės gale yra kintamosios frazės, kurių ėjimą drauge lemia situacija, o jų nariai dažniausiai gali būti pakeisti kitais, sinonimiškais. Riba tarp jų ir laisvųjų žodžių junginių sunkiai nustatoma: karstą nunešė į (kapines); ant tėvo (kapo) padėjau gėlių; naktį stipriai (šalo); įkalta į sieną (vinis); žmogus (neturi) gyvenimo tikslo; (šlama) lapai vėjui pučiant; paukščiai (išskrenda) į šiltuosius kraštus; šuo pradėjo smarkiai (loti); nulūžo karvės (ragas); nulaužta beržo (šaka); jos puiki (figūra); buria iš (kavos) tirščių; vakar (snigo) dideliais kąsniais; mums (teko) ilgai laukti; (trenkė) durimis ir išėjo; (uždaryk) duris iš kitos pusės; (vos) spėjau į traukinį; apie (tai) net ir negalvok; (nepyk),
137
1 da lis. T E O R I N I A I I R M E TO D O LO G I N I A I PA M ATA I
aš tik pajuokavau; (matom), kas iš to išėjo; visi (daro), kas ką nori; (geram) žmogui nieko negaila; pavyko iš (pirmo) karto; (Lietuva) – Marijos žemė; (mis) Lietuva; (top) modelis; (metalo) laužas; garbės (žodis); likimo (ironija).
Čia, kaip matyti iš pateiktų pavyzdžių, įeina ilgėlesnės veiksmažodinės ar trumpesnės daiktavardinės frazės bei dažniausiai užduodami klausimai, kurių klausiamieji žodeliai lengvai numanomi iš konteksto, ar frazės su galimu tik vienu tarnybiniu žodžiu: (kelinta) dabar valanda; (kas) tau atsitiko; (kada) pareisi namo; (ko) nori iš manęs; kas tau s(akė); (ar) nepamiršote išjungti lygintuvo; (kas), kur, kada; (ar) vyras mirė; (ar) saga ištrūko; bėga (iš) pamokų; prisivalgiau (iki) soties; ar tau (dar) negana.
Taigi kryžiažodžių frazeologija apima visą nevienodai stabilių posakių ir frazių skalę nuo cituojamų, iš atminties atgaminamų patarlių ir priežodžių, tautosakos ir etiketo frazių bei posakių, sentencijų, pavadinimų, citatų, aforizmų, tradicinių frazeologizmų per morfologines samplaikas, tautologinius ar šiaip kasdienės kalbos posakius, dialogines frazes prie sustabarėjusių, apstabarėjusių ar kintamųjų kolokacijų, besiribojančių su laisvaisiais žodžių junginiais. Visai jai, kad ir kokia įvairi būtų, būdingas vienas bendras bruožas – dėl kalbos ar nekalbinės tikrovės atsiradęs daugiažodžių kalbos vienetų (sakinių, konstrukcijų ar frazių) vartojimo pastovumas ir iš jo einanti galimybė atspėti trūkstamus narius. Remiantis gausiais ir įvairiais panoraminiuose kryžiažodžiuose spėjimui pateikiamais stabiliais posakiais bei frazėmis, galima suvokti sustabarėjusių ar apstabarėjusių kalbos vienetų apimtį ir pobūdį. Tradiciškai suvokiama frazeologija čia sudaro kiekybiškai ir kokybiškai nedidelę stabilių žodžių junginių, kontrukcijų ir sakinių dalį. Todėl atsižvelgus į frazinį kalbos pobūdį bei dabartinės lietuvių kalbos vartojimo ypatumus siūloma praplėsti tradicinę frazeologijos sampratą į ją įtraukiant visiškai iš atminties atgaminamus kalbos vienetus, taip pat įvairaus stabilumo laipsnio kolokacijas. Taip suvoktą frazeologiją sietų vienas bendras požymis – įvairios apimties kalbos vienetų (frazių ar posakių, žodžių junginių ar sakinių) vartojimo pastovumas. Kiti požymiai – reikšmės vientisumas, perprasminimas, vaizdingumas skirtų tradicinį frazeologijos centrą nuo šių požymių neturinčios periferijos.
138
2 dalis LIETUVIŲ KALBOS KOLOKACIJŲ ŽODYNAS
Čia pristatomas pirmasis lietuvių kalbos daiktavardinių frazių žodynas, kurį sudaro stabiliai vartojami junginiai su daiktavardžiais, to žodyno sudarymo principai, paskirtis ir tolesni analizės etapai. Frazių žodynas sudarytas iš kolokacijų, automatiškai gautų iš Dabartinės lietuvių kalbos tekstyno. Tiek kolokacijos, tiek ir iš jų gauti sustabarėję žodžių junginiai yra labai koncentruota kalbos išraiška, pati reprezentatyviausia rašytinės kalbos dalis. Šiame skyriuje nuodugniai aptariami egzistuojantys kolokacijų išgavimo būdai ir jų pagrindu sukurtas naujas metodas, esminiai automatiškai išgautų kolokacijų ir rankiniu būdų sudarytų jų frazių žodyno ypatumai. Atskirai, remiantis ankščiau aptartais teoriniais principais, aptariamos šio žodyno metaforos ir frazeologizmai.
139
2 d a lis. L I E T U V I Ų K A L B O S K O LO K A C I J Ų ŽO DY N A S
2.1. KOLOKACIJOS IR NATŪRALIOSIOS KALBOS APDOROJIMAS Kaip buvo minėta, kolokacija yra daugiareikšmis ir neapibrėžtas terminas, skirtingų tyrėjų suprantamas įvairiai. Jos samprata priklauso nuo tyrėjo išeities pozicijos, taip pat nuo kolokacijų išgavimo būdo. Esama dviejų kolokacijos sampratos atmainų, kai į kolokaciją žvelgiama jos turinio ir formos atžvilgiu. Viena autorių grupė (Firth 1957; Sinclair 1991; Stubbs, 2001 ir kiti) pateikia kontekstinę ar į ją panašią statistinę kolokacijos sampratą. Kontekstinė kolokacijos apibrėžtis nusakoma taip: vienas žodis laikomas kito kolokatu, jei tik tas kitas vartojamas artimu kontekstu (Partington 1998: 16). Statistinę kolokacijos apibrėžtį geriausiai įvardijo M. Stubbsas (2001: 29): „paprastai domina dažnas ėjimas drauge, koreliacija, o tekstynų lingvistika remiasi nuostata, kad dažni dalykai yra svarbūs. Mano apibrėžtis yra statistinė – kolokacija yra dažnai drauge vartojami žodžiai“ (Usually it is frequent co-occurrences which are of interest, and corpus linguistics is based on the assumption that events which are frequent are significant. My definition is therefore a statistical one: collocation is a frequent co-occurrence). Statistinė kolokacijos sampratos atmaina grindžiama dvinare kolokacijos sandara. Pagal ją kolokacija susideda iš pagrindinio žodžio (a node word) ir jo kolokatų, aptinkamų tam tikru, iš anksto numatytu atstumu nuo pagrindinio. Taip suprantamos kolokacijos paieškos prasideda nuo iš anksto žinomo ar pasirinkto pagrindinio žodžio, kuriam ieškoma dažniausių junglumo partnerių. Šią sampratą atspindi ir kolokacijų pateikimo forma. Paprastai tokios kolokacijos pristatomos kaip pagrindinio žodžio ir jo kolokatų sąrašas, susidedantis tik iš prasminių žodžių, dažniausiai praleidžiant tarnybinius, plg.: Caring < seeks, loving, honest, sincere, etc. >. Skaitytojas, norintis pamatyti visą natūralios kalbos teksto atkarpą su rūpima kolokacija, turi ieškoti jos tekstyne, gauti pagrindinio žodžio konkordansą su nurodytu kolokatu. Kitu atveju galima pasikliauti savo ar kito gimtakalbio kalbos jausmu ir sukurti dviem izoliuotiems žodžiams platesnį kontekstą. Pavyzdys čia pateiktai kolokacijai galėtų būti trumpas pažinčių skelbimas: Seeks sincere, caring single lady (Stubbs 2001: 19).
140
2. 1. K O LO K A C I J O S I R N AT Ū R A L I O S I O S K A L B O S A P D O R O J I M A S
Statistinė kolokacijos samprata išryškina leksinį ryšį tarp žodžių labiau nei konkrečias žodžių poras autentiškomis jų pavartojimo formomis. Todėl M. Stubbsas apibrėžia kolokaciją kaip „leksinį ryšį tarp dviejų ar daugiau žodžių, kurie paprastai atsiduria netoli vienas nuo kito tekste, pavyzdžiui: teikti vartojamas su pagalbą, pastogę, informaciją“ (Collocation is a lexical relation between two or more words which have a tendency to co-occur within a few words of each other in running text, e.g. „provide“ occurs with „help, assistance, money, food, shelter, informatikon“) (Stubbs, 2001: 24). Į pirmą planą iškeltas leksinis ryšys, nurodomas pagrindine dažnai kartu vartojamų žodžių forma, ir statistinis kolokacijos nustatymo būdas užmaskuoja autentiškus tokių kolokacijų pavartojimo pavyzdžius. Be to, į kolokaciją žvelgiama hierarchiškai, skiriant pagrindinį, taigi svarbiausią, žodį ir jo kolokatus, kolokacijų ieškoma pagal pagrindinį žodį parenkant jam tik po vieną kolokatą, todėl daugiažodžių junginių taip suprantamos kolokacijos neaprėpia, juo labiau, iš šios sampratos neišryškėja kolokacijų ribos. O be aiškiai apibrėžtų kolokacijų ribų negalima pasakyti, kokią teksto ar tekstyno dalį sudaro kolokacijos. Žvelgiant plačiau, negalima pasakyti, kokia mūsų kalbos dalis yra atsiradusi dėl J. Sinclairio įvardyto idiomų principo (žr. Sinclair 1991: 109–121). Kalbėdamas apie kolokacijų ribas J. Sinclairis (1991: 113) teigia: „Ribos tarp teksto atkarpų, sudarytų remiantis skirtingais būdais (idiomų ir laisvu žodžių pasirinkimu – R. M.) paprastai nėra aiškios <...>, tačiau yra įmanoma statistiškai apskaičiuoti kolokacijos ilgį ir nustatyti jos ribas (The boundaries between stretches constructed on different principles will not normally be clear-cut…nevertheless it is possible to measure statistically the length of collocations and to set its boundaries). Kita teksto lingvistų grupė (Kjellmer 1982, Williams 1998 ir kiti) remia leksikografinę kolokacijos sampratą, į kurią įeina gramatinio taisyklingumo kriterijus. Jiems kolokacija nėra vien tik statistika paremtas žodžių junginys. G. Kjellmeris (1982: 25) rašė: „Jei vien tik vartojimo dažnumas būtų pagrindas išgauti kolokacijas iš tekstyno, taip gautų kolokacijų sąrašas būtų labai margas. Negana to, jei kolokacijas norima pateikti žodyno pavidalu, tokie junginiai kaip kad although he, but too, hall to būtų labai ribotos vertės“ (If frequency alone were to be our guide in extracting collocational material from the Corpus, it is clear that the material
141
2 d a lis. L I E T U V I Ų K A L B O S K O LO K A C I J Ų ŽO DY N A S
would be of a very heterogeneous nature. Moreover, it is obvious that if the inventory is to have the form of a dictionary, the „although he, but too, hall to“ type of combinations is of very limited value). Atsižvelgus į abu kriterijus – vartojimo dažnumą ir gramatinę struktūrą – galima atrinkti tokias kolokacijos, kurios galėtų sudaryti kolokacijų žodyną. Tačiau statistinio kriterijaus šalininkai ignoruoja gramatinį taisyklingumą. Radikaliausias šiuo atžvilgiu buvo J. Sinclairis – atmetė galimybę suvokti kolokaciją remiantis ją sudarančių žodžių gramatine forma. Jis (Sinclair 1991: 113) tvirtino , jog „klaidinga ir neperspektyvu būtų mėginti atlikti tokių darinių kaip of course gramatinę analizę, taip pat nevykę būtų bandymai gramatiškai tirti bet kurią dalį teksto, sudaryto remiantis idiomų principu. Kitokie nei gramatiniai apribojimai galioja toms žodžių grupėms, kurios pasirenkamos vienu metu ir todėl gali būti vadinamos gatavomis ar pusiau gatavomis frazėmis. Ribos tarp skirtingais būdais sudarytų teksto atkarpų paprastai nėra ryškios, ne visos atkarpos yra tokios akivaizdžios kaip žodžių junginys of course, kuris parodo, kad yra sudarytas kitaip nei remiantis gramatinėmis taisyklėmis“ (Just as it is misleading and unrevealing to subject „of course“ to grammatical analysis, it is also unhelpful to attempt to analyze grammatically any portion of text which appears to be constructed on the idiom principle. Constraints other than grammatical ones are placed on those strings of words that constitute single choices and can be called preconstructed or semi-preconstructed phrases. The boundaries between stretches constructed on different principles will not normally be clear-cut, and not all the stretches carry as much evidence as „of course“ does to suggest that it is not constructed by the normal rules of grammar). Papildomas argumentas prieš gramatinio kriterijaus taikymą kolokacijoms identifikuoti galėtų būti kolokaciją sudarančių žodžių semantiniai ryšiai. Paprastai įvairių gramatinių formų kolokacijas sudaro tų pačių šaknų žodžiai, plg.: argue heatedly, heated argument, in the heat of argument (Stubbs 2001: 30). Lietuvių kalbos pavyzdys galėtų būti junginiai su daiktavardžiu atmintis: išlikti, išliekantys, išliekamumas atmintyje arba lavinti atmintį, atminties lavinimas, išlavinta, išlavėjusi atmintis. Vienintelė statistinio požiūrio šalininkų pripažįstama svarbia gramatine kategorija yra pagrindinio žodžio gramatinė forma, nes ji lemia skirtingą junglumą (plg. daiktavardis prasmė, vartojamas vienaskaitos įnagininko linksniu, dažniausiai jungiasi su įvardžiais ta, šia, tam tikra,
142
2. 1. K O LO K A C I J O S I R N AT Ū R A L I O S I O S K A L B O S A P D O R O J I M A S
o bet kuri kita jo forma – su kur kas daugiau ir įvairesnių junglumo partnerių). Tai tekstynų lingvistikoje vadinama idiosinkračiu stabilumu (idiosyncratic collocability). Siekiant suderinti dviejų skirtingų kolokacijos sampratos atmainų prieštaras, čia siūloma skirti dvi kolokacijų atmainas ir vadinti jas skirtingais vardais. Įprastinį terminą kolokacija palikti pirmosios sampratos šalininkams ir juo įvardyti ryšį tarp dviejų ar daugiau žodžių, o autentiškas įvairuojančio ilgio teksto atkarpas vadinti statistinėmis kolokacijų atkarpomis (statistical collocational strings). Pastarasis terminas pabrėžtų automatinį tokių kolokacijų išgavimo būdą ir autentišką jų prigimtį. Žmogaus apdorotoms kolokacijoms būtų taikomas frazių terminas. Sudarant lietuvių kalbos kolokacijų žodyną teko pasirinkti vieną iš kolokacijos sampratų, pagal kurią dažnai drauge vartojami žodžių junginiai būtų išgaunami iš Dabartinės lietuvių kalbos tekstyno ir atitinkamai pateikiami. Lietuvių kalbos kolokacijoms išgauti ir jų žodynui parengti priimtinesnis leksikografinis požiūris. Juo remiantis lingvistui pateikiamos autentiškos tekstyno tekstų atkarpos, arba statistinės kolokacijų atkarpos, kuriose atsispindi gramatinės jas sudarančių žodžių formos ir natūrali žodžių tvarka, o ne atskirų žodžių lemos. Kolokacijų atkarpos gali būti klasifikuojamos pagal baigtumą, gramatiškumą ar savarankiškumą, tačiau jų nereikia atkurti iš paskirų lemų, pateikiamų pagrindinių žodžių ir jų kolokatų sąrašuose. Galiausiai, ši kolokacijos samprata nereikalauja išankstinio sąrašo žodžių, kuriems būtų ieškoma kolokatų. Negana to, ji leidžia traktuoti tekstyną kaip vieną ilgą žodžių atkarpą, kurioje ieškoma labiau ar mažiau tarpusavy susijusių darinių. Kitaip sakant, kolokacijoms išgauti panaudojamas visas tekstynas, o ne vien tik jo konkordansai, sudaryti remiantis išankstiniu žodžių sąrašu. Svarbiausia tai, kad leksikografinis požiūris leidžia išrinkti visas didesniu nei paprastai junglumu pasižyminčias teksto atkarpas ir pagal jas apskaičiuoti idiomų principu sudarytą tekstyno dalį (Sinclair 1991: 109–121). Būtent šios kolokacijų sampratos pasirinkimas nulėmė ir būdą, kuriuo jos buvo išgautos iš tekstyno. Taigi kolokacijos atskiroms žodžių poroms buvo nustatytos statistiniu būdu, o kolokacijų atkarpos iš tekstyno atrinktos remiantis leksikografiniu požiūriu. Jos buvo išgautos iš Dabartinės lietuvių kalbos tekstyno paskaičiavus žodžių traukos tekste įvertį (gravity counts).
143
2 d a lis. L I E T U V I Ų K A L B O S K O LO K A C I J Ų ŽO DY N A S
Šiame skyriuje aprašomi įprastiniai žodžių vartojimo dažnumu paremti kolokacijų nustatymo būdai. Taip pat pristatomas naujas junglumo įvertinimo metodas, nepriklausantis nuo žodžių dažnumo. Pradžioje aptariami trys dažniausiai naudojami junglumo įvertinimo metodai (MI, T įvertis, Dice įvertis) ir naujas žodžių traukos tekste įvertinimo būdas, vadinamasis gravitacijos metodas (gravity counts). Remiantis eksperimento rezultatais parodomi kiekvieno metodo privalumai, trūkumai ir paskirtis. Kolokacija apibrėžiama naujai ir parodoma sąsaja tarp junglumo, kuris yra dviejų kalbos vienetų traukos išraiška, ir dažnai drauge einančio žodžių junginio ar frazės, kuri yra neatsiejama nuo teksto ir nustatoma naudojantis ją sudarančių žodžių junglumu. Parodoma kolokacijos nustatymo subjektyvumo problema apibrėžiant junglumo stiprumo ribą, kai du kalbos vienetai suformuoja kolokaciją. Remiantis statistiniais duomenimis, analizuojama kolokacijų vartosena ir ilgis kalboje.
2.1.1. Dažniausi kolokacijų išgavimo būdai Jau daugiau nei trisdešimt metų bandoma statistiškai apibrėžti kolokaciją, analizuojama kolokacijos prigimtis, jos nustatymo būdai. Tačiau lig šiol informatikai nesutaria dėl bendro apibrėžimo ir pateikia įvairių kolokacijų nustatymo būdų. Štai O. Masonas (1997) įvardija ir aptaria visą spektrą parametrų ir metodų kolokacijoms nustatyti: kolokacijos ilgis, pakankamumo riba, pagrindinis žodis, patikimumo įvertinimas, atstumas ir kt. D. Pearce (2001) atliko eksperimentus lygindamas įvairius junglumo įvertinimo metodus (Berry-Rogghe, MI, Kita, Shimohata, Blaheta, Pearce) ir pateikė rezultatus atgaminimo ir tikslumo (recall ir precision) įvertinimais. D. Pearce (2001) analizuoja sinonimų, D. Linas (1998) – priklausomybių panaudojimą nustatant kolokacijas. Šiuose darbuose galima pastebėti, kad žodžių junglumas ir kolokacija sutapatinami. Kartais net sunku pasakyti, ar kalbama apie junglumą, kuris yra tarpusavio traukos įvertinimas, ar kolokaciją, kuri yra stabilesnis kalbos vienetas iš kelių žodžių. Naudojant skirtingus junglumo įvertinimo metodus gaunami skirtingi rezultatai. Tai skatina paanalizuoti žodžių traukos tekste savybes, išryškinamas populiariausiais junglumo įvertinimo metodais, ir įsitikinti, ar nėra kokios nors sąsajos tarp žodžių dažnumų ir junglumo.
144
2. 1. K O LO K A C I J O S I R N AT Ū R A L I O S I O S K A L B O S A P D O R O J I M A S
Kolokacijų vartosena vis dar nėra tirta kai kuriais aspektais, t. y. vis dar lieka neaišku, kokią kalbos vartosenos dalį sudaro kolokacijos, kokio ilgio kolokacijos dominuoja, kokio ilgio kolokacijų gali būti apskritai. Įvairiais junglumo įverčiais bandoma įvertinti dviejų skirtingų žodžių jungimosi stiprumą ir taip nustatyti kolokacijas. Tačiau literatūroje nepavyko rasti tyrimų apie tai, kaip aptikti ilgesnes nei dvižodes kolokacijas nenaudojant paieškos pagal iš anksto turimą žodį principo, kaip nustatyti, kur kolokacija prasideda ir baigiasi. Visi šie neaiškumai atsiranda dėl minėtos priežasties, būtent – žodžių junglumas sutapatinamas su kolokacija. Reikėtų atskirti šias dvi sąvokas, nes jos apima šiek tiek besiskiriančius dalykus. Junglumo terminas čia vartojamas ryšio stiprumui tarp dviejų kalbos vienetų nustatyti. Kolokacijos terminas skirtas apibūdinti kalbos vienetui, sudarytam iš kelių žodžių dėl įvairaus stiprumo junglumo tarp šių žodžių, t. y. junglumas naudojamas kolokacijoms atpažinti. Daugelyje literatūroje aprašytų tyrimų kolokacijos nagrinėjamos imant vieną kalbos vienetą kaip pradinį ar pagrindinį. Nagrinėjant jo aplinką ir junglumą pasakoma, kokias kolokacijas sudaro šis žodis. Siekiant nustatyti ilgesnės nei dvižodė kolokacijos ribas, be pagrindinio vieneto reikėtų analizuoti tuos žodžius, su kuriais tas pagrindinis vienetas sudaro pastovesnius junginius, o šie savo ruožtu sudaro dar kitus junginius. Taip analizuojant žodžių junglumą, galima išsiplėsti iki visų kokio nors teksto ar tekstyno žodžių. Atliekant eksperimentą ir Dabartinės lietuvių kalbos tekstynui taikant senus ir naująjį kolokacijų išgavimo būdus, jis buvo traktuojamas kaip viena labai ilga, 100 milijonų žodžių atkarpa, kuriai taikyti skirtingi statistiniai metodai. Ta atkarpa buvo apdorojama nuo pirmojo ir paskutinio žodžio kiekvienai žodžių porai apskaičiuojant jų tarpusavio traukos įvertį. Be to, šis įvertis buvo skaičiuojamas greta ir šiek tiek toliau esantiems žodžiams, bet ne toliau nei trijų žodžių atstumu nuo tiriamojo į abi puses. Tai iliustruojama vienu sakiniu Nauja programa siekiama pagerinti raštingumą tarp vaikų ir suaugusių. Žodžių porų junglumas buvo skaičiuojamas nuo pirmojo žodžio į dešinę šioms žodžių poroms: nauja programa, nauja siekiama, nauja pagerinti. Atsižvelgiant į žodžių tvarką, kuri yra svarbi kolokacinėms atkarpomis, greta esančių žodžių junglumas buvo skaičiuojamas ir priešinga linkme, t. y. iš dešinės į kairę trijų žodžių atstumu. Sakinio viduryje
145
2 d a lis. L I E T U V I Ų K A L B O S K O LO K A C I J Ų ŽO DY N A S
esančiam žodžiui pagerinti parinkti žodžiai slenkant iš dešinės į kairę: pagerinti siekiama, pagerinti programa, pagerinti nauja.
A
A
new
new
programme
programme
aims
aims
to
to
improve literacy for
improve literacy for
both
adults
both
adults
and
children
and
children
2 pav. Junglumo porų nustatymo schema
Taip traktuojant tekstą ar tekstyną, išsprendžiama paieškos pagal iš anksto žinomą pagrindinį žodį problema. Svarbiausia tai, kad matuojant greta ar 2–3 žodžių atstumu esančių žodžių porų junglumą, pamatuojamas jų tarpusavio ryšio stiprumas, o pagal jį galima nustatyti kolokacinių atkarpų ribas. Ten, kur aptinkamas stipresnis nei tikėtina žodžių poros ryšys, fiksuojama kolokacijos pradžia, toliau žiūrima, kelioms šalia einančių žodžių poroms tas ryšys būdingas, o ten, kur ryšys nutrūksta, fiksuojama kolokacijos pabaiga. Žodžių poros junglumas skaičiuojamas įvertinus kelis požymius: 1) kiekvieno žodžio dažnumą, 2) žodžių poros dažnumą ir 3) žodžių tvarką tekste, 4) skirtingų žodžių skaičių pasirinktoje teksto atkarpoje. Pastarasis požymis yra naujas, netaikytas kituose statistiniu pagrindu besiremiančiuose metoduose (Daudaravičius, Marcinkevičienė 2004: 330). Atskirų žodžių dažnumas skiriasi, nuo jo priklauso ir junglumas. Egzistuoja aiškus ryšys tarp dviejų žodžių junglumo ir jų dažnumo sumos, skirtingoms dažnumų sumoms nustatytas skirtingas junglumas. Tarkime, kad „x y“ yra žodžių x ir y pora; poros junglumo įvertis yra skaičius z; stebime, kaip kinta z priklausomai nuo s, kai s=f(x)+f(y), kur f(x) yra žodžio x dažnumas ir f(y) yra žodžio y dažnumas. Žodžių poros dažnumų suma yra svarbus rodiklis, leidžiantis ne tik palyginti skirtingų dažnumų žodžių poras, bet ir nustatyti junglumo skirtumus tais atvejais, kai žodžių porų dažnumų suma panaši, bet tas poras sudarančių atskirų
146
2. 1. K O LO K A C I J O S I R N AT Ū R A L I O S I O S K A L B O S A P D O R O J I M A S
žodžių vartojimo dažnumas smarkiai skiriasi. Pavyzdžiui, jei vieną porą sudaro 1 ir 999 kartus pavartoti žodžiai, o kitą – vienodai dažnai po 500 kartų pavartoti žodžiai, abiejų porų dažnumų suma bus ta pati, tačiau skirsis jų junglumas. Koks jis yra, labai priklauso nuo skirtingų toliau pristatomų skaičiavimo būdų.
2.1.1.1. Abipusės informacijos įvertis (Mutual Information score) Labai populiarus junglumo pastovumo įvertinimo tipas yra abipusės informacijos įvertis (plačiau apie tai žr. McEnery, Wilson 1996, Ooi 1998, Oakes 1998). Jis apskaičiuojamas dviem vienetams,
¥ P ( x, y ) ´ MI ( x; y ) log 2 ¦ µ § P( x) P( y ) ¶ pavyzdžiui, dviem teksto žodžiams x ir y, pagal formulę:, Čia P(x, y) yra tikimybė x ir y eiti drauge, o P(x) ir P(y) yra tikimybės aptikti šiuos žodžius atskirai, f(x, y) žymi žodžių poros dažnumai, kai jie eina drauge, o f(x) ir f(y) – atskirai paimtų žodžių dažnumus, N rodo tekstyno dydį. MI apskaičiuojamas taip:
P ( x, y ) =
f ( x, y ) N
P ( x) =
f ( x) N
P( y ) =
f ( y) N
⎛ N ⋅ f ( x, y ) ⎞ ⎟⎟ MI ( x; y ) = log 2 ⎜⎜ ⎝ f ( x) ⋅ f ( y ) ⎠ Jei tiriamieji žodžiai x ir y dažnai vartojami drauge, jų abipusės informacijos įvertis bus didelis. Jei šie žodžiai paprastai drauge nevartojami, o greta atsidūrė atsitiktinai, jų abipusės informacijos įvertis bus lygus nuliui. K. Churchas teigia (Church et al. 1991), kad jų abipusės informacijos įvertis gali padėti aptikti įdomių sintaksinių, leksinių ar semantinių ryšių. Juo abipusės informacijos įvertis didesnis, tuo tiriamieji žodžiai yra susiję labiau ir įvairesniais ryšiais.
147
2 d a lis. L I E T U V I Ų K A L B O S K O LO K A C I J Ų ŽO DY N A S
Pritaikius abipusės informacijos įverčio skaičiavimo būdą visoms aprašytu būdu gautoms tekstyno žodžių poroms, paaiškėjo šio skaičiavimo būdo esmė. Gauti rezultatai ne visiškai, tik iš dalies, patvirtino K. Churcho žodžius. 3 pav. pateikta šio įverčio priklausomybė nuo žodžių dažnumų sumos. Kaip matyti, ji gali būti trejopa – maksimali, vidutinė ir minimali. Riba, skirianti silpną ir stiprų žodžių poros ryšį, pasirenkama arbitraliai, šiuo atveju ties vertikalios koordinačių ašies 10 padala. Taigi stipresnio nei 10 ryšio porų junglumas jau gali būti laikomas kolokatyvumu.
3 pav. Žodžių poros mažėjančia MI tvarka 1
Naudodamiesi MI analizuojame junglumo tarp dviejų vienetų įvertinimo problemą. Visame tekstyne 3 žodžių atstumu buvo sudaromas galimų žodžių porų sąrašas ir apskaičiuojamas MI įvertis kiekvienai porai. Rasta apie 100 milijonų žodžių porų. 3 pav. pateikiame MI pasiskirstymą tokiame sąraše MI mažėjimo tvarka. Šiame pasiskirstyme pastebime netolygumus. Ties tam tikra riba MI pradeda sparčiai didėti (MI=12) arba mažėti (MI=1). Tai sudaro prielaidą, kad žodžių poros, kurių MI 1
Visi šio skyriaus paveikslai rengti V. Daudaravičiaus.
148
2. 1. K O LO K A C I J O S I R N AT Ū R A L I O S I O S K A L B O S A P D O R O J I M A S
MI
yra didesnis nei 12 arba mažesnis nei 1, pasižymi kitomis savybėmis nei visos kitos žodžių poros. Sąraše išskiriame tris žodžių porų grupes: MI didelis, MI vidutinis, MI mažas. Nagrinėjant pastovius junginius kreipiamas dėmesys į dvi žodžių porų grupes, kurių MI didelis / mažas. Laikoma: kuo MI įvertinimas didesnis, tuo stipresnis ryšys tarp dviejų poros žodžių, pavyzdžiui, „tautinė mažuma“. Žemą įvertinimą turi ir tam tikru atstumu nutolę yra drauge vartojami funkciniai žodžiai,, pavyzdžiui, „nors … tačiau …“, „… ir … ir …“. Turint labai didelius tekstynus ir taikant MI, regis, būtų galima labai lengvai sudaryti stabilių kalbos junginių žodynus, nagrinėti kalbą pastovumo prasme, tačiau yra kliūtis, kurios niekam nepavyksta įveikti objektyviai. Ta kliūtis – riba, kuri turi atskirti tai, kas yra stabilu ir nestabilu. Kiekvienas tyrėjas šią ribą nustato eksperimentais ir savo subjektyvia nuožiūra. MI atveju ši problema pasidaro dar gilesnė, nes reikia nustatyti ne vieną, o dvi ribas. Nagrinėjant įvairius atvejus buvo nuspręsta, kad tie junginiai, kurių MI yra daugiau nei 13,5, yra stabilūs, o tie, kurių MI yra žemiau už 1,5, – stabilūs funkcine prasme. Tačiau šios ribos vis dėlto yra subjektyvios. Tokios jos lieka ir kitais įvertinimo atvejais (T įvertis, G). Statistiškai paremtų (objektyvių) ribos įvertinimo kriterijų literatūroje nepavyko aptikti. Tai paliekama tolesniems tyrimams.
žodžių dažnumo suma žodžių porai
4 pav. MI priklausomybė nuo žodžių dažnumo sumos
149
2 d a lis. L I E T U V I Ų K A L B O S K O LO K A C I J Ų ŽO DY N A S
Iš 4 pav. matome, kad MI labai priklauso nuo dažnumų sumos – kuo mažesnė suma, tuo didesnis MI, o kuo didesnė suma, tuo mažesnis MI. Iš to galima daryti išvadą, kad MI išryškina tas žodžių poras, kuriose žodžiai yra panašaus dažnumo: du šalia einantys reti žodžiai turės didelį MI, o du šalia einantys dažni žodžiai turės žemą MI. Visi šių porų žodžiai tekstyne pasitaiko tik vieną kartą. Štai kodėl kolokacijų tyrinėtojai savo tyrimuose iš žodžių sąrašo išmeta visus retesnius žodžius kaip nepatikimus. Tačiau net ir išmetus rečiausius žodžius, kolokacijų sąrašo viršuje pagal MI didumą vis vien atsiduria tie žodžiai, kurie yra rečiausi subjektyviai pakoreguotame žodžių sąraše. Paanalizavus MI metodu iš tekstyno gautas kolokacijas, arba, tiksliau sakant, kolokacijų atkarpas iš retų žodžių, galima pastebėti kelias leksines semantines grupes. Čia priklauso: 1) posakiai kitomis kalbomis (homini lupus est), 2) vienarūšių sakinio dalių vardijimai (paviršutiniškų, nesklandžių, dirbtinokų, filosofinių), 3) neskaidomos frazės įvairiais linksniais (tautinę mažumą“,„juodoji kronika), 4) terminai su šalia pateiktais vertimais į kitą kalbą (grįžtamasis ryšys (feedback)), 5) teisinės kalbos frazės (rašytinis pasižadėjimas neišvykti), 6) vardai ir pavardės su pareigybėmis, padėtimi ar profesija (koncertuojanti pianistė Svetlana Karas), 7) kai kurie kiti posakiai (trokšdamas tetrokšiu, ieškodamas terasiu, mylėdamas temylėsiu, rasdamas išpažįstu). Apibendrinant šį metodą galima pasakyti, kad jis geriausiai tinka iš retų žodžių sudarytoms kolokacijų atkarpoms aptikti.
150
2. 1. K O LO K A C I J O S I R N AT Ū R A L I O S I O S K A L B O S A P D O R O J I M A S
2.1.1.2. T įvertis Vietoj arba šalia MI labai dažnai naudojamas T įvertis, kuris pateikia kiek kitokį junglumo įvertį. T įvertis skaičiuojamas pagal formulę:
T ( x, y )
f ( x) f ( y ) N f ( x, y )
f ( x, y )
T score
kur f(x,y) – žodžių poros x ir y dažnumas, N – tekstyno dydis, f(x) – žodžio x dažnumas, f(y) – žodžio y dažnumas.
žodžių dažnumų suma žodžių porai
5 pav. T įverčio priklausomybė nuo žodžių dažnumų sumos
5 pav. pateikiama T įverčio priklausomybė nuo žodžių dažnumų sumos. Akivaizdu, kad T įvertis labai priklauso nuo žodžių poros dažnumų sumos – kuo mažesnė ši suma, tuo T įvertis mažiau kinta, o kuo ji didesnė, tuo T įvertis labiau kinta. Iš to galima daryti dvi išvadas: 1) su T įverčiu galima analizuoti tas žodžių poras, kuriose žodžių dažnumų suma yra didelė; 2) T įvertis mažėja tada, kai vieno iš žodžių dažnumas yra daug mažesnis už antro žodžio dažnumą, kitaip sakant, kai žodžių dažnumai labai skiriasi. T įvertis didėja tada, kai abiejų žodžių dažnumai
151
2 d a lis. L I E T U V I Ų K A L B O S K O LO K A C I J Ų ŽO DY N A S
skiriasi labai nežymiai arba yra vienodi. T įvertis išryškina dažnų žodžių vartoseną: du šalia einantys dažni žodžiai turės didelį T įvertį , o du šalia einantys skirtingų dažnumų žodžiai turės žemą T įvertį. Tai patvirtina 6 lentelėje pateikti duomenys: parodytos pirmosios ir paskutiniosios žodžių poros iš sąrašo pagal T įvertį. 6 lentelė. Kolokacijų sąrašo, gauto pagal T įvertį, pradžia ir pabaiga x
y
Lietuvos
Respublikos
taip ir m bet jis vadovaudamasis Respublikos vyriausybė Respublikos
pat ir d ir lėšos į šitaip žmogus kelis
atitikmuo angliškai Republic of Lithuania also and … and year … day but … and
T(x,y)
f(x)
f(y)
f(x,y)
382,43 346,55 339,58 304,48 277,23 -19,77 -19,79 -19,82 -19,83 -19,83
Kaip ir MI atveju, čia tyrėjui reikia apsispręsti, ties kokia junglumo skalės padala nustatyti ribą, kai žodžių porų junglumas jau gali būti laikomas stabilumu. T įverčio atveju minimali dažnų žodžių porų vertė yra didesnė nei maksimali retų žodžių porų vertė. Tokia riba pasirinkus 10, į išgaunamų kolokacijų atkarpų sąrašus patenka ir ne tokios dažnos žodžių poros. T įverčio metodas kolokacijoms gauti yra lankstesnis nei MI, nes apima kur kas platesnį žodžių porų junglumo diapazoną, leidžia aptikti ir dažnai, ir retai vartojamų žodžių poras. Bet ir šį metodą reikia taikyti atsargiai, nes jis labiau tinka pačioms dažniausioms dažnai vartojamų žodžių poroms.
152
2. 1. K O LO K A C I J O S I R N AT Ū R A L I O S I O S K A L B O S A P D O R O J I M A S
2.1.1.3. Dice įvertis Dice įvertis taip pat padeda aptikti drauge vartojamus žodžius ir taip tekste atpažinti kolokacijas. Juo paremtas kolokacijų ir leksikono išgavimo įrankių XTract ir Champollion (Smadja 1993, 1996 atitinkamai) veikimo principas. Dice skaičiuojamas taip:
Dice( x; y )
2 f ( x, y ) f ( x) f ( y )
kur f(x,y) – žodžių poros x ir y dažnumas, N – tekstyno dydis, f(x) – žodžio x dažnumas, f(y) – žodžio y dažnumas. Kai x ir y paprastai eina kartu, jų Dice įvertis bus aukštas. Prie šios formulės pridedamas logaritmas ir formulė šiek tiek pakeičiama, kad labiau išryškėtų priklausomybė tarp dažnumų sumos ir Dice įverčio:
¥ 2 f ( x, y ) ´ Dice( x; y ) log 2 ¦ µ § f ( x) f ( y ) ¶
2.900.000
930.000
650.000
400.000
80.000
150.000
55.000
30.000
9.500
7.000
4.500
2.000
850
600
350
100
75
50
25
0
6 pav. matyti Dice įverčio priklausomybė nuo žodžių poros dažnumų sumos.
5
Dice
0 -5 -10 -15
max avg
-20 min -25 The sum of the word frequencies in a word pair
6 pav. Žodžių poros dažnumo suma, skaičiuota pagal Dice įvertį
153
2 d a lis. L I E T U V I Ų K A L B O S K O LO K A C I J Ų ŽO DY N A S
Ji parodo: juo mažesnė dažnumų suma, tuo didesnis Dice koeficientas, ir atvirkščiai, kuo didesnė dažnumų suma, tuo mažesnis šis koeficientas. Tai tokia pat priklausomybė kaip ir MI atveju, todėl galima teigti, kad Dice metodu išgautos žodžių poros susideda iš panašaus vartojimo dažnumo žodžių. Šios poros atsidura kolokacijų sąrašo pradžioje ar pabaigoje. Du drauge vartojami reti žodžiai bus sąrašo pradžioje, o du dažnai vartojami žodžiai gali būti ir pradžioje, ir pabaigoje. Kitaip nei MI atveju, didžiausi Dice įverčiai yra panašūs įvairioms dažnumų sumoms. Taip yra todėl, kad formulėje neatsispindi tekstyno dydis. Sprendžiant pagal tai, kad Dice ir MI įverčiai yra panašūs, galima manyti, jog tekstyno dydis čia nėra labai svarbus veiksnys. Atsižvelgus į 6 pav. kreivės pobūdį, riba, ties kuria junglumas tampa stabilumu, šiuo atveju nuspręsta laikyti 4. Visi trys pristatyti žodžių porų junglumo skaičiavimo būdai remiasi žodžių vartojimo dažnumu. Ryški kolokacija gali būti sudaryta tiek iš dažnai, tiek iš retai vartojamų žodžių, nes svarbus ne žodžių vartojimo dažnumas apskritai, o nuo jo priklausantis dviejų žodžių tarpusavio ryšys. Toks požiūris sutampa su vienu iš pirmųjų kolokacijų apibrėžimų: „... įprastinė kolokacija yra ryšys tarp tokių vienetų, kurie drauge yra vartojami dažniau nei tikėtina pagal individualų kiekvieno jų dažnumą arba pagal teksto, kuriame jie buvo aptikti, ilgį“ (...regular collocations between items, such that they co-occur more often than their respective frequencies and the length of text in which they appear would predict (Sinclair 1974: 25)). Taigi apibusė vartojimo drauge tikimybė, o ne vartojimo dažnumas, yra lemiamas veiksnys. Todėl naujasis toliau pristatytas junglumo skaičiavimo metodas dažnumui neteikia lemiamos reikšmės.
154
2. 1. K O LO K A C I J O S I R N AT Ū R A L I O S I O S K A L B O S A P D O R O J I M A S
2.1.1.4. Žodžių traukos tekste įvertis (gravity counts) Iš pateiktų rezultatų matome, kad MI ir T įverčiai labai priklauso nuo žodžių dažnumo. Žodžių junglumo stabilumą reikėtų analizuoti naudojant tokius įverčius, kurie kuo mažiau priklausytų nuo žodžių dažnumo. Plačiąja prasme stabilų žodžių junginį galima apibrėžti kaip dviejų ar daugiau žodžių buvimą kartu dažniau nei tikėtina, t. y. kelių žodžių junglumo stabilumas yra kai kas daugiau nei įprasta. Norėta šį apibrėžimą išreikšti matematine formule, o įvertį pavadinti gravitacija. Toks pavadinimas parinktas neatsitiktinai. Naujajame įvertyje atkreipiamas dėmesys į žodžių tvarką ir tai, kaip pirmasis žodis daug dažniau nei įprasta yra prieš antrąjį žodį ir kaip antrasis žodis daug dažniau nei įprasta yra po pirmojo žodžio. Gravitacijos įvertis apskaičiuojamas taip:
¥ f ( x, y ) f ( x, y ) ´ G ( x, y ) log ¦ µ g ( y) ¶ § g ( x) G(x,y) parodo, kaip x pasitaiko prie y dažniau nei vidutiniškai ir y pasitaiko prie x dažniau nei vidutiniškai. f(x,y) - x ir y žodžių poros dažnumas tekstyne
g ( x)
g ( y)
f ( x) n( x )
- po žodžio x esančių žodžių pasikartojimo vidurkis
n(x) f(x)
- po žodžio x esančių skirtingų žodžių skaičius - x žodžio dažnumas tekstyne
f ( y) - prieš žodį y esančių žodžių pasikartojimo vidurkis n( y ) f(y) n(y)
- y žodžio dažnumas tekstyne - prieš žodį y esančių skirtingų žodžių skaičius
Galutinė Gravitacijos išraiška:
¥ f ( x, y ) n ( y ) ´ ¥ f ( x, y ) n ( x ) ´ G ( x, y ) log ¦ µ µ log ¦ f ( x) f ( y) ¶ ¶ § §
155
2 d a lis. L I E T U V I Ų K A L B O S K O LO K A C I J Ų ŽO DY N A S
Pavyzdys: f(x) = 50 - žodžio x dažnumas f(y) = 350 - žodžio y dažnumas f(x,y) = 4 - žodžių x ir y poros dažnumas n(x) = 35 - po žodžio x einančių skirtingų žodžių skaičius n(y) = 250 - prieš žodį y einančių skirtingų žodžių skaičius Šiuo konkrečiu atveju gravitacijos įvertis apskaičiuojamas taip: ¥ 4 250 ´ ¥ 4 35 ´ 7) 2.999 G ( x, y ) log ¦ µ log ¦ µ log(2.8) log(2.857 50 § ¶ § 350 ¶
Gravitacija
7 pav. pateikta šio įverčio priklausomybė nuo žodžių dažnumų sumos. Akivaizdu, kad G nepriklauso nuo dažnumų sumos – G kinta labai panašiose ribose tiek prie didelio dažnumo, tiek prie mažo. Galima daryti dvi išvadas: 1) G galime taikyti bet kokio dažnumo žodžiams; 2) pastovumą patikimai galime analizuoti tik tiems žodžiams, kurių dažnumų suma yra didesnė nei 30 kartų. Naudodami G galime nustatyti ribą, žemiau kurios negalima patikimai įvertinti šalia einančių retų žodžių pastovumą. Pavyzdžiui, kai x dažnumas yra 4 kartų, o y dažnumas – 10 kartų, negalima patikimai įvertinti, ar x ir y sudaro kolokaciją. Kai x dažnumas yra 4 kartų, o y dažnumas – 1 000 kartų, galima patikimai įvertinti, ar x ir y sudaro kolokaciją. Tai patvirtina 7 lentelė, kurioje parodytos pirmos ir paskutinės žodžių poros iš kolokaciniu ryšiu susijusių žodžių porų sąrašo, apskaičiuoto pagal G.
žodžių dažnumų suma
7 pav. G priklausomybė nuo žodžių dažnumų sumos
156
2. 1. K O LO K A C I J O S I R N AT Ū R A L I O S I O S K A L B O S A P D O R O J I M A S
7 lentelė. Kolokacijų sąrašo, gauto pagal žodžių traukos įvertį tekste, pradžia ir pabaiga x
in English G(x,y) also 27,82 not only 25,91 Republic of 25,86 Lithuania m d year … day 25,83 ir ir and … and 25,18 nekonkurentinėms jeigu -9,17 ir konkurentinės -9,20 ir pragiedruliais -9,22 Mundrytė korespondentas -9,34 Mundrytė ir -9,73 Pilaitis ir -9,83
taip ne Lietuvos
y pat tik Respublikos
f(x)
f(y)
f(x,y)
Daugelis tyrimų, nagrinėjančių kolokacijas, apsiriboja kolokacijų analize kalbos vienetų dažnumų lygmeniu, t. y. žodžių junglumas nagrinėjamas visiškai atsiribojant nuo teksto ir naudojant tik bendrus statistinius duomenis, gautus iš tekstyno, dažniausiai, kalbos vienetų dažnumus. Čia norėta parodyti, kad ir pats tekstas yra labai svarbus prie tekstyno statistinių duomenų ir negalima jo ignoruoti. Į tekstą žiūrima kaip į besikeičiančio junglumo stiprumo kitimą tarp greta einančių vienetų. Taip gaunama junglumo stiprumo kitimo kreivė, kuri ir padeda nustatyti, kur kolokacija prasideda, baigiasi ir kiek tęsiasi. Kolokacija laikyta teksto atkarpa, kurioje junglumo stiprumas tarp greta einančių žodžių yra aukščiau už nustatytą ribą, o jos pradžioje ir pabaigoje stiprumas yra žemiau už šią ribą. Taip išrinktos visos atkarpos ir gautas visų tekstyno kolokacijų atkarpų sąrašas.
157
MI
2 d a lis. L I E T U V I Ų K A L B O S K O LO K A C I J Ų ŽO DY N A S
8 pav. Kolokacijos atkarpa tekste
Kai kurie autoriai nagrinėja keliažodes kolokacijas naudodami dipolio principą: jei du žodžiai sudaro kolokaciją, ta pora laikoma vienetu ir analizuojama, ar šalia einantys žodžiai nesudaro kolokacijos su šiuo vienetu. Tačiau būtina pasilikti viename lygmenyje, t. y. analizuoti tik žodžių poras ir niekada nenaudoti frazių kaip vieneto. Kolokacija sudaryta iš pavienių žodžių. Sunku pasakyti, ar kolokacija gali būti sudaryta iš atskiro žodžio ir jau esančios kolokacijos. Šioje vietoje atsiranda labai daug subjektyvių analizės kriterijų. Poros frazė–žodis ir žodis–žodis yra skirtingi dalykai, šių derinių negalima lyginti. Formaliai gal ir galima, nes imami du vienetai, tačiau akivaizdu, kad ilga kolokacija tekste niekada nebus aptikta – kuo ilgesnė žodžių atkarpa, tuo ji retesnė tekstyne. Pavyzdžiui, „Lietuvos Respublikos vyriausybė“. Šią kolokaciją frazė–žodis principu galima analizuoti dvejopai: 1) „Lietuvos Respublikos“ ir „vyriausybė“; 2) „Lietuvos“ ir „Respublikos vyriausybė“. Akivaizdu, kad bet kuriuo junglumo skaičiavimo metodu gauti rezultatai skirsis ir niekada nebus tapatūs. Gali būti, kad pirmuoju atveju bus nustatytas tvirtesnis ryšys ir dažnesnis atskirų žodžių vartojimas drauge nei antruoju. Tačiau galutinis rezultatas turi būti gaunamas vienareikšmiškai, todėl tenka ribotis tik atskirų žodžių junginiais. Poros žodis–žodis naudojimas išsprendžia daugiareikšmiškumo problemą. Jei imame atskirus žodžius „Lietuvos“, „Respublikos“,
158
2. 1. K O LO K A C I J O S I R N AT Ū R A L I O S I O S K A L B O S A P D O R O J I M A S
„vyriausybė“ ir tiriame tekstuose su jais einančių žodžių ryšio tvirtumą, paaiškėja, kad frazė „Lietuvos Respublikos vyriausybė“ yra stabilus junginys, nes ją sudarantys atskiri žodžių junginiai „Lietuvos Respublikos“ bei „Respublikos vyriausybė“ taip pat yra stabilūs. Taip gautas stabilus junginys nustatomas vienareikšmiškai. Kita vertus, analizė naudojant žodžių junginius ar frazes kaip atskirus vienetus yra sunkiai realizuojama. Kai frazė tampa ilgesnė nei 10 žodžių, frazių dažnumų sąrašas pasidaro be galo didelis. Jam apdoroti nepakanka net ir labai galingo kompiuterio resursų. Laikantis aptartų principų ir taikant gravitacijos metodą maždaug bendros 100 milijonų žodžių ir 1,7 milijono skirtingų žodžių ir žodžių formų apimties Dabartinės lietuvių kalbos tekstynui, buvo gauta 110 935 stabiliuoju ryšiu susijusių žodžių porų. Kai kurios poros susijungė į keliažodes kolokacijų atkarpas, kurių buvo gauta 19 878 281. Dalis šio sąrašo vienetų kartojosi ne vieną kartą, todėl reikėjo apskaičiuoti skirtingas kolokacijų atkarpas. Jų liko 10 147 250. Visos kolokacijų atkarpos sudarė 68,1 % tekstyno. Šis procentas panašus į B. Altenbergo (1991) gautus rezultatus, pagal kuriuos apie 70 % 1 milijono apimties Londono–Lundo tekstyno dalį sudaro sustabarėję žodžių junginiai, didžiuma jų – dvižodės kolokacijos. 45 %
42,60 %
40 % 35 % 30 %
24,00 %
25 % 20 % 15 %
13,2 0%
10 %
KOLO
5%
DAIKT 2,80 %
0% 2
3
4
5
6
7
1,70 %
8
1,10 %
9
0,70 %
10
1,70 %
>10
9 pav. Kolokacijų grandinių pasiskirstymas pagal jų ilgį žodžiais
159
2 d a lis. L I E T U V I Ų K A L B O S K O LO K A C I J Ų ŽO DY N A S
Literatūroje neteko aptikti duomenų apie kolokacijų atkarpų ilgio tyrimus. Kolokacijų atkarpų nereikėtų painioti su atstumu tarp žodžių, pasirenkamu nustatant junglumo stiprumą (span). Kalbant apie kolokacijų atkarpų ilgį kyla tokie klausimai: kokio ilgio jos būna, kokio ilgio kolokacijų yra daugiausia. Svarbiausias ir įdomiausias klausimas yra šis: kokią vartosenos dalį sudaro kolokacijos, t. y. kiek kalba yra sustabarėjusi? 9 pav. pateikti duomenys gauti iš tekstyno naudojant gravitacijos kriterijų ir laikant, kad kolokatyvumas išryškėja aukščiau už 5,5 ribą. Kaip ir buvo galima tikėtis, kad didžioji dalis kolokacijų atkarpų sudaryta iš dviejų žodžių (8 462 626 vienetų, kurie sudaro 42 % nuo bendro sąrašo). Atkarpai ilgėjant, jų skaičius žymiai mažėja. Trižodžių kolokacijų atkarpų yra perpus mažiau (4 760 991 vienetai, 24 % sąrašo). Tas pat pasakytina apie keturžodes (2 629 953 vienetai, 13 % sąrašo) bei penkiažodes kolokacijas (1 532 370 vienetai, 8 % sąrašo). Ilgesnių kolokacijų atkarpų kreivė leidžiasi lėčiau (žr. 9 pav.). Ilgiausia kolokacija paimta iš kanceliarinės stiliaus teksto – ji susideda iš 34 žodžių. Ne tik kolokacijų pasiskirstymas pagal ilgį, bet ir kolokacijų atkarpų vartojimo dažnumas rodo tam tikras tendencijas (žr. 10 pav.). Pati bendriausia – ne itin dažnos, bet ilgos kolokacijos sudaro žymią tekstyno dalį. Štai vienąkart pavartotos kolokacijos apima 39, 1 % tekstyno. O dažniau nei 10 kartų pavartotoms kolokacijoms tenka palyginti nedidelė tekstyno dalis – tik 14,5 %. Tai reikštų, kad tik idiomų principu sudarytos, sustabarėjusios kalbos aštuntąją dalį sudaro dažnai vartojami žodžių junginiai. Taigi didžioji kolokacijų vartosenos dalis yra labai įvairi. Dėl šios įvairovės kalbos vartotojai nejaučia nuolatinio jų pasikartojimo. 39.1 %
40 % 35 % 30 % 25 %
14.5 %
20 % 15 %
>1
0.7 % 9
0.8 % 8
5
0.8 % 7
1.1%
4
1.0 % 6
1.5 %
2
1
0%
3
5%
2.3 %
ERD Ė
10 %
10 pav. Kolokacijų grandinių pasiskirstymas pagal jų vartojimo dažnumą
160
2.2. LIETUVIŲ KALBOS DAIKTAVARDINIŲ FRAZIŲ ŽODYNO YPATUMAI Statistiniu kriterijumi pakako išmatuoti žodžių porų tarpusavio traukos ryšio stiprumą ir aptikti kolokacijų atkarpas. Frazėms, arba gramatiškiems žodžių junginiams, nustatyti reikia papildomo, leksikografinio kriterijaus. Mat siaurai suvokta ir griežtai apibrėžta kolokacija suprantama ne tik kaip įprastinis, bet taip pat ir gramatiškas, prasmingas, leksiškai išbaigtas žodžių junginys, susidedantis bent jau iš dviejų prasminių žodžių, jei minėsime tik pačius svarbiausius kolokacijos bruožus (plačiau žr. Kennedy 1998, Partington 1998, Hunston and Francis 2000 ir kiti). Statistinės kolokacijos gavimo priemonės garantuoja, kad žodžių junginys yra įprastinis, jį sudarantys žodžiai paprastai vartojami drauge. Leksikografinis požiūris į kolokacijas prideda gramatinį ir semantinį kriterijus, todėl antrasis lietuvių kalbos kolokacijų žodyno tvarkymo etapas – peržiūrėti statiškai gautas kolokacijų gradines. Tikrinama, kiek statiškai gautos atkarpos sutampa su prasmingais ir gramatiškais žodžių junginiai, o nesutapus atliekami būtini pakeitimai. Kadangi žodžių traukos tekste įvertis leidžia aptikti autentiškai, realiai vartojamas kolokacijų atkarpas – autentiškų tekstų atkarpas, daugelis jų yra ir gramatiškos, ir prasmingos, kitaip sakant, gravitacijos metodu iš tekstyno daugeliu atveju gaunami prasmingi ir gramatiški žodžių junginiai. Didžiuma jų yra ganėtinai autonomiški ir baigtiniai, tačiau toli gražu ne visi. Autonomiški žodžių junginiai vadinami frazėmis, nemodifikuojami ir iškart įtraukiami į žodyną, pavyzdžiui: praėjusią savaitę, dar kartą, kitaip tariant, kitą dieną, ilgą laiką, šį kartą ir daugelis kitų. Šių frazių žodžiai tekstyne pavartoti įvairiais linksniais, tokiais jie yra ir išgauti: informacijos šaltiniai, informacijos šaltiniais, informacijos šaltinio, informacijos šaltinis, informacijos šaltiniu, informacijos šaltiniams, informacijos šaltinių. Nors formaliai yra įvairių gramatinių formų, nesutampančių su antraštinėmis, šios kolokacijų atkarpos gali būti laikomos frazėmis. Kiti autonomiškų kolokacijų atkarpų tipai apima a) morfologines samplaikas vos tik, ko tik, kad ir lyg tai, vien tik; b) sudėtines veiksmažodžių laikų ir nuosakų formas turėtų būti, gali būti, buvo
161
2 d a lis. L I E T U V I Ų K A L B O S K O LO K A C I J Ų ŽO DY N A S
sumažinta; c) sudėtinius įvardžius as kai kas, kas nors, bet kas ar įvardines grupes toks pat, beveik visas, visiškai kitas; d) idiomines prielinksnines frazes be abejo, iš karto, iš tiesų, be galo arba neidiomines, bet sustabarėjusias prielinksnines frazes iš pradžių, į priekį, iš gailesčio, iš viso; e) didelę kitokių frazių, dažnai vartojamų žiniasklaidoje, įvairovę: vienaip ar kitaip, ilgą laiką, norom nenorom ir pan. Pirmieji trys tipai Dabartinės lietuvių kalbos gramatikoje priskiriami morfologiniams junginiams (Ambrazas 1997: 396). Visos išvardytos frazės yra prasmingos, gramatiškos ir autonomiškos. Kitoms kolokacijų atkarpoms kai ko trūksta, kad jas būtų galima vadinti autonomiškomis. Vienoms, susidedančioms tik iš tarnybinių kalbos dalių, trūksta prasminių žodžių, pavyzdžiui, tarp jų, ir jos, su juo, kitoms stinga būtinų frazei sakinio dalių: manoma kad, sakė kad, priklausomai nuo, aš noriu, duomenys apie, dar labiau, ir panašiai. Trūkstamos kolokacijų atkarpų dalys lengvai nuspėjamos, todėl gali būti pridėtos remiantis gimtakalbio kalbos jausmu, tekstyno duomenimis ar abiem informacijos šaltiniais drauge, pavyzdžiui: [imti, ėmė, paima] iniciatyvą į savo rankas, [sirgti, sirgo, serga] inkstų ligomis. Dar vieną kolokacijų atkarpų grupę sudaro tos pačios frazės skirtingo ilgio fragmentai, kuriuos dėl sutampančių dalių galima sulieti į vieną frazę, tai tarsi trys tos pačios frazės aukštai: dalinio pakeitimo, dalinio pakeitimo ir papildymo, dalinio pakeitimo ir papildymo projektas. Tokios atkarpos atsiranda dėl to, kad žodžių tarpusavio trauka susilpnėja skirtingose frazės vietose. Jas galima nesunkiai aptikti abėcėliniame kolokacijų atkarpų sąraše ir sujungti, ties kiekvienu segmentu nurodant tik jam būdingą vartojimo dažnumą. Dažniausias paprastai būna trumpasis frazės segmentas. Autonomiškų ir neautonomiškų kolokacijų atkarpų skyrimas nėra visai paprastas dalykas, esama ir diskutuotinų atvejų, tačiau galima teigti, kad naudojant žodžių traukos tekste įvertį kaip kolokacijų atkarpų išgavimo iš tekstyno būdą didžiuma gautų atkarpų, net 82 %, yra autonomiškos.
162
2 .2 . L I E T U V I Ų K A L B O S D A I K TAVA R D I N I Ų F R A Z I Ų ŽO DY N O Y PAT U M A I
2.2.1. Kolokacijų atkarpų transformavimas į frazes Pagal leksikografinės kolokacijos sampratą trūktinų, neautonomiškų frazių negalima palikti Lietuvių kalbos daiktavardinių frazių žodyne. Jų reikia arba atsisakyti, arba transformuoti į prasmingus, gramatiškus žodžių junginius. Buvo pasirinktas pastarasis kelias. Lingvistams reikėjo aptikti neautonomiškas atkarpas ir jas transformuoti, šį procesą automatizuoti neįmanoma. Darbas susidėjo ir trijų etapų. Pirmiausiai, gavus bendrą kolokacijų atkarpų sąrašą (apie 20 milijonų vienetų iš 100 milijonų žodžių tekstyno), iš jo buvo ištrintos retos, tik iki 3 kartų pavartotos atkarpos, nepriklausomai nuo jų ilgio. Taip pat buvo atsisakyta ir dažnesnių atkarpų pagal jų ilgį, t. y. dvižodžių, pavartotų rečiau nei 19 kartų, trižodžių – rečiau nei 9 kartus, keturžodžių – rečiau nei 8 kartus, o penkiažodžių – rečiau nei 4 kartus. Toks sprendimas priimtas patikrinus minėtas grupes ir atradus jose daug netinkamų kolokacijų atkarpų. Po peržiūros liko 88 562 kolokacijų atkarpų sąrašas. Be to, buvo atsisakyta frazių, į kurias neįėjo nė vienas daiktavardis, tad ankstesnis sąrašas dar sutrumpėjo. Taip buvo apsispręsta dėl didžiulio duomenų kiekio ir dėl to, kad kolokacijų atkarpose be daiktavardžių buvo itin daug defektyvių darinių. Fraze su daiktavardžiu laikytas dažnai kartu vartojamų žodžių junginys, kuriame yra vienas ar daugiau daiktavardžių. Daiktavardinę frazę gali sudaryti tikriniai ir bendriniai daiktavardžiai, vienarūšės sakinio dalys ar net ilgesnio teksto atkarpa (keli sakiniai), kurie automatiniu statistiniu būdu atpažįstami kaip kolokacija, pavyzdžiui: Baltijos asamblėjos sesija; Hitlerio ir Stalino; daržovių, vaisių ir uogų sultis; Didžiosios Britanijos užsienio reikalų ministras; privatizuojamiems objektams esantiems regioninio parko teritorijoje taikomos Lietuvos Respublikos Vyriausybės patvirtintos privatizuojamų objektų esančių valstybės saugomose teritorijose naudojimo privalomosios sąlygos (Rimkutė 2006). Po automatinio trynimo likusi sąrašo dalis (73 189 vienetų) buvo tvarkoma taip: prasmingos, gramatiškos ir autonomiškos kolokacijų atkarpos imtos nepakeistos, labai anomalių, kurių neįmanoma rekonstruoti, buvo atsisakyta. Pirmiausia buvo ištrintos semantiškai neautonomiškos frazės, pavyzdžiui: žmogus iš tikrųjų; rūmų į kitus su dalimi; kurio tema; mokėjimo atleista; šiuo atveju bendrojo dokumento importo rinkinio; pildomas jei prekės gabenamos muitinės. Tokių kolokacijų atsirado
163
2 d a lis. L I E T U V I Ų K A L B O S K O LO K A C I J Ų ŽO DY N A S
todėl, kad tie žodžiai dažnai vartojami kartu, nors kartais gali priklausyti skirtingiems sakiniams. Taip pat į frazių žodyną nepateko iš vieno bendrinio ir kito (kitų) tikrinių daiktavardžių sudarytos kolokacijos, pavyzdžiui: režisierius G. Padegimas; vyskupas M. Valančius; jeigu frazę sudaro veiksmažodis ir tikrinis daiktavardis, ypač jei varijuoja tikriniai daiktavardžiai, pavyzdžiui: sakė V. Adamkus; sakė V. Andriukaitis; sakė V. Jankauskas; sakė V. Landsbergis. Daiktavardinėmis frazėmis nelaikomi daiktavardžio ir nekaitomų žodelių junginiai, pavyzdžiui: kokybę ir; respublikoje arba; Lietuva jau; net širdis. Iš pirminio kolokacijų sąrašo ištrinti daiktavardžio ir veiksmažodžio būti junginiai, nes galima sakyti, kad būti yra pagalbinis žodis, neturintis prasmės, pavyzdžiui, langai buvo (Rimkutė 2006). Likusios trūktinos kolokacijų atkarpos buvo transformuojamos į autonomiškas frazes. Dažniausiai tai vyko jas a) patrumpinus, t. y. atsisakius gramatiškai nereikalingų ir nesavarankiškų jų dalių, b) papildžius trūkstamais lengvai nuspėjamais žodžiais, imant juos iš tekstyno konkordanso ir prirašius skliausteliuose, pavyzdžiui: legenda apie (kilmę), (peržengė) padorumo ribas, sujungus skirtingo ilgio tas pačios frazės fragmentus į vieną, kitaip sakant, trumpesnius junginius įtraukus į ilgesnes frazes, jei tik jose yra trumpiesiems junginiams tapačios dalys, pavyzdžiui: kolokacijų atkarpa asmenims, kurie (pavartota 73 kartus), sujungiama su ilgesne fraze asmenims, kurie šią žemę išnuomoja (pavartota 5 kartus). Kolokacijų atkarpos su vienodais bendriniais, bet skirtingais tikriniais daiktavardžiais, buvo sujungos surašius tikrinius skliaustuose, pavyzdžiui: dėl posėdžio vedimo tvarkos kalbėjo seimo narys (A. Baležentis; A. Endriukaitis; A. Kubilius). Galutinį transformuotų frazių sąrašą sudarė 68 600 vienetų, taigi liko apie 74 % pirminio sąrašo. Sąrašas labiausiai pakito atsisakius defektyvių kolokacijų atkarpų arba kelias sujungus į vieną. Apie 10 % kolokacijų atkarpų buvo papildytos 2–4 žodžiais, tačiau dėl to sąrašo ilgis nepakito. Kai kuriais atvejais jos buvo pildomos ne žodžiais, o tik skliaustais, parodant, kad juose turėtų atsirasti koks nors leksinis vienetas – skaitvardis, tikrinis daiktavardis ar pan. Tušti skliaustai buvo paliekami, kai nebuvo nė vieno dažniau vartojamo žodžio tai vietai užimti. Kolokacijos vidutiniškai papildytos 2–4 žodžiais, kurių trūko iš kairės, dešinės ar abiejų pusių.
164
2 .2 . L I E T U V I Ų K A L B O S D A I K TAVA R D I N I Ų F R A Z I Ų ŽO DY N O Y PAT U M A I
Daugiausiai pildytos tos kolokacijos, kurias sudaro prielinksnio ir daiktavardžio junginys, pavyzdžiui: padažas tinka su (pudingais, žuvim); padėka už (darbą; pasiaukojimą; ryžtą; paramą); padidinti žemės ūkio objektų priemonių (parduodamų už pinigus, pradines pardavimo aukcionuose kainas); (dėl ... komandiruotės) į Šveicariją. Pildant vienas semantiškai neautonomiškas frazes, pavyzdžiui, minėtąsias, negalima iš anksto numanyti, kokio žodžio ar žodžių junginio trūksta. O trūkstami kitų frazių žodžiai gali būti gana lengvai numanomi, pavyzdžiui: (peržengė) padorumo ribas; padėtis dar labiau (komplikavosi). Šias, net ir nepapildytas, frazes supranta gimtakalbiai, t. y. jaučia, kokio žodžio trūksta. Dažnai tokias kolokacijas galima papildyti ne tik pažiūrėjus į tekstyną, bet tiesiog remiantis savo kalbos jausmu. Tai įrodo, kad daiktavardinės frazės yra apylaisviai ar nelaisvieji junginiai. Kai kurios kolokacijos sujungtos į vieną, pavyzdžiui: laikinasis premjeras E. Gentvilas; laikinasis premjeras Eugenijus Gentvilas; laikinasis premjeras. Šios kolokacijos sujungtos ir paliktas toks junginys: laikinasis premjeras (E. Gentvilas). Dėl atliktų pakeitimų sąrašas ne tik gerokai patrumpėjo, bet ir pakito kokybiškai, dvižodės ir trižodės kolokacijos pailgėjo, keturžodės ir penkiažodės patrumpėjo, o šešiažodės ir ilgesnės liko nepakitusios. 11 pav. pavaizduotos dvi kreivės – pirminio (tamsesnė) ir transformuotojo (šviesesnė), rodančios sąrašo sudėtį pagal frazių ilgį. Iš jo matyti, kad kokybiškai sąrašas pakito nedaug. 50,00 % 40,00 % 30,00 % 20,00 % 10,00% 0,00% 2
3
4
5
6
7
8
9
10
>10
11 pav. Kolokacijų sąrašas prieš ir po lingvistinės peržiūros
165
2 d a lis. L I E T U V I Ų K A L B O S K O LO K A C I J Ų ŽO DY N A S
2.2.2. Leksiniai-gramatiniai lietuvių kalbos kolokacijų modeliai Leksinių-gramatinių modelių terminas (lexicogrammatical patterns) ir samprata perimta iš tekstynų lingvistikos atstovų darbų (Hunston et al. 2000). Tradiciškai modelius naudoja leksikografai, kurie jais apibūdina konkretaus leksinio vieneto vartosenos ypatumus, arba gramatikai, kurie taiko morfologinius ar sintaksinius modelius, sudarytus iš kalbos ar sakinio dalių. Pirmuoju atveju modeliai yra labai konkretūs, tinkantys tik vienam žodžiui ar panašių žodžių grupei, antruoju – labai abstraktūs, apimantys ištisas morfologines ar sintaksines kategorijas. Akivaizdu, kad trūksta tarpinės modelių grandies – tokių darinių, kurie užimtų tarpinę padėtį tarp labai abstrakčių ir labai konkrečių modelių. Kitaip sakant, reikia jungti leksinius ir gramatinius modelius į vieną visumą, kad jais būtų galima apibendrinti lietuvių kalbos frazes. J. Sinclairio pasiūlyta leksinės gramatikos idėja kaip tik ir leidžia tai padaryti, t. y. susieti konkrečių frazių leksinius, semantinius ir gramatinius požymius į vieną modelį, apibendrinanti palyginti nedideles, tačiau bendrų bruožų turinčios frazių grupes, pavyzdžiui: modelis, susidedantis iš slinkties veiksmažodžio, prielinksnio „link“ ir daiktavardžio, pavartoto kilmininko linksniu, apibendrinantis tokias frazes kaip judėti namų link, kaip tik ir sieja semantiką, leksiką ir gramatiką. Lietuvių kalbos kolokacijų žodyno frazės buvo apibendrintos taikant būtent tokią modelio sampratą. Kadangi šios frazės yra dažnos, atspindinčios kartu einančių lietuvių kalbos žodžių junginių sandarą, jų pagrindu gauti modeliai laikytini esminiais, būtinais kuriant programinius sintaksės analizės instrumentus ir į juos panašius automatinius kalbos apdorojimo įrankius. Didžiausias jų privalumas – jie sudaryti autentiškų lietuvių kalbos frazių pagrindu. Lietuvių kalbos frazių modelių pobūdį lemia jų ilgis, taigi kokybė priklauso nuo kiekybės. Daiktavardinių frazių ilgis labai įvairus: nuo dvižodžių iki frazių, sudarytų iš 46 žodžių. Daugiausia yra dvižodžių frazių (46,4 %), mažiau trižodžių (28,7 %) ir keturžodžių (10,1 %). Šios trys frazių grupės sudaro didžiąją visų junginių dalį – daugiau nei 85 %. Kuo ilgesnės frazės, tuo jų mažiau. Pačių ilgiausių frazių pasitaikė vienetiniai atvejai. Pagrindinė daiktavardinių frazių pasiskirstymo pagal ilgį tendencija yra tokia pati kaip ir dažniausių žodžių, t. y. kuo ilgesnė
166
2 .2 . L I E T U V I Ų K A L B O S D A I K TAVA R D I N I Ų F R A Z I Ų ŽO DY N O Y PAT U M A I
frazė, tuo ji retesnė. Retesnės, bet ilgesnės frazės apima didžiąją tekstyno dalį. Tik vieną kartą pavartotos frazės sudaro apie 39 % viso tekstyno. Dažnos frazės, tekstyne pavartotos daugiau nei 10 kartų, užima tik apie 14 % tekstyno. Analizuotos lietuvių kalbos frazės pagal ypatybes suskirstytos į keturis pagrindinius tipus: dvižodės, trižodės–šešiažodės, septyniažodės–devyniažodės ir daugiau nei iš dešimties žodžių sudarytos frazės. Trumpiausios – dvižodės – frazės yra tipiški žodžių junginiai, arba įprastinės kolokacijos. Tarpinę padėtį užimančios trižodės–penkiažodės atkarpos labiausiai atitinka tai, ką įprasta vadinti frazėmis. Ilgiausios frazės yra kaip tik tekstų fragmentai. Daugiau nei iš dešimties žodžių sudarytos kolokacijos – tipiški kanceliarinės kalbos pavyzdžiai. Taip pat pasitaiko junginių iš medicininių, religinių tekstų, bet tai tik vienetiniai atvejai. Nuo septyniažodžių prasideda kanceliarinės kalbos frazės. Nemažai junginių iš orų prognozių, horoskopų. E. Rimkutės (2006) nustatyta, kas būdinga kiekvienam kolokacijų tipai (tai apibendrintai pateikta 8 lentelėje). 8 lentelė. Pagrindiniai daiktavardinių frazių tipai ir būdingosios jų ypatybės (cituojama iš Rimkutė 2006: 252–253) Frazių tipas Ypatybės Dvižodės Gana autonomiški junginiai, mažiausiai pildyti. Tai tradicinių kolokacijų žodžių kombinacijos. Vartojamos įvairiuose stiliuose. Sudaro apie 75 proc. visų daiktavardinių frazių. Trižodės– Panašios į tradicines frazes. Kešešiažodės turžodės frazės dažniausiai atpažįstamos intuityviai, jas mažiausiai reikėjo keisti, t. y. trumpinti ar pildyti. Penkiažodėse dominuoja pavadinimai, yra nemažai frazeologizmų. Nuo šešiažodžių frazių atsiranda tikrųjų idiomų. Tai bendresnio pobūdžio frazės, iš įvairesnių šaltinių.
Pavyzdžiai kalendorines dienas balansinė vertė laikraščio teigimu ligoninės administracija
(drebėjo) iš pykčio (išeiti) į sceną akcijų kaina padidėjo imtis šio darbo kitų metų balandį pagal Dievo valią (parašyta ...) amžiuje prieš Kristų (didinti ...) centais už kilovatvalandę žurnale mokslas ir gyvenimas
167
2 d a lis. L I E T U V I Ų K A L B O S K O LO K A C I J Ų ŽO DY N A S
Septyniažodės–devyniažodės
Tokios frazės gali būti vadinamos tekstų fragmentais. Nuo septyniažodžių prasideda kanceliarinės kalbos frazės. Nemažai junginių iš orų prognozių, horoskopų.
blogas ženklas sutikti žmogų su tuščiais kibirais lengvatinių kreditų ir valstybės specialiųjų fondų lėšų Valstybinei mokesčių inspekcijai ir valstybės dokumentų technologinės apsaugos tarnybai Pravieniškių sustiprintojo režimo Daugiau nei Tai tipiški kanceliarinės kalbos ir Marijampolės griežtojo režimo iš dešimties pavyzdžiai. Taip pat pasitaiko žodžių junginių iš medicininių, religinių pataisos darbų kolonijose sudarytos tekstų. Tokių frazių dažniausiai Valstybinės draudimo priekolokacijos pasitaiko tik vienetiniai atvejai. žiūros tarnybos prie finansų ministerijos valdybos pirmininkas (R. Kleinauskas) Dėl įmonių kurių valstybei priklausančiomis akcijomis kompensuojama už valstybės išperkamą žemę mišką gyvenamuosius namus jų dalis butus Kur du ar trys susirinkę mano vardu ten ir aš esu tarp jų
Skirtingo ilgio kolokacijų atkarpos buvo morfologiškai anotuotos naudojantis lietuvių kalbos morfologinio anotavimo sistema Lemuoklis, automatiškai nustatančia antraštinę žodžio formą (lemą) ir pateikiančia gramatines pažymas (Zinkevičius 2000). Daiktavardinių frazių žodyne pateikiamos konkrečios gramatinės formos, o ne jų lemos, t. y. antraštinės formos. Tai padaryta dėl to, kad kai kuriose frazėse vartojamos tik tam tikros formos. Kai kurios lemos gali būti net nesuprantamos dabartinės lietuvių kalbos vartotojams, pavyzdžiui, omenis (vartojama tik junginiuose turėti omeny(je)), perstojas (vartojama tik be perstojo) ir pan. Pritaikius automatinę morfologinio anotavimo programą buvo sužymėtos visos žodyno frazės, tačiau tik keturžodės, penkiažodės ir šešiažodės gramatiniu aspektu paanalizuotos detaliau. Šios analizės pagrindu ir nustatyti leksinių-gramatinių lietuvių kalbos kolokacijų modeliai bei pristatyti jų ypatumai. Mažiausiai transformuotos ir intuityviai tipiškiausiai atrodančios yra keturžodės kolokacijų atkarpos. Joms buvo nustatyti leksiniai
168
2 .2 . L I E T U V I Ų K A L B O S D A I K TAVA R D I N I Ų F R A Z I Ų ŽO DY N O Y PAT U M A I
gramatiniai modeliai. Bendras skirtingų keturžodžių kolokacijų atkarpų skaičius yra 3895, o jų dažnumas tekstyne – 62 854 pavartojimo atvejai. Automatiškai anotavus keturžodes frazes gauta 1 511 skirtingų modelių. Keturžodės daiktavardinės lietuvių kalbos kolokacijos iš lietuvių kalbos kolokacijų žodyno buvo atrinktos naudojant Lemuoklio kompiuterinę programą, dar neturinčią jokių priemonių automatiškai sintaksinei ar semantinei analizei atlikti (Zinkevičius 2000: 247). Dėl šios priežasties kiekvieną žodžio formą programa nagrinėja atskirai, atsietą nuo konteksto, – lemuojant žodį, išrenkamos visos gramatinės jo traktuotės, kokias tik Lemuoklis suranda savo duomenų apie lietuvių kalbos leksiką ir gramatiką bazėje, ir kiekvienai žodžio formai pateikiama ne viena, o iš karto kelios lemos. LIETUVIŲ (dktv) NAFTA (dktv) SVEIKATOS (dktv)
IR (prvksm, dll, jngt) IR (prvksm, dll, jngt) IR (prvksm, dll, jngt)
KITŲ (įvrd) JOS (įvrd, vksm) JOS (įvrd, vksm)
TAUTŲ (dktv, tikr. dktv) PRODUKTAIS (dktv) APSAUGOS (dktv, vksm)
Kaip matyti, tais atvejais, kai tik žodis gali būti dvejopai (ar net trejopai) interpretuojamas, Lemuoklis pateikia visus galimus šios interpretacijos variantus. Daugiareikšmiškumo atvejais lingvistui pačiam reikia atmesti lemuojant klaidingai nurodytas perteklines pažymas, pavyzdžiui, kai į kolokacijos sudėtį įeina kovos, kyla klausimas, ar laikyti jį dktv. (vns. K.), ar vksm. (būs. l. 3 asm.): KOVOS SU ORGANIZUOTU NUSIKALSTAMUMU Remiantis platesniu žodžio kontekstu ar tiesiog kalbine nuojauta, reikėjo ištrinti tas pažymas, kurios nereikalingos. 1. (bdvr) (bdvr) (dktv) (bndr (dlv)) → (bdvr) (bdvr) (dktv) (dlv) ŪKINEI KOMERCINEI VEIKLAI SKIRTI 2. (prln) (dlv) (dktv) (bndr (dlv)) → (prln) (dlv) (dktv) (dlv) NUO LIKUSIOS BAUSMĖS ATLEISTI 3. (dktv (vksm)) (prln) (dlv) (dktv) → (dktv) (prln) (dlv) (dktv) KOVOS SU ORGANIZUOTU NUSIKALSTAMUMU APSAUGOS NUO NUSIKALSTAMO POVEIKIO
169
2 d a lis. L I E T U V I Ų K A L B O S K O LO K A C I J Ų ŽO DY N A S
4. (dktv (vksm)) (prln) (bdvr) (dktv) → (dktv) (prln) (bdvr) (dktv) KOVOS SU TARPTAUTINIU TERORIZMU APSAUGOS NUO FIZINIO POVEIKIO Taip keturžodžių kolokacijų atveju buvo gauti tikslūs kolokacijas sudarančių kalbos dalių modeliai, pagal juos sudarančių daiktavardžių skaičių suskirstyti į vieno, dviejų, trijų ir keturių daiktavardžių frazes: 1. keturžodžių kolokacijų grupė 1 daiktavardis ir kitos kalbos dalys (pavyzdžiui: SMULKUS IR VIDUTINIS VERSLAS SUSIDEDA IŠ DVIEJŲ DALIŲ, VIENA IŠ SUSITARIANČIŲJŲ ŠALIŲ ir pan.); 2. keturžodžių kolokacijų grupė 2 daiktavardžiai ir kitos kalbos dalys (pavyzdžiui: BENDROSIOS DALINĖS NUOSAVYBĖS TEISE, PASIUNTINIU IR ĮGALIOTUOJU MINISTRŲ REGIONINIO PARKO VEIKLAI ORGANIZUOTI ir pan.); 3. keturžodžių kolokacijų grupė 3 daiktavardžiai ir kitos kalbos dalys (pavyzdžiui: VALSTYBINIO VISUOMENĖS SVEIKATOS CENTRO, PIRMINĖS SVEIKATOS PRIEŽIŪROS ĮSTAIGŲ, GREITOSIOS MEDICINOS PAGALBOS STOČIAI ir pan.); 4. keturžodžių kolokacijų grupė 4 daiktavardžiai (pavyzdžiui: EUROPOS VYRŲ KREPŠINIO KLUBŲ, RUSIJOS VYRŲ KREPŠINIO SUPERLYGOS, LIETUVOS AUTOMOBILIŲ SPORTO ) Susumavus rezultatus, paaiškėjo, jog daugiausia yra kolokacijų, kurias sudaro trys daiktavardžiai – 1497, truputį mažesnę keturžodžių kolokacijų dalį (1042) sudaro kolokacijos su dviem daiktavardžiais. Kolokacijų, sudarytų iš keturių daiktavardžių, buvo rasta 535. Mažiausią keturžodžių kolokacijų grupės dalį (508) užima kolokacijos su vienu daiktavardžiu, tačiau pastaroji grupė yra pati gausiausia skirtingų modelių. Išryškėjo tam tikri kokybiniai modelių įvairovės dėsningumai: iš keturių daiktavardžių sudarytos frazės priklausė tam pačiam modeliui, trijų daiktavardžių grupėje buvo rasta 40 skirtingų morfologinių modelių, dviejų daitavardžių grupėje modelių buvo triskart daugiau, t. y. apie 120, o vieno daiktavardžio grupėje modelių įvairovė buvo pati didžiausia – apytikriai 300 modelių. Kad gramatiniai modeliai įgytų leksinę dimensiją ir taptų leksiniaisgramatiniais, po automatinio frazių anotavimo ir rankiniu būdu atlikto išdviprasminimo turėtų būti atliktas morfologinio modelio detalizavimas. Pirmasis jo etapas – nurodyti kiekvieno kaitomo žodžio, frazėje
170
2 .2 . L I E T U V I Ų K A L B O S D A I K TAVA R D I N I Ų F R A Z I Ų ŽO DY N O Y PAT U M A I
vartojamo konkrečia forma, morfologines kategorijas: skaičių, linksnį, laiką ir kt. Nekaitomi žodžiai – prielinksniai, jungtukai, prieveiksmiai – turėtų būti įtraukti į modelį kaip konkrečios leksemos: Smulkios (bdv. dgs. N)
ir (jung. „ir“)
vidutinės įmonės (bdv. dgs. N) (dktv. dgs. N)
Paskutinėje leksinio gramatinio modelio tikslinimo stadijoje turėtų būti nurodomi kaitomų kalbos dalių – daiktavardžių ir veiksmažodžių grupių, galinčių užimti modelyje nurodytas pozicijas, semantinius požymius: Smulkios (bdv. dgs. N)
ir (jung. „ir“)
vidutinės (bdv. dgs. N)
įmonės ( konkretusis dktv. dgs. N)
Šešiažodės kolokacijos, palyginti su iš dviejų, trijų, keturių žodžių sudarytomis kolokacijomis, yra gana retos, nes minėtų tipų kolokacijos sudaro 85 % visų daiktavardinių kolokacijų. Analizuojant gramatiškai, kolokacijos taip pat suskirstytos į šešis tipus pagal tai, kiek jose vartojama daiktavardžių. Tuos tipus sudaro kolokacijos, kuriose pavartotas vienas, du, trys, keturi, penki arba šeši daiktavardžiai: 1. kolokacijos, kurias sudaro 1 daiktavardis ir 5 kitos kalbos dalys (pavyzdžiui: NE VĖLIAU KAIP PRIEŠ TRIS MĖNESIUS), 2. kolokacijos, kurias sudaro 2 daiktavardžiai ir 4 kitos kalbos dalys (pavyzdžiui: KREIPĖSI Į ETIKOS IR PROCEDŪRŲ KOMISIJĄ), 2. kolokacijos, kurias sudaro 3 daiktavardžiai ir 3 kitos kalbos dalys (pavyzdžiui: IŠ TĖVO IR IŠ MOTINOS PUSĖS), 4. kolokacijos, kurias sudaro 4 daiktavardžiai ir 2 kitos kalbos dalys (pavyzdžiui: TIK TURINT LIETUVOS RESPUBLIKOS VYRIAUSYBĖS LEIDIMĄ), 5. kolokacijos, kurias sudaro 5 daiktavardžiai ir 1 kita kalbos dalis (pavyzdžiui: GABENIMAS PER LIETUVOS RESPUBLIKOS VALSTYBĖS SIENĄ), 6. kolokacijos, kurias sudaro 6 daiktavardžiai (pavyzdžiui: VATIKANO VALSTYBĖS SEKRETORIUS KARDINOLAS ANGELO SODANO). Kaip ir trižodžių kolokacijų atveju, gramatinių modelių įvairovė susijusi su gramatiniais šešiažodžių kolokacijų tipais. Daugiausiai gramatinių modelių susidarė tarp tų kolokacijų, kurios sudarytos su trimis
171
2 d a lis. L I E T U V I Ų K A L B O S K O LO K A C I J Ų ŽO DY N A S
daiktavardžiais, – 255 modeliai (31,33 %) (žr. 9 lentelę). Taip pat labai skirtingais gramatiniais modeliais pasižymi iš keturių daiktavardžių sudarytos kolokacijos. Tokių modelių rasta 231 ir tai sudaro 28,38 %. Gerokai mažiau gramatinių modelių sudaro du daiktavardžius turinčios šešiažodės kolokacijos – 150 (18,43 %). Nuo šio kolokacijų tipo gramatinių modelių įvairove mažai atsilieka iš penkių daiktavardžių sudarytos kolokacijos – joms būdinga 110 skirtingų gramatinių modelių (tai sudaro 13,51 %). Beveik dvigubai mažiau modelių galima skirti kolokacijoms su vienu daiktavardžiu – tik 47 (5,77 %), o mažiausiai gramatinių modelių turi kolokacijų su šešiais daiktavardžiais tipas – nustatytas tik 21 modelis (2,56 %). Iš pirmo žvilgsnio turėtų atrodyti, kad su šešiais daiktavardžiais sudarytų kolokacijų tipas turėtų priklausyti tik vienam gramatiniam modeliui, tačiau dėl automatinės morfologinės analizės specifikos skiriami daiktavardžiai ir tikriniai daiktavardžiai kaip atskiros gramatinės kategorijos. Formaliai žiūrint, daiktavardžiai ir tikriniai daiktavardžiai traktuojami kaip atskiros kalbos dalys, todėl kolokacijose su šešiais daiktavardžiais ir susidaro 21 skirtingas gramatinis modelis dėl skirtingo daiktavardžių ir tikrinių daiktavardžių išsidėstymo. Kaip matyti iš 9 lentelės, skirtingų kolokacijų skaičiaus proporcijos nesutampa su skirtingų gramatinių modelių pasiskirstymu. Iš viso rasta 1560 skirtingų kolokacijų. Kalbant apie skirtingas kolokacijas, reikia paminėti, kad daugiausiai skirtingų kolokacijų rasta tarp kolokacijų su keturiais daiktavardžiais – 459, tai sudaro beveik trečdalį visų kolokacijų. Kiek mažiau kolokacijų turi kolokacijų su trim daiktavardžiais tipas – 377 (24,17 %). Nuo šio tipo kolokacijų gausumo mažai atsilieka kolokacijų su penkiais daiktavardžiais tipas; čia rasta 371 skirtinga kolokacija (23,78 %). Daug mažiau skirtingų kolokacijų nustatyta kolokacijų su dviem daiktavardžiais tipe – 203 (13,01 %). Visai nedaug kolokacijų nustatyta tuose tipuose, kurie pasižymi ir mažiausiu skirtingtų gramatinių modelių skaičiumi. Tarp kolokacijų su šešiais daiktavardžiais rastos 86 skirtingos kolokacijos (5,51 %), o tarp kolokacijų su vienu daiktavardžiu nustatytos tik 64 skirtingos kolokacijos (4,1 %). Taigi iš pateiktų duomenų matyti: kuo daugiau galima skirtingų gramatinių modelių, tuo daugiau randama ir skirtingų kolokacijų, tiesa, visiškos atitikties tarp modelių gausos ir skirtingų kolokacijų, kaip minėta, nėra.
172
2 .2 . L I E T U V I Ų K A L B O S D A I K TAVA R D I N I Ų F R A Z I Ų ŽO DY N O Y PAT U M A I
Suskaičiavus, kuriems gramatiniams modeliams galima priskirti daugiausia skirtingų kolokacijų, išryškėjo tam tikra tendencija: kuo daugiau daiktavardžių sudaro kolokacijas, tuo labiau skirtingų kolokacijų dažnumu išsiskiria tam tikri gramatiniai modeliai. Palyginkime šiuos duomenis: dažniausiems kolokacijų su vienu daiktavardžiu gramatiniams modeliams priskiriamos 5, 4 ir 4 kolokacijos (tie modeliai komentuojami aptariant kiekvieno tipo kolokacijas, pateikti 1 priede); dažniausiems kolokacijų su dviem daiktavardžiais gramatiniams modeliams priskiriamos 7, 6 ir 5 kolokacijos; dažniausiems kolokacijų su trimis daiktavardžiais gramatiniams modeliams priskiriamos 16, 10 ir 8 kolokacijos; dažniausiems kolokacijų su keturiais daiktavardžiais gramatiniams modeliams priskiriamos 29, 21 ir 20 kolokacijų; dažniausiems kolokacijų su penkiais daiktavardžiais gramatiniams modeliams priskiriamos 42, 27 ir 20 kolokacijų. Tokia tendencija galėtų būti vertinama kaip lietuvių kalbos daiktavardėjimas, dažna sustabarėjusių daiktavardinių frazių vartosena. Šios tendencijos nepatvirtina kolokacijos su šešiais daiktavardžiais: šio tipo kolokacijų dažniausiems gramatiniams modeliams priskiriamos 25, 19 ir 8 kolokacijos. Tačiau, kaip buvo minėta, apskritai šio tipo kolokacijos turėtų pasižymėti tik vienu modeliu, jei laikytumės tradicinio gramatinio požiūrio, bet čia buvo išskirti tikriniai ir bendriniai daiktavardžiai kaip atskiros gramatinės kategorijos. 9 lentelė. Skirtingų kolokacijų gramatinių modelių pasiskirstymas Kolokacijų modelis
Skirtingų modelių skaičius
Kolokacijos su 1 dktv Kolokacijos su 2 dktv Kolokacijos su 3 dktv Kolokacijos su 4 dktv Kolokacijos su 5 dktv Kolokacijos su 6 dktv Iš viso
47 150 255 231 110 21 814
Skirtingų modelių procentinė dalis 5,77 18,43 31,33 28,38 13,51 2,58 100
Skirtingų kolokacijų skaičius 64 203 377 459 371 86 1560
Skirtingų kolokacijų procentinė dalis 4,1 13,01 24,17 29,42 23,78 5,51 100
Nepaisant didelės gramatinių modelių įvairovės, dominuoja tie modeliai, kuriems priskiriamos pavienės kolokacijos. Suskaičiavus visus
173
2 d a lis. L I E T U V I Ų K A L B O S K O LO K A C I J Ų ŽO DY N A S
vienetinius kolokacijų modelius, pastebėta tendencija: kuo daugiau daiktavardžių sudaro kolokacijų tipą, tuo mažiau galima skirti vienetinių gramatinių modelių. Plg.: iš kolokacijų su vienu daiktavardžiu vienetiniai gramatiniai modeliai sudaro 80,9 %, iš kolokacijų su dviem daiktavardžiais – 81,3 %, iš kolokacijų su trim daiktavardžiais – 76,9 %, iš kolokacijų su keturiais daiktavardžiais – 70,1 %, iš kolokacijų su penkiais daiktavardžiais – 56,4 %, o iš kolokacijų su šešiais daiktavardžiais – 47,6 %. Vadinasi, vidutiniškai vienetiniai gramatiniai modeliai iš šešiažodžių kolokacijų sudaro 68,9 %. Taigi labai sunku gramatinę kolokacijų analizę susieti su semantine, nes negalima daryti patikimų apibendrinimų, kad vienam ar kitam gramatiniam kolokacijų modeliui būdingos tam tikros reikšmės.
2.2.3. Leksinės-semantinės lietuvių kalbos kolokacijų ypatybės Kolokacijų žodyno semantika gali būti tiriama keliais aspektais: a) semantiniu stilistiniu, bendrais bruožais nurodant kolokacijomis įvardijamus dalykus ir joms būdingą funkcinį stilių ar diskurso tipą bei žanrą, b) semantiniu taksonominiu, suskirtant kolokacijas į Sisteminiame lietuvių kalbos žodyne ar bet kokiame kitame tezaure įvardytas bendrąsias semantines grupes, c) semantiniu frazeologiniu, nustatant stabiliųjų junginių grupes pagal jų reikšmės nedalomumą. Visi šie būdai aptariami išsamiau. Analizuojant kolokacijas pirmuoju aspektu išryškėjo tam tikros semantinės stilistinės grupės. Didelę semantinę grupę sudaro tikrinių daiktavardžių kolokacijos – patys įvairiausi pavadinimai. Didelę dalį trumpesniųjų kolokacijų sudaro vardai: asmenų, įmonių, įstaigų, organizacijų pavadinimai. Kai kurie jų gali būti gali būti gana ilgi, todėl jų galima rasti tarp šešiažodžių kolokacijų, pavyzdžiui: (bdvr) (jngt) (bdvr) (dktv) (bdvr) (dktv) SMULKAUS IR VIDUTINIO VERSLO PLĖTROS AGENTŪRA=13 (tikr dktv) (bdvr) (jngt) (bdvr) (bdvr) (dktv) LIETUVOS AKLŲJŲ IR SILPNAREGIŲ UGDYMO CENTRE=9
174
2 .2 . L I E T U V I Ų K A L B O S D A I K TAVA R D I N I Ų F R A Z I Ų ŽO DY N O Y PAT U M A I
Asmenys kartais apibūdinami išvardijant jų socialinį statusą atspindinčius žodžius. Tokie apibūdinimai paprastai yra ilgi, dėl to iš šešiažodžių kolokacijų su keturiais daiktavardžiais rasta tokio pobūdžio frazių, pavyzdžiui: (tikr dktv) (bdvr) (dktv) (dktv) (bdvr) (dktv) (ANTANAS PETRAUSKAS) SOCIALINIŲ MOKSLŲ DAKTARAS NEPRIKLAUSOMAS EKSPERTAS=4 (sntrmp) (tikr dktv) (dktv) (bdvr) (dktv) (tikr dktv) AB KAUNO GRŪDAI GENERALINIS DIREKTORIUS (TAUTVYDAS BARŠTYS)=14
Konstrukcija, apibrėžianti mokslo ir pedagoginius vardus, yra stabili, dažnai vartojama, taigi nekeista, kad rasta tarp kolokacijų: (dktv) (jngt) (bdvr) (dktv) (dktv) (dktv) DAKTARO IR HABILITUOTO DAKTARO MOKSLO LAIPSNIUS=4 (dktv) (dktv) (jngt) (bdvr) (dktv) (dktv) MOKSLO LAIPSNIŲ IR PEDAGOGINIŲ MOKSLO VARDŲ=12
Aptariant bendrinių daiktavardžių grupę itin svarbus funkcinis stilius bei diskurso tipas ir žanras. Iš kolokacijų gana daug junginių, vartojamų administracinio stiliaus tekstuose, pavyzdžiui: (sntrmp) (jngt) (tikr dktv) (dktv) (sntrmp) (tikr dktv) BNS IR LIETUVOS RYTO INF LIETUVA=6 (sntrmp) (dktv) (dktv) (dktv )(prln) (tikr dktv) JAV GYNYBOS MINISTRO VIZITO Į LIETUVĄ=4 (vksm) (prln) (bdvr) (dktv) (dktv) (sntrmp) KREIPĖSI Į SPECIALIŲJŲ TYRIMŲ TARNYBĄ STT=4 (dlv) (prln) (bdvr) (bdvr) (dktv) (dktv) SUSIJUSIŲ SU VALSTYBINIO SOCIALINIO DRAUDIMO (įmokomis ir išmokomis)=7 (dktv) (bndr) (jngt) (bndr) (bdvr) (dktv) LEIDIMO LAIKYTI IR NEŠIOTIS ŠAUNAMĄJĮ GINKLĄ=4
Dabartinės lietuvių kalbos tekstyną sudaro nemažai publicistikos tekstų. Skaitant pastarųjų metų spaudą, į akis krinta tai, kad daug dėmesio skiriama kriminalams, pavyzdžiui:
175
2 d a lis. L I E T U V I Ų K A L B O S K O LO K A C I J Ų ŽO DY N A S
(dlv) (jngt) (prln) (bdvr) (dktv) (dktv) ATVEŽTA IR DĖL DURTINĖS ŽAIZDOS KRŪTINĖJE=4 (vksm) (dlv) (jngt) (dlv) (dktv) (dktv) BUVO AREŠTUOTAS IR NUTEISTAS MIRTIES BAUSME=5
Keletas kolokacijų akivaizdžiai paimtos iš orų prognozių: (prvks) (dktv) (vksm) (bdvr) (prln) (dktv) RYTOJ KRAŠTE BUS DEBESUOTA SU PRAGIEDRULIAIS=7
Dėl didelio publicistikos tekstų kiekio tekstyne tarp kolokacijų nemažai ir horoskopų ištraukų, pavyzdžiui: (jngt) (padlv) (prln) (dktv) (dktv) (vksm) JEI IŠĖJUS IŠ NAMŲ VĖJAS PŪSTŲ=19 (bdvr) (dktv) (bndr) (bdvr) (bdvr) (dktv) GERAS ŽENKLAS RASTI AŠTRIŲ METALINIŲ DAIKTŲ=6
Kolokacijoms priklauso ir religiniam diskursui būdingos frazės, pavyzdžiui: (įvrd) (vksm) (dktv) (dktv) (įvrd) (dktv) AŠ ESU KELIAS TIESA IR GYVENIMAS=4 (tikr dktv) (tikr dktv) (sntrmp) (bdvr) (bdvr) (dktv) JONAS PAULIUS II POSINODINIS APAŠTALIŠKASIS PARAGINIMAS=14 (sntrmp) (strmp) (tikr dktv) (dktv) (įvrd) (dktv) ŠVČ M MARIJOS ĖMIMAS Į DANGŲ=6 (tikr dktv) (sntrmp) (dktv) (dktv) ()() VATIKANO II SUSIRINKIMAS DEKRETAS UNITATIS REDINTEGRATIO=6 (tikr dktv) (vksm) (įvrd) (dktv) (jngt) (dktv) VIEŠPATS YRA MANO JĖGA IR GIESMĖ=6
Nors šiame darbe neatlikta labai išsami semantinė kolokacijų analizė, tačiau net plika akimi galima pastebėti, kad vyrauja administracinio stiliaus tekstuose vartojamos frazės. Antruoju, t. y. semantiniu taksonominiu, aspektu klasifikuojant lietuvių kalbos kolokacijas, labiausiai atsižvelgiama į jomis įvardijamus nekalbinės tikrovės dalykus. Reikšmės, kaip santykio tarp tos pačios sistemos ženklų, supratimas daugelio kalbos specialistų laikomas grynai
176
2 .2 . L I E T U V I Ų K A L B O S D A I K TAVA R D I N I Ų F R A Z I Ų ŽO DY N O Y PAT U M A I
lingvistiniu, nes esą turinio plano elementai šiuo atveju aiškinami remiantis ne ekstralingvistiniais reiškiniais, o tikra lingvistine medžiaga, tekstu (Leech 1977: 71). Tačiau tiriant atskirus leksinius vienetus – žodžius ar žodžių junginius – teksto ir kontekto pasitelkti negalima. Todėl kliaujamasi referentine šių leksinių vienetų, tarp jų ir kolokacijų funkcija bei kognityvine reikšme. Šiandien, kai labai svarbi tampa intelektikos ir automatinio kalbos apdorojimos sritis, kai daugeliui sričių kuriamos semantinės ontologijos, taksonomiškai klasifikuotos kolokacijos gali labai praversti, jei būtų įdiegtos į automatinio ar automatizuoto vertimo, sakinio analizės ir bet kokias kitas sistemas. Trečiuoju, t. y. semantiniu frazeologiniu, aspektu lietuvių kalbos kolokacijų žodynas analizuotinas išsamiau, nes tai leidžia spręsti kai kurias stabiliųjų žodžių junginių tyrimo problemas. Tai buvo pradėta daryti 2008 m., parengus magistro darbus iš VDU Lietuvių kalbos katedros kuruojamos Taikomosios kalbotyros programos. Juose buvo aptartos kolokacijų metaforos ir frazeologizmai. Toliau pristatomi aktualiausi V. Drūlienės, J. Šilinytės ir L. Dumbliauskaitės magistro darbų aspektai.
2.2.3.1. Lietuvių kalbos kolokacijų metaforos Lietuvių kalbos daiktavardinių kolokacijų žodynas buvo tirtas (Drūlienė 2008, Šilinytė 2008) metaforiniu aspektu siekiant pagrįsti anksčiau iškeltą ir tik vieno daiktavardžio atmintis junglumu pagrįstą hipotezę apie glaudžias kolokacijų ir metaforų sąsajas. Kitaip sakant, buvo siekiama parodyti, kad mirusios, kalbinės arba kognityvinės metaforos randasi iš kolokacijų, nes pastarosios sudaro kasdienės kalbos branduolį. Priešingai nei leksinių-gramatinių modelių atveju, metaforoms rinkti daugiausiai naudotos dvižodės ir trižodės kolokacijos. Buvo bandyta rinkti metaforas iš visų keturių pagal frazės ilgį suskirstytų kolokacijų tipų, t. y. iš dvižodžių, trižodžių–šešiažodžių, septyniažodžių–devyniažodžių ir daugiau nei iš dešimties žodžių sudarytų daiktavardinių frazių. Tačiau peržvelgus vidutinio ilgio ir ilgiausias kolokacijas buvo nuspręsta apsiriboti tik dvižodėmis ir trižodėmis, nes: 1) jų buvo daugiausia, 2) iš daugiau nei dviejų ar trijų žodžių sudarančiose kolokacijose atsispindi tos pačios trumpesniųjų kolokacijų frazės, 3) metaforai
177
2 d a lis. L I E T U V I Ų K A L B O S K O LO K A C I J Ų ŽO DY N A S
atsirasti pakanka ir dviejų ar trijų žodžių, ilgesnės, išplėstinės metaforos pasitaiko gana retai. Metaforų būta ir keturžodėse (pavyzdžiui: sutelkti visą dėmesį į; argi mūsų širdys užsidegusios) bei penkiažodėse kolokacijose (pavyzdžiui: buvo padarytas apysunkis kūno sužalojimas; po ilgų ir karštų diskusijų; jis viešai gins daktaro disertaciją). Viena kita metafora aptikta šešių (nuo seniausių laikų iki šių dienų), septynių (sumažinta kaina, vertė, jeigu šie daiktai sunaudoti) ir aštuonių (nėra didesnės meilės kaip gyvybę už draugus atiduoti; o jei yra toks didelis noras gyventi svetur) žodžių kolokacijose. Pastebėta, kad keturių, penkių žodžių ar ilgesnėse kolokacijose kartojasi tos pačios dvižodžių ir trižodžių kolokacijų frazės, pavyzdžiui: jis viešai gins daktaro disertaciją ir gins daktaro disertaciją. Identifikuojant metaforas Lietuvių kalbos daiktavardinių frazių žodyne kilo šios pagrindinės problemos: 1) metaforiškumo apskritai, 2) metaforų atpažinimo bei 3) klasifikavimo. Svarbiausias metaforiškumo kriterijus – reikšmės perkėlimas, išryškėjantis iš konkretaus ir abstraktaus daiktavardžio priešpriešos. Kai konkretaus daikto savybės imamos pagrindu abstraktui įtraukti į kontekstą, sudaryti žodžių junginį su juo, tuomet gimsta metafora, pavyzdžiui: šuo graužia kaulą plg. graužia sąžinė; kraujo / vandens tėkmė plg. laiko tėkmė; verda kava plg. verda aistros; sunkus maišas plg. sunki galvos trauma. Tradicinės metaforos teorijoje tai dar vadinama paslėptu palyginimu, o konceptualiosios metaforos teoretikai teigia, kad vienas, dažniausiai abstraktus, dalykas suvokiamas kaip kitas, konkretus, pasitelkus pastarojo terminiją, pavyzdžiui: kilo saulė plg. kilo idėja, triukšmas, sąmyšis, noras, panika; gili duobė plg. gili senovė, gili senatvė, gili prasmė; kelti dėžę plg. kelti baimę, grėsmę, pavojų, kvalifikaciją. Praktiškai renkant metaforas iš kolokacijų galima pasikliauti ir šiuo kriterijumi: jei protu suvokiama, kad tiesioginė kolokacijos reikšmė juslėmis realiai neapčiuopiama, tai ir yra metafora. Tačiau vaizduotėje, nors ir kalbama apie abstraktus, pagal išryškėjusią analogiją su konkretu, gana realus vaizdinys gali ir susidaryti, pavyzdžiui: kyla klausimas plg. kyla saulė, psichologinis spaudimas plg. sulčių spaudimas arba pasąmonės gelmėse plg. jūros gelmėse. Taigi abstraktas žmogaus suvokiamas kaip konkretas, nes jam taikomi pastarojo terminai. Kolokacija nelaikoma metafora tada, kai abstraktas matuojamas konkrečiais vienetais, turi apčiuopiamą pagrindą realybėje. Konkreto
178
2 .2 . L I E T U V I Ų K A L B O S D A I K TAVA R D I N I Ų F R A Z I Ų ŽO DY N O Y PAT U M A I
reikšmė perkeliama metonimijos pagrindu dalies visumai (sinekdocha). Pavyzdžiui, aukšta temperatūra, aukštas slėgis, mažinti kraujospūdį – reiškia, jog aukštai pakilęs termometro stulpelis, pakilus slėgio ar nukritus kraujospūdžio matuoklio rodyklė. Šie matuokliai rodo skaitmenis, kurie visoje jų išdėstytoje skalėje pažymėti aukšta ar žema pozicijomis. Kitas panašių pavyzdžių nemetaforiškumo patvirtinimo kriterijus – žmogus įvairiomis savo juslėmis gali pajusti aukštą temperatūrą, aukštą slėgį ar nukritusį kraujospūdį. Tai tinka ir kalbant apie elektros įtampą, žmogaus kalbėjimo toną, balsą ar garsą. V. Drūlienė pastebi, kad pasitaiko tokių kolokacijų, kurios, priklausomai nuo konteksto, gali būti ir metaforos, ir nemetaforos, pavyzdžiui, uždaro tipo. Jei tai drabužis ar apykaklė, bus nemetafora, jei tokio būdo žmogus – metafora. Daikto konkretumas čia apibrėžiamas kaip žmogaus juslėmis apčiuopiama medžiagiško daikto savybė. Tačiau kai kurie konkretūs dalykai gali būti, nors ir neapčiuopiami žmogaus juslėmis, bet išmatuojami prietaisais, pavyzdžiui, oro slėgis, todėl tai nelaikoma metafora. Erdvinių metaforų atveju pavyzdžiai būtų kiek kitokie: aukštas pareigūnas, aukštoji mokykla, žemesnė klasė. Aukštas pareigūnas gali būti tiesiog aukštas žmogus, aukštoji mokykla – tokia, kurios pastatas yra aukštas, o klasė, suprantama kaip patalpa, gali būti žemų lubų. Aukščio parametras juslėmis apčiuopiamas, regimas, taip pat matuojamas realiais vienetais – metrais, centimetrais ir t. t. Tačiau pavyzdyje pateiktos kolokacijos turi ir kitą, perkeltinę reikšmę, kuri reiškia, jog pareigūnas užima ypač svarbias pareigas, turi pavaldinių, mokyklos atveju – tai universiteto sinonimas, o klasė – grupė žmonių, kuri gyvena (ekonomiškai) prasčiau už kitą grupę žmonių. Šios kolokacijos gali būti suprantamos dvejopai, jų reikšmės patikrinamos pažiūrėjus į kontekstą (tekstyną), tačiau jau vien pasikliaujant savo kalbiniu jausmu galima teigti, kad jos dažniausiai vartojamos perkeltine reikšme. Taigi į tiriamąjį metaforų sąrašą įtraukiama tik viena (perkeltinė) tokių kolokacijų reikšmė. Nustatant kolokacijų metaforiškumą buvo atkreiptas dėmesys į jau minėtą abstraktaus daiktavardžio kolokatų junglumo apimtį. Jei kolokato junglumas didelis, t. y., jis jungiasi su įvairiais žodžiais ir jo reikšmė labai apibendrinta, junginiai su juo nelaikomi metaforiškais, pavyzdžiui, dauguma kolokacijų su žodžiais didelis ir mažas neįtrauktos į tyrimą: didelės galimybės, didelės viltys. Taip nuspręsta dėl to, kad labai daug kas gali būti
179
2 d a lis. L I E T U V I Ų K A L B O S K O LO K A C I J Ų ŽO DY N A S
didelis ir mažas. Šios kolokacijos į galutinį sąrašą nebuvo įtrauktos dar ir todėl, jog dydis nėra vien vertikalumo, kuris buvo pasirinktas analizuoti, matas. Žodžiai daug, geras, visas taip pat gali sudaryti junginius su daugeliu kitų daiktavardžių, todėl nekelia specifinių asociacijų, plg.: daug vilčių, gera sveikata, geras gyvenimas, visas kliūtis. „Tik ribotą junglumo apimtį turintys kolokatai, vartojami su abstrakčios reikšmės daiktavardžiais, lemia metaforinių žodžių junginių atsiradimą“ (Marcinkevičienė 1999: 116), pavyzdžiui: verda aistros; skendi skolose; smurto banga; trūko kantrybė; graužia sąžinė; iš krūtinės išsiveržė; prie valdžios vairo. Šie kriterijai buvo taikyti visų trijų tipų metaforoms, kaip papildomas kriterijus ontologinėms metaforoms atpažinti buvo taikoma formulė „x turi konkretaus daikto savybę“, kur x – abstrakčios reikšmės daiktavardis. Struktūrinėms metaforoms identifikuoti buvo taikoma formulė „x yra konkretus daiktas“. Erdvinių metaforų atpažinimo elementas buvo vertikalė ir ją įvardijantys leksiniai vienetai. Pirmiausia pamatoma kolokacija, kurios semantikoje yra erdvės elementų, ir tik tada sprendžiama, ar ji yra metafora, ar ne (o ne atvirkščiai). Tai parodė, kad dauguma erdvinės raiškos kolokacijų ir buvo metaforos, tik viena kita iš jų pasitaikė ne metafora. Išrinktos metaforos papildomai buvo peržiūrėtos ir kai kurių neryškaus metaforiškumo atvejų atsisakyta. Pasitaikė nemažai tokių pavadinančių (konceptualizuojančių) abstraktą žodžių, su kuriais galima sudaryti labai daug įvairių junginių. Kuo daugiau vienas žodis gali sudaryti junginių su įvairiais žodžiais, tuo mažiau jis metaforizuotas. J. Šilinytė (2008) nustatė, kad daugiausia junginių sudarė šie pernelyg abstraktūs žodžiai: a) daug, pavyzdžiui: daug kartų; daug pastangų; daug rūpesčių; daug vietos; daug vilčių; daug žalos; daug dėmesio skyrė; daug laiko praleidžia; daug namų; daug vaikų; daug knygų; b) visas, pavyzdžiui: visa širdimi; visas kliūtis; visas gyvenimas; visas viltis; visomis jėgomis; visas pastangas; visą teisybę; c) geras–blogas, pavyzdžiui: geras laikas; geras pavyzdys; geras ženklas; geri norai; gero gyvenimo; gero skonio; gerą valią; gerų naujienų; gerų žodžių; geros valios žmonėms; blogas oras; blogas gyvenimas; arba blogiausiu atveju; d) paskutinis, pavyzdžiui: paskutinėmis dienomis, paskutinėmis minutėmis; e) duoti, pavyzdžiui: davė priesaiką; davė ženklą; davė interviu; f) turėti–neturėti, pavyzdžiui: turi savybę; turi tikslą; turi įtakos; turima informacija; neturi jokios prasmės; neturi jokių šansų; neturi juridinės galios. Buvo nuspręsta atmesti ir metaforinius frazeologizmus, kurių perkeltinė
180
2 .2 . L I E T U V I Ų K A L B O S D A I K TAVA R D I N I Ų F R A Z I Ų ŽO DY N O Y PAT U M A I
reikšmė yra pastovi, išstūmusi pirmykštę reikšmę, visas junginys turi ne kelias, o vieną reikšmę ir tuo skiriasi nuo analizuojamų nefrazeologinių metaforų. Metaforinių frazeologizmų daugiausia buvo iš atmestų kolokacijų, pavyzdžiui: krito į akį; ant bedugnės krašto; susiveržti diržus; apverčia aukštyn kojomis; neišėjo iš galvos; pakibo ant plauko; pakišo koją; nusišypsojo laimė; skinasi kelią; šaltu protu; kraustosi iš proto. Taip susidarė šiame darbe metaforomis nelaikomų kolokacijų grupė, į kurią įeina matuojami ir žmogaus juslėmis juntami reiškiniai, kurie gali būti ir aukšti ar žemi, ir kilti ar kristi (tono atveju – būti pakeltu ar nuleistu) bei padidėti ir pamažėti, pavyzdžiui: (temperatūra nukrinta) žemiau nulio, žemo slėgio sūkurys, pakyla temperatūra, padidėjusio kraujospūdžio, pakeltu tonu, aukštos įtampos. Dar viena panaši savo realiu pamatu tikrovėje ir dėl to į metaforų sąrašą neįtraukta grupė – vietovių ir kitų objektų pavadinimai bei įvardijimai: Aukštųjų Šančių; Aukštojoje Panemunėje; Aukštuosiuose Paneriuose); Žemaitijos ir Aukštaitijos; (klubas) Žemyn upe. Pastaruoju atveju reikia turėti galvoje, kad upės ištakos vadinamos aukštupiu, o vieta, kur ji įteka į kitą vandens telkinį, – žemupiu. Peržiūrėjus buvo apskaičiuotas metaforų grupių santykis. Kaip matyti iš 12 pav., didžiausią jos dalį užima erdvinės vertikalės metaforos – net apie 57 %, kiek mažiau ontologinės – apie 34 %, o struktūrinės – tik apie 9 %. Kadangi dėl Lietuvių kalbos daiktavardinių frazių žodyno struktūros, tikslius skaičius pateikti sunku, nes jame trumpesnės daiktavardinės frazės dažnai įeina į ilgesnes, be to, kolokacijas sudarantys žodžiai pasikartoja įvairiomis morfologinėmis kategorijomis, todėl ir gauti duomenys tik apytiksliai.
12 pav. Iš Lietuvių kalbos daikatavardinių frazių žodyno atrinktų metaforų tipai
181
2 d a lis. L I E T U V I Ų K A L B O S K O LO K A C I J Ų ŽO DY N A S
2.2.3.1.1. Struktūrinės metaforos Iš Lietuvių kalbos daiktavardinių frazių žodyno atrinkta 226 skirtingos ontologinės ir struktūrinės metaforos: ontologinių rasta 179, struktūrinių – 47. Pastarosios priklauso kelioms stambioms grupėms – skysčio, augalo ir kelio, ir kelioms smulkesnėms, jei žiūrėsime konkrečiojo daiktavardžio, kurio požymiai atsispindi abstrakto kolokatų semantikoje. Prie jų priklauso skraistės, bagažo, transporto priemonės, įtaiso ir kai kurios kitos metaforos. Gausiausia – skysčio metaforų grupė. Į ją patenka tie abstraktai, kurie jungiasi su virimo, tekėjimo, bridimo, skendimo reikšmę turinčiais veiksmažodžiai ir šaltinio, tėkmės, srauto, sūkurio, bangos reikšmę turinčiais daiktavardžiais. 11 lentelė. Struktūrinių skysčio metaforų pavyzdžiai Metaforizuojantis kolokatas virti
kilti – atslūgti
Metaforinės kolokacijos darbas virte virė verda aistros
vadovų kabinetuose verda įtemptas darbas – rengiamasi Pažaislio tarptautiniam festivaliui; aistros dėl šio posto verda jau seniai
kyla aistros
Kaitinama politinė atmosfera, kyla nereikalingos aistros. Po pusmečio, kai, kaip jam atrodė, aistros atslūgo
aistros atslūgo
tekėjimas, tėkmė
Vartosenos pavyzdys
informacijos nutekėjimas protų nutekėjimas istorijos tėkmėje
Vyksta nesustabdomas gabiausių protų „nutekėjimas“ į užsienį
laiko tėkmė srautas, sūkurys, banga krovinių srautas žinių srautas pinigų srautai įvykių sūkuryje protestų banga smurto banga
182
Prieš kelerius metus panašių įvykių sūkuryje buvo atsidūręs ir ekspremjeras
2 .2 . L I E T U V I Ų K A L B O S D A I K TAVA R D I N I Ų F R A Z I Ų ŽO DY N O Y PAT U M A I
bristi – skęsti
išbristi iš krizės skęsta skolose
šaltinis
žmonija ieško konstruktyvių kelių išbristi iš krizės.
finansavimo šaltinis lėšų šaltinis pajamų šaltinis pragyvenimo šaltinis įkvėpimo šaltinis taršos šaltinių didesnio pavojaus šaltinio
Produktyvi ir augalo metafora, apimanti žydėjimo, brendimo veiksmažodžius bei šakos ir šaknų daiktavardžius, plg.: pačiame jėgų žydėjime, pribrendo laikas, mokslo šaka, pramonės šaka, gilias istorines šaknis, tikėjimo šaknys. Šiais kolokatais metaforizuojami dažnai vartojami abstraktai: Manau, kad pribrendo laikas iš esmės pakeisti požiūrį į operatyvinės informacijos kaupimą; Pribrendo laikas keisti jų veiklos pobūdį. Kolokacijų žodyne esama ir dažnai vartojamų, nors ir skaičiumi negausių kelio metaforų: istorijos vingiuose, nuomonių kryžkelėje. Atskirai minėtinos gijos metaforos, apimančios mezgimą ir trūkimą: diplomatinių santykių užmezgimo, užmegzti ryšius, užmegzti naujas pažintis, derybos nutrūko, nervai neišlaikė (suprask, trūko kaip gija), tampo nervus, trūko kantrybė, pavyzdžiui: egzistuoja didelė rizika, nuolat tampo nervus komplikuota atsiskaitymų sistema, vieną dieną trūksta. Gijos trūkimas turi itin neigiamą atspalvį, pavyzdžiui: Sekmadienį vyriškiui neišlaikė nervai ir jis pats bandė nusižudyti. Vieną dieną trūko kantrybė ir pasakiau: arba jis susitvarko, arba skiriamės. Esama atskiros metaforų grupės, sudarančios mašinos metaforą, kuriai panaudojami atskirų mašinos dalių pavadinimai: vairas, stabdžiai, variklis, plg. metaforines kolokacijas: prie valdžios vairo, prie valstybės vairo. Vieninteliai jūsų sėkmės stabdžiai – lankstumo stoka ir nepataisomas; Kokie yra svarbiausi verslo plėtros stabdžiai Lietuvoje? tai maištas prieš regresą, tai gyvenimo variklis. Pavienėmis metaforomis laikytinos tos, kurios realizuojamos tik vienu daiktavardžiu ar veiksmažodžiu. Tokia kolokacijų žodyne yra karo metafora, įkūnyta tik vienu veiksmažodžiu apginti: apgynė
183
2 d a lis. L I E T U V I Ų K A L B O S K O LO K A C I J Ų ŽO DY N A S
disertaciją, apginti savo interesus, apginti savo teises, apgynė daktaro disertaciją. Panašiai ir barjeras, vaizdžiai įvardijantis trukdį ar sunkumą bendrauti, yra metafora, aptikta dviejose kolokacijose: kalbos barjeras, psichologinis barjeras, pavyzdžiui: trukdo ne materialinės priežastys, bet labiau sunkiai įveikiamas psichologinis barjeras. Todėl jaučiausi drąsiau. Kalbos barjerą greitai įveikiau; Prasideda naujas mano gyvenimo tarpsnis. Kalbos barjeras nugalėtas! Kitos pavienės struktūrinės metaforos, nesudarančios didesnių grupių, yra atminties kaip įrašo, kantrybės taurės, žinių bagažo ir paslapties skraistės: ištrinti iš atminties (pavyzdžiui: valdžia atkakliai siekė ištrinti iš atminties patį Lietuvos vardą; Niekas negali ištrinti iš atminties tautos tragedijos). Įrašu gali būti metaforizuoti ir kiti abstraktai, pavyzdžiui: buvo numatyta visiškai ištrinti iš gyvenimo atleisti iš pareigų ir ištrinti iš istorijos (suprasti kaip „iš praeities“); ir kiti okupantai bandė ištrinti iš mūsų atminties ir širdies. Kita metafora kantrybės taurę dažniausiai yra vartojama su veiksmažodžiu perpildyti, pavyzdžiui: šaliai iškyla mirtinas pavojus ar jau būna perpildyta kantrybės taurė; Kantrybės taurę perpildė mūsų kompanijai priklausančio automobilio vagystė Kaune. Bagažo metafora žinių bagažą abstraktui žinios suteikiamas tvarkingai sudėliotų į savo vietas reikalingiausių, kruopščiai atrinktų daiktų krovinio įvaizdis. Pagal bagažo, pilno daiktų, analogiją, žmogus gali nešioti ar kitaip vartoti savąjį žinių bagažą, pavyzdžiui: tikisi prasmukti iš vidurinės mokyklos atsineštu žinių bagažu, gali papildyti, šis naujas faktas ne tik papildytų jūsų žinių bagažą, ir pan. Žinių bagažas gali būti apibūdinamas tais pačiais būdvardžiais ir daiktų bagažas, pavyzdžiui: kompozitorius Antanas Belazaras sukrovė mums didelį žinių bagažą, talpus lietuvio žinių bagažas. Panašiai kontekstualizuojama ir skraistės metafora paslapties skraistė. Ji vartojama išimtinai su veiksmažodžiais dengti, gaubti, būdvardiniai epitetai šiai metaforinei kolokacijai nebūdingi, plg.: 1985-ųjų tragediją Kauno mariose dengė paslapties skraistė; moterys neįleidžiamos, iniciacijas gaubia paslapties skraistė. Išnagrinėjus išrinktų iš Lietuvių kalbos daiktavardinių frazių žodyno struktūrinių metaforų konceptus, matyti, kad abstraktas gali būti konceptualizuojamas įvairiausiais būdais: pradedant nuo agregatinės medžiagos būsenos – skysčio, ir baigiant labai konkrečiu daiktu: taure,
184
2 .2 . L I E T U V I Ų K A L B O S D A I K TAVA R D I N I Ų F R A Z I Ų ŽO DY N O Y PAT U M A I
bagažu, skraiste ir kt. Visos čia aptartos struktūrinės metaforos atskleidžia mūsų supratimą apie daugelį abstraktų. Struktūrinėmis metaforomis, pasitelkus konkretų daiktą, abstraktai paverčiami matomais, jaučiamais, apčiuopiamais. Šios metaforos įdomios tuo, kad pasirenkamu labai konkrečiu daiktu konceptualizuojami abstraktai įgyja ne dalį, o visas konkretui būdingas savybes, todėl tokios metaforos gana vaizdingos, to negalima pasakyti apie ontologines metaforas.
2.2.3.1.2. Ontologinės metaforos Metaforizuojant ne visu konceptu, kaip struktūrinių metaforų atveju, o tik viena kita konkretumą, daiktiškumą ir apčiuopiamumą implikuojančia savybe, randasi ontologinės metaforos. Kolokacijų žodyno medžiaga rodo, kad jos apima tris dideles grupes: daikto, gyvo padaro ir spalvos metaforas, kurioms priklauso minėtų konceptų savybės. Štai daiktiškumas implikuojamas tuomet, kai abstraktui priskiriamos tokios konkretaus daikto savybės kaip jo metmenys – aukštis, ilgis ir plotis. Visos jos žymimos neapibrėžtos reikšmės abstraktų būdvardiniu intensifikatoriumi didelis, kuris, palyginti su prieveiksmiu daug, su išlygomis gali būti laikomas metaforizuojančiu, plg. šias kolokacijų žodyno metaforas: didelis dėmesys, didelis džiaugsmas, didelis pavojus, didelis triukšmas, didelius įgaliojimus, didelių laimėjimų, didelė atsakomybė, didelė garbė, didelė konkurencija, dideles viltis, didelio meistriškumo, didžiausios laimės, su dideliu malonumu, su didele meile, didelis dėmesys, didelis triukšmas, didelius įgaliojimus, didelių laimėjimų, be didelio entuziazmo, be didelio vargo, be didelių pastangų, be didelės žalos, daro didelę įtaką, didelio įspūdžio, didelė šventė, didelės reikšmės, didelės įtakos, su dideliu entuziazmu. Kad didelis metaforizuoja abstraktus, teigia ir G. Lakoffas (1980: 50). Jo manymu, didumas žymi svarbą, panašiai kaip tai, kas aukštai yra gerai. Taigi didelis reiškia svarbus. Ši analogija galioja ir tuo atveju, kai svarba yra su minuso ženklu, konotuota neigiamai, plg. metaforines kolokacijas: didelė žala, didelė nelaimė, didelė problema, didelis triukšmas, didžiausią nerimą didžiausia bausmė, didžiausia kliūtis, didžiausias pavojus. Panašiai metaforizuoja ir didelio vediniai padidėjęs, didesnis, didžiausias: padidėjusios rizikos, padidėjęs jautrumas, be didesnių pastangų, didesnius įgaliojimus, didesnių galimybių, didesnių nuostolių,
185
2 d a lis. L I E T U V I Ų K A L B O S K O LO K A C I J Ų ŽO DY N A S
didžiausią nerimą, didžiausia bausmė, didžiausia kliūtis, didžiausia problema, didžiausia vertybė, didžiausias dėmesys, didžiausias laimėjimas, didžiausias pavojus. Konkretesnės yra tos kolokacijų metaforos, kuriose nurodoma specialesnė abstrakto savybė – platumas arba siaurumas: platesnio konteksto, plataus pasitikėjimo, plataus vartojimo, plačių užmojų, plačios erudicijos, siauresne prasme, siauros specializacijos. Metaforose pateikti abstraktai sukonkretinami matu, o tai būdinga apčiuopiamam daiktui. Platus suvokiamas kaip didelis, siauras – kaip mažas. Taip ir abstraktai: tie, kuriems suteikiamos plataus daikto savybės: kontekstas, pasitikėjimas, vartojimas, užmojis, erudicija, – turi daugiau teigiamų, o tie, kuriems siauro daikto savybės: prasmė, specializacija, – neigiamų savybių. Kitas metaforizuojantis matas – ilgis, taikomas laiką ar tekstą įvardijantiems žodžiams apibūdinti. Šių ontologinių metaforų metaforiškumas yra ribinis, nes teksto apimtį galima suvokti ir tiesiogiai, matant, kad jis užima (ne)ilgą atkarpą arba trunka (ne)ilgą laiko tarpą: trumpos žinutės, trumpa istorinė apžvalga, ilga pauzė, ilgam laikui, ilgas valandas, ilgiems metams, ilgo gyvenimo, ilgus amžius, ilgus dešimtmečius, ilgus mėnesius, ilgus šimtmečius, trumpesnį laiką, trumpam laikui. Svorio metafora apima kur kas didesnę abstraktų įvairovę nei ilgio. Ją įkūnija du būdvardvardžiai ir jų vediniai – lengvas ir sunkus, pvz.: nelengva užduotis, nelengvomis sąlygomis, sunkaus kūno sužalojimo, būklė buvo sunki, kitą sunkų nusikaltimą, laukia sunkus išbandymas, sunki liga, sunki našta, sunkias pasekmes, sunkioje padėtyje, sunkioje situacijoje, sunkiomis sąlygomis, sunkūs laikai, sunkią traumą, sunkią valandą, sunkių išbandymų, sunkus darbas, sunkią nepagydomą ligą, sunkioje finansinėje būklėje, sunkios finansinės padėties, sunkių nelaimingų atsitikimų, sunkus kūno sužalojimas, lengvą kūno sužalojimą, lengviausiu keliu, lengvo gyvenimo. Savotišką priešpriešą sudaro tvirto ir laužomo daikto metaforos. Pirmoji skirta žmogaus psichologinėms ypatybėms apibūdinti, plg.: tvirta valia, tvirto charakterio, arba yra pastato metaforos dalis: tvirtas pozicijas, tvirtus pamatus. Pagrindas, pamatas ar pozicija gali būti vartojami ir tiesiogine reikšme, tačiau, kaip rodo šių daiktavardžių vartosenos analizė tekstyne, beveik visada jie vartojami metaforiškai, pavyzdžiui: legendos autorius paklojo tvirtus pamatus marinistinei lietuvių literatūrai, tuo nori Kanto teorijai suteikti jai stokojantį tvirtą pagrindą. Laužomo
186
2 .2 . L I E T U V I Ų K A L B O S D A I K TAVA R D I N I Ų F R A Z I Ų ŽO DY N O Y PAT U M A I
daikto metaforą kolokacijų žodyne atitinka tik vienas šios metaforos pavartojimo atvejis: priesaikos sulaužymą. Tekstyne buvo aptikta ir kitų šio tipo metaforų, rodančių, kad sulaužyti galima ir ištikimybę (pavyzdžiui: buvusių herojų žmonų, norėdamas jas įkalbinti sulaužyti ištikimybę), įsipareigojimus (nepriklausoma stotis bus priversta sulaužyti įsipareigojimus), žodį (kas privertė Šleževičių sulaužyti žodį Prezidentui) ir kt. Tačiau į kolokacijų žodyną jos nepateko. Dar vieną priešpriešą sudaro dalijimosi ir kaupimo metaforos. Dalomo daikto savybė perteikiama tokiems abstraktams: dalytis patirtimi, dalijosi mintimis, dalijosi prisiminimais, dalijosi įspūdžiais, pasidalinti savo nuomonėmis. O kaupiama, remiantis kolokacijų žodynu, gali būti tik patirtis: sukaupta patirtimi, bet ir ja, kaip rodo šios kolokacijos platesnis kontekstas, dažniausiai dalijamasi, ji perduodama, perteikiama. Rasta po vieną ontologinę metaforą, įvardijančią šias metaforizuojančio koncepto savybes: aštrumą, susivėlimą, nešvarą aštrios kritikos, nesivelkite į ginčus, pinigų plovimas. Šio metaforos ganėtinai akivaizdžios. Kiek sunkiau apibūdinti tokias implikuojamo daikto savybes kaip konsistenciją, įvardijamą veiksmažodžiu strigti ir realizuojamu vienintele metafora įstrigo į atmintį. Tokiu pat požymiu gali būti įvardyta ir daugiau abstraktų: širdis (pavyzdžiui: atsisveikindamas jis sakė, kad ši viešnagė jam giliai įstrigo į širdį), sąmonė (pavyzdžiui: paveikslas visam gyvenimui įstrigo į mano sąmonę), tačiau jie nepateko į kolokacijų žodyną. Atskirai minėtinos talpyklos, arba, tiksliau sakant, jos atmainos – patalpos, metaforos, kolokacijų žodyne realizuojamos būdvardžiais ir veiksmažodžiais atviras, uždaras, atverti, uždaryti ir pan. Taip metaforizuojama visuomenė ir žmogus: atvėrė kelią, atvira visuomenė, uždaro būdo, uždaros visuomenės. Apžvelgus daikto metaforas matyti, kad dažniausiai įvairiems abstraktams priskiriamos matuojamo ir sveriamo daikto savybės. Antroji stambi ontologinių metaforų grupė sudaryta iš gyvam padarui – žmogui ar gyviui – būdingų bruožų: judėjimo (eiti, bėgti, lydėti), radimosi (gimti, mirti ir kt.) žmogaus būdo bruožų (klastos, apgaulės ir kt.), kūno dalių (plaukas, liežuvis). Tai išplėstinės antropomorfinės metaforos, kurias G. Lakoffas priskiria prie ontologinių (1980: 33–34). Gebėjimas judėti priskiriamas tokiems abstraktams kaip laikas, metų laikai, eilė: ateina laikas, atėjus laiko pilnatvei, dabar atėjo laikas, atėjo metas, ateinančių metų biudžetą, atėjus pavasariui, atėjo eilė, laikas bėga, bėgo metai,
187
2 d a lis. L I E T U V I Ų K A L B O S K O LO K A C I J Ų ŽO DY N A S
nepraėjus nė valandai. Taigi visi jie pagal analogiją suvokiami kaip gyvas padaras, gebantis eiti ar bėgti. Panašiai metaforizuoja ir veiksmažodis lydėti: lydi sėkmė. Lietuvių kalbos daiktavardinių frazių žodyne su žodžiu lydėti aptiktas tik vienas atvejis, tačiau Dabartinės lietuvių kalbos tekstyne metaforų su minėtu žodžiu yra kur kas daugiau, pavyzdžiui: Kur lydi baimė pažvelgti į save; Vyriausybės sprendimą lydi kapų tyla; Kristiną, matyt, lydi laimė; Gyvenimą visuomet lydi pavojus iš baimės prarasti save. Grynai antropomorfinėms metaforoms priskirtinos metaforų kolokacijos, žyminčios žmogaus būdo bruožus ar jo gimimą: nuojauta neapgavo, klastinga liga, idėja gimė. Šią savybę gali turėti ir daugiau abstraktų, bet jau ne kolokacijų: labai laimingas, kad jo intuicija neapgavo; tas kvapas kriminalistų uoslės neapgavo; sudarytas įvaizdis beveik neapgavo. Platesnės semantinės apimties yra metaforos su gyvių pasaulio asociacijas keliančiais veiksmažodžiais: graužia sąžinė, sąžinės graužatį, sąžinės graužimo, tyko pavojai, ugnis pasiglemžė. Tas pat pasakytina ir apie kūno dalių (liežuvis) arba išaugų (plaukas) metaforas: ugnies liežuviai, žiloje senovėje, žilos senatvės. Pastarojoje metaforinis reikšmės perkėlimas susipynęs su metoniminiu. Šioje gana gausioje metaforų grupėje konceptualizavimui pasirenkamos įvairios gyvam padarui būdingos savybės – nuo jam būdingo veiksmo atlikimo iki konkretaus gyvam padarui priklausančio organo. Ontologinėms priskirtinos ir spalvos metaforos. Lietuvių kalbos daiktavardinių frazių žodyne aptiktos ontologinės juodos, pilkos ir margos spalvos metaforos. Tuo, kas juoda, tamsu, nešvaru, konceptualizuojami tokie abstraktai: juodoji kronika, juodas nerimas, juodojoje rinkoje, juodą darbą. Su būdvardžiu pilkas Lietuvių kalbos daiktavardinių frazių žodyne rasta tik viena metafora pilkos kasdienybės. Margu konceptualizuojamas pasaulis: margas pasaulis. Šviesia ir ryškia spalva įvardytos metaforos apimančios intelektines savybes. Čia priklauso protas, atmintis ir atminimas: šviesaus proto, šviesios atminties; šviesus atminimas. Šviesa asocijuojasi su tuo, kas matoma, gana gerai įžiūrima, atpažįstama, kas skaidru it vanduo, perregima, švaru – taip suvokiamas ir protas (pavyzdžiui: buvo tvirtas spiritualistas, ir šviesus protas visada rodė jam tiesą), atmintis (pavyzdžiui: neįsivaizdavau, kad jai 96 metai, kad jos tokia šviesi atmintis ir toks entuziazmas) ir atminimas (pavyzdžiui: Generolo Vėtros mirties, jo šviesus atminimas deramai pagerbtas ir įamžintas).
188
2 .2 . L I E T U V I Ų K A L B O S D A I K TAVA R D I N I Ų F R A Z I Ų ŽO DY N O Y PAT U M A I
Ryškumas – taip pat spalvos savybė, todėl priskirtina šiai metaforų grupei: ryškiausias pavyzdys, ryškų pėdsaką. (Rusų menininkai, humanitarai irgi savo metu paliko ryškų pėdsaką lietuvių kultūroje). Čia įdomu tai, kad konceptualizuojama ne tik daiktui būdinga kokios nors konkrečios spalvos savybe, bet ir pačios spalvos savybe (šviesi / ryški). Apžvelgus konceptualiąsias ontologines metaforas, paaiškėjo, kad abstraktai gali būti konceptualizuojami tiek labai konkrečiam, tiek abstrakčiam daiktui būdinga savybe.
2.2.3.1.3. Erdvinės metaforos Iš Lietuvių kalbos daiktavardinių frazių žodyno taip pat buvo atrinktos trimatį erdvės suvokimą įkūnijančios metaforos. Erdvinės metaforos glaudžiai susijusios su ontologinėmis, nes tam, kad būtų galima sąvoką suprojektuoti erdvėje, dažniausiai iš pradžių reikia ją įkūnyti, sudaiktinti, suteikti formą, substanciją. Todėl kai kurios metaforos gali būti priskiriamos tiek ontologinių, tiek erdvinių grupei, pavyzdžiui, talpyklos ar dydžio, – tai priklauso nuo norimo pabrėžti aspekto. Erdvinės metaforos atsiranda tada, kai nurodoma metaforizuojamos sąvokos vieta ar kryptingas judėjimas erdvėje, dažniausia jos išraiška – metaforose įvardyti du poliai: aukštai–žemai, viršuje–apačioje, giliai–sekliai, centre–periferijoje, viduje–išorėje, priekyje–užnugaryje. Paprastai vieną iš opozicijų poros elementų žmogus suvokia kaip teigiamą, kitą – neigiamą. O tai, ką laikome teigiama ir neigiama, priklauso ne tik nuo mūsų jutiminės patirties, bet ir labai didžia dalimi nuo mūsų kultūros. Taigi tai, kas vienoje kultūroje bus teigiamoje dalyje, kitoje gali atsidurti neigiamoje (Lakoff 1980: 22–24). Beje, mūsų kultūroje visada geriau vertinamas tas poros narys, kuris anksčiau išvardytuose pavyzdžiuose eina pirmasis. Tą rodo ir tai, kad kaip tik tokia žodžių pateikimo tvarka skamba natūraliai, o ne pavyzdžiui, žemai–aukštai, periferijoje– viduje ir kt. (ten pat: 132) Erdvinės metaforos nesuteikia vienam konceptui kito struktūros, kaip kad struktūrinės metaforos, bet sukuria visą konceptų sistemą, kurie vienas kito atžvilgiu nukreipti erdvėje. Šių metaforų pagrindas – įvairūs žmogaus kūno funkcionavimo aspektai fizinėje jo aplinkoje. Abstrakčioms sąvokoms suteikiama erdvinė orientacija,
189
2 d a lis. L I E T U V I Ų K A L B O S K O LO K A C I J Ų ŽO DY N A S
dažniausiai remiantis iš prigimties fizinėmis dvinarėmis opozicijomis: aukštai–žemai, priekyje–užnugaryje ir pan. Bet fizinė patirtis – ne vienintelis pagrindas ir vien jos nepakanka susidaryti ar sukurti visoms erdvinėms metaforoms. Kaip minėta, išvardytų opozicijų suvokimas gali varijuoti įvairiose kultūrose, todėl metaforoms atsirasti ne mažiau svarbi yra ir kultūrinė patirtis. Ryškiausia iš visų orientacijų – vertikalė aukštai–žemai. Ją ir pasitelkė G. Lakoffas bei M. Johnsonas norėdami pagrįsti išvardytus teiginius. Pateikiami kalbinių metaforų pavyzdžiai šių dvinarių konceptualiųjų metaforų: laimingas yra aukštai, nelaimingas – žemai (pakilo nuotaika, jaučiuosi prislėgtas); sąmoningumas yra aukštai, nesąmoningumas – žemai (anksti pakilo; nugrimzdo į miegą); sveikata ir gyvybė yra aukštai, liga ir mirtis – žemai (gyvenimo viršūnė, krito visi gyvuliai); valdžia yra aukštai, buvimas kontroliuojamam – žemai (valdžios viršūnėlės, jis po padu); daug yra aukštai, mažai – žemai (pajamos augo, žemi rodikliai); aukštas statusas yra aukštai, žemas – žemai (kilti karjeros laiptais, visuomenės padugnės); gera yra aukštai, bloga – žemai (aukšta kokybė, žema kvalifikacija); vertinamos savybės – aukštai, smerkiamos – žemai (jis mano akyse pakilo, iš jo juoktis buvo žema); racionalumas – aukštai, emocingumas – žemai (aukšto lygio intelektuali diskusija, pakilti aukščiau emocinio lygmens). Išvardytų konceptualiųjų metaforų pagrindas aiškinamas taip: gera emocinė būsena dažniausiai siejama su išsitiesusiu kūnu ir pakelta galva, lupų kampučiais, o bloga – su sukniubusiu kūnu ir nusvirusiomis rankomis, nuleistomis akimis ir pan., todėl laimingas – aukštai, o nelaimingas – žemai; miegantis, praradęs sąmonę, sergantis ar miręs žmogus paprastai guli, o atsibudęs, sąmoningas, sveikas ir gyvas – stovi, dėl to sąmoningumas, sveikata ir gyvybė – aukštai, o nesąmoningumas, liga ir mirtis – žemai; fizinis dydis paprastai susijęs su fizine jėga, o pergalė mūšyje paprastai visada viršuje, todėl valdžia – aukštai, o buvimas kontroliuojamam – žemai; kai kokios nors substancijos ar objektų būna daug, dažniausiai matome, kad pakilo substancijos lygis ar paaukštėjo sudėta krūva, todėl daug yra aukštai, o mažai – žemai ir pan. Dažnai kitų konceptualiųjų metaforų pagrindas būna ir jau egzistuojančios metaforos, pavyzdžiui: žmogaus vertinami gerovės elementai – gyvybė, sveikata, valdžia – yra aukštai, vadinasi, ir gerai yra aukštai. Arba: racionalumas
190
2 .2 . L I E T U V I Ų K A L B O S D A I K TAVA R D I N I Ų F R A Z I Ų ŽO DY N O Y PAT U M A I
iškeliamas virš emocingumo, ne tik fiziniu, bet ir kultūriniu pagrindu, nes žmogus save suvokia Žemės valdovu, jis jaučiasi esąs aukščiau už gyvulius, augalus, savo fizinę aplinką, o tai suteikia jam valdžią, vadinasi, jei valdžia yra aukštai ir iš to išeina, kad žmogus yra aukštai, tai ir racionalumas yra aukštai (Lakoff 1980: 14–17). Erdvinę metaforą puikiai iliustruoja Johno Gardnerio romano ištrauka: Jis šį tą išmanė apie kritimą, puolimą žemyn: žmogus gali pulti, paukštis kristi, arklys suklupti, nusivaryti nuo kojų, nukabinti nosį, galų gale kristi ir nebepasikelti. Ašaros, bombos, pašautas lėktuvas krenta. Kainos gali kristi, pinigų kursas irgi. Nereikia nė sakyti, Džeimsas Peidžas išmanė ir apie kilimą: kartais žmogaus ūpas pakyla, ir jis jaučiasi galįs viską įveikti, prieš viską atsilaikyti, iškelta galva sutikti sunkumus. Jis žinojo, kad žmogus žiūri iš aukšto į tą, kurį mano esant žemesnį, gali turėti aukštus idealus ir žemus kėslus, būti pakilios ar nupuolusios dvasios, moralės. Jo dvasia kyla tada, kai jis pats kyla aukštyn, o kartais jo dvasia puola kaip nugalėtas miestas, kaip gali pulti moteris. Garbė gali kilti ir kristi, rūkas pakyla ir krinta ant žemės. Net kalba, ir ta gali būti pakili, silius – žemas (Džonas Gardneris. Rudens šviesa. Iš anglų kalbos vertė Virgilijus Čepliejus. Vilnius, 1984, p. 15.) Metaforos turi savitą hierarchiją, priklausomą nuo kultūros: atsirandant naujoms, vienos būna reikšmingesnės už kitas, pavyzdžiui, daug yra aukštai turi pranašumą prieš gerai yra aukštai, tai išryškėja kalbinėse metaforose kyla infliacija ar kyla nusikaltimų lygis (Lakoff 1980: 19, 23). Taigi žmogaus galvoje egzistuoja erdvinio suvokimo visuma, kurioje metaforos tarpusavyje yra susijusios ir turi tam tikrą tvarką ne tik kiekviena savo vidinėje sistemoje, bet ir tarp visų konceptualiųjų metaforų. Erdvinės metaforos yra fundamentalios ir dažnai universalios, tai paaiškėjo lyginant kalbas (žr. šias disertacijas: Cibulskienė 2005, Papurėlytė-Klovienė 2004, Racevičiūtė 2002, Toleikienė 2004, Vaičenonienė 2000). Pačias svarbiausias sąvokas dažniausiai įkūnija kaip tik erdvinės metaforos ir sunku suvokti, kad galėtų būti kitaip, surasti tam pakaitinę sistemą. Taip yra todėl, kad erdvinės orientacijos yra artimiausios tiesiogiai suprantamai fizinei Žemės traukos veikiamo, kojomis į žemę, galva į dangų nukreipto žmogaus reikšmei (ne gravitaciniame lauke gyvenanti būtybė sąvoką aukštai tikriausiai suprastų kitaip ar visai nesuprastų). Be to, ši patirtis yra glaudžiai susijusi su kultūrine (socialine)
191
2 d a lis. L I E T U V I Ų K A L B O S K O LO K A C I J Ų ŽO DY N A S
patirtimi. Jų griežtai atskirti neįmanoma, nes erdvinėms metaforoms vienas fizinis pagrindas yra pasirinktas iš daugelio kitų įmanomų, o jo pasirinkimą vienaip ar kitaip vartoti kaip tik ir nulemia kultūra (Lakoff 1980: 17–19, 57). V. Drūlienė nustatė, kad erdvinių metaforų sąraše aiškiausiai ir dažniausiai erdvėje reiškiama kryptis buvo vertikalė, užimanti 60 % visų erdvinių metaforų, kai metaforizuojami objektai atsiduria kurioje nors vertikalios tiesės dalyje tarp aukštai ir žemai. Ypač čia ryškus kilimo– kritimo motyvas. Dažniausiai tai, kas suvokiama teigiamai – yra aukštai, kas neigiamai – žemai, tačiau nebūtinai. Iš trimačių metaforų ryškiausios turi talpyklos reikšmę. Jos gali būti priskiriamos tiek erdvinių, tiek ontologinių metaforų grupei (Lakoff 1980: 152), pavyzdžiui, uždaro būdo, atsiveria galimybė, sezono uždarymo, (išeiti) iš krizės, (prasiskverbti) į sielą. Čia atsidūrė ir kitos konceptualiųjų metaforų grupės: žyminčių objektų vietą erdvėje vienas kito atžvilgiu (nukreiptos prieš lietuvius, pergalės prieš lietuvius) arba subjekto atžvilgiu (balsas už kadro, likti už kadro) ir buvimo toli – arti ar judėjimo tolyn – artyn (nuomonės išsiskyrė, nuomonės sutampa, neatmeta galimybės). Prie pastarųjų priklauso didelė grupė metaforų su veiksmažodžio siekti formomis: siekti taikos, pasiekti pergalę, pasiekė apogėjų. Ypač daug trimačių metaforų rasta trižodžių kolokacijų sąraše, nes jame atsirado kolokacijos su prielinksniais. Visa tai rodo erdvinį žmogaus mąstymą, nukreiptą į vertikalę. Dauguma pavyzdžių atspindi asmeninę ar socialinę žmonių realybę: visuomenės nustatytos ar asmeninės vertybės yra nevienodos – turi savo hierarchiją, išsidėsčiusios pagal skalę, visuomeniniai reiškiniai taip pat išsidėstę įvairiais lygiais, tarp jų ir pinigai, kurių metaforos kainų ir infliacijos lygis dar kartą rodo vertikalų jų suvokimą, taip pat skirtingos žmonių grupės skirstomos į sluoksnius. Išaiškėja: norėdamas suvokti abstrakčius dalykus, žmogus vaizduotėje turi matyti juos sudėliotus tam tikra tvarka, vienetus priskirti kokioms nors grupėms, ir tai daro atsižvelgdamas į tipiškiausią jų narį – prototipą (Lakoff 1980: 119–125, 162). Būtina matyti vientisą schemą, kurioje išryškėtų kiekvieno reiškinio vieta kito ir visų atžvilgiu. Tik klasifikuodamas, grupuodamas ir vėl pergrupuodamas abstraktus lyg konkretus pagal naujus aspektus, žmogus geba apie juos mąstyti ir kalbėti.
192
2 .2 . L I E T U V I Ų K A L B O S D A I K TAVA R D I N I Ų F R A Z I Ų ŽO DY N O Y PAT U M A I
2.2.3.2. Kolokacijų frazeologija Dabartinės lietuvių kalbos frazių žodyne esama įvairių tipų stabiliųjų žodžių junginių (žr. plačiau 1.3.2.), tačiau atskirai buvo tirta žodyno frazeologija, siekiant nustatyti, kiek ir kokių frazeologizmų jame esama. Papildoma užduotis buvo palyginti rastus frazeologizmus su pateiktais anksčiau leistuose lietuvių kalbos frazeologijos žodynuose ir nurodyti ten nepakliuvusius. Lietuvių kalbios kolokacijų žodyno dvižodžių, trižodžių, keturžodžių, penkiažodžių ir šešiažodžių kolokacijų sąrašuose L. Dumbliauskaitė (2008) rado 360 skirtingų seniau vartojamų frazeologizmų pavyzdžius, aptinkamus ir tradiciniuose žodynuose. Be jų, dar buvo rasti 225 į tradicinius žodynus neįtraukti šiandien rašto kalboje vartojami frazeologiniai junginiai. Reikšmės požiūriu frazeologizmai buvo tradiciškai skirstomi į nemotyvuotos reikšmės, arba idiomas, bei motyvuotos reikšmės frazeologizmus (apie jų skyrimo pagrindą žr. 1.3.2.1.), o pastarieji toliau skaidomi į tropinius ir lyginamuosius frazeologizmus bei frazeologines samplaikas. Iš viso reikšmės požiūriu buvo identifikuoti 55 nemotyvuotos reikšmės ir 305 motyvuotos reikšmės (241 tropiniai, 34 lyginamieji, 30 frazeologinės samplaikos) seniau vartojami frazeologizmai, randami ir popieriniuose žodynuose. Iš viso nagrinėjamame žodyne rasta apie 600 skirtingų frazeologizmų, identiški, tik kita gramatine forma pavartoti kolokacijų frazeologizmai nebuvo įtraukti į bendrą skaičių. Net jei tai ir būtų padaryta, bendras frazeologizmų skaičius neperžengtų 1 000 vienetų ribos. Bet kuriuos atveju galima teigti, kad kiekybiškai frazeologija sudaro tik nedidelę kolokacijų dalį. Aptariant reikšmės požiūriu motyvuotos reikšmės tropinius frazeologizmus, vartojamus tekstyno pagrindu sudarytame Dabartinės lietuvių kalbos frazių žodyne bei randamus specialiuose lietuvių kalbos frazeologijos žodynuose, pažymima, kad daugiausia vartojama frazeologizmų, kuriuose metaforizuojamos žmogaus kūno dalys ar įvairios jų funkcijos. Čia pateikiama 30 naujų somatinių frazeologizmų, neaptiktų minėtuose frazeologijos žodynuose. Juos sudaro motyvuotos reikšmės tropiniai, somatiniai frazeologizmai: akių šviesa, paprasta akimi, juokas pro ašaras, (sakyti; rėžti) tiesą į akis, šeimos galva), virš galvų (pakibo), (įkiša) galvą į smėlį, (kiša galvas) (makaronų) ant ausų (nekabinti), (pasukiojo) pirštą prie smilkinio), (apsivijo) aplink kaklą, (pilti) jam į burną, (tampyti) už ūsų,
193
2 d a lis. L I E T U V I Ų K A L B O S K O LO K A C I J Ų ŽO DY N A S
(kikena) į saują, (trenkė) kumščiu į stalą, rankas kojas (raišioti, pančioti), nematoma ranka (...), viena ranka (duoda; apkabino), švarių rankų programai įgyvendinti, (paėmė) vairą į savo rankas, (įbruko) man į rankas, slysta iš po kojų, šaltas prakaitas, sveiko proto, (prasilenkia) su sveiku protu, šviesaus proto, proto bokštas, protų nutekėjimas, protų nutekėjimo, nervų karas, aštrių pojūčių, balsas tyruose, pakeltu tonu. Iš jų dažniausiai vartojami sveiko proto (278), viena ranka (duoda; apkabino) (205), šeimos galva (102). Ypač dažna ir savita frazeologizmo sveiko proto (278) vartosena kilmininko linksniu. Frazeologijos žodyne randami tik šie frazeologizmai šaltas protas, trumpas protas, nepilno proto, nors šiandienėje kalboje ypač dažnai vartojamas junginys sveikas protas: šie rinkimai bus ir piliečių sveiko proto išbandymas; B. Jelcinas turėjo paklausyti sveiko proto balso. Kita gausi metaforinių frazeologizmų grupė, kurių atraminiai žodžiai – negyvosios ar gyvosios gamtos objektų ir įvairių buities realijų pavadinimai: auksinis ruduo, gilias šaknis, kiaurą naktį, kiaurą parą, nepasitenkinimo banga, saulės vėjo, sena vaga, ugnies liežuviai, šventa karvė, abipus sienos, balta dėmė, gero tono, geras vardas, amžinoji ugnis, antrieji namai, atviru tekstu, atvirų durų, aukso fondas, garbės žodis, paskutinę akimirką, paskutinėje vietoje, užleisti vietą, juodoji kronika, juodoji skylė, mokėti duoklę, muilo opera, padėjo pamatus, kopti karjeros laiptais, tik per stebuklą (liko gyvas). Šios kolokacijos yra konotuotos, jų turinys neapsiriboja denotatine reikšme. Dabartinės lietuvių kalbos frazių žodyno frazeologizmai turi įvairiausius vertinamosios reikšmės atspalvius, per kuriuos išryškėja vertinamasis aspektas ir nūdienos realijos. Dažnai vartojami vientisos reikšmės vaizdingieji frazeologizmai pasižymi neigiama, pajuokiančio, šiurkštaus atspalvio konotacija – muilo opera, juodoji skylė, mokėti duoklę, plg.: Ekonominė muilo opera Lietuvoje; (…) prezidento ir premjero santykius būtų galima paversti paprasčiausia muilo opera, tačiau Slovakija yra (...); Švedijoje teko išgirsti, kad Lietuva yra juodoji skylė, į kurią niekas nenori investuoti; norintys „įtaisyti“ vaiką, turi mokėti duoklę darželiui, kas mėnesį. Taip pat, pavyzdžiui, Lietuvių kalbos frazeologijos žodyne yra frazeologizmas per plauką, reiškiantis ‘nedaug trūko’: Per plauką gyvas išliko iš tų muštynių (2001: 538). Tekstyne vartojamas kiek kitokios formos ir kito atspalvio frazeologizmas tik per stebuklą (liko gyvas): Bet ore lūžus sparnui tik per stebuklą liko gyvas lakūnas. Iš kitų frazeologinių vienetų minėtini šie: valandą kitą, vakarykštė diena, paskutinę
194
2 .2 . L I E T U V I Ų K A L B O S D A I K TAVA R D I N I Ų F R A Z I Ų ŽO DY N O Y PAT U M A I
sekundę, baltais siūlais, tiesia linija, (šviesa) tunelio gale, tiesiu taikymu, vienas malonumas, vieno rato. Atskirą Dabartinės lietuvių kalbos frazių žodyno frazeologijos sluoksnį sudaro patarlės, kasdieniai posakiai, priežodžiai: atsarga gėdos nedaro, kare kaip kare, vienas lauke ne karys, mano namai mano tvirtovė, ką žmonės pasakys, namai be dūmų, viskam yra ribos, ylos maiše nepaslėpsi, (ant palinkusio karklo) visos ožkos lipa, (neik) su velniu (obuoliauti; galima eiti obuoliauti), lazda su dviem galais, lazda turi du galus, ne iš gero gyvenimo, (šiaučius) be batų (kriaučius be kelnių, (kerta) šaką ant kurios sėdi, kerta šaką ant kurios sėdi, (pjauname) šaką ant kurios sėdime, kaimas ne vien duonas sotus, kiekviena tauta turi savo (dugną), obuolys nuo obels netoli (rieda; krenta), po manęs nors ir tvanas, po mūsų nors ir tvanas, visi keliai veda į Romą, visur gerai bet namuose geriausia, (negalima du kartus įbristi) į tą pačią upę (neįmanoma dusyk įžengti), ne viskas auksas kas auksu žiba. Čia priklauso ir krikščioniškų apeigų, maldų žodžiai: alyvų kalne, amžinoji šviesa, aname pasaulyje, atpildo valanda, paskutinę vakarienę, (prikaltas) prie kryžiaus, tesaugo tave Dievas, Tėve mūsų, kuris esi danguje, (palinkėkite) vieni kitiems ramybės, (pateks) į Dievo karalystę, (sukurtas) pagal jo paveikslą ir panašumą, atsivertimo į Dievą ir į bažnyčią, aš esu kelias ties ir gyvenimas, gerbk savo tėvą ir savo motiną, kas Dievo Dievui kas Ciesoriaus Ciesoriui, kasdieninės duonos duok mums šiandien, į tavo rankas atiduodu savo dvasią, Dievo plane, Dievo planą, Tėve mūsų. Su religine frazeologija siejasi ir kai kurie sušukimai ir mandagumo frazės: Dieve Dieve, Jėzau Jėzau, Viešpatie Dieve, garbė Jėzui Kristui, o viešpatie, – nors esama ir kitokių: o siaube, gero apetito, (linkiu kuo) geriausios kloties. Ties frazeologijos riba balansuoja ir tie žodžių junginiai, kurie nepasižymi vientisa reikšmę, tačiau gali būti pakeisti trumpesniu ir ne tokiu vaizdingu posakiu ar fraze. Tarp kolokacijų gana dažnos prielinksninės konstrukcijos, sudarančios nekintamąją frazeologizmo dalį, kintamoji, todėl nepatekusi į kolokaciją, pateikiama skliaustuose: (atsimuša) į sieną, (atėjo) į pasaulį, (grimzta; nusinešė) į nebūtį, (iškilo) į viešumą, (išeiti) į eterį, (keltis; pasikėlė) į puikybę, (leido; kibti) į mokslus, (ritasi; garma) į prarają, (užspeitė) į kampą, (vilkui; krokodilui) į nasrus, (įkišo) į užantį, grimzta į dugną, iškilo į viešumą, iškilus į viešumą, varė į neviltį, (nevyniojo) žodžių į vatą, (nustumti; pasitraukti) į antrą planą,
195
2 d a lis. L I E T U V I Ų K A L B O S K O LO K A C I J Ų ŽO DY N A S
(pasikeitė) į blogąją pusę, (patenka) į užburtą (ratą), išėjo į laisvę, langas į gamtą, langas į pasaulį, palenkti į savo pusę, (išlipti) iš duobės, (dega) iš nekantrumo, (iškrito; pasitraukė) iš žaidimo, (pasitrauktų; pasuko) iš kelio, (prisikelti) iš pelenų, (surašyta) iš lubų, iš akiračio (dingo), iš amžių glūdumos, iš didžiosios raidės, ištrinti iš atminties, (išmesti) už borto (liko), atsidūrė už grotų, (perduodama) iš kartos į kartą, (balansuoja) ties riba, (medaus laižymas) per stiklą, (maudėsi) šlovės spinduliuose, (kviečia; pasikvietė) ant kilimėlio, (pradėti) nuo nuli, (išėjo) pro užpakalines duris, (žiūrėti) pro rakto skylutę, be išlygų (priimti; pripažinti; pritarti), (paukštis) be sparnų, be penkių minučių (...), iki koktumo (banalus), (didelei) mano nuostabai, (apsijuokti) prieš visą pasaulį, (vaistas) nuo visų ligų, (vakarienė) prie žvakių (šviesos), lašas po lašo, tikra to žodžio prasme, tikrąja ta žodžio prasme, tikrąja šio žodžio prasme, dėl vietos po saule (kautis), kartą ir visiems laikams, ant pasaulio stogo. Iš frazeologinių samplaikų, randamų Dabartinės lietuvių kalbos frazių žodyne, išsiskiria ekspresyvūs, emocinio atspalvio junginiai, kurių komponentai, paprastai antonimai, sujungti įvairiais jungiamaisiais žodžiais (prieveiksmiais, jungtukais, dalelytėmis), pasikartojančiais prie abiejų komponentų. I. Ermanytė (2004: 12), analizuodama antonimų kilmės frazeologizmus teigia, kad tai raiškus leksinis semantinis reiškinys, rodantis žmogaus proto poreikį gretinti. Nes paprastai pasakius ar išgirdus vieną poros narį tuoj prisimenamas ir jam parenkamas tam tikras opozicinis poros narys: tiek iš rytų, tiek iš vakarų; tiek iš vidaus, tie iš išorės; tiek tarp vyrų, tiek tarp moterų;, ne tik maistas, bet ir vaistas; ne tik rankomis, bet ir kojomis; ne tik vaikai, bet ir suaugę; ne tik vaikams, bet ir suaugusiems; ne tik žodžiais, bet ir darbais; nuo aušros iki sutemų; nuo ryto iki vakaro; nuo ryto ligi vakaro; nuo ankstaus ryto iki vėlyvo vakaro; nuo ankstaus pavasario iki vėlyvo rudens; nuo seniausių laikų iki šių dienų; nuo algos iki algos; (vartėsi) nuo šono ant šono; perduodama iš kartos į kartą; (perėjimas) iš vieno gyvenimo į kitą, tris dienas ir tris naktis. Čia trumpai aptarti į žodynus nepatekę šiandien rašto kalboje vartojami 225 frazeologiniai junginiai, gauti iš Dabartinės lietuvių kalbos frazių žodyno. Palyginti su žodynuose pateiktais frazeologizmais, jie sudaro nedidelę, tačiau dažnai vartojamų stabiliųjų žodžių junginių dalį. Viso tekstyno analizė frazeologiniu aspektu leistų atrasti dar daug šiandienėje kalboje vartojamų, tačiau į žodynus nepatekusių frazeologinių žodžių junginių.
196
2.3. APIBENDINAMOSIOS PASTABOS Lietuvių kalbos daiktavardinių frazių žodynas apima palyginti nedidelę, tačiau dažnai vartojamos kalbos dalį. Jį galima panaudoti keliems tikslams: sudarant įvairius – bendruosius ir specialiuosius – bendrinės lietuvių kalbos žodynus. Leksikografams jis galėtų būti pravartus sudarant į žodynus įtrauktinų leksinių vienetų sąrašus ar pateikiant žodyninių straipsnių iliustracijas, nes šis žodynas labai gerai atskleidžia būdingiausius ir dažniausius tam tikro žodžio ar junginio vartosenos atvejus. Dar viena sritis, kur galėtų būti pritaikytas minėtas žodynas, – gramatinė analizė. Pavyzdžiui, iš šio žodyno galima nustatyti daiktavardžių, veiksmažodžių, būdvardžių junglumą, dažniausiai vartojamas gramatines formas, kalbos dalis, tų kalbos dalių morfologines pažymas, dažniausius leksinius gramatinius modelius. Aptariamasis žodynas bus naudingas kuriant statistinius, tikimybinius lietuvių kalbos modelius ir jais pagįstus programinius įrankius. Jį galima panaudoti kuriant mašininio vertimo sistemas, mat kolokacijos – tai frazės, dažnai verčiamos vienodai, tais pačiais kitos kalbos atitikmenimis, kurie irgi yra stabilūs. Iš minėto žodyno galima gauti ne tik kalbinės, bet ir bendro pobūdžio informacijos, pavyzdžiui, daiktavardinės frazės gerai atspindi tam tikro laikotarpio (šiuo atveju 1993–2003 m.) dažniausiai minimus politikus, visuomenės veikėjus, menininkus, mokslininkus, politines partijas, tuo metu gyvavusias įmones, organizacijas ir pan. Galima teigti, kad frazių žodynas – savotiškas minėto laikotarpio visuomeninio ir kultūrinio gyvenimo metraštis. Lietuvių kalbos daiktavardinių frazių žodynas turėtų padėti užsieniečiams, besimokantiems lietuvių kalbos, lengviau išmokti dažniausiai vartojamus žodžių junginius, taip pat galėtų būti naudingas ir patiems lietuviams, kartais suabejojantiems, koks žodis labiau tinka tam tikrame junginyje. Kitaip sakant, šis žodynas yra daugialypės paskirties, jį publikavus tikimasi įvairialypių vartotojų.
197
R ū t a M arc i n k e v i č i e n ė. L I E T U V I Ų K A L B O S K O LO K A C I J O S
COLLOCATIONS OF THE LITHUANIAN LANGUAGE The monograph deals with an interdisciplinary topic of corpus and computational linguistics, i.e. collocation that is conceived as habitual co-occurrence of lexical items. The notion of collocation is presented in a wider context of the Western history of syntagmatic analysis of word combinations as well as present day perspective. The book discusses the appearance of the term “collocation”, the development and status quo of its contents in various schools of linguistic thought, collocational resources in a number of languages of the world. Greater emphasis is given for the presentation and evaluation of the existing methods and statistical tools for the collocation extraction, a new method of extraction, applied for the Corpus of Contemporary Lithuanian, is described in detail. The results of the extraction, i.e. statistical collocations, are overviewed as well as their step-by-step transformation into the dictionary of Nominal Collocational Phrases. The collocations from the dictionary are analysed from the point of view of structural and semantic features, their relationship with metaphors and idioms. The monograph is meant for linguists and computer science people that are keen on the problems of natural language description and processing and its application for the electronic lexicography, machine translation, information extraction and retrieval or any other related human language technologies. The book can also be used for teaching purposes in post-graduate studies.
198
LITERATŪRA Aitchison J. 1994. Words in Mind. An Introduction to the Mental Lexicon. Oxford UK and Cambridge USA. Altenberg B. 1991. “Amplifier Collocations in Spoken English”. In S. Johansson and A. B. Strenström (eds). English Computer Corpora. Berlin: Mouton de Gruyter. Alverson H. 1994. Semantics and Experience. Universal Metaphors of Time in English, Mandarin, Hindi, and Sesotho. Baltimore and London: The John Hopkins University Press. Ambrazas V. 1997. Lithuanian Grammar. Vilnius: Baltos lankos. Арrеsian J., Меlčuk I., Žoskovskij A. K. 1973. “Materials for an Explanatory Combinatory Dictionary of Modern Russian”. Trends in Soviet Theoretical Linguistics, ed. by Kiefer F. (ed.), p. 411–438. Dordrecht, Boston. Apresian, V. J. and J. D. Apresian. 1993. “Metafora v Semanticheskom Predstavleniji Emotsij”. Voprosi Jazykoznaniji 3, p. 27–35. Atkins B. T. S., J. Clear and N. Ostler. 1992. “Corpus Design Criteria”. Journal of Literary and Linguistics Computing 7 (1), p. 1–16. Balkevičius J. 1998. Lietuvių kalbos predikatinių konstrukcijų sintaksė. Vilnius: Mokslo ir enciklopedijų leidybos institutas. Barauskaitė J. 1995. „Leksikologija“. Lietuvių kalba, red. K. Župerka. T. 1, p. 4–78. Barlow M. 1998. “Review. Michael Stubbs: Text and Corpus Analysis: Computer-assisted Studies of Language and Culture.” International Journal of Corpus Linguistics 2(3), p. 319–326. Barlow M. 2000. “Parallel Texts in Language Teaching”. Multilingual Corpora in Teaching and Research, ed. by S. P. Botley et al., p. 106–115. Amsterdam and Atlanta: Rodopi. Baugh S., Harley A., Jellis S. 1996. “The Role of Corpora in Compiling the Cambridge Dictionary of English”. International Journal of Corpus Linguistics 1 (1), p. 39–60. Beaugrande de R. 1999. “Reconnecting Real Language with Real Texts: Text Linguistics and Corpus Linguistics”. International Journal of Corpus Linguistics 2 (4), p. 243–260. Benson M., Benson E., Ilson R. 1986. The BBI Combinatory Dictionary of English. Amsterdam/Philadelphia. Biber D. 1987. “A textual comparison of British and American writing”. American Speech 62, p. 99–119.
199
R ū t a M arc i n k e v i č i e n ė. L I E T U V I Ų K A L B O S K O LO K A C I J O S
Biber D. 1988. Variation across Speech and Writing. Cambridge: University Press. Biber D. 1993. “Representativeness in Corpus Design”. Literary and Linguistic Computing, 8 (4), p. 243–257. Biber D., Conrad S., Reppen R. 1998. Corpus Linguistics. Investigating Language Structure and Use. Cambridge: University Press. COLLINS COBUILD English Collocations on CD-ROM. 1995. London: HarperCollins Publishers. Church K., Gale W., Hanks P., Hindle D. 1991. “Using Statistics in Lexical Analysis”. In Uri Zernik (ed). Lexical Acquisition: Exploiting On-line Resources to Build a Lexicon. Hillsdale, New Jersey: Lawrence Erlbaume Associates, p. 115–164. Cibulskienė J. 2006. Conceptual Metaphor in the Election Discourses of Lithuania and Great Britain. Daktaro disertacija. Vilnius: Vilniaus universitetas. Coseriu E. 1967. “Lexikalische Solidaritäten”. Zeitschrift für Sprach- und Literaturwissenschaft 1 (3), p. 293–303. Cowie A. P. 1986. “Collocational Dictionary: a Comparative View”. In Murphy M. G. Proceedings of the Fourth Joint Anglo-Soviet Seminar on English Studies. London, p. 91–69. Crystal D. 1991. A Dictionary of Linguistics and Phonetics. Basil: Blackwell. Cruse D. A. 1990. “Language, Meaning and Sense: Semantics”. An Encyclopedia of Language. Collinge N. E. (ed.), p. 160–163. London and New York. Čermàk F. 1997. “Czeck National Corpus: A Case in Many Contexts”. International Journal of Corpus Linguistics 2 (2), p. 181–198. Čermàk F. 1998. “Linguistic Units and Text Entities: Theory and Practice”. EURALEX’98 Proceedings, ed. by T. Fontenelle et al., p. 109–118. Liege: University of Liege. Danielsson P., Ridings D. 2000. “Corpus and terminology: software for the translation program at Goeteborgs Universitet or getting students to do the work”. Multilingual Corpora in Teaching and Research, ed. by S. P. Botley et al., p. 65–72. Amsterdam and Atlanta: Rodopi. Daudaravičius V., Marcinkevičienė R. 2004. “Gravity Counts for the boundaries of collocations”. International Journal of Corpus Linguistics 9 (2), p. 321–348. Dickens A., Salkie R. 1996. “Comparing Bilingual Dictionaries with parallel Corpus”. EURALEX’96 Proceedings, ed. by M.Gellerstam et al., p. 551–560. Goeteborg: Goeteborg University. Dini L., Di Tomasso V. 1998. “Corpus Linguistics for Application Development”. International Journal of Corpus Linguistics 2 (3), p. 305–319.
200
L I T E R AT Ū R A
Drūlienė V. 2008. Erdvinės metaforos daiktavardinių frazių žodyne. Magistro darbas. Vytauto Didžiojo universitetas. Drūlienė V. 2008. „Lietuviškosios metaforikos vertikalumo matas“. Darbai ir dienos 50, p. 73–90. Dufour N. 1998. “Recognizing Collocational Constraints for Translation Selection: DEFI’s Combined Approach”. EURALEX’98 Proceedings, ed. by T. Fontenelle et al., p. 109–118. Liege: University of Liege. Dumbliauskaitė L. 2008. Dabartinės lietuvių kalbos tekstyno frazeologija. Magistro darbas. Vytauto Didžiojo universitetas. Erjavec T. 1995. “Public Domain Generic Tools: An Overview”. Proceedings of the first European Seminar “Language Resources for Language Technology” Tihany, Hungary, September 15–16, 1995, ed. by H. Rettig et al., p. 37–48. Ermanytė I. 2004. „Antonimų kilmės frazeologizmai“. Gimtoji kalba 6, p. 9–12. Facchinetti R. 1998. “Drawbacks and Pitfalls of Machine-Readable Texts for Linguistic Reseach”. International Journal of Corpus Linguistics 2 (3), p. 211–229. Fillmore C. J. 1992. “Corpus linguistics” or “Computer-aided armchair linguistics””. Directions in Corpus Linguistics. Proceedings of Nobel Symposium 82, Stockholm, 4–8 August 1991, ed. by J. Svartvik, p. 35–60. Berlin: Mouton de Gruyter. Firth J. R. 1957. “Modes of Meaning”. Papers in Linguistics 1934–1951. London, p. 190– 215. Galnaitytė E., Pikčilingis J., Šivickienė M. 1989. „Žodyno sandara“. Mokyklinis lietuvių – rusų kalbų frazeologijos žodynas. Kaunas, p. 5–8. Gordon T. W. 1982. A History of Semantics. Amsterdam/Philadelphia, p. 114. Greenbaum S. 1970. Verb-Intensifier Collocations in English. The Hague, Paris, p. 56–57. Grefenstette G. et al. 1996. “The DECIDE Project: Multilingual Collocation Extraction”. EURALEX’96 Proceedings, ed. by M. Gellerstam et al., p. 93–108. Göteborg: Göteborg University. Greffenstette G., Segoond F. 1997. “Multiligual Natural Language Processing”. International Journal of Corpus Linguistics 1 (2), p. 153–162. Greffenstette G. 1998. EURALEX’98 Proceedings, ed. by T. Fontenelle et al., p. 25–42. Liege: University of Liege. Grumadienė L., Žilinskienė V. 1997. „Įvadas“. Dažninis dabartinės rašomosios lietuvių kalbos žodynas (mažėjančio dažnio tvarka).V–XXXIV. Vilnius. Halliday M. A. K. 1966. “Lexis as a Linguistic Level”. In Memory of J. R. Firth. Bazeli C. E. et al. (eds.). London, p. 148–162.
201
R ū t a M arc i n k e v i č i e n ė. L I E T U V I Ų K A L B O S K O LO K A C I J O S
Halliday M. A. K., Hasan R. 1976. “Cohesion in English”. English Language Series 9. London. Hanks P. 1998. “Enthusiasm and Condescension”. EURALEX’98 Proceedings, ed. by T. Fontenelle et al., p. 151–166. Liege: University of Liege. Harlow S., Nigel V. 1988. “Generative Linguistics. An Overview”. Newmeyer F. J. (ed.) The Cambridge Survey 1. Linguistic Theory. Foundations. Cambridge, p. 1–18. Hausmann F. J. 1979. “Un dictionaire des collocations est-il possible?” Travaux de linguistique et de litterature 17, p. 187–195. Heid U. 1998. “Towards a Corpus-based Dictionary of German Noun-verb Collocations”. EURALEX’98 Proceedings, ed. by T. Fontenelle et al., p. 291–300. Liege: University of Liege. Hunston S., Francis G. 2000. Pattern Grammar. A Corpus-driven Approach to the Lexical Grammar of English. Amsterdam/Philadelphia: John Benjamins Publishing Company. Hutchins W. J., Sommers H. 1992. An Introduction to Machine Translation. London: Academic press. Jackson H. 1998. Words and Their Meaning. London and New York, p. 96. Jakaitienė E. 1980. Leksikologija. Vilnius: Mokslas. Jakaitienė E. 1988. Leksinė semantika. Vilnius: Mokslas. Jarošova A. 1997. “Parallel Corpora and Equivalents not Found in Bilingual Dictionaries”. Proceedings of the Second European seminar “Language Applications for a Multilingual Europe” Kaunas, Lithuania, April 17–20, 1997, ed. by R. Marcinkevičienė et al., p. 69–76. Mannheim/Kaunas: IDS/VDU. Katiliūtė R., Labutis V. 1999. „Žodyno lietuviškosios dalies rengėjų pratarmė“. Anglų– lietuvių kalbų kasdienių frazeologizmų žodynas. Vilnius. Kennedy G. 1998. An Introduction to Corpus Linguistics. London/NewYork: Longman. Kjellmer G. 1982. “Some Problems Relating to the Study of Collocations in the Brown Corpus”. Johansson S. (ed.). Computer Corpora in English Language. Bergen. Kjellmer G. 1991. “A Mint of Phrases”. In Aijmer K., Altenberg B. (eds.). English Corpus Linguistics. London and New York, p. 111–128. Klumper J. 2000. Muldi (Multi Lingual Database Interface). Manual. Entschede/ Kaunas. Knowles M., Moon R. 2006: Introducing Metaphor. London: Routledge.
202
L I T E R AT Ū R A
Kövecses Z. 1986. Metaphors of Anger, Pride, and Love. A Lexical Appraoch to the Structure of Concepts. Amsterdam / Philadelphia: John Benjamins. Krauwer S. 1995. Proceedings of the first European seminar “Language Resources for language Technology” Tihany, Hungary, September 15–16, 1995, ed. by H. Rettig et al., p. 79–86. Labutis V. 1998. Lietuvių kalbos sintaksė. Vilnius: Vilniaus universiteto leidykla. Lakoff G., Johnson M. 1980. Metaphors We Live By. Chicago / London: The University of Chicago Press. Leech G., Fallon R. 1992. “Computer corpora – what do they tell us about culture?” ICAME Journal 16, p. 29–50. Lehrer A. 1974. Semantic Fields and Lexical Structure. Amsterdam, London, New York, p. 173. “Lexis and Lexicology”. The Linguistic Encyclopedia. Malmkjaer K. (ed.) London and New York, 1991, p. 298–305. Levin B., Song G., Atkins B. T. 1997. “Making Sense of Corpus Data: A Case Study of Verbs of Sound”. International Journal of Corpus Linguistics 1(2), p. 23–64. Ljung M. 1990. A Study of TEFL Vocabulary. Stockholm Studies in English 78. Stockholm: Almqvist and Wiksell. Lin D. 1998. “Extracting collocations from text corpora”. Workshop on Computational Terminology. Montreal, Canada, August. Lipka L. 1990. An Outline of English Lexicology. Tübingen, s. 159–171. Lipskienė J. 1979. „Įvadas“. Lietuvių kalbos somatiniai posakiai. Vilnius, p. 9–22. Lyons J. 1977. Semantics 1. Cambridge, London, New York, Melbourne, p. 261–267. Maciejauskaitė I. 2000. „Kontekstinė antonimų reikšmės analizė“. Darbai ir Dienos 24, p. 121–142. Manseris R. H. 1999. „Įvadas“. Anglų–lietuvių kalbų kasdienių frazeologizmų žodynas. Vilnius, p. 5. Marcinkevičienė R. 1994. „Metafora nemetafora“. Naujasis Židinys 4, p. 76–81. Marcinkevičienė R. 1994. „Gyvosios kalbos etnografija“. Sociolingvistika ir kalbos kultūra, p. 47–54. Vilnius: „Gimtoji kalba“. Marcinkevičienė R. 1995. „Kolokacija: tyrimo kryptys, metodai, mokyklos“. Lituanistica 2, p. 40–54. Marcinkevičienė R. 1997a. „Klausimas dėl klausimo, arba ką gali kompiuterinis tekstynas“. Darbai ir Dienos 5, p. 19–37.
203
R ū t a M arc i n k e v i č i e n ė. L I E T U V I Ų K A L B O S K O LO K A C I J O S
Marcinkevičienė R. 1997b. “Seeming Tautologies in Lithuanian”. E-Prime Anthology III, ed. by D. David Bourland et al., p. 253–270. California: Concord. Marcinkevičienė R. 1997c. „Tekstynų lingvistika ir lietuvių kalbos tekstynas“. Lituanistica 1(29), p. 58–78. Marcinkevičienė R. et al. (eds.) 1997d. Proceedings of the Second European seminar “Language Applications for a Multilingual Europe” Kaunas, Lithuania, April 17–20, 1997. Mannheim/Kaunas: IDS/VDU. Marcinkevičienė R. 1998. “Happax Legomena as a Platform for text Alignment”. Proceedings of the Third European Seminar “Translation Equivalence”. Montecatini Terme, Italy, October 16–18, 1997, ed. by W. Teubert et al., p. 125–137. Mannheim: IDS/TWC. Marcinkevičienė R. 1999a. „Treji vartai į Šventąjį Raštą“. Naujasis Židinys 7/8, p. 367–372. Marcinkevičienė R. 1999b. „Atminties labirintuose. Kognityvinės ir tekstynų lingvistikos sąveika“. Darbai ir Dienos 10(39), p. 109–124. Marcinkevičienė R. 1999c. „Paauglių žodynas“. Knygų aidai 01–03, p. 39–42. Marcinkevičienė R. 2000a. „Patterns of word usage in corpus linguistics“. Kalbotyra, 49 (3), p. 71–80. Marcinkevičienė R. 2000b. „Terminografija ir tekstynas“. Terminologija 6, p. 5–22. Marcinkevičienė R. 2000c. „Kauno vardo konotacija (vardažodžių semantika)“. Kauno istorijos metraštis 2, p. 137–146. Marcinkevičienė R. 2000d. „Metaphors from Collocations“. Paradigmatika, sintagmatika ir kalbos funkcijos, p. 190–192. Kaunas: KHF. Marcinkevičienė R. 2000. „Tekstynų lingvistika (teorija ir praktika)“. Darbai ir dienos 24, p. 7–64. Marcinkevičienė R. 2001a. “The Importance of Syntagmatic Dimension in the Multilingual Lexical Database”. International Journal of Corpus Linguistics. Special Issue, p. 55–65. Marcinkevičienė R. 2001b. „Tradicinė frazeologija ir kiti stabilūs žodžių junginiai“. Lituanistica 4 (48), p. 81–98. Marcinkevičienė R. 2001c. „Daiktavardžių konotacijos tyrimas tekstynų lingvistikos metodu“. Lituanistica 3 (47), p. 46–57. Marcinkevičienė R. 2002. „Palyginamieji tekstynai – šaltinis tarptautinių žodžių vartosenai tirti“. Kalbotyra 51 (3), p. 81–93. Marcinkevičienė R. 2004. „Dictionary of Lithuanian Phrases”. Proceedings of the Eleventh EURALEX International Congress, EURALEX’04, Lorient, France, July 6–10, 2004, ed. by G. Williams et S. Vessier. University of Bretagne, p. 741–751.
204
L I T E R AT Ū R A
Marcinkevičienė R., Grigonytė G. 2005a. „Lexicogrammatical patterns of Lithuanian Phrases“. Proceedings of the Second Baltic Conference on Human Language Technologies, April 4–5, 2005, Tallinn, Estonia, ed. by M. Langemets, P. Penjam. Tallinn, Institute of Cybernetics, Tallinn University of Technology and Institute of the Estonian Language, p. 299–304. Marcinkevičienė R. 2005b. “Noun collocations from a multilingual perspective“. Meaningful texts. The Extraction of Semantic Information from Monolingual and Multilingual Corpora. Continuum: London and New York, p. 179–187. Marcinkevičienė R. 2007. “Patterns of word usage in corpus linguistics”. Corpus Linguistics. Critical Concepts in Linguistics 3, p. 85–96. London, New York : Routledge, Taylor & Francis Group, Marcinkevičienė R. 2007. “The importance of the syntagmatic dimension in the multilingual lexical database”. Text Corpora and Multilingual Lexicography. Amsterdam, Philadelpia: John Benjamins Publishing Company, p. 49–58. Marcinkevičienė R., Vitkutė-Adžgauskienė D. Developing the Human Language Technology Infrustructure in Lithuania. In: Proceedings of the Fourth International Conference Baltic HLT 2010, IOS Press, p. 3–10. Marcinkevičienė R. Two decades of Lithuanian HLT. In: Proceedings of the NoDaLiDa 2009 Workshop Nordic Perspectives on the CLARIN nfrastructure of Common Language Resources May 14, 2009, Odense, Denmark. Eds. R. Domeij, Kimmo Koskenniemi, Steven Krauwer, Bente Maegaard, Eiríkur Rgnvaldsson, Koenraad De Smedt, p. 16–20. Mason O. 1997. “The Weight of Words: An Investigation of Lexical Gravity”. Proceedings of PALC’97. Lodz, p. 361–375. McEnery T., Wilson A. 1996. Corpus Linguistics. Edinburgh: University Press. McEnery T., OakesM. 2000. “Bilingual text alignment – an overview”. Multilingual Corpora in Teaching and Research, ed. by S. P. Botley et al., p. 1–37. Amsterdam and Atlanta: Rodopi. McIntosh A., Halliday M. A. K. 1966. Patterns of Language. London. Meyer R., Okurowski M. E., Hand T. 2000. “Using authentic corpora and language tools for adult-centered learning”. Multilingual Corpora in Teaching and Research, ed. by S. P. Botley et al., p. 86–91. Amsterdam and Atlanta: Rodopi. Monnink de I. 1999. “Combining Corpus and Experimental Data”. International Journal of Corpus Linguistics 1 (4), p. 77–112. Montemagni S., Federici S., Pirrelli V. 1996. “Example-based Word Sense Disambiguation: a Paradigm-driven Approach”. EURALEX’96 Proceedings, ed. by M. Gellerstam et al., p. 151–160. Göteborg: Göteborg University.
205
R ū t a M arc i n k e v i č i e n ė. L I E T U V I Ų K A L B O S K O LO K A C I J O S
Moon R. 1995. “Introduction”. Collins Cobuild Dictionary of Idioms. P. iv–vii. Morton H. C. 1994. The Story of Webster’s Third: Philip Gove’s Controvercial Dictionary and its Critics. Cambridge: Cambridge University Press. Nattinger J. R., DeCarrico J. S. 1992. Lexical Phrases and Language Teaching. Oxford. Newmark P. 1988. Approaches to Translation. New York, London, Toronto, Sydney, Tokyo. 1988. New Webster‘s Dictionary of the English Language. College Edition. Delhi, 1988. Nimb S. 1996. “Collocations of Nouns: How to Present Verb-noun Collocations in a Monolingual Dictionary”. EURALEX’96 Proceedings, ed. by M. Gellerstam et al., p. 265–272. Göteborg: Göteborg University. Oakes M. P. 1998. Statistics for Corpus Linguistics. Edinburgh: Edinburgh University Press. Ooi V. B. Y. 1998. Computer Corpus Lexicography. Edinburgh: Edinburgh University Press. Palionis J. 1985. Kalbos mokslo pradmenys. Vilnius, p. 220. Palmer F. R. 1972. Descriptive and Comparative Linguistics. London, p. 192. Palmer F. R. 1976. Semantics. Cambridge, London, New York, Melbourne, p. 96. Palmer F. R. 1981. Semantics. Cambridge: University Press. Papaurėlytė-Klovienė S. 2004. Liūdesio konceptas lietuvių ir rusų kalbose. Daktaro disertacija. Vilnius, Vilniaus universitetas. Papaurėlytė-Klovienė S. 2005. „Probleminiai konceptualiosios metaforos EMOCINĖ BŪSENA yra ASMUO atvejai“. Žmogus ir žodis 7, p. 43–47. Partington A. 1998. Patterns and Meanings. Using Corpora for English Language Research and Teaching. Amsterdam/Philadelphia: John Benjamins Publishing Company. Paulauskas J. 1977. „Įvadas“. Lietuvių kalbos frazeologijos žodynas. Kaunas, p. 5–9. Pearce D. 2001. “Synonymy in collocation extraction”. Proceedings of the NAACL’01 Workshop on WordNet and Other Lexical Resources: Applications, Extensions and Customizations. Carnegie Mellon University, Pittsburgh, p. 41–46. Pearce D. 2002. “A Comparative Evaluation of Collocation Extraction Techniques”. Third International Conference on Language Resources and Evaluation. May. 2002. Las Palmas, Canary Islands, Spain. Pearson J. 1998. Terms in Context. Amsterdam /Philadelphia: John Benjamins. Pearson J. 2000. “Teaching terminology using electronic resources”. Multilingual Corpora in Teaching and Research, ed. by S. P. Botley et al., p. 92–105. Amsterdam and Atlanta: Rodopi.
206
L I T E R AT Ū R A
Persson G. 1990. Meanings, Models and Metaphors. A Study of Lexical Semantics in English. Stockholm, p. 50–71. Peters C., Picchi E., Biagini L. “Parallel and comparable bilingual corpora in language teaching and learning”. Multilingual Corpora in Teaching and Research, ed. by S. P. Botley et al., p. 73–85. Amsterdam and Atlanta: Rodopi. Pikčilingis J. 1975. Lietuvių kalbos stilistika. T. 2. Vilnius. Porzig W. 1934. “Wesenhafte Bedeutungsbeziehungen”. Beitrage zur Geschichte der deutschen Sprache und Literatur 58, s. 70–97. Racevičiūtė R. 2002. Metaphorical Motivations of English and Lithuanian Somatic Idioms. Daktaro disertacija. Vilnius: Vilniaus universitetas. Renouf A., Sinclair J. 1991. “Collocational Frameworks in English”. In Aijmer K., Altenberg B. (eds.) English Corpus Linguistics. London and New York, p. 128–145. Rettig H. et al. (eds). 1995. Proceedings of the first European seminar “Language Resources for Language Technology” Tihany, Hungary, September 15–16. 1995. Hungary. Rimkutė E. 2006. „Lietuvių kalbos kolokacijų žodynas: sandara ir paskirtis“. Prace Baltystyczne 3, p. 249–258. Rissanen M. 1992. “The diachronic corpus as a window to the history of English”. Directions in Corpus Linguistics. Proceedings of Nobel Symposium 82, p. 185–205. Stockholm, 4–8 August 1991, ed. by J. Svartvik Berlin: Mouton de Gruyter. Robins R. H. 1989. General Linguistics. An Introductory Survey. London and New York, p. 65. Salkie R. “Unlocking the power of the SMEMUC”. Multilingual Corpora in Teaching and Research, ed. by S. P. Botley et al., p. 148–156. Amsterdam and Atlanta: Rodopi. Schmied J., Fink B. 2000. “Corpus-based contrastive lexicology: the case of English with and its German translation equivalents”. Multilingual Corpora in Teaching and Research, ed. by S. P. Botley et al., p. 157–176. Amsterdam and Atlanta: Rodopi. Schoenefeld D. 1999. “Corpus Linguistics and Cognitivism”. International Journal of Corpus Linguistics 1(4), p. 137–172. Scott M. 1997. WordSmith Tools Manual. Version 2. http://www.liv.ac.uk/~ms2928/ wordsmit.htm Sigley R. 1997. “Text Categories and Where You Can Stick Them: A Crude Formality Index”. International Journal of Corpus Linguistics 2(2), p. 199–238. Simard M., Foster G., Hannan M. L., Macklovitch E., Plamondon P. 2000. “Bilingual text alignment: where do we draw the line?” Multilingual Corpora in Teaching and Research, ed. by S. P. Botley et al., p. 157–176. Amsterdam and Atlanta: Rodopi.
207
R ū t a M arc i n k e v i č i e n ė. L I E T U V I Ų K A L B O S K O LO K A C I J O S
Simonavičiūtė S. 2000. Sinoniminės abstrakčiųjų daiktavardžių grupės ‘siela, dvasia, sąmonė’ reikšmių tyrimas ir lyginimas. Magistro darbas. Kaunas: VDU. Sinclair J. McH. (ed.) 1987. Looking Up. An account of the COBUILD project in lexical computing. London and Glasgow: Collins ELT. Sinclair J. McH. 1991. Corpus, Concordance, Collocation. Oxford: Oxford university press. Sinclair J. McH. 1996a. “The Empty Lexicon”. International Journal of Corpus Linguistics 1 (1), p. 99–120. Sinclair J. McH. 1996b. “The Search for Units of Meaning”. Textus IX 1, p. 75–106. Sinclair J. McH. 1997. Language Engineering and Informatics in Europe, 1988–2002. Ms. Sinclair J. McH. 1998. “A Way with Common Words”. Out of Corpus. Studies in Honour of Stig Johansson, ed. by H. Hasselgard et al. Studies in practical linguistics 26, p. 157–175. Amsterdam – Atlanta: Rodopi. Sinclair J. McH. 1999a. “New roles for Language Center: the mayonnaise problem”. Language Centres: Intergration through Innovation, ed. by D. Bickerton et al., p. 31–50. Plymouth: Cercles. Sinclair J. McH. 1999b. “The Lexical Item”. Contrastive Lexical Semantics 17, ed. by E. Weigand, Current issues in Linguistic Theory. Amsterdam/Philadelphia: John Benjamins. Sinclair J. McH. 2000a. Current Issues in Corpus Linguistics. Ms. Sinclair J. McH. 2000b. “The Deification of Information”. Patterns of Text: in Honour of Michael Hoey, ed. by G. Thompson et al. Amsterdam/Philadephia: John Benjamins. Sinclair J. McH. 2000c. „Lexical grammar“. Darbai ir Dienos 24, p. 191–203. Sližienė N. 1994. „Žodyno sandara“. Lietuvių kalbos veiksmažodžių junglumo žodynas. Vilnius: Mokslo ir enciklopedijų leidykla. Smadja F. 1993. Retrieving Collocations from Text: XTRACT. Computational Linguistics 19 (1), p. 143–177. Smadja F. 1993. Retrieving Collocations from Text: XTRACT. Computational Linguistics 19 (1), p. 143–177. Smadja F., McKeown K. R., Hatzivassiloglou V. 1996. Translation Collocations for Bilingual Lexicons: A Statistical Approach. Computational Linguistics 22 (1), p. 1–38. Summers D. 1991. Longman/Lancaster English Language corpus: Criteria and Design. Harlow: Longman. Stubbs M. 1995. “Collocations and Semantic profiles: on the Cause of the Trouble with Quantitative Studies”. Functions of Language 2 (1), p. 23–55.
208
L I T E R AT Ū R A
Stubbs M. 2001. Words and Phrases. Corpus Studies of Lexical Semantics. Oxford: Blackwell Publishers. Stubbs M. 2002. “Two quantitative methods of studying phraseology in English”. International Journal of Corpus Linguistics 7 (2), p. 215–244. Svartvik J. 1992. “Corpus linguistics comes of age”. Directions in Corpus Linguistics. Proceedings of Nobel Symposium 82, Stockholm, 4–8 August 1991, ed. by J. Svartvik, p. 1–9. Berlin: Mouton de Gruyter. Šilinytė J. 2008. Ontologinės ir struktūrinės metaforos daiktavardinių frazių žodyne. Magistro darbas. Vytauto Didžiojo universitetas. Taylor J. R. 1990. Linguistic Categorization. Prototypes in Linguistic Theory. Oxford: Clarendon Press. Teubert W. 1996. “Comparable or Parallel Corpora?” International Journal of Lexicography 3(9), p. 238–264. Teubert W. 1996. “Editorial”. International Journal of Corpus Linguistics 1(1), p. iii–x. Teubert W. 1999. “Editorial: Corpus Linguistics – A Partisan View”. TELRI. Trans European Language Resources Infrastructure. Newslatter 8, p. 4–19. Teubert W., Tognini-Bonelli E., Volz. N. (eds.) 1998. Proceedings of the Thirds European Seminar “Translation Equivalence”. Montecatini Terme, Italy, October 16–18, 1997. Mannheim: IDS/TWC. Tognini-Bonelli E. 1996. “Towards Translation Equivalence from a Corpus Linguistics Perpsective”. International Journal of Lexicography 3(9), p. 197–217. Tognini-Bonelli E. 2000. „Corpus Classroom Currency“. Darbai ir Dienos 24, p. 205–243. Toleikienė R. 2004. „Seele“ und „Vestand“ im Deutschen and Litauishen. Daktaro disertacija. Vilnius: Vilniaus universitetas. Utka A. 1998. „D. Orvelo romano 1984-ieji nagrinėjimas, naudojant informacines technologijas“. Informacinės technologijos ir universitetinės studijos. Konferencijos pranešimų medžiaga, p. 158–159. Kaunas: VDU. Utka A. 1999. „Ką reiškia mintis filosofinėje literatūroje?“ Darbai ir Dienos 10 (19), p. 141–154. Utka A. 2000. „Kalbinė programinė įranga“. Darbai ir Dienos 24, p. 275–285. Vaičenonienė J. 2000. „The Conduit Metaphor in English and Lithuanian: a Corpusbased Approach“. Darbai ir Dienos 24, p. 143–167. Vaitkevičiūtė V. 1998. „Pratarmė“. Posakių ir žodžių žodynas. Vilnius, p. 7–13.
209
R ū t a M arc i n k e v i č i e n ė. L I E T U V I Ų K A L B O S K O LO K A C I J O S
Van der Meer G. 1998. “Collocations as One Particular Type of Conventional Word Combinations. Their Definition and Character”. EURALEX’98 Proceedings, ed. by T. Fontenelle et al., p. 313–322. Liege: University of Liege. Valeckienė A. 1998. Funkcinė lietuvių kalbos gramatika. Vilnius. Viehweger D. 1979. “Kollokatione. Sprache und Gesellschaft”. Berlin, 1987. Bd. 20, p. 228–237. Wierzbicka A. 1987. English Speech Act Verbs. Sydney; [...]; Toronto, p. 21–22. Williams G. C. 1998. “Collocational Networks: Interlocking Patterns of Lexis of Plant Biology Research Articles”. International Journal of Corpus Linguistics 1(3), p. 151–172. Williams G. 1998. “Lexis in a Corpus of Plant Biology Research Articles”. International Journal of Corpus Linguistics 3 (1). Vosylytė K. B. 1985. „Pratarmė“. Lietuvių kalbos palyginimų žodynas. Vilnius. Zernic U. (ed.). 1991. Lexical acquisition: Exploiting on-line resources to build a lexicon. Hillsdale, NJ: Lawrence Erlbaum. Zinkevičius V. 2000. „Lemuoklis – gramatinės analizės programa“. Darbai ir Dienos 24, p. 245–274.
Апресян Ю. Д. 1974. Лексическая семантика. Москва, c. 45. Виноградов В. В. 1953. «Основные типы лексических значений слова». ВЯ 5, c. 12–26. Виноградов В. В. 1973. «Основные понятия русской фразеологии». Избранные труды. Москва, 1973. Телия В. Н. 1980. «Семантика связных значений слов и их сочетаемость». Аспекты семантических исследований. Москва, c. 250–319. Телия В. Н. 1981. Типы языковых значений: связное значение слова в языке. Москва.
210
Marcinkevičienė, Rūta Lietuvių kalbos kolokacijos. Monografija / Rūta Marcinkevičienė. – Kaunas: Vytauto Didžiojo universiteto leidykla, 2010. –212 p. ISBN 978-9955-12-656-0 Monografija priklauso tarpdisciplininei tekstynų ir kompiuterinės lingvistikos sričiai, skirta dažnai drauge vartojamų žodžių junginiams, t. y. kolokacijoms, aprašyti. Kolokacijos samprata pristatoma stabiliųjų žodžių junginių tyrimo tradicijos Vakarų Europoje ir dabartinės jos ištyrimo būklės kontekste. Apžvelgiamas kolokacijos termino atsiradimas, raida ir šiandienis turinys tekstynų lingvistikoje, įvairių Europos kalbų kolokacijų duomenų bazių ir žodynų rengimo patirtis. Daugiausia dėmesio skiriama labiausiai paplitusiems kolokacijų gavimo iš tekstynų būdams ir priemonėms, atskirai pristatomas naujas statistinių kolokacijų gavimo metodas iš „Dabartinės lietuvių kalbos tekstyno“, aptariamos tuo metodu gautos kolokacijos, jų transformavimas ir daiktavardinių frazių žodyno sudarymas. Remiantis sudarytuoju žodynu, analizuojamos lietuviškųjų kolokacijų struktūrinės ir semantinės ypatybės, jų ryšys su frazeologija ir laisvaisiais žodžių junginiais, metaforiškumo laipsnis ir kt. Monografija skirta lingvistams bei informatikams, besidomintiems mokslo problemomis ir konkrečiu jų taikymu elektroninei leksikografijai, automatinei kalbos analizei, mašininiam vertimui, informacijos gavimui ir bet kokioms kitoms kalbos technologijoms. Ji gali būti panaudota kaip mokomoji knyga magistrantūros ir doktorantūros studentams.
Rūta Marcinkevičienė LIETUVIŲ KALBOS KOLOKACIJOS Monografija Redaktorė Renata Endzelytė Dizainerė maketuotoja Irena Sabaliauskaitė 2010-12-21 Išleido Vytauto Didžiojo universiteto leidykla S. Daukanto g. 27, LT-44249 Kaunas