Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...
Transcript of Hoe gelexicaliseerder hoe vertrouwder? Een experimentele ...
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
1
Hoe gelexicaliseerder hoe vertrouwder?
Een experimentele studie naar de leessnelheid en vertrouwdheidsoordelen van ‘hoe X-er
hoe Y-er’-constructies
Anouk Vermulst
ANR: 421974
UNR: 1271840
Masterscriptie
Opleiding: Communicatie- en Informatiewetenschappen
Faculteit: Tilburg School of Humanities
Universiteit van Tilburg, Tilburg
Aantal woorden: 8233
Begeleider: Dr. Rein Cozijn
Tweede lezer: Dr. Maria Mos
Juni 2019
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
2
Abstract
Er is onduidelijkheid over de manier waarop het mentale lexicon, de verzameling van alle
woorden die een spreker kent, is gestructureerd. Worden expressies woord voor woord
‘ontleed’ en zijn deze woorden apart opgeslagen in het lexicale geheugen, of worden
expressies in zijn geheel opgeslagen?
Middels een corpusstudie zijn tien ‘hoe X-er hoe Y-er’-, tien ‘hoe X-er hoe beter’- en
tien ‘hoe langer hoe Y-er’-constructies verzameld. Deze vormden, samen met 30 equivalente
‘als-dan’-constructies, het materiaal voor een leesexperiment. 65 participanten hebben
deelgenomen aan het experiment. Van hen zijn leestijden en de mate waarin zij expressies
‘vertrouwd’ vonden gemeten.
Expressies in een ‘hoe X-er hoe beter’-constructie werden sneller gelezen en als
vertrouwder beoordeeld dan ‘hoe-hoe’-constructies in een minder gefixeerd schema. Tevens
werden laagfrequente ‘hoe-hoe’-expressies als vertrouwder beoordeeld dan equivalente ‘als-
dan’-expressies, wat het aannemelijk maakt dat gedeeltelijke schema’s als geheel worden
opgeslagen in ons talig geheugen.
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
3
Inhoudsopgave
Abstract 2
Inhoudsopgave 3
Introductie 4
1. Theoretisch kader 5
1.1 Taalverwerking 5
1.2 Productiviteit 8
1.2.1 Frequentie 9
1.3 Lexicalisatie 10
1.4 Hoe X-er hoe Y-er 13
1.5 Psycholinguïstisch onderzoek naar de 14
verwerking van gefixeerde uitdrukkingen
1.6 Vraagstelling 16
2. Methode 17
2.1 Participanten 17
2.2 Materiaal 18
2.3 Design 21
2.4 Instrumentatie 21
2.5 Procedure 22
3. Resultaten 23
4. Conclusie 27
5. Discussie 28
Referenties 31
Appendix A 33
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
4
Introductie
Binnen taalverwerkingstheorieën bestaat er consensus over dat ieder mens een ‘mentaal
woordenboek’ heeft. Dit woordenboek, ook wel het mentale lexicon genoemd, bevat
waarschijnlijk niet alleen woorden, maar ook groepen van woorden die regelmatig samen
voorkomen (Jackendoff, 2002). Langacker (1988) beschrijft in zijn theorie Usage based
Model of Mental Grammar dat vaak voorkomende groepen woorden, gefixeerde
uitdrukkingen, kunnen ontstaan doordat bepaalde syntactische uitdrukkingen herhaaldelijk
worden berekend. Door het herhaaldelijk berekenen van deze expressies raken ze meer en
meer gefixeerd. Het gevolg hiervan is dat ze als eenheid op te halen zijn uit het mentale
lexicon.
Een expressie kan ook deels gefixeerd zijn. Een deels gefixeerde uitdrukking wordt
een schema genoemd. Een voorbeeld van een schema in de Nederlandse taal is het ‘hoe X-er
hoe Y-er’-schema, bijvoorbeeld ‘hoe eerder hoe beter’, ‘hoe moeilijker hoe fijner’ en ‘hoe
langer hoe leuker’. Het ‘hoe X-er hoe Y-er’-schema komt veel voor in het Nederlandstalige
corpus SoNaR. Daaruit kan worden geconcludeerd dat deze constructie met regelmaat
voorkomt in het dagelijks taalgebruik. Het is niet duidelijk hoe zo’n expressie wordt
opgeslagen in het talig geheugen. Volgens Langacker (1988) zou een frequent gebruikt
schema als eenheid opgeslagen moeten zijn in het mentale lexicon. Dit heeft implicaties voor
de verwerking van deels gefixeerde expressies. Hoe meer een expressie gefixeerd is, hoe lager
de druk op verwerkingscapaciteit is. Dit zorgt voor een snellere verwerking van gefixeerde en
(deels) schematische expressies (Smits, 2004). Als dit zo is, dan zouden de ‘hoe X-er hoe Y-
er’-constructies dus sneller gelezen moeten worden dan niet-schematische uitdrukkingen zoals
‘als X-er dan Y-er’. Op het moment dat expressies in het geheel zijn opgeslagen en ze in die
vorm frequent worden gebruikt, betekent dit wellicht ook dat ze vertrouwder worden
gevonden dan niet-schematische uitdrukkingen. Ook zouden schema’s die in mindere mate
gefixeerd zijn langzamer gelezen moeten worden en minder vertrouwd gevonden moeten
worden dan schema’s die gefixeerder zijn. In deze scriptie wordt middels een experiment
onderzocht of deze veronderstellingen kloppen.
Allereerst is er een kleinschalig corpusonderzoek uitgevoerd om materiaal te
selecteren. Er zijn drie schema’s gevonden die frequent voorkomen: ‘hoe X-er hoe Y-er’, ‘hoe
langer hoe Y-er’ en ‘hoe X-er hoe beter’. Van elk van deze schema’s zijn 5 hoogfrequente en
5 laagfrequente instanties geselecteerd als materiaal voor het leesexperiment. Deze 30
instanties van de ‘hoe-hoe’-constructie zijn in het leesexperiment ook aangeboden in een ‘als-
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
5
dan’-constructie, welke in SoNaR niet of nauwelijks voorkomen. Zo is onderzocht of het
aanbieden van targetzinnen in een deels gefixeerde ‘hoe-hoe’-constructie zorgt voor een
kortere leestijd en hogere vertrouwdheidsoordelen dan zinnen in een niet-schematische ‘als-
dan’-constructie. De leestijden van de zinnen zijn gemeten. Na elke zin gaven participanten
aan hoe ‘vertrouwd’ ze zich voelden bij de zin. Zo is onderzocht of deels schematische
expressies leiden tot lagere leestijden en hogere vertrouwdheidsoordelen.
1. Theoretisch kader
In dit theoretisch kader wordt allereerst dieper ingegaan op de relevante aspecten van
taalverwerking zoals productiviteit, frequentie en lexicalisatie. Hierbij zal worden uitgelegd
wat onder schema’s wordt verstaan. Ook zal worden uitgelegd hoe de ‘hoe X-er hoe Y-er’-
constructie wordt gebruikt en wat de kenmerken van deze constructie zijn. Vervolgens zal
psycholinguïstisch onderzoek dat reeds is verricht naar de verwerking van gefixeerde
uitdrukkingen worden uitgelicht. Het theoretisch kader zal eindigen met de centrale
vraagstelling van deze scriptie.
1.1 Taalverwerking
Het ‘mentale woordenboek’ in het menselijk brein is een belangrijk begrip binnen de
taalwetenschap. Dit mentale woordenboek wordt ook wel het mentale lexicon genoemd en
omvat de verzameling van alle woorden die een spreker kent. Hieruit is het stereotype beeld
ontstaan dat het mentale lexicon alleen woorden bevat. Jackendoff (2002) stelde dat er een
belangrijk onderscheid is tussen ‘woorden’ en ‘lexicale items’. Lexicale items zijn volgens
Jackendoff alle eenheden die opgeslagen worden in het lexicale langetermijngeheugen. Deze
eenheden kunnen bestaan uit groepen van grammaticale woorden. ‘Woorden’ definieert
Jackendoff als grammaticale eenheden die opzichzelfstaand een betekenis hebben in het
lexicale geheugen. Dit onderscheid wordt geïllustreerd aan de hand van de uitdrukking ‘de
pijp uitgaan’. Wanneer deze drie grammaticale eenheden los van elkaar bekeken worden, zal
worden vastgesteld dat ‘de’ een lidwoord is, ‘pijp’ verwijst naar een langwerpige ronde koker
en ‘uitgaan’ een werkwoord is dat onder andere beschrijft hoe iets of iemand van punt A naar
punt B beweegt. Echter, deze drie grammaticale eenheden krijgen een andere betekenis
wanneer ze in deze specifieke volgorde gepresenteerd worden. Ze krijgen dan de betekenis
‘doodgaan’. De uitdrukking bestaat dus uit drie grammaticale eenheden, maar wordt als
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
6
geheel opgeslagen in het lexicaal geheugen omdat de specifieke combinatie van deze drie
grammaticale eenheden een andere betekenis heeft dan wanneer deze drie woorden apart van
elkaar in een context worden gepresenteerd. Door Jackendoff zou deze uitdrukking dus
gedefinieerd worden als een lexicaal item.
Er zijn verschillende theorieën die voorspellingen doen over wat er zoal wordt
opgeslagen in het lexicale geheugen. Jackendoff (2002) onderbouwt in zijn boek het verschil
tussen het ‘online construeren’ van uitingen en het in zijn geheel opslaan van uitingen in het
langetermijngeheugen. Met ‘online construeren’ bedoelt Jackendoff het bouwen van
uitdrukkingen door woorden aan elkaar te plakken of gedeeltelijke schema’s in te vullen. Het
woord ‘hond’, zo legt hij uit, kan niet worden ontleed in deelwoorden en kan niet ‘online’
worden geconstrueerd omdat het een opzichzelfstaand grammaticaal woord is. Dit woord
wordt dus in zijn geheel opgeslagen in het lexicale langetermijngeheugen.
De zin ‘jouw hond heeft op mijn tapijt geplast’ kan vervolgens online worden
geconstrueerd door verschillende grammaticale woorden uit het lexicale
langetermijngeheugen aan elkaar te plakken. Echter, het is volgens Jackendoff (2002) ook
mogelijk dat de zin ‘jouw hond heeft op mijn tapijt geplast’ zodanig vaak geproduceerd wordt
dat deze uiting in zijn geheel als lexicaal item in het lexicale langetermijngeheugen wordt
opgeslagen. Voorbeelden van uitingen die in zijn geheel in het lexicale langetermijngeheugen
kunnen worden opgeslagen zijn uitdrukkingen zoals ‘fijne verjaardag’, ‘vergeven en
vergeten’, ‘veni, vidi, vici’ maar bijvoorbeeld ook titels van films, televisieprogramma’s en
songteksten.
Verschillende theorieën doen voorspellingen over de structuur van het mentaal
lexicon. In taalonderzoek is er onderscheid te maken tussen taalproductie en
taalcomprehensie. In deze scriptie staat taalcomprehensie centraal. Er zijn echter theorieën
met betrekking tot taalproductie die ook voor taalcomprehensie relevant zijn, bijvoorbeeld de
taalproductietheorie van Willem Levelt (1999). Levelt (1999) schetst in één van zijn
onderzoeken een zogenaamde ‘blueprint of the speaker’ waarin het gehele
taalproductieproces van een spreker is ontleed. In Figuur 1 is de ‘blauwdruk van de spreker’
te zien. De rechterkant van de blauwdruk is voor deze scriptie niet relevant. De linkerhelft
bevat echter wel een relevant component: grammaticaal encoderen van taaluitingen.
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
7
Figuur 1: Levelt’s blauwdruk van de spreker (Levelt, 1999, p. 87).
Het grammaticaal encoderen van expressies is volgens Levelt (1999) één van de belangrijkste
stappen van het taalproductieproces. Het grammaticaal encoderen neemt zogeheten
‘preverbale’ uitdrukkingen als input uit het mentale lexicon. Als output produceert
grammaticaal encoderen ‘surface structures’, oppervlaktestructuren bestaande uit een
ordening van de lemma’s die worden geactiveerd bij het genereren van de preverbale
uitdrukking. Een lemma is in essentie hetzelfde als wat Jackendoff (2002) een lexicaal item
noemt. Volgens Levelt kan een lemma één of meerdere woorden bevatten. Het idioom ‘de
pijp uitgaan’ is een voorbeeld van een lemma met meerdere woorden. Lemma-selectie is een
belangrijke stap in het proces van grammaticaal encoderen.
Lemma’s bevatten verschillende soorten informatie. Twee soorten informatie zijn
belangrijk bij het grammaticaal encoderen van een taaluiting, namelijk betekenisinformatie en
informatie over syntactische eigenschappen. Ten eerste is de betekenis relevant, omdat een
spreker moet weten wat er bedoeld wordt met de woorden die worden geuit. Dit is dus in feite
‘wat’ er gezegd wordt. Ten tweede zijn de syntactische eigenschappen van een woord, zoals
woordsoort, belangrijk om een woord correct grammaticaal te kunnen encoderen. Dit is dus
‘hoe’ taal geuit wordt. Een lexicaal concept in een uiting activeert het corresponderende
lemma. Als dit lemma dan vervolgens geselecteerd wordt, worden de syntactische
eigenschappen van het lemma toegankelijk uit het mentale lexicon.
Bybee (1995) stelt dat woorden in het mentale lexicon worden opgeslagen met een
bepaalde ‘lexical strength’. Hoe sterker de lexicale kracht, des te meer verbonden lemma’s in
het mentale lexicon zijn. Dit zorgt voor lexicale connecties tussen woorden. Zo kan het zijn
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
8
dat bij het oproepen van het werkwoord ‘selecteren’ uit het mentale lexicon óók het
werkwoord ‘kiezen’ wordt opgeroepen. Dit komt doordat deze twee woorden min of meer
synoniemen van elkaar zijn, dus zullen ze vaak in eenzelfde context gebruikt worden. Het
oproepen van één van deze lexicale items kan ervoor zorgen dat lexicale items die middels
een lexicale connectie aan elkaar verbonden zijn, ook opgeroepen worden. Het is echter niet
duidelijk of een expressie van meerdere grammaticale woorden in zijn geheel als lexicaal item
wordt opgeslagen in het talig geheugen, of dat een expressie keer op keer wordt ‘gebouwd’
door de losse stukjes aan elkaar te plakken. De volgende paragraaf gaat hier dieper op in.
1.2 Productiviteit
Gebruikers van taal zijn continu bezig met het vormen en begrijpen van expressies. Het is
mogelijk om expressies te vormen die nog nooit eerder gebruikt zijn. Sprekers hebben twee
opties als het gaat om het produceren van een expressie: het aan elkaar plakken van woorden
uit het lexicale geheugen om zo nieuwe expressies te ‘bouwen’ of het ophalen van een groep
regelmatig voorkomende woorden uit het lexicale geheugen. Het produceren van expressies
door verschillende woorden uit het lexicale geheugen aan elkaar te plakken wordt ook wel het
productief vormen van een expressie genoemd. Dit kan worden gedaan door woorden in te
vullen in een gedeeltelijk schema (Bybee, 1995).
Schema’s kunnen volgens Langacker (1988) in meer of mindere mate gefixeerd zijn.
Schema’s die in meer of mindere mate gefixeerd kunnen zijn worden door Langacker ‘lagere
schema’s’ genoemd. Er bestaat volgens hem ook een tweede soort schema’s, namelijk
‘hogere’ ongespecificeerde schema’s, die syntactische en morfologische regels bevatten.
Hieronder vallen bijvoorbeeld de syntactische regels die beschrijven hoe meervoudsvormen
gevormd dienen te worden. Om van het woord ‘strijkijzer’ meervoud te maken, moet er een -s
aan toegevoegd worden. De meervoudstoevoeging ‘-s’ is een typisch voorbeeld van een hoger
schema. Volgens Langacker worden deze ‘hogere’ schema’s maar zelden gebruikt en zijn
taalgebruikers over het algemeen afhankelijk van de ‘lagere’, minder abstracte schema’s. Het
is volgens Langacker dan ook waarschijnlijk dat we voor frequent voorkomende
meervoudsvormen, zoals de uitgang ‘-s’, een lager schema hebben opgebouwd.
In deze context heeft Jackendoff (2002) het over productieve morfologie. Productieve
morfologie is het toepassen van regelmatige syntactische regels om woorden te vormen. Zo
kunnen bijvoeglijke naamwoorden in het Engels bijvoorbeeld gevormd worden door de
uitgang -ly toe te voegen aan een woord. Een voorbeeld van een Nederlandse productieve
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
9
morfologische regel is het toevoegen van -baar aan een woord. Wanneer dit morfeem achter
de stam van een werkwoord is gevoegd, dan geeft dat aan dat de actie die door het werkwoord
beschreven wordt ‘te doen’ is (Backus & Mos, 2011). Zelfs als een niet-bestaand woord zoals
‘glarf’ wordt opgevolgd door het morfeem ‘-baar’, dan is het duidelijk dat iets ‘te glarfen’ is.
Deze syntactische regels zijn te classificeren als een gedeeltelijk schema. De uitgang -baar is
immers het schematische deel, waarbij de stam van het werkwoord in dit geval een open
positie is.
De waarschijnlijkheid waarmee een (gedeeltelijk) schema gebruikt gaat worden voor
nieuwe items is afhankelijk van twee factoren. Ten eerste is het afhankelijk van de
definiërende eigenschappen van het schema. Wanneer de definiërende eigenschappen van het
schema erg specifiek zijn, zijn er minder items in te vullen in de open posities waardoor het
schema minder wordt in productiviteit. De tweede factor is hoe sterk het schema is. Dit is
afhankelijk van hoe vaak een schema voorkomt en in welke vormen dit schema voorkomt.
Zowel expressies die niet als geheel in het talig geheugen zijn opgeslagen als
expressies die dat wel zijn, worden door sprekers continu gebruikt. Het is echter niet duidelijk
welke expressies zijn opgeslagen in het talig geheugen en welke er keer op keer opnieuw
worden ‘berekend’. Een belangrijke rol hierbij speelt frequentie, het aantal keer dat een
bepaalde expressie wordt gebruikt (Backus & Mos, 2011; Bybee, 1995).
1.2.1 Frequentie
Bybee (1995) deed onderzoek naar productiviteit in taalverwerking door de rol van een hoge
type-frequentie in productiviteit te onderzoeken. Een hoge type-frequentie wil zeggen het
aantal ‘unieke’ instanties waarin een schema voorkomt. Bijvoorbeeld, de type-frequentie van
de meervoudsvorm ‘-en’ in het Nederlands is alle verschillende instanties waarin deze
meervoudsvorm voorkomt. ‘Stokken’, ‘flessen’ en ‘hoezen’ zijn dus allemaal types van dit
schema. Token-frequentie is dan het aantal keren dat het schema in totaal voorkomt. De
token-frequentie van de meervoudsvorm ‘-en’ is dus het totaal aantal keren dat deze
meervoudsvorm voorkomt. Bybee (1995) concludeert dat een hoge type-frequentie cruciaal is
voor productiviteit; unieke instanties waarin een schema voorkomt kunnen ‘gebouwd’ worden
door woorden uit het mentale lexicon aan elkaar te plakken.
De belangrijke rol van frequentie in productiviteit is aangetoond door Bybee (1995)
middels een studie waarin de taalverwerving van jonge kinderen werd onderzocht. In veel
Romaanse talen zoals het Spaans en het Frans is een aantal werkwoord-uitgangen dominant
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
10
(bijvoorbeeld -er in het Frans). Niet-dominante uitgangen, zoals -re, hebben een lage type-
frequentie, maar een hoge token-frequentie. Het aantal door de kinderen geproduceerde
werkwoord-uitgangen werd geteld. Daaruit bleek dat niet de uitgangen met de hoogste type-
frequentie, maar juist de woorden met de hoogste token-frequentie het meest door de kinderen
werden gebruikt. Deze vormen komen het vaakst voor, zijn dus het meest toegankelijk en
worden daarom door kinderen die ‘de regel’ met betrekking tot werkwoord-uitgangen nog
niet accuraat toe kunnen passen het meest gebruikt.
Vormen met een hoge individuele token-frequentie worden vaker als geheel
aangeleerd in plaats van dat men deze moet ‘ontleden’. Deze vormen zijn niet bevorderlijk
voor de productiviteit van een uiting. Zo is het mogelijk dat twee klassen van onregelmatige
werkwoorden in het Engels met een vergelijkbare type-frequentie significant verschillen in
productiviteit, omdat de token-frequentie van de twee klassen van elkaar verschillen. Zo is de
werkwoordsvorm ‘strung’, met 13 types en 199 tokens, veel productiever dan de
werkwoordsvorm ‘swept’, die 14 types en 656 tokens heeft (Bybee, 1995). Baayen en Lieber
(1991) stellen tevens dat type-frequentie bevorderlijk is voor de productiviteit van een
bepaalde taalvorm, en dat token-frequentie schadelijk is voor de productiviteit.
Dabrowska (2004) stelt dat er drie factoren zijn die de waarschijnlijkheid voorspellen
waarmee een woord productief zal worden gevormd: type-frequentie, of het woord regelmatig
is of niet en fonologische heterogeniteit, de mate waarin het woord ‘klinkt als’ een ander
woord. Wanneer de type-frequentie van een constructie hoog is, dan is de kans groter dat er
een nieuwe instantie van dit type productief wordt gevormd. Hoe hoger de type-frequentie
van een constructie, hoe regelmatiger het woord is en hoe gelijkender het woord fonologisch
is met andere woorden, des te hoger de productiviteit van een constructie.
Het is duidelijk dat er een belangrijke relatie bestaat tussen productiviteit en
frequentie. Hoe meer een bepaald schema in unieke gevallen voorkomt, des te hoger de type-
frequentie en productiviteit van dat schema. De tegenhanger van productiviteit is lexicalisatie,
het in zijn geheel opslaan van gehele woordgroepen en volledig ingevulde schema’s in
lexicaal geheugen.
1.2 Lexicalisatie
Doordat bepaalde syntactische uitdrukkingen herhaaldelijk worden berekend kan een
uitdrukking gefixeerd worden. Gefixeerde uitdrukkingen zijn als lexicaal item op te halen uit
het mentale lexicon, waardoor uitdrukkingen vervolgens niet meer door de spreker of
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
11
toehoorder te hoeven worden ‘ontleed’. Zo’n eenheid, in de literatuur ook een
geprefabriceerde uitdrukking of afgekort ‘prefab’ genoemd, wordt door Wray en Perkins
(2000) gedefinieerd als een sequentie woorden of andere betekeniselementen die als geheel
opgeslagen in en opgehaald uit het mentale lexicon kunnen worden, zonder dat deze
geproduceerd of geanalyseerd hoeven te woorden door taalgrammatica.
Geprefabriceerde uitdrukkingen zijn dus gelexicaliseerde uitdrukkingen. Erman en
Warren (2000) geven twee redenen waarom het definiëren van gelexicaliseerde uitdrukkingen
problematisch kan zijn. Ten eerste omdat niet voor iedereen een bepaalde expressie
opgeslagen zal zijn als gelexicaliseerde uitdrukking. Dit is voor elke spreker heel persoonlijk.
Ten tweede is het moeilijk om erachter te komen of een dergelijke sequentie woorden als
gelexicaliseerde uitdrukking tellen, omdat ze op het eerste gezicht compositioneel kunnen
lijken.
Naar het bestaan en het gebruik van gelexicaliseerde uitdrukkingen is reeds veel
onderzoek verricht. Erman en Warren (2000) deden onderzoek naar het zogenaamde ‘open
choice’ principe versus het ‘idiom choice’ principe. Het open choice principe omvat het
combineren van aparte lexicale items middels het gebruik van een aantal syntactische regels.
Dit is dus te vergelijken met het fenomeen productiviteit. Het idiom choice principe houdt in
het gebruik van gelexicaliseerde multi-woord eenheden. Deze eenheden zouden als eenheid
opgeslagen zijn in het lexicale geheugen, en is daarom te vergelijken met het fenomeen
lexicalisatie. Erman en Warren (2000) stellen dat een spreker bij het produceren van taal
afwisselt tussen het toepassen van het open choice principe en het idiom choice principe. Het
uiteindelijke doel van hun studie was het geven van een realistische representatie van de
structuur van het mentale lexicon. Erman en Warren (2000) concludeerden dat ongeveer 55
procent van de tekst die zij analyseerden bestond uit gelexicaliseerd taalgebruik. Zij hebben
dit gemeten door de ‘restricted exchangeabilitytest’ uit te voeren. Ten minste één item uit de
gelexicaliseerde uitdrukking mag niet vervangbaar zijn door een synoniem item zonder dat de
betekenis van het geprefabriceerde item verloren gaat. Erman en Warren (2000) geven hier
een voorbeeld van. ‘I’m afraid’ is een uitdrukking die in het Engels vaak wordt gebruikt om
een deel slecht nieuws te verzachten voor de toehoorder. ‘Afraid’ kan niet worden vervangen
door een synoniem item zoals ‘scared’ zonder dat er betekenisverlies optreedt, dus is ‘I’m
afraid’ een typisch geval van een Engelse gelexicaliseerde uitdrukking.
Erman en Warren (2000) concluderen dus dat meer dan de helft van de tekst die zij
hebben geanalyseerd bestaat uit (woorden uit) gelexicaliseerde uitdrukkingen. In hun definitie
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
12
van een gelexicaliseerde uitdrukking zijn Erman en Warren echter niet streng geweest. Zij
verstaan onder een ‘geprefabriceerde uitdrukking’ elke combinatie van meer dan één woord.
Zo zou ‘theekopje’ bijvoorbeeld geen uitdrukking zijn, maar als het als ‘thee kopje’ gespeld
zou zijn, dan wel. Desalniettemin concluderen Erman en Warren (2000) dat gelexicaliseerde
uitdrukkingen veel voorkomen in teksten. Ook vinden Erman en Warren bevestiging voor hun
hypothese over het combineren van gelexicaliseerde uitdrukkingen met niet-gelexicaliseerde
uitdrukkingen. Zij concluderen dat er bij het schrijven van een tekst veel wordt geswitcht
tussen het gebruik van gelexicaliseerde uitdrukkingen en uitdrukkingen die niet
gelexicaliseerd zijn.
Het gebruiken van gelexicaliseerde uitdrukkingen heeft verschillende voordelen.
Gelexicaliseerde uitdrukkingen zijn makkelijker te memoriseren dan expressies die nog online
geconstrueerd moeten worden (Smits, 2004). Of dat ook betekent dat gelexicaliseerde
eenheden sneller uit het mentale lexicon worden opgehaald dan niet-gelexicaliseerde
uitdrukkingen is nog onduidelijk. Tevens kan de grammaticale encodering die Levelt (1999)
als belangrijk onderdeel van het taalproductieproces beschouwde worden overgeslagen
wanneer er gebruik wordt gemaakt van een gelexicaliseerde uitdrukking. Ten slotte wordt de
betekenis van de gelexicaliseerde uitdrukking bepaald door het corresponderende schema en
is de betekenis daardoor makkelijk te bepalen (Smits, 2004).
Een nadeel van het gebruiken van een gelexicaliseerde uitdrukking is het feit dat een
in zijn geheel opgeslagen expressie een beperkter aantal gebruiksmogelijkheden heeft (Smits,
2004). De gelexicaliseerde eenheid ‘happy birthday to you’ is hoogfrequent, maar is niet in
veel verschillende contexten toe te passen. Deze gelexicaliseerde eenheid is namelijk alleen te
gebruiken wanneer men iemand een fijne verjaardag wil wensen. Het grammaticale woord
‘happy’ kan echter in veel meer contexten gebruikt worden. Het aantal
gebruiksmogelijkheden neemt af naarmate de gelexicaliseerde eenheid langer en specifieker
wordt.
De vraag of het lexicale geheugen voornamelijk uit losse woorden die door middel van
het invullen van schema’s keer op keer ‘gebouwd’ moeten worden of uit gelexicaliseerde,
geprefabriceerde uitdrukkingen bestaat is nog niet beantwoord. Door middel van dit
onderzoek wordt getracht een bijdrage te leveren aan deze discussie. Het is nu duidelijk dat er
gefixeerde uitdrukkingen bestaan die als geheel opgeslagen worden in het mentale lexicon. Er
zijn echter ook uitdrukkingen die gedeeltelijk gefixeerd zijn. Deze deels-gefixeerde
uitdrukkingen worden schema’s genoemd. Een voorbeeld van een schema in de Nederlandse
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
13
taal is de ‘hoe X-er hoe Y-er’-constructie. De kenmerken en vorm van deze constructie zullen
nu worden uiteengezet.
1.4 Hoe X-er hoe Y-er
De specifieke constructie waar in deze scriptie naar gekeken zal worden is de ‘hoe X-er hoe
Y-er’-constructie. Er is een corpusonderzoek uitgevoerd waarin honderden verschillende
instanties van deze constructie zijn bekeken. In paragraaf 2.2 zijn de uitkomsten van dit
corpusonderzoek uitgelicht. Na het bekijken van deze verschillende instanties is te
concluderen dat het schema er als volgt uitziet:
‘HOE’ [adj.] ‘HOE’ [adj.].
Hoffmann, Horsch en Brunner (2019) deden onderzoek naar de Engelse equivalent van deze
constructie, de the X the Y-constructie. Zij noemen deze constructie een minder frequente
vorm van de filler-gap constructies. Met ‘gaps’ bedoelen zij de open posities in een
constructie. De ‘hoe X-er hoe Y-er’-constructie heeft twee posities, de ‘gaps’, die open zijn.
Hier kunnen dan bijvoeglijke naamwoorden worden ingevuld, bijvoorbeeld ‘langer’ en
‘groter’. Hiermee kan dan een instantie van het schema ‘hoe X-er hoe Y-er’ gevormd worden.
‘Langer’ en ‘groter’ zijn dus ‘fillers’ in de twee open posities die het schema heeft. De ‘hoe
X-er hoe Y-er’-constructie kan in meer of mindere mate gefixeerd zijn. Het is mogelijk dat de
X- en/of Y-positie gefixeerd is. Een meer gefixeerde variant van het ‘hoe X-er hoe Y-er’-
schema is bijvoorbeeld ‘hoe X-er hoe beter’. De Y-positie van de constructie is in dit geval
ook ingevuld, waardoor dit schema meer gefixeerd is dan de ‘hoe X-er hoe Y-er’-variant. Het
‘hoe X-er hoe Y-er’-schema zou volgens Langacker (1988) gespecificeerd worden als een
‘lager schema’ omdat het schema in meer of mindere mate gefixeerd kan zijn.
Cappelle (2011) beschrijft de twee volgens hem belangrijke semantische aspecten van
de ‘hoe X-er hoe Y-er’ -constructie. Dit zijn dynamicity en directionality. Dynamicity
gebruikt hij om aan te geven dat met behulp van de constructie aangeduid kan worden dat
zaken op verschillende schalen met elkaar vergeleken worden. De ‘hoe X-er hoe Y-er’
constructie duidt een ‘beweging’ op de ene schaal ten opzichte van de ‘beweging’ op de
andere schaal aan. De constructie ‘hoe langer hoe moeilijker’ laat beweging zien op de schaal
van lengte (of tijd) ten opzichte van beweging op de schaal van moeilijkheid. Met andere
woorden, de ‘hoe X-er hoe Y-er’-constructie geeft een dynamische relatie weer, geen
statische.
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
14
Het tweede semantische aspect is directionality, wat inhoudt dat de X-positie van de
constructie de onafhankelijke variabele bevat en de Y-positie van de constructie de
afhankelijke variabele. In de constructie ‘hoe leuker hij het vindt, hoe harder hij lacht’ is de
invulling van de X-positie, namelijk het grammaticale woord ‘leuker’, de onafhankelijke
variabele omdat het een toename in het lachgeluid teweegbrengt. Het grammaticale woord in
de Y-positie, ‘harder’, is dus een gevolg van een verandering van de onafhankelijke variabele.
De onafhankelijke variabele in positie X beïnvloedt de afhankelijke variabele in positie Y. Er
zit dus een bepaalde richting in de constructie waarin geredeneerd wordt, van positie X naar
positie Y.
De ‘hoe X-er hoe Y-er’-constructie is een comparatieve constructie waarin de toestand
van de onafhankelijke variabele in positie X wordt vergeleken met de toestand van de
afhankelijke variabele in positie Y. Naar de verwerking van gefixeerde uitdrukkingen en
schema’s is reeds onderzoek verricht. Dit specifieke schema is echter nog niet onderzocht. In
de volgende paragraaf zullen enkele studies worden uitgelicht die psycholinguïstisch
onderzoek verrichtten naar de verwerking van gefixeerde uitdrukkingen.
1.5 Psycholinguïstisch onderzoek naar de verwerking van gefixeerde uitdrukkingen
De studies die reeds zijn verricht naar de verwerking van gefixeerde uitdrukkingen
onderzochten niet dezelfde uitdrukkingen, maar kunnen toch relevant zijn in het achterhalen
welke cognitieve processen belangrijk zijn bij de verwerking van gefixeerde expressies. Bij de
verwerking van vaste uitdrukkingen zoals ‘het voordeel van de twijfel’ kunnen we ervan
uitgaan dat vergelijkbare cognitieve processen worden gebruikt als bij de verwerking van ‘hoe
X-er hoe Y-er’-constructies
Schilperoord en Cozijn (2010) deden oogbewegingsregistratieonderzoek naar
gefixeerde expressies door vaste uitdrukkingen zoals ‘het is mij een groot genoegen’ en ‘hij
werkt op mijn zenuwen’ in gefixeerde- en in gemodificeerde vorm aan te bieden, bijvoorbeeld
‘hij werkt op mijn gevoelige zenuwen’. Zo trachtten zij aan te tonen dat entiteiten uit
gefixeerde uitdrukkingen minder toegankelijk zijn als antecedent bij het oplossen van
anaforische relaties. De resultaten van het onderzoek wezen uit dat de anaforische relaties in
de tekstjes met daarin gefixeerde uitdrukkingen inderdaad minder snel werden opgelost dan
de relaties uit tekstjes met gemodificeerde uitdrukkingen. Leestijden van het gedeelte na de
anaforische expressies waren langer bij een gefixeerde uitdrukking dan bij een niet-gefixeerde
uitdrukking. Participanten sprongen bij het lezen van de zinnen vaker terug naar expressies
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
15
die gefixeerd waren dan naar expressies die niet-gefixeerd waren. Schilperoord en Cozijn
(2010) concludeerden dat entiteiten uit een gefixeerde expressie minder toegankelijk zijn
omdat de gefixeerde expressie als eenheid ‘in de weg’ zit. De verwijzing naar een entiteit is
dus moeilijker bij een gefixeerde expressie omdat de delen van de expressie niet zo
toegankelijk zijn als delen van een niet-gefixeerde expressie.
Sprenger (2003) heeft experimenteel onderzoek verricht naar de verwerking van
idiomen. Een idioom is een gefixeerde uitdrukking met een figuurlijke betekenis. Er is vaak
geen relatie tussen wat de uitdrukking in zijn geheel betekent en wat de losse woorden apart
betekenen, bijvoorbeeld het in paragraaf 1.1 genoemde idioom ‘de pijp uitgaan’. Sprenger
(2003) tracht in kaart te brengen hoe idiomen mentaal in het lexicaal geheugen zijn
gerepresenteerd. Dit werd gedaan door paren te maken tussen idiomatische expressies zoals
‘door de mand vallen’ en normale expressies bestaande uit dezelfde grammaticale onderdelen,
zoals ‘in de mand zitten’. Participanten werd gevraagd om zowel de idiomatische als de
normale expressies uit hun hoofd te leren. Zodra ze dit hadden gedaan, zagen participanten
ezelsbruggetjes bestaande uit één woord. Voor ‘door de mand vallen’ was het ezelsbruggetje
bijvoorbeeld ‘bekennen’ en voor ‘in de mand zitten’ was deze ‘resideren’. Ook hoorden de
participanten een ‘prime’, dit woord kwam letterlijk voor in de te produceren zin. In het geval
van de zinnen ‘door de mand vallen’ en ‘in de mand leggen’ was de prime bijvoorbeeld het
woord ‘mand’. Er werd gemeten hoe veel tijd het de participanten kostten om te beginnen met
uiten van de zinnen die ze moesten produceren. De resultaten wezen uit dat de invloed van de
prime sterker was bij de gefixeerde uitdrukkingen dan bij niet gefixeerde uitdrukkingen.
Vermoedelijk is dit het geval omdat de gefixeerde uitdrukkingen in het lexicaal geheugen zijn
opgeslagen als eenheid waardoor de prime een directe relatie heeft met alle woorden waaruit
het idioom bestaat. Daarentegen hebben de grammaticale woorden ‘mand’ en ‘resideren’
waarschijnlijk geen directe lexicale connectie. Om deze reden kost het participanten
vermoedelijk minder tijd om woorden uit een gefixeerde uitdrukking te produceren wanneer
deze uitdrukkingen geprimed zijn.
Er is nu meer duidelijk over wat de productiviteit versus lexicalisatie-discussie
inhoudt. Begrippen zoals taalverwerking, frequentie en schema’s zijn een belangrijk
onderdeel van deze discussie. In de volgende paragraaf zullen de centrale vraagstelling en de
hypotheses van deze scriptie uiteen worden gezet.
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
16
1.6 Vraagstelling
Er is veel onderzoek verricht naar de manier waarop het mentaal lexicon is gestructureerd.
Een belangrijke discussie rondom dit onderwerp gaat over productiviteit versus lexicalisatie.
‘Bouwen’ we constructies keer op keer, of slaan we naar verloop van tijd gehele constructies
als lexicaal item op in het mentaal lexicon? Deze scriptie tracht een bijdrage te leveren aan die
discussie. Dat wordt gedaan door antwoord te geven op de volgende vragen:
Bevordert het gebruik van (deels) schematische constructies de leessnelheid en verhoogt het
gebruik van (deels) schematische constructies het gemiddelde vertrouwdheidsoordeel dat aan
een constructie wordt toegekend door participanten?
Deze onderzoeksvragen zullen worden beantwoord middels een experiment. In het
experiment zullen zinnen in een ‘hoe X-er hoe Y-er’-constructie worden vergeleken met
zinnen in een ‘als X-er dan Y-er’-constructie, om af te tasten of constructievorm effect heeft
op leestijden en vertrouwdheidsoordelen.
Er is gekeken naar de type-frequentie waarmee schema’s voorkomen in SoNaR.
Frequentie is voor dit onderzoek als controlemaat meegenomen, omdat frequentie-effecten al
reeds aangetoonde en robuuste effecten zijn. Bybee (1995) concludeert dat hoogfrequente
constructies sneller worden gelezen dan laagfrequente omdat hoogfrequente constructies reeds
als eenheid in talig geheugen zijn opgeslagen. Laagfrequente constructies zouden keer op keer
opnieuw ‘aan elkaar geplakt’ moeten worden, waardoor de leestijd voor deze constructies
langer is. Om te controleren of frequentie in dit experiment dit verwachte effect heeft, zijn
voor deze controlemaat twee hypotheses opgesteld.
Corpusonderzoek wijst uit dat de schema’s ‘hoe langer hoe Y-er’ en ‘hoe X-er hoe
beter’ frequent voorkomen in dagelijks taalgebruik. Smits (2004) stelt dat schematische
uitdrukkingen makkelijker te memoriseren zijn dan expressies die niet of in mindere mate
gelexicaliseerd zijn. Door deels ingevulde schema’s te vergelijken met het abstractere schema
‘hoe X-er hoe Y-er’, waarin zowel de X- als de Y-posities nog niet ingevuld zijn, wordt
getracht aan te tonen dat hoe schematischer een constructie is, hoe lager de leestijden en hoe
hoger de vertrouwdheidsoordelen zijn.
Tevens worden laagfrequente ‘hoe-hoe’-constructies vergeleken met hun ‘als-dan’-
equivalent om te onderzoeken of het aanbieden van expressies in een schematische
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
17
constructie leestijden verlaagt en vertrouwdheidsoordelen verhoogt.
Om de onderzoeksvragen te beantwoorden zijn hypotheses opgesteld:
Ter controle, H1a: Hoogfrequente constructies zullen sneller worden gelezen dan
laagfrequente constructies.
Ter controle, H1b: Hoogfrequente constructies zullen als vertrouwder worden beoordeeld dan
laagfrequente constructies.
H2a: Zinnen in een ‘hoe-hoe’-constructie zullen sneller worden gelezen dan vergelijkbare
zinnen in een ‘als-dan’-constructie.
H2b: Zinnen in een ‘hoe-hoe'-constructie zullen als vertrouwder worden beoordeeld dan
vergelijkbare zinnen in een ‘als-dan’-constructie.
H3a: Zinnen in een ‘hoe X-er hoe beter’- constructie en in een ‘hoe langer hoe Y-er’-
constructie zullen sneller worden gelezen dan zinnen in een ‘hoe X-er hoe Y-er’-constructie.
H3b: Zinnen in een ‘hoe X-er hoe beter’-constructie en in een ‘hoe langer hoe Y-er’-
constructie zullen als vertrouwder worden beoordeeld dan zinnen in een ‘hoe X-er hoe Y-er’-
constructie.
H4a: Laagfrequente ‘hoe-hoe’-constructies in een bepaald schema zullen sneller worden
gelezen dan de equivalente ‘als-dan’-constructies.
H4b: Laagfrequente ‘hoe-hoe’-constructies in een bepaald schema zullen vertrouwder worden
beoordeeld dan de equivalente ‘als-dan’-constructies.
2. Methode
Om de onderzoeksvragen te kunnen beantwoorden is er een experiment uitgevoerd. In dit
experiment zijn de leestijden en vertrouwdheidsoordelen die participanten gaven aan zinnen
die zowel in een ‘hoe-hoe’-constructie als een ‘als-dan’-constructie werden aangeboden
gemeten.
2.1 Participanten
In totaal hebben 65 participanten deelgenomen aan het experiment. De participanten waren
studenten aan de Faculteit Geesteswetenschappen van de Universiteit van Tilburg. 41
participanten waren bachelor studenten, 20 premasterstudenten en 4 masterstudenten. De
participanten zijn benaderd via een proefpersonenpool en kregen 0.5 punt om deel te nemen
aan het experiment. De leeftijden van de participanten lagen tussen de 18 en de 27 jaar, met
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
18
een gemiddelde van 21.5 jaar.
2.2 Materiaal
Voor het selecteren van het materiaal is een kleinschalig corpusonderzoek uitgevoerd. Daar is
SoNaR voor gebruikt, een Nederlandstalig corpus van hedendaagse en geschreven taal
bestaande uit circa 500 miljoen woorden. SoNaR is bedoeld om linguïstisch onderzoek mee te
verrichten.
In de zoekopdracht zijn de woorden ‘hoe ADJECTIEF hoe ADJECTIEF’ ingevuld.
Opmerkelijk is dat de instanties van de constructie die het woord ‘meer’ bevatten, zoals ‘hoe
meer hoe beter’, niet in de zoekresultaten waren opgenomen. Vermoedelijk komt dit door de
aparte vorm van het adjectief ‘meer’, een afwijkende vergrotende trap vergeleken met andere
vormen van de vergrotende trap. Er is om die reden een additionele corpus zoekopdracht
gedaan naar het woord ‘meer’ in de eerste positie en een zoekopdracht met ‘meer’ in de
tweede positie.
In de zoekresultaten was een aantal fouten te vinden, bijvoorbeeld ‘hoe oud hoe oud’
en ‘hoe groot hoe klein’. Deze zoekresultaten zijn niet meegenomen in het onderzoek. Ook
kwam eenzelfde hit in het corpus met en zonder hoofdletter als twee aparte zoekresultaten
voor. Deze werden samengevoegd. Ten slotte is ‘hoe vetiiger hoe prettiger’ geïnterpreteerd
als een spelfout van de constructie ‘hoe vettiger hoe prettiger’. Na deze handmatige check van
de zoekresultaten bleven er 1790 tokens over, verdeeld over 383 types. 1
De constructie ‘hoe langer hoe meer’ is in het corpus verreweg het meest frequent.
Deze constructie heeft 943 hits en vormt, samen met de constructies ‘hoe meer hoe beter’,
‘hoe langer hoe moeilijker’, ‘hoe eerder hoe beter’, en ‘hoe langer hoe beter’ de top vijf van
meest frequent voorkomende ‘hoe X-er hoe Y-er’-constructies.
Uit de corpusstudie is gebleken dat het woord ‘beter’ in verhouding erg vaak in de Y-
positie wordt ingevuld. Van de 383 verschillende types die in totaal zijn gevonden waren 107
expressies daarvan instanties van het schema ‘hoe X-er hoe beter’. Niet alleen de Y-positie
kan gefixeerd zijn, het kan ook zo zijn dat de X-positie gefixeerd is. Zo waren er in totaal 136
unieke instanties van het schema ‘hoe langer hoe Y-er’. Hieruit is te concluderen dat het
schema ‘hoe X-er hoe Y-er’ in meer of mindere mate gefixeerd kan zijn en dat de X en/of Y-
posities in deze expressie ook gefixeerd kunnen zijn.
Wanneer ‘meer’ ingevuld wordt in de Y-positie van de ‘hoe X-er hoe Y-er’-
1 De volledige resultaten van het corpusonderzoek zijn bij de auteur te verkrijgen.
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
19
constructie, wordt duidelijk dat de constructie ‘hoe langer hoe meer’ 943 keer voorkomt. Deze
constructie is het meest frequent van alle ‘hoe X-er hoe Y-er’-constructies. Hiermee kan
wellicht verondersteld worden dat de constructie ‘hoe langer hoe meer’ een gefixeerde
expressie is.
De voor dit onderzoek geselecteerde stimuli zijn per schema weergegeven in Tabellen
1 tot en met 3. De frequentie waarmee de ‘hoe-hoe’-constructies voorkomen in SoNaR is ook
in de Tabellen weergegeven. Alle geselecteerde ‘hoe-hoe’-constructies hadden een ‘als-dan’-
equivalent, bijvoorbeeld ‘als langer dan meer’. De ‘als-dan’-constructies zijn voor dit
experiment verzonnen, waardoor ze geen frequentie hebben. Er zijn in totaal 60 stimuli
gekozen voor het experiment.
Tabel 1
De 5 hoogfrequente en 5 laagfrequente constructies in het ‘langer, Y-er’ schema met de
bijbehorende frequentie in SoNaR.
Hoe-hoe constructie Frequentie Als-dan constructie
Hoe langer hoe meer 943 Als langer dan meer
Hoe langer hoe moeilijker 46 Als langer dan moeilijker
Hoe langer hoe duidelijker 15 Als langer dan duidelijker
Hoe langer hoe gekker 7 Als langer dan gekker
Hoe langer hoe harder 6 Als langer dan harder
Hoe langer hoe leuker 1 Als langer dan leuker
Hoe langer hoe korter 1 Als langer dan korter
Hoe langer hoe minder 1 Als langer dan minder
Hoe langer hoe eenvoudiger 1 Als langer dan eenvoudiger
Hoe langer hoe gezonder 1 Als langer dan gezonder
Tabel 2
De 5 hoogfrequente en 5 laagfrequente constructies in het ‘X-er, beter’-schema met de
bijbehorende frequentie in SoNaR.
Hoe-hoe constructie Frequentie Als-dan constructie
Hoe meer hoe beter 70 Als meer dan beter
Hoe eerder hoe beter 29 Als eerder dan beter
Hoe ouder hoe beter 13 Als ouder dan beter
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
20
Hoe sneller hoe beter 9 Als sneller dan beter
Hoe vroeger hoe beter 8 Als vroeger dan beter
Hoe enger hoe beter 1 Als enger dan beter
Hoe strenger hoe beter 1 Als strenger dan beter
Hoe zwaarder hoe beter 1 Als zwaarder dan beter
Hoe vetter hoe beter 1 Als vetter dan beter
Hoe duurder hoe beter 1 Als duurder dan beter
Tabel 3
De 5 hoogfrequente en 5 laagfrequente constructies in het ‘X-er, Y-er’-schema met de
bijbehorende frequentie in SoNaR.
Hoe-hoe constructie Frequentie Als-dan constructie
Hoe vettiger hoe prettiger 16 Als vettiger dan prettiger
Hoe ouder hoe zotter 5 Als ouder dan zotter
Hoe later hoe zotter 4 Als later dan zotter
Hoe hoger hoe groter 4 Als hoger dan groter
Hoe groter hoe slapper 3 Als groter dan slapper
Hoe later hoe schoner 1 Als later dan schoner
Hoe harder hoe mooier 1 Als harder dan mooier
Hoe later hoe langzamer 1 Als later dan langzamer
Hoe wilder hoe leuker 1 Als wilder dan leuker
Hoe zwaarder hoe duurder 1 Als zwaarder dan duurder
Om ervoor te zorgen dat eventuele effecten niet toegeschreven kunnen worden aan
individuele woordlengte van de woorden die ingevuld worden in de X- en Y-posities is de
woordlengte gecontroleerd. De gemiddelde woordlengtes van de woorden in de X- en Y-
posities zijn met elkaar vergeleken. In Tabel 4 zijn de gemiddelde woordlengtes per
constructie weergegeven.
Gemiddelde frequentie van de 5 geselecteerde items per conditie is ook meegenomen.
Voor de laagfrequente groep zijn alleen constructies gekozen die als tokenfrequentie ‘1’
hadden. Voor de hoogfrequente condities zijn constructies gekozen die 3 keer of vaker
voorkwamen in het corpus.
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
21
Tabel 4
Gemiddeld aantal letters per woord en gemiddelde frequentie per schema in SoNaR.
Schema Frequentie Gemiddeld
aantal
letters X-
positie
Gemiddeld
aantal
letters Y-
positie
Gemiddelde
frequentie
Langer, Y-er Hoog 6 7.2 203.4
Langer, Y-er Laag 6 7.2 1
X-er, beter Hoog 5.8 5 25.8
X-er, beter Laag 6.8 5 1
X-er, Y-er Hoog 5.8 6.8 6.4
X-er, Y-er Laag 6 7 1
2.3 Design
Er was in dit experiment sprake van twee soorten onafhankelijke
binnenproefpersoonsvariabelen: constructietype en schematype. Frequentie is als
controlemaat meegenomen. Er zijn twee constructietypen onderzocht, namelijk ‘hoe-hoe’ en
‘als-dan’ en drie schematypen, namelijk ‘X-er, Y-er’, ‘X-er, beter’ en ‘langer, Y-er’. Van elk
van deze schematypes zijn tien constructies verzameld. Vijf van deze constructies waren
hoogfrequent en vijf waren laagfrequent. ‘Als-dan’-constructies zijn voor dit onderzoek
verzonnen, waardoor deze niet in te delen waren in een frequentieklasse. Elk proefpersoon
kreeg alle condities te zien, dus het experiment had een binnenproefpersoonsontwerp. De
volgorde waarin de stimuli werden aangeboden is gerandomiseerd.
2.4 Instrumentatie
Er waren twee afhankelijke variabelen, namelijk leestijden en vertrouwdheidsoordelen. De
leestijden werden gemeten door zinnen op een verder leeg beeld aan te bieden. De
participanten werden geïnstrueerd om de zinnen zo snel mogelijk te lezen en vervolgens op de
spatiebalk te drukken. De tijd tussen het verschijnen van de zin en het drukken op de
spatiebalk is geregistreerd als de leestijd van de zin. Met ‘vertrouwdheid’ werd bedoeld de
mate waarin participanten een constructie zelf zouden gebruiken of ooit zijn tegengekomen.
Participanten werd gevraagd de mate van vertrouwdheid aan te geven op een 7-punts Likert
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
22
schaal.
2.5 Procedure
Participanten lazen allereerst een informatiebrief waarin stond dat ze deel gingen nemen aan
een leesexperiment. Daarna tekenden participanten een toestemmingsformulier waarmee ze
toestemming gaven voor hun deelname en het analyseren en verwerken van de
onderzoeksresultaten. Van de participanten werd tevens een aantal demografische
eigenschappen genoteerd zoals leeftijd, geslacht en opleidingsniveau. Vervolgens namen de
participanten plaats in een geluiddichte cabine met daarin een computerscherm. De
participanten werd eerst gevraagd de instructie te lezen. In de instructie lazen participanten
dat ze zinnen zo snel mogelijk moesten lezen en daarna op de spatiebalk moesten drukken.
Vervolgens lazen ze dat ze over die zin een vertrouwdheidsoordeel op een schaal van 1 tot 7
moesten geven. De volledige instructie is te vinden in Appendix A. De proefleider lichtte de
instructies mondeling toe en de participanten kregen de kans om vragen te stellen voordat het
experiment startte. Wanneer de participanten aangaven de instructies te hebben begrepen,
startte een oefenblok met vijf oefentrials. De proefleider bleef tijdens het oefenblok in de
cabine aanwezig om ervoor te zorgen dat de participanten begrepen wat er van ze verwacht
werd.
De oefentrials en de experimentele trials waren precies hetzelfde: allereerst verscheen
er op het beeldscherm een ‘+’-teken, dat na één seconde automatisch weer verdween. Daarna
verscheen de constructie bestaande uit vier woorden gecentreerd op het scherm. De tekst was
zwart met een grijze achtergrond. Zodra participanten de constructie gelezen en begrepen
hadden, drukten zij zo snel mogelijk op de spatiebalk. Daarna zagen participanten bovenaan
het scherm de vraag ‘Hoe vertrouwd vind je de constructie die je zojuist gelezen hebt op een
schaal van 1-7?’. Links onderin het scherm stonden de woorden ‘minst vertrouwd’, daarnaast
de cijfers 1 tot en met 7 en rechts van de schaal stonden de woorden ‘meest vertrouwd’.
Participanten gaven middels de toetsen 1 tot en met 7 op het toetsenbord hun oordeel. Aan het
geven van een vertrouwdheidsoordeel zat geen tijdslimiet verbonden. Na het geven van een
oordeel verscheen er weer een ‘+’- teken en begon de volgende trial.
Na het beoordelen van de 60 experimentele trials verscheen er een tekst die meedeelde
dat het experiment afgelopen was en dat de participanten de cabine mochten verlaten.
Vervolgens werden de participanten gedebrieft. Hen werd verteld dat het doel van de studie
was om meer duidelijkheid te krijgen over de structuur van het mentale lexicon. Ten slotte
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
23
werden de participanten bedankt voor hun deelname. De gemiddelde duur van het experiment
was 15 minuten.
3. Resultaten
Er is getoetst of frequentieklasse, constructietype en schematype van invloed zijn op
leestijden en vertrouwdheidsoordelen. De data van vier participanten zijn geëxcludeerd omdat
zij geen gebruik hebben gemaakt van de gehele schaal om vertrouwdheidsoordelen toe te
kennen aan de stimuli. Deze participanten kenden bijvoorbeeld alleen de cijfers 1 tot en met 3
toe aan de stimuli. De data van nog twee participanten zijn geëxcludeerd omdat zij hetzelfde
vertrouwdheidsoordeel toekenden aan alle stimuli in de ‘als-dan’-constructie. Van deze
participanten was het gemiddelde voor deze constructie 1.00 (SD = .00). In totaal zijn de data
van 59 participanten gebruikt voor analyse. De data zijn in een binnenproefpersoonsanalyse
geanalyseerd (Repeated Measures ANOVA).
Tabel 5
Gemiddelde leestijden (ms) en vertrouwdheidsoordelen (op een schaal van 1-7) van hoe-hoe
constructies als functie van frequentie (hoog/laag).
Leestijd Vertrouwdheidsoordeel
Hoe-hoe hoogfrequent 1818 (SD = 87.27) 4.84 (SD = .11)
Hoe-hoe laagfrequent 1816 (SD = 78.84) 4.01 (SD = .13)
Ten eerste is onderzocht of de controlemaat frequentie de verwachte invloed had op de
leestijden en vertrouwdheidsoordelen binnen ‘hoe-hoe’-constructies. De gemiddelde
leestijden en vertrouwdheidsoordelen staan weergegeven in Tabel 5. ‘Als-dan’-constructies
zijn voor deze analyse buiten beschouwing gelaten omdat deze verzonnen zijn en ze geen
frequentie in het dagelijks taalgebruik hebben. Er was geen effect van frequentie op
leestijden: (F(1, 58) =.002, p =.966). Daarmee is Hypothese 1a niet bevestigd. Er was echter
wel een effect van frequentie op vertrouwdheidsoordelen: (F(1, 58) =137.806, p <.001, ɳ²
=.704). Hoogfrequente constructies werden niet significant sneller gelezen, maar wel als
vertrouwder beoordeeld dan laagfrequente constructies. Hiermee is Hypothese 1b bevestigd.
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
24
Tabel 6
Gemiddelde leestijden (ms) en vertrouwdheidsoordelen (op een schaal van 1-7) van hoe-hoe
constructies als functie van constructie (hoe-hoe/als-dan).
Leestijd Vertrouwdheidsoordeel
Hoe-hoe 1817 (SD = 80.40) 4.42 (SD = .12)
Als-dan 1825 (SD = 85.81) 2.73 (SD = .10)
De tweede hypothese voorspelde een effect van constructietype. De gemiddelde leestijden en
vertrouwdheidsoordelen zijn weergegeven in Tabel 6. Enerzijds werd er een hoofdeffect van
constructietype op leestijd voorspeld (Hypothese 2a). Dit effect werd niet gevonden: (F(1, 58)
=.041, p =.840). Anderzijds werd er een effect van constructietype op
vertrouwdheidsoordelen voorspeld (Hypothese 2b). Hier toonde de Repeated Measures
ANOVA wel een significant effect (F(1,58) =139.046, p <.001, ɳ² =.706). ‘Hoe-hoe’-
constructies werden niet significant sneller gelezen dan de ‘als-dan’-constructies, maar wel
significant als vertrouwder beoordeeld.
Tabel 7
Gemiddelde leestijden (ms) en vertrouwdheidsoordelen (op een schaal van 1-7) van hoe-hoe
constructies als functie van schema (hoe X-er hoe Y-er / hoe X-er hoe beter / hoe langer hoe
Y-er).
Leestijd Vertrouwdheidsoordeel
Hoe X-er hoe Y-er 1911 (SD = 92.03) 3.34 (SD = .10)
Hoe X-er hoe beter 1729 (SD = 75.01) 4.19 (SD = .08)
Hoe langer hoe Y-er 1822 (SD = 81.33) 3.21 (SD = .11)
Ook is onderzocht of schematype effect had op de leestijden en de vertrouwdheidsoordelen
van participanten. De gemiddelde leestijden en vertrouwdheidsoordelen staan weergegeven in
Tabel 7. Er was een effect van schematype op leestijden: (F(1,58)= 8.059, p = .006, ɳ² =.122).
De participanten lazen expressies in een ‘hoe X-er hoe beter’-schema significant sneller dan
expressies in een ‘hoe X-er hoe Y-er’ of een ‘hoe langer hoe Y-er’-schema. Dit effect is
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
25
gevisualiseerd in Figuur 2. Er was geen effect van schematype op vertrouwdheidsoordelen:
(F(1,58)= 2.386, p = .128). Constructies in een ‘hoe X-er hoe beter’-schema leken echter wel
door participanten met hogere vertrouwdheidsoordelen beoordeeld te worden dan constructies
in een ‘hoe langer hoe Y-er’ of ‘hoe X-er hoe Y-er’-schema. Dit is gevisualiseerd in Figuur 3.
Om deze reden zijn de gemiddelde vertrouwdheidsoordelen van de schema’s afzonderlijk
getoetst. Er was een effect tussen ‘hoe X-er hoe beter’ en ‘hoe X-er hoe Y-er’: (F(1,58)=
100.554, p < .001, ɳ² =.634). Er was ook een effect wanneer ‘hoe X-er hoe beter’ en ‘hoe
langer hoe Y-er’ werden vergeleken: (F(1,58)= 146.156, p < .001, ɳ² =.716). Er was echter
geen effect wanneer ‘hoe X-er hoe Y-er’ en ‘hoe langer hoe Y-er’ met elkaar werden
vergeleken (F(1,58)= 2.386, p = .128). Zinnen in een ‘hoe X-er hoe beter’-schema werden
significant hoger beoordeeld dan zinnen in een ‘hoe X-er hoe Y-er’- of een ‘hoe langer hoe Y-
er’-schema. Tussen de schema’s ‘hoe X-er hoe Y-er’ en ‘hoe langer hoe Y-er’ was er geen
significant verschil tussen vertrouwdheidsoordelen.
Figuur 2: Gemiddelde leestijden (ms) Figuur 3: Gemiddelde vertrouwdheidsoor-
per constructie als functie van schema. delen op een schaal van 1-7 (1=laag,
7=hoog) per constructie als functie van
schema.
Tabel 8
Gemiddelde leestijden (ms) en vertrouwdheidsoordelen (op een schaal van 1-7) van
laagfrequente hoe-hoe constructies als functie van schema (X-er, Y-er / X-er, beter / langer,
Y-er).
Constructie Schema Leestijd Vertrouwdheidsoordeel
Hoe-hoe X, Y 1904 (SD = 115.13) 4.02 (SD = .15)
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
26
X, beter 1930 (SD = 120.33) 2.68 (SD = .14)
Langer, Y 1737 (SD = 88.71) 4.54 (SD = .16)
Als-dan X, Y 1930 (SD = 120.33) 2.68 (SD = .14)
X, beter 1806 (SD = 87.70) 3.46 (SD = .16)
Langer, Y 1822 (SD = 94.95) 2.39 (SD = .11)
Ten slotte is er onderzocht of er een verschil is in leestijden en vertrouwdheidsoordelen tussen
laagfrequente ‘hoe-hoe’-constructies en ‘als-dan’-constructies per schema. ‘Hoe-hoe’- en ‘als-
dan’-equivalenten zijn per schema met elkaar vergeleken. Voor deze analyse zijn ‘als-dan’-
equivalenten van laagfrequente ‘hoe-hoe’-constructies tevens laagfrequent genoemd. De
gemiddelde leestijden en vertrouwdheidsoordelen staan weergegeven in Tabel 8. Er was geen
effect van constructie op leestijden in een ‘X, Y’-schema (F(2,116)= .064, p = .801) maar wel
van constructie op vertrouwdheidsoordelen (F(1,58)= 61.636, p < .001, ɳ² =.515). Voor het
schema ‘X-er, beter’ was er zowel een effect van constructie op leestijden (F(1,58)= 4.791, p
= .033, ɳ² =.076) als een effect op vertrouwdheidsoordelen (F(1,58)= 71.195, p < .001, ɳ²
=.551). Voor het schema ‘langer, Y-er’ was er geen effect op leestijden (F(1,58)= .048, p =
.827) maar wel op vertrouwdheidsoordelen (F(1,58)= 55.225, p < .001, ɳ² =.488).
Laagfrequente ‘hoe X-er hoe beter’-constructies werden sneller gelezen dan hun ‘als-dan’-
equivalenten, maar ‘hoe X-er hoe Y-er’ en ‘hoe langer hoe Y-er’ werden niet significant
sneller gelezen dan equivalente ‘als X-er dan Y-er’ en ‘als langer dan Y-er’-constructies.
Laagfrequente ‘hoe-hoe’-constructies in alle schema’s werden wel significant als vertrouwder
beoordeeld dan hun ‘als-dan’-equivalenten.
De interactie tussen schema en constructie in laagfrequente expressies was op het
gebied van leestijden niet significant (F(1,58)= .007, p = .934). Het interactie-effect op
vertrouwdheidsoordelen was tevens niet significant, maar er is wel een trend te zien (F(1,58)=
3.237, p = .077). Dit is gevisualiseerd in Figuur 4. Laagfrequente expressies werden in een
‘hoe-hoe’-constructie niet significant sneller gelezen dan de ‘als-dan’-constructies in dit
schema, waardoor Hypothese 4a niet is bevestigd. De laagfrequente expressies in een ‘hoe-
hoe’-constructie leken wel hoger beoordeeld te worden dan equivalente expressies in een ‘als-
dan’-constructie, waardoor Hypothese 4b deels is bevestigd.
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
27
Figuur 4: Gemiddelde vertrouwdheidsoordelen op een schaal van 1-7 (1=laag, 7=hoog) voor
laagfrequente constructies als functie van schema en constructietype.
4. Conclusie
In dit onderzoek is het effect van frequentieklasse, constructietype en schematype op
leestijden en vertrouwdheidsoordelen onderzocht om zo een bijdrage te kunnen leveren aan de
productiviteit versus lexicalisatie-discussie. De onderzoeksvraag was als volgt:
Bevordert het gebruik van (deels) schematische constructies de leessnelheid en verhoogt het
gebruik van (deels) schematische constructies het gemiddelde vertrouwdheidsoordeel dat aan
een constructie wordt toegekend door participanten?
Frequentie werd als controlemaat meegenomen in het onderzoek. Hypothese 1
voorspelde een effect van frequentie op leestijd en vertrouwdheidsoordelen. Expressies met
een hoge frequentie werden niet significant sneller gelezen, maar wel als vertrouwder
beoordeeld. Zoals gesteld in paragraaf 1.2.1 worden vormen met een hoge individuele token-
frequentie vaker als geheel aangeleerd in plaats van dat men deze moet ‘ontleden’. Het is
aannemelijk dat dit ook geldt voor het opslaan van expressies in lexicaal geheugen. Gezien
het feit dat constructies met een hoge frequentie in deze studie als vertrouwder werden
beoordeeld dan constructies in eenzelfde schema met een lage frequentie, is het aannemelijk
dat frequentie een predictor is van of een constructie in zijn geheel wordt opgeslagen in
lexicaal geheugen of niet. In de Discussie zal dieper worden ingegaan op de afwezigheid van
een effect van frequentie op leestijden en worden er mogelijke verklaringen besproken.
De twee constructietypes ‘hoe-hoe’ en ‘als-dan’ zijn in dit onderzoek met elkaar
vergeleken. Constructietype bleek geen effect te hebben op leestijd maar wel op
vertrouwdheidsoordelen. Participanten beoordeelden expressies in een ‘hoe-hoe’ constructie
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
28
significant als vertrouwder dan vergelijkbare expressies in een ‘als-dan’-constructie.
Constructies die frequent in Nederlands taalgebruik voorkomen en daardoor als schematisch
kunnen worden gezien ontvingen van participanten hogere vertrouwdheidsoordelen dan
vergelijkbare expressies in een niet-schematische constructie.
Hypothese 3 veronderstelde een effect van schematype op leestijden en
vertrouwdheidsoordelen. Volgens Langacker (1988) kunnen schema’s in meer of mindere
mate gefixeerd zijn. Dit blijkt uit het corpusonderzoek ook te gelden voor de ‘hoe X-er hoe Y-
er’-constructie. Naast het schema ‘hoe X-er hoe Y-er’, die twee open posities heeft, is
gebleken dat de schema’s ‘hoe langer hoe Y-er’ en ‘hoe X-er hoe beter’ ook frequent
voorkomen in dagelijks taalgebruik. Deze twee schema’s hebben beide slechts één open
positie en zijn daardoor meer gefixeerd dan het algemene patroon met twee open posities. Op
basis van de data-analyse kan geconcludeerd worden dat leestijden lager zijn bij het ‘hoe X-er
hoe beter’-schema dan bij het ‘hoe X-er hoe Y-er’- en ‘hoe langer hoe Y-er’-schema.
Expressies worden significant hoger als vertrouwd beoordeeld wanneer ze in een ‘hoe X-er
hoe beter’-schema worden aangeboden dan in een ‘hoe X-er hoe Y-er’- of ‘hoe langer hoe Y-
er’-schema. Dit zou erop kunnen wijzen dat het ‘hoe X-er hoe beter’-schema het meest
gelexicaliseerd is. Hierop wordt in de Discussie verder ingegaan.
Laagfrequente ‘hoe-hoe’-constructies werden vergeleken met hun ‘als-dan’-
equivalenten. Er werd geen effect op leestijden gevonden, maar wel een effect op
vertrouwdheidsoordelen. Deels schematische constructies worden als vertrouwder beoordeeld
dan niet schematische constructies. Dit effect tussen laagfrequente ‘hoe-hoe’- en ‘als-dan’-
constructies zou kunnen betekenen dat gedeeltelijke schema’s als zodanig in het lexicale
geheugen zijn opgeslagen.
Kortom: het gebruik van een (deels) schematische uitdrukking kan leestijd verlagen,
afhankelijk van welk deels gefixeerd schema er wordt gebruikt. Het ‘hoe X-er hoe beter’-
schema lijkt als geheel te zijn opgeslagen in lexicaal geheugen. Op basis van de resultaten van
deze studie is het aannemelijk dat gedeeltelijke schema’s als geheel worden opgeslagen in
lexicaal geheugen. Over deze conclusie wordt in de Discussie verder gediscussieerd.
5. Discussie
De controlemaat frequentie heeft in dit onderzoek niet het verwachte effect gehad op
leestijden. Hoogfrequente constructies werden even snel gelezen als laagfrequente
constructies. Dit kan verschillende oorzaken hebben. Het is mogelijk dat de aard van de taak
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
29
een eventueel effect van frequentie op leestijden heeft gemaskeerd, bijvoorbeeld doordat
participanten tijdens het lezen van de expressies hun vertrouwdheidsoordelen al hebben
bepaald waardoor in de leestijden ook de tijd die men nodig had om tot een
vertrouwdheidsoordeel te komen is meegenomen. In een eventuele vervolgstudie zou dit
voorkomen kunnen worden door eerst alle expressies één voor één aan te bieden en
vervolgens middels een aparte taak de vertrouwdheidsoordelen te meten, zodat het zeker is
dat alleen de tijd die participanten nodig hebben om de zin te lezen wordt gemeten.
Dit zou echter niet verklaren waarom er voor het schema ‘hoe X-er hoe beter’ wel een
effect op leestijd is gevonden. Hoe meer een expressie gefixeerd is, hoe lager de druk op
verwerkingscapaciteit. Dit zorgt voor een snellere verwerking van gefixeerde en schematische
expressies (Smits, 2004). Deze verklaring zou aannemelijk zijn als voor beide gefixeerde
schema’s, ‘hoe X-er hoe beter’ en ‘hoe langer hoe Y-er’, een effect op leestijd gevonden zou
zijn. Dat is echter niet het geval. Er is geen effect van leestijd op het schema ‘hoe langer hoe
Y-er’ gevonden. Dit zou kunnen komen doordat de token-frequentie van de hoogfrequente
constructies in een ‘hoe langer hoe Y-er’-schema die voor deze scriptie zijn gebruikt 1017 is,
tegenover een token-frequentie van 129 in het ‘hoe X-er hoe beter’-schema. Baayen en Lieber
(1991) stellen dat type-frequentie bevorderlijk is voor de productiviteit van een bepaalde
taalvorm, en dat token-frequentie schadelijk is voor de productiviteit. Dit kan komen doordat
het aantal gebruiksmogelijkheden afneemt naarmate een gelexicaliseerde eenheid specifieker
wordt. Dit zou kunnen verklaren waarom gelexicaliseerde expressies minder lexicale
connecties hebben en zij om deze reden ook geen snellere leestijden teweegbrengen. Het
schema ‘hoe X-er hoe beter’, dat een hoge type-frequentie heeft, is productiever, wat een
verklaring zou kunnen zijn voor de lagere leestijden.
Er kan uit dit onderzoek wel geconcludeerd worden dat deels schematische
uitdrukkingen als vertrouwder worden beoordeeld dan niet-schematische uitdrukkingen.
‘Hoe-hoe’-constructies worden als vertrouwder beoordeeld dan ‘als-dan’-constructies. Een
verklaring voor deze bevinding is dat schematische uitdrukkingen vanwege hun hogere type-
en/of token-frequentie vaak worden gebruikt, waardoor ze vertrouwd aanvoelen.
Voor dit onderzoek zijn ‘hoe-hoe’-expressies die middels corpusonderzoek zijn
verzameld vergeleken met zelfverzonnen ‘als-dan’-expressies. Wellicht dat het gebruik van
deze niet-bestaande expressies de resultaten van het onderzoek heeft beïnvloed. ‘Als-dan’-
constructies zijn ongebruikelijk in natuurlijk taalgebruik. Er zijn alternatieven denkbaar
waarmee de ‘hoe-hoe’-constructie vergeleken kan worden, bijvoorbeeld constructies met
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
30
visuele eigenschappen zoals ‘groter = leuker’ of ‘groter → leuker’. De leestijden van de
woorden die worden ingevuld op de X- en Y-posities, in dit geval groter en leuker, zouden
kunnen worden gemeten middels oogbewegingsregistratieonderzoek. Op deze manier kan
opnieuw worden onderzocht of het gebruik van deels schematische expressies vergeleken met
niet-schematische expressies leestijden verlaagt. Uiteraard kan ook worden onderzocht of
deels schematische expressies wederom hogere vertrouwdheidsoordelen veroorzaken.
Door het uitgevoerde experiment kan worden geconcludeerd dat het gebruik van een
deels schematische constructie leessnelheid kan bevorderen wanneer de type-frequentie van
een schema hoog is en de token-frequentie laag. Het gebruik van deels schematische
expressies verhoogt de mate waarin participanten constructies vertrouwd vinden. Gefixeerde
expressies zijn dus als eenheden opgeslagen in het lexicaal geheugen, wat vertrouwdheid
verhoogt en leessnelheid kan verlagen. Constructies die niet schematisch zijn en dus als het
ware ‘ontleed’ moeten worden zijn niet zo vertrouwd en kosten meer tijd om te lezen dan
schematische uitdrukkingen. Wat als duidelijkste resultaat uit deze studie naar voren komt is:
hoe gelexicaliseerder hoe vertrouwder!
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
31
Referenties
Baayen, H., & Lieber, R. (1991). Productivity and English derivation: A corpus-based
study. Linguistics, 29(5), 801-844.
Backus, A., & Mos, M. (2011). Islands of (im)productivity in corpus data and acceptability
judgments. Converging evidence: Methodological and theoretical issues for linguistic
research, 165-195.
Bybee, J. (1995). Regular morphology and the lexicon. Language and Cognitive
Processes, 10(5), 425-455.
Cappelle, B. (2011). The the… the… construction: Meaning and Readings. Journal of
Pragmatics, 43(1), 99-117.
Dabrowska, E. 2004. Rules or schemas? Evidence from Polish. Language and Cognitive
Processes, 19, 225-271.
Erman, B., & Warren, B. (2000). The idiom principle and the open choice principle. Text-
Interdisciplinary Journal for the Study of Discourse, 20(1), 29-62.
Hoffmann, T., Horsch, J., & Brunner, T. (2019). The more data, the better: A usage-based
account of the English comparative correlative construction. Cognitive
Linguistics, 30(1), 1-36.
Jackendoff, R., & Jackendoff, R. S. (2002). Foundations of language: Brain, meaning,
grammar, evolution. Oxford University Press, USA.
Langacker, R. (1988). A Usage-Based Model. In: B. Rudzka-Ostyn (Eds.). Topics in
Cognitive Linguistics, 127-161. Amsterdam: John Benjamins.
Levelt, W.J.M. (1999). Producing spoken language: A blueprint of the speaker. In C.M.
Brown, & P. Hagoort (Eds.), The Neurocognition of Language (83-121). Oxford:
Oxford University Press.
Schilperoord, J., & Cozijn, R. (2010). The representation and processing of fixed and
compositional expressions. In M. Everaert, T. Lentz, H. de Mulder, Ø. Nilsen, & A.
Zondervan (Eds.), The linguistics enterprise: From knowledge of language to
knowledge in linguistics, 291-314. Amsterdam: John Benjamins.
Smits, M. (2004). De verwerking van geprefabriceerde uitdrukkingen in tekst: Een
oogbewegingsexperiment. Scriptie, Universiteit van Tilburg. Ontleend aan
http://arno. uvt. nl/show. cgi.
Sprenger, S. A. (2003). Fixed expressions and the production of idioms. Doctorale dissertatie,
Radboud University Nijmegen.
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
32
Wray, A. & Perkins, M. (2000). The functions of formulaic language: An integrated model.
Language & Communication, 20, 1-28.
Hoe gelexicaliseerder hoe vertrouwder? Masterscriptie
33
Appendix A
Letterlijke instructies die participanten kregen alvorens het experiment.
Beste participant,
Je gaat deelnemen aan een leesexperiment. Het is hiervoor belangrijk dat je de instructies
GOED doorleest! Wanneer je iets niet begrijpt, vraag het dan aan de proefleider.
Er wordt van je gevraagd om 60 korte uitdrukkingen te lezen. Het is voor dit experiment van
belang dat je de zinnen zo goed mogelijk probeert te begrijpen. Wanneer je een uitdrukking
gelezen hebt, druk dan zo snel mogelijk op de spatiebalk.
Nadat je op de spatiebalk hebt gedrukt, zal je worden gevraagd om op een schaal van 1 tot 7
aan te geven hoe vertrouwd de uitdrukking aanvoelt. Met vertrouwdheid wordt bedoeld de
mate waarin de zin in het dagelijks taalgebruik gebruikt zou kunnen worden of voor zou
kunnen komen.
Je kan je oordeel geven door de toetsen 1 tot en met 7 op je toetsenbord te gebruiken: 1
betekent helemaal niet vertrouwd en 7 betekent heel erg vertrouwd met de uitdrukking. Denk
niet te lang over dit oordeel na, maar geef je eerste indruk.
DRUK NU OP SPATIEBALK VOOR VERDERE INSTRUCTIES
Elke uitdrukking wordt voorafgegaan door een scherm met een ‘+’-teken. Dit teken verdwijnt
automatisch na enkele seconden. Daarna verschijnt er een uitdrukking. Lees te uitdrukking
snel en goed en als je hem begrepen hebt, druk je op de spatiebalk. Dan verdwijnt de
uitdrukking en verschijnt het scherm waarop je op een schaal van 1 tot 7 kunt aangeven hoe
vertrouwd je met de uitdrukking bent. Als je een oordeel hebt gegeven, verschijnt weer het
scherm met een ‘+’-teken.
Is dit duidelijk? Heb je hierover vragen?
Er volgt nu eerst een oefenblok. Dan kun je de procedure oefenen.
Ik blijf erbij staan.
WACHT OP EEN TEKEN VAN DE PROEFLEIDER