What gramma8cal morphemes tell us about

Transkript

What gramma8cal morphemes tell us about
 What gramma)cal morphemes tell us about discourse: A key“morph” analysis of Czech presiden)al speeches Masako U. Fidler (Brown University, USA) in Prague, Czech Republic) Václav Cvrček (Charles University upon Tyne, UK ICLC-­‐13, Newcastle July 21, 2015 Overview Ini)al hypothesis: gramma)cal morphemes inform us about discourse style. Method: a corpus-­‐driven key“morph” analysis of Czech presiden)al speeches (1975-­‐present) Exposure to language and what it does… •  Frequent exposure to linguis)c forms ! entrenchment (Usage-­‐based grammar) (Bybee 1985: 117). •  “Mental Corpus” (Taylor 2014) –  A possible view that a speaker implicitly knows the rela)ve frequencies of linguis)c units. •  “No)cing hypothesis” (Schmidt 1990, 2010) –  Benefits of speaker's explicitly contras)ng his/her familiar linguis)c paferns and the new language input ! befer language learning ! Interac)on between what the speaker knows about language and the new input -­‐-­‐ how does this help us capture individual discourse style? Approach and method •  A corpus linguis)c method of TgC keyword analysis with Difference Index (DIN) (Cvrček and Fidler 2013) •  Number of words (measuring the surprisal degrees of –  Husák, Gustáv 27 374 the addressee) –  Havel, Václav 47 853 •  Corpora –  Klaus, Václav 26 650 –  Reference Corpus (RefC): SYN2010 –  Zeman, Miloš 5 086 A balanced corpus of 100 million from wrifen language primarily from 2005-­‐2010. A model (idealized) na)ve speaker of the 21st century. 2005–2010 . –  Target Corpora (TgC) from corpus Speeches Includes the Presiden)al speeches by four Czechoslovak/Czech presidents (Husák, Havel, Klaus, and Zeman), tagged, lemma)zed, 248,839 posi)ons Number of speeches –  Husák, Gustáv
–  Havel, Václav
–  Klaus, Václav
–  Zeman, Miloš
17 25 21 4 Havel
zastupitelských
odpovědně
vstupujeme
mírového
jistot
vykonali
rozkvět
mírových
demokratických
solidaritu
soužití
národy
zájmům
sborů
národů
hospodářského
společenství
úspěchů
přátelé
československa
společenského
spravedlivé
hospodářství
prospěchu
příznivé
společenských
společenský
nadcházející
zárukou
rozvíjet
politika
ekonomiku
politického
hospodářský
republika
občany
odpovědnosti
milióny
čelitvůle
smyslem
politiku
politická
lidstvo
politice
mír
národních
hospodářské
stručně
úspěšně
ovzduší
politickou
zájmů
společné
úsilí
dobré
společný
svobodu
zájmu
rostoucí
cílů
svobody
rozvoj
státy
budoucnosti
přesvědčen
zájmy
řešitvíme
životě
cíle
života
ekonomické
společnosti
chceme
nového
význam
žít
mnoho
světě
státní
především
nové
znovu
lidí
Husak
•  Can be informa)ve w.r.t. 0
přičiňme
soudružky
pětiletky
osvobozenecký
zamýšlíme
bratrskými
pětiletce
energičtěji
pokrokovým
pozdravuji
bratrských
střízlivým
kvalitněji
socialistickými
imperialistické
bratrský
upevňování
mírový
socialistických
imperialismu
přikládáme
opíráme
oceňujeme
uplynulým
pokročili
posíláme
xv
poctivou
pokrokových
kapitalistických
odzbrojení
opravňují
rozvíjelo
progresivních
prohlubování
upevnili
pracujícího
udělejme
vzestupný
pozdravy
upevňovat
optimismem
sovětským
pracujících
socialistickým
svazem
kapitalistického
nastávajícím
vykonanou
připomeneme
podporujeme
prohlubovat
pracujícím
usilujeme
všestranný
vyspělou
zabezpečování
zbrojení
rovnoprávnosti
upevnění
kolektivy
osvobozeneckého
nejspolehlivější
soudružské
bratrskému
drazí
horečného
fronty
vyspělost
tužby
sjezdem
rozkvétala
svědomitou
přispěli
vědeckotechnické
vědeckotechnického
všestranná
zdravíme
dařila
obětavé
uplynulý
xvii
spolehlivou
uplynulém
socialistického
rozdílným
činorodé
uvědomujeme
náročně
mírovému
vzkvétala
urychlení
tvořivou
překonávání
obětavou
rolníkům
socialistické
soudruzi
spojenectví
příslušníkům
obětavá
tvořivá
pokroku
odvrácení
nestraníků
lidu
domovům
všestranného
poctivé
pracovištích
ústředního
uskutečňování
přejeme
mírovou
socialistická
výborů
zasedáních
opravňuje
osvobozování
kolektivů
dělníkům
zmařit
překonávat
sjezd
vykořisťování
zřízením
sjezdu
uvolňování
národností
uspokojování
všestranné
generacím
národně
angažovanost
vlasti
odhodláni
tvořivé
pozvednout
přestavbě
přestavby
klademe
uplynulého
mírové
úsecích
xiv
bratrské
uskutečňovat
důvěrou
rozvoji
úkoly
vážíme
hodnotíme
zabezpečit
plodem
ksss
upřímné
rozvíjela
vážené
nadcházejícím
komunistické
dosažené
efektivněji
jednoty
spokojenosti
zlepšovat
výhodnou
zdokonalovat
varšavské
pozitivních
xvi
konstruktivní
ústavech
prohloubení
spokojenost
novoroční
obětavě
odhodláním
srdečně
hrdostí
československo
sovětskou
realisticky
dějinné
hrozby
pohodu
školských
historickými
zlepšování
vlast
rozvoje
připomněli
rolníků
rozkvětu
zdravím
důsledné
slováků
revolučních
sovětského
maloobchodních
efektivnosti
socialismu
kontinentě
překonání
továrnách
inteligenci
československá
zeměmi
krizových
úkolů
mládeži
socialistickou
socialistický
soudruha
mírová
podnětem
československý
kázně
prožili
považujeme
lid
nedostatků
přispívat
československého
náročných
efektivnost
výboru
dělnické
stavbách
kriticky
vlastenectví
hospodařit
úspěchy
společenským
jistoty
splnění
přesvědčeni
společným
armádou
vyvrcholení
šťastného
zřízení
styků
respektování
silám
dynamiku
dosáhli
hmotné
hrdosti
nemálo
složitost
pracující
širokých
odvětvích
překážek
stranických
důsledně
uspokojením
osobním
ksč
ozbrojených
těžkosti
výsledcích
úseků
záměry
československé
hranicemi
výsledkům
perspektivy
nedostatky
odstraňovat
uplynulých
aktivně
potvrdily
uvítali
přáním
politickém
iniciativy
přátelům
pramení
vědeckých
pevným
samozřejmé
vyžadovat
usilovat
důvěry
splnili
příznivý
složitých
základnou
plnění
míru
vyjádřili
jednota
spojenci
odkazu
nezávislosti
upřímně
konfrontace
věříme
společenském
rodinném
svazu
přátelství
výročí
sovětských
dopravě
reakční
hrdí
potřebám
jménem
závěrů
díváme
pracovišti
pokrok
vzpomínat
úspěšného
materiální
životních
přátele
vůlí
vrstev
styky
vašim
jaderných
stupních
vítěznou
mezinárodních
odhodlání
spolupráce
úrovně
podíleli
mechanismu
zasedání
inteligence
prostá
naléhavé
sovětský
závěry
rozloučili
složitou
rozvojem
důstojně
prosazování
výstavbě
společenské
blaho
národní
dělníků
revoluční
budování
udrželi
dialogu
zhodnotil
významných
reálné
zásobování
osvobození
podmínkách
tvůrčí
stavebnictví
zvyšování
sovětském
náročnost
nejvyšších
měny
socialismus
hovoříme
povstání
předpoklady
orgánů
náročné
výsledků
potřeb
trvalý
trvalého
spojeno
výsledky
katastrofy
úsilím
mezinárodním
vývojem
složitá
vztazích
zlepšení
válečného
ústřední
spotřeby
plní
surovin
lidstva
silami
vyžadují
organizací
potvrzují
právem
sociálně
bezpečnosti
vědě
nezbytná
zásluhou
zajistili
prošli
počest
šesté
úspěšný
důvěra
zemědělství
slovenského
výbor
podílí
návrhy
rovnosti
tendence
výstavby
spokojený
zkušenostmi
členských
jaderné
základnu
delegace
komunistů
existující
pevnou
jednotlivců
sil
správě
mezinárodní
vstupu
zdůraznit
prahu
zdravotnických
obav
zásad
etapy
států
ekonomice
úroveň
dobrých
letošním
příslušníků
naléhavě
zvyšovat
důraz
společná
zajištění
otevřeně
dnešním
bojují
vítězstvím
jdeme
prací
úseky
významné
stranické
úlohy
zničení
desetiletí
připomínat
přínos
aktivita
zahraničního
vědy
minulém
službách
složek
kupředu
válečné
slabá
vzájemně
pohodě
ženám
současných
zdrojem
ekonomických
kultuře
šťastný
strany
plně
mezinárodního
životní
oblastech
minulého
napětí
osmé
dalšímu
sociálních
uplatnění
zápasu
vysoce
tříd
plnou
československu
vývoj
vývoje
cen
realizovat
čechů
plánu
dalšího
obyvatelstva
síly
revoluce
zachování
páté
průmyslu
podporuje
vnitřních
státních
vývoji
nadále
závodů
příštích
říci
zásady
správnou
růstu
spolupráci
vzájemné
podrobně
výroby
otázek
národního
ukazují
školství
přáteli
dalšími
základy
překonat
účasti
práci
nároky
loňském
lidové
realizaci
zápase
postupu
zabezpečení
odstranění
povinnosti
vztahů
bezpečnost
základem
rychleji
orgány
podporu
mládeže
boje
pracovat
konat
zdravotnictví
užívání
kulturních
zbraní
události
práce
celkově
dále
nových
důsledky
vztahy
sociálního
zvýšení
pracovní
stupňů
zápas
lépe
podmínky
závisí
věnovat
celém
podstatně
můžeme
opatření
vytvoření
pozitivní
postavení
celého
dosáhnout
generace
dobrou
kulturní
rozhodující
potřebné
široké
cestou
kvalitu
novém
dalším
sociální
zemích
dalších
udržet
pokračovat
zkušenosti
všude
program
procesu
miliónů
přání
potřeby
vlády
správné
postup
roce
růst
vysokou
krok
evropě
zvláště
obchodu
možností
cesta
cestu
ostatních
pozornost
chci
řešení
hlavním
smlouvy
velkou
poděkovatpokračoval
cílem
současně
vítězství
srdce
člověka
rovněž
celé
lepší
období
řízení
splnit
další
PC2
–  Discourse agendas –  Topics −50
•  Disadvantage roku
štěstízejména
zemí
problémy
pevné
radost
krize
problémů
ekonomického
zdraví
pozdravil
přispět
spolutvoří
přerozdělovacích
dřímaly
spoluodpovědnos
nedobrých
mocnějších
provázeny
raduji
standardnost
turbulencemi
zapomínali
proměňující
desítiletích
přelomový
parlamenty
soudobý
provázena
svobodám
sebelepší
spoluobčanům
hlásíme
desítiletí
vyzývám
rozmáhá
občanech
tvořivě
sdružování
státnosti
obstáli
sjednocování
staneme
iniciativní
vzkvétá
kriminalitě
lide
obracím
nepoměrně
severoatlantické
kultivovat
civilizačních
mravního
prohloubit
občanskou
demokratickým
solidarity
právům
snášeli
probouzet
občanovi
nalézat
zmíním
cílech
nabyté
demokratický
národům
mravním
identitě
zdědili
projevům
nervozity
ocitáme
demokratického
bližním
zklamáni
pokora
zvolíme
věznicích
onak
veskrze
pociťují
federaci
všestranně
vskutku
pečují
bezpočet
hospodářským
úcta
uzavřeme
rozmanitých
obecným
liberalizace
vpravdě
nadcházejících
slušnosti
žádám
staletích
transformaci
posilovat
ztraceno
bližní
bytostně
obklopuje
pravidlům
nadhled
poměrech
zdůrazňovat
tvořivosti
nedůvěry
slováky
svobodného
aliance
spravedlivě
dovolíte
mravní
systematicky
privatizace
poměrů
občanském
mocných
samých
trvalým
šťasten
chápali
radostné
nevyhnutelné
vzájemného
idea
lokálních
veřejném
solidarita
urychleně
nadhledem
zjišťujeme
vyvodit
hledáme
demokratické
ústava
obecných
svobodně
založenou
politikům
parlament
občanské
účastnit
výzvou
chybné
východiskem
umíme
demokracií
občanská
rasismu
totalitní
tržní
natrvalo
ideu
vlastníky
respektu
neobejde
slováci
právního
lidským
jevit
republikou
brzké
každodenním
zajisté
srdcí
transformace
nenávistí
úctu
důležitých
historicky
trpělivosti
úkor
systémové
záruky
obecné
rozděluje
konfliktů
opřít
klima
trvale
úcty
důvěře
zvykli
mluvím
státem
politický
zlem
dařit
obecného
cítíme
evropskými
uvědomují
budovat
sousedy
respekt
ekologicky
kriminality
samu
lidském
ohromnou
občanský
federální
povodně
souvislostí
hodnot
považuji
masaryk
komenského
vizi
přátelské
statisíce
dobrému
příslušnosti
občana
naději
vzájemných
samostatná
justice
naslouchat
hloubku
pomáhali
společném
reformě
zdí
reforma
obecnou
standardní
zhroutil
rukách
lidského
lidskou
potenciál
komunismu
institucí
rozdělení
budoucího
pocitu
nekončí
odpovědnost
politiků
obyvateli
začneme
tvorby
ba
naděje
politicky
lepšího
navázat
poměry
vůli
občanských
ústavního
integrace
lepšímu
evropa
tvorba
rozhodovat
tisíciletí
úkolem
dějinách
vytvářet
skutečného
přijmout
neméně
občanského
žádoucí
evropu
principu
připravovat
dobrého
plnit
sebevědomí
nemáme
pořádek
kéž
civilizace
nenápadně
ústavní
dobrém
ústavy
právním
zákonů
jevy
senát
chápat
podniků
nejrůznějších
výzvu
dědictví
vracet
konkrétních
druhých
trápí
podílet
politici
vize
rodí
tvorbě
kulturu
bytí
skutečné
mnozí
novému
touhy
navzájem
pomáhají
sektoru
klimatu
atmosféře
jedince
lidský
volbách
prospěch
státě
hezký
důležitou
uznání
obzvlášť
míře
příčiny
celek
myslet
posléze
podnikání
bytosti
evropy
úkol
hluboce
prezidentem
zákony
veřejného
definitivně
důležitější
řádu
vlivu
dnešního
neznamená
oběti
mínění
řád
svoboda
budoucí
nejlépe
životem
nejsme
shromáždění
celku
odvahu
charakteru
instituce
sloužit
věcí
směr
evropských
smyslu
automaticky
osudu
životu
jiným
ducha
kdykoli
záleží
podaří
jinými
tradice
historie
násilí
osud
pevně
denně
špatné
obecně
závěr
existence
různé
ostatně
zahraniční
pochopitelně
společnost
systém
mnoha
zároveň
naopak
různých
světa
hodnoty
důležité
česká
zdá
znamená
víc
nový
systému
myslím
dělat
lidem
prostě
svět
měly
nelze
opět
dosud
daleko
jiného
stále
samozřejmě
méně
prostředí
nejen
velké
měli
sice
být
dokonce
tedy
totiž
není
jen
Zeman
by
politiky
politické
přeji
spoluobčané
životstátu
občané bych
budeme
demokracie
dobrým
země
politických
rokem
máme
musíme
jsme
občanů
vážení
občanům
jsem
jsou
dovolte
rokprezidentské
vím
chtěl
činnosti
ministr
prezident
vystoupení
zákon
negativní
dej
nebudu
členové
hodnotu
účty
nemohu
parlamentní
popřát
osobnosti
slib
vědom
rozuměl
deviace
nabízím
dnes
smysl
bychom
věci
stát
bude
lidské
věřím
reformy
změny
pokusme
nemůžeme
milí
porozumění
nemůže
ekonomiky
svobodných
nikoli
žijeme
zkusme
zemi
svobodné
schopni
sféře
nepřímo
budoucnost
důvěru
ekonomika
dnešní
volit
veřejné
voleb
členství
voliči
jedině
věcech
nesmí
evropské
vláda
republiky
právě
více
nebude
české
dětí
vědět
nejvíce
příležitost
vzniku
nebudou
týká
neměli
říkám
sněmovny
přicházejí
jistou
dnem
unie
uspořádání
přál
ukončení
nebudeme
žili
vpřed
volby
evropského
pokles
občan
vedly
parlamentu
ovlivnit
potřebujeme
loňský
životy
stabilní
vlastními
Klaus
ciziny
poslanecké
unii
vládu
dluh
ukázaly
rozhodnou
vědomím
životů
nesmíme
volbám
úspěšným
svobodnou
nezapomínejme
buďme
přejme
dělejme
zadlužování
hlasům
nenechme
važme
−100
–  Cannot be held constant across speakers (right: Cvrček and Fidler 2014) 0.5
−100
−50
0
PC1
50
0.5
0.0
0.0
−0.5
−0.5
50
What about lexical content? Gramma)cal features 1. Parts of speech Nouns-­‐Adjec)ves vs. Verbs-­‐Adverbs (cf. nominaliza)on in Fairclough 2003: 143-­‐44) 2. Inflec)onal morphemes Case , Person, Number 3. Aspect-­‐Mood 40.000 1. Parts of speech (in Difference Index (DIN)) 30.000 20.000 Nouns 10.000 Adjec)ves Verbs 0.000 Husák Havel Klaus Zeman Adverbs -­‐10.000 -­‐20.000 -­‐30.000 Noun-­‐heavy (adjec)ves as modifier, predicate nominals) Husák vs. the other three presidents 2. Verbal aspect Imperfec)ve ≈ [PROCESS], perfec)ve ≈ [THING] 10.000 5.000 0.000 -­‐5.000 Husák Havel Klaus -­‐10.000 -­‐15.000 -­‐20.000 -­‐25.000 -­‐30.000 Imperfec)ve Perfec)ve Zeman 3. Gramma)cal case (Agency: N>I>G>D>A>>L) 40.000 30.000 20.000 Nomina)ve 10.000 Instrumental Geni)ve 0.000 Husák -­‐10.000 Havel Klaus Zeman Da)ve Accusa)ve Loca)ve -­‐20.000 -­‐30.000 -­‐40.000 80.000 4. Gramma)cal person (verb forms) S1 “I” : P1 “we” : P2“you (pl)” 60.000 40.000 20.000 0.000 -­‐20.000 Husák Havel Klaus Zeman -­‐40.000 -­‐60.000 -­‐80.000 -­‐100.000 S1 P1 P2 Prominence of P1 expected for the genre: S1 is less expected 5. Mood 60.000 40.000 20.000 Condi)onal 0.000 Husák -­‐20.000 Havel Klaus Zeman Infini)ve Impera)ve Indica)ve -­‐40.000 -­‐60.000 -­‐80.000 6. Passive Par)ciples 18.000 16.000 14.000 12.000 10.000 passive par)ciple 8.000 6.000 4.000 2.000 0.000 Husák Havel Klaus Zeman Gramma)cal features suggest… Husák •  Last socialist president, boring, loyal to the USSR •  flat, ritualis)c, sta)c texts Havel •  first President awer 1989, intellectual, dissident, •  Inten)onally a “non-­‐professional”/”dissident” poli)cian (dis)nct from the previous regime), instructs indirectly, sophis)cated intellectual prose (contrast between hypothe)cal and current worlds, modal expressions in passive construc)ons) Klaus •  macro-­‐economist, Euro-­‐skep)c, an)-­‐ecology, strongly opinionated, arrogant •  top-­‐down leader, telling the audience what to do, professional poli)cian, conflates what he thinks and what the audience should think Zeman •  social-­‐democrat, “one of us”, having a big ego, “father-­‐like”; cri)cized as a “yokel”* •  populist, professional poli)cian, contact with the audience, use of a limited set of politeness expressions to assert his own self. What this all might mean to cogni)ve linguis)cs •  Morphemes are not empty: a crystalized conceptualiza)on of human cogni)on, sequen)al and summary scanning (Langacker 1987) •  Prominence levels of gramma)cal morphemes informs us of discourse style ! serve as KEYs to discourse style •  A combina4on of keymorphs informs discourse style Offshoots of this study •  Keyword analysis, which has been looking mostly at lexicon to analyze discourse, can benefit from probing into gramma)cal informa)on (thus keymorph analysis) •  Advantages of keymorph analysis based on inflected languages: gramma)cal case, person, mood, aspect, par)cipial forms References Biber, D. 1993. Using Register-­‐Diversified Corpora for General Language Studies. Computa)onal Linguis)cs. 19(2): 291-­‐241. Brown, P. and S. C. Levinson. 1987. Politeness: Some universals in language usage. Bybee, J. 1985, Morphology: A study of the rela)onbetween meaning and form. Cvrček, V. and M. Fidler 2013. Not all keywords are made equal: How can we measure keyness: Corpus Linguis)cs Conference. Lancaster UK. Cvrček, V. and M. Fidler 2014. Prezidentské projevy: Analýza téma)cké výstavy a řečových strategií pomocí Kwords [Czech presiden)al speeches: Analysis of their thema)c structures and speech strategies using Kwords]. Knference korpusové lingvis)ky. Prague, Czech Republic. Cvrček, V., P. Truneček, P. , and V. Horký. 2015. SPEECHES: korpus prezidentských projevů. Ins)tute of Czech Na)onal Corpus, Charles U. in Prague. . At hfp://www.korpus.cz Fidler, M. 2002. Rela)onal features in poli)cal language: A comparison of speeches by Havel, Clinton and Mori. Where one’s tongue rules well: Festschriw for Charles E. Townsend, ed. by L. A. Janda and S. Franks, 213-­‐28. Indiana: Slavica. Fidler, M. and V. Cvrček. forthcoming. Corpus-­‐assisted analysis of reader viewpoints: Reconstruc)ng the historical reader using keyword analysis. Journal of Slavic Linguis)cs 23 (2). Hart, Ch. 2014. 15. Discourse. E. Dabrowska and D. Divjak (eds.), Handbook of Cogni)ve Linguis)cs. 322-­‐346. Hopper P. and S. Thompson. 1980. Transi)vity in grammar and discourse. Language56(2): 251-­‐299. Janda, L. A. 2004. A metaphor in search of a source domain: the categories of Slavic aspect. Cogni)ve Linguis)cs 15(4), 471-­‐527. Langacker, R. 1987. Founda)ons of cogni)ve grammar, vol. 1: Theore)cal prerequisites. Schmidt, R. 1990. The role of consciousness I second language learning. Applied Linguis)cs, 129-­‐158. Schmidt, R. 2010. Afen)on, awareness, and individual differences in language learning. In W. M. Chan, et al. Taylor, J. 2014. The mental corpus: How language is represented in the mind. Acknowledgments •  Brown University Humani)es Research Fund •  Programme for the Development of Fields of Study at Charles University, No. P11 Czech na)onal corpus. THANK YOU! 

Podobné dokumenty

Prezidentské projevy: Analýza tématické výstavby a řečových

Prezidentské projevy: Analýza tématické výstavby a řečových Pokus o charakteristiku jednotlivých řečnických strategií

Více

od cuni.cz - Český národní korpus

od cuni.cz - Český národní korpus use a combination of statistical tests and ways of presenting data that enable salient patterns of language to be identified. Partington et al (2013: 11) argue that corpus approaches can thus help ...

Více