pdf 2,57 MB

Transkript

pdf 2,57 MB
Lucie Chlumská, Olga Richterová
Ústav Českého národního korpusu
Co všechno nám může říct korpus
*den vědy (2012)
Obsah prezentace
* O korpusech Českého národního korpusu (ČNK)
• jak se registrovat
• dostupné korpusy a jejich složení
• nové korpusové nástroje
* Pokládáme dotaz
• typy dotazu
• co lze hledat (a najít) – příklady
* Hledáme kolokace
* Srovnáváme varianty
* „Všeříkající“ ukázka kontrastivního výzkumu
5 minut
O ČNK
přístup ke korpusům ČNK
dostupné korpusy a nástroje
Co je tedy jazykový korpus?
* Vzorek jazyka
* Výhody oproti webu?
• reprezentativní – vytvořený z pečlivě vybraných textů
• neměnný (referenční) – po zveřejnění se nemění
• opatřený dalšími informacemi
• lemmatizovaný – každé slovo opatřeno slovníkovým
tvarem, podle nějž lze hledat všechny tvary (např.
psát, pes, zelený atd.)
• anotovaný – každý text opatřen informací o autorovi,
roku vydání, příp. překladateli, žánru atd.
• označkovaný – každé slovo opatřeno morfologickou
značkou (tagem), podle níž lze např. vyhledat všechna
slovesa v min. čase nebo adjektiva v superlativu
K čemu může korpus sloužit?
* Komu:
• Jazykovědcům: hl. jednojazyčné referenční korpusy
• Překladatelům: kolokace, paralelní korpusy (pro
překladové ekvivalenty – hl. neterminologické)
• Redaktorům, novinářům: SyD – průzkum variant
* Korpus je užitečný pro:
•
•
•
•
srovnávání variant (mluveného i psaného jazyka)
ověřování překladatelských řešení
zdůvodňování překladatelských řešení
vyhledání vhodného výrazu (podle koncovky, sl. druhu apod.)
Přístup ke korpusům ČNK
www.korpus.cz
* Přístup ke korpusům je pro všechny uživatele ZDARMA!
• nezbytná elektronická registrace zde:
http://korpus.cz/prohlaseni.php
• více než 3 400 aktivních registrovaných uživatelů
• přibližně 1 200 dotazů/den
* Pro technické nadšence: naše korpusy využívají
• server: Manatee (autor: Pavel Rychlý z MU Brno)
• klient: The NoSketch Engine (dříve Bonito) nebo Park (pro
paralelní korpusy)
Jak začít
* Jaký jazyk nás zajímá?
– mluvený, psaný?
– publicistiky, beletrie nebo odborné literatury?
– překladový, původní?
– současný, historický?
výběr korpusu
* Jaký jev chceme hledat?
– konkrétní tvar (bysme, anti.*, slovo rýmující se s „nou“ [word=".*nou"] )
– ustálené slovní spojení/kolokaci
– informace z tagů (slovní druh, pád, čas, …)
výběr dotazu
10 – 15
minut
Výběr korpusu
co všechno máme k dispozici
Synchronní psané korpusy
název
velikost popis
SYN2000
100 mil. vyvážený korpus; většina textů z let 1990–1999
SYN2005
100 mil. vyvážený korpus; většina textů z let 2000–2004
SYN2006PUB
300 mil. publicistické texty z let 1989–2004
SYN2009PUB
700 mil. publicistické texty z let 1995–2007
SYN2010
100 mil. vyvážený korpus; většina textů z let 2005–2009
SYN
1 300
mil.
•
•
•
nereferenční korpus, souhrn všech SYN korpusů
všechny korpusy lemmatizovány a morfologicky označkovány
vyvážený korpus jednou za 5 let
referenční vs. nereferenční korpusy
Synchronní psané korpusy
* Kritérium reprezentativnosti:
• recepce vs. produkce
• korpusy řady SYN založeny na recepci (tj. co se čte)
• distribuce text. typů a žánrů na základě sociologické studie z
roku 2000 – nová studie je třeba
* Korpusy SYN zahrnují originální i překladové české texty
• beletrie: především novější, ale limitem je rok vydání 1945
(autoři narození po 1880)
• publicistika: současná (za každý rok stejný objem textu)
• odborná literatura: po roce1990
Složení SYN2010
textové typy (beletrie, publicistika a odborná) a žánry
C.
OEO
THE ML ETH
LOG
THE
."
SPO LI< tIO
STA
TEC
tlF MAT CH E l.Ji
'NV
RfL
EOO
ECN
, Nf
MUS
BEL BOT
REL
."
1Vf
,CO ETH
TEC
HS
ART
UT
PH'
JU.
MAN
PH'
. UI
CF
psy
AMU
HOU
AST
••
EXC
ZOO
ML
SEC
C•
..,
"'O
"'O
TRA
JU.
AH!
MAN
SOC
HS
POL
POL
NAT
"ED
NAT
"AT
seT
'CO
sro
CO"
seznam zkratek žánrů: http://korpus.cz/bonito/n_genre2.html
..........
i~ :~: : t~:· ·· :
*den vědy (2013)
Synchronní mluvené korpusy
název
velikost
popis
ORAL2006
1 mil.
korpus neformální mluvené češtiny
ORAL2008
1 mil.
sociolingvisticky vyvážený korpus neformální mluvené
češtiny
* referenční (nemění se)
* neformální situace – konverzace v rodině nebo s přáteli
* zatím není lemmatizace, ani značkování
* plánovaný ORAL2013:
• z celé republiky (nejen z Čech)
• se zvukovou stopou pro každou promluvu
Oral2013
Hledat
Ulivatel : chlumska
Konkordance
Seznam slov
Korpus: oral2013
PopiS: SOCtolJngvlstk:ky vyválený korpus neformálnl mlwené čefitlny
vysky1ll : 14 (3.96 Lp .m.l I ARF: 9
08A03SN
08A086N
08A125N
takovej ten nezastavitelneJ proslě smith jO
(smfch)
hodinou .
KWlCJvěta
l1idén f
Vlevo I Vpravo
JSWK;
Reference
~
smith
budefi taky .. .
no jakO p rostě něco
no . to já se
~de
smk:h
vo bě
proSim tě
10H014N
smlch
takoveJten smlch takOY'ýty eee
tun si chtěl povidat teda
smk:h .. (kafiel)
a tak ..
11A010N
a p rávě . startovali ten smith
llA082N
taky bylo vidétjak držf smith jako
R iU
11A087N
Frekv. distribuce
Sloyn i tyary
llPO07N
komenta' režijn f
(smfch)
10 je samá . samej smith ~de slyšlfi jenom
10P015N
11A082N
okolo .
taky by . taky by
ted1<o jako . uplné zadržovala smlch j
dva roky malujete znova
09PO02N
Vzorek
vodboural
jo
tam
ň ákej
ň<i.kej
novém roku aj .
tlama a budu (se smlchem) chrápal
smith .
- smith
smk:h
(smICh)
hmm .
no tak sem
upozo rňovali
(smích)
kde
(smích)
Dando co
a . apak
je . takjá idu
to všechno vi broval a (citoslovce chrápánQ
lII1
lexical Computing Ltd
Sketch Engme (ver open-2331-open-2.6r lcr
Dokumenty
~
Kolokace
Popis dotazu
..........
i~~:~::}~:;····:
doufám
jako ano . hysterickY smk:h
tfi no
09A094N
09H013N
teda doufám
nevidomé
09A012N
Ulolit
Moln. zobrazeni
Výskyt{!: 14
Velikost 3532669 polk: Z
*den vědy (2013)
Diachronní korpus
název
velikost
popis
DIAKORP
2 mil.
korpus mapující sedm století vývoje češtiny (14.–20. století)
* nereferenční korpus
* transkripce, nikoli transliterace
* plánovaná lemmatizace a značkování
• především 19. století
• hyper-lemma: způsob, jak vyhledat všechny pravopisné
varianty jednoho lemmatu
Paralelní korpus
název
velikost
popis
InterCorp
ca 140 mil.
paralelní korpus zahrnující 27 evropských jazyků
* ve spolupráci s dalšími ústavy a univerzitami
* stále roste
* původně rozhraní Park, nově přístupné přes NoSketch Engine
* zarovnání na úrovni vět
* lemmatizace a značkování u těch jazyků, kde je k dispozici
* čeština jako pivot
• užitečný ne tolik pro terminologii (převaha beletrie), ale pro překladové
ekvivalenty (výzkum, překladatele atd.)
Specializované korpusy
název
velikost
popis
KSK-Dopisy
800 000
hostovaný; soukromá korespondence z let 1990–2004
SCHOLA2010 790 000
hostovaný; přepisy vyučovacích hodin
PMK
BMK
675 000
490 000
hostovaný; Pražský mluvený korpus z let 1988–1996
hostovaný; Brněnský mluvený korpus z let 1994–1999
CzeSL
2.5 mil.
Czech as Second Language; slohové práce romských
žáků, eseje cizinců, odborné kvalifikační práce
LINK
1.8 mil.
korpus akademických textů (lingvistika)
DOTKO
12 mil.
hostovaný; korpus dolnolužické srbštiny z let 1848–1933
* hostování korpusu:
• služba nabízená v rámci ČNK dalším výzkumným institucím
• finální technické zpracování dat
• poskytování veřejného přístupu a související služby
15 minut
Pokládáme dotaz
typy dotazu
frekvenční distribuce (přehled)
třídění a filtr
15 minut
Kolokace
v hlavě i v korpusu (i v malíčku)
Máte kolokace v malíčku?
Podle intuice
nepřeberný (dop l ňte SUBST)
propastný
zarytý
zapř i sáh l ý
dokořán (dop l ňte
v
VERB)
v
uprene
vstř íc
navenek
úsilí (dop l ňte ADJ a VERB)
snaha
výzva
prob lém
Podle korpusu
Kolokace v NoSketch Engine
• Nejprve si najdeme hledaný výraz, např. nepřeberný
Kolokace v NoSketch Engine
• Po zobrazení konkordancí zvolíme možnost Kolokace.
Kolokace v NoSketch Engine
• Rozsah nastavíme na -3 +3 (3 slova vlevo a 3 vpravo)
• Atribut zvolíme lemma (nechceme vidět konkrétní tvary)
• Statistické míry měnit nemusíme (třídí podle LogDice)
Kolokace v NoSketch Engine
• Výsledky se zobrazí v přehledné tabulce.
• Nás zajímá nejsilnější kolokát (podle LogDice) hledaného
slovního druhu:
kolokace: nepřeberné množství
Kolokace v NoSketch Engine
• Stejně postupujeme u všech ostatních slov.
POZOR!
• Je třeba mít na paměti, že i výsledky opřené o
statistickou míru je nutné interpretovat – někdy
statistické míry „nadržují“ méně častým slovům (dobrým
příkladem je slovo propastný)
• Velkou roli hraje i nastavení:
– hledáme kolokace na konkrétní pozici, nebo v celém okolí?
– zajímají nás nejčastější tvary, s nimiž se slovo pojí, nebo
lemmata (tj. souhrn všech tvarů konkrétního slova)?
Co nám tedy korpus ukázal?
Podle korpusu (s daným nastavením)
nepřeberný (doplňte SUBST)
propastný (!)
zarytý
zapřisáhlý
množství
nepřeberné množství
tůně
propastná tůně
odpůrce
zarytý odpůrce
nekuřák
zapřisáhlý nekuřák
dokořán
upřeně
vstříc
navenek
otevřít
otevřít dokořán
hledět
upřeně hledět
vyjít
vyjít vstříc
projevovat
projevovat navenek
(doplňte VERB)
úsilí (doplňte ADJ a VERB)
snaha
výzva
problém
vynaložený, vynaložit
vynaložené úsilí
marný, udržet
snaha udržet
opakovaný, uposlechnout
zdravotní, řešit
opakovaná výzva
zdravotní problém
10 minut
Srovnáváme varianty
Seznamte se se SyDem!
syd.korpus.cz
D.achronnf .... ...Synchronm r
UCNK
SyD::)<
Korpusový průzkum variant
SyD je určen pro všestranný pruzl(um variant jak v současném
jazyce - synchronní část, tak v prutJéhu jeho vývoje - diachronní
část. K ana~ vyuiivá data mluvenýc h a psanýc h korpusů
projektu Českého národního korpusu. Stačí zad at dvě varianty
(nebo víc ) jednoho jevu, které si vzájemně konkurují ( např. ačkoli x
ačkoliv, ut x jit, mimoto x mimo to, sama sebe x sebe sama, stále x
pořád x ruff apod.)
Vyhodnocení sloiiteiších dotazů, jej K: h.!: podotKl může využit všech
mo.!:nosti dotazovacího jazyka Cal, muže trvat i několi k desítek
sekund.
Pos~ n í
pok>iené dotazy
takhl' x takl'
Vánoc' x vánoc'
blbost x blbina (lemma)
pepa x jasel
ohánět se
SyD
• Synchronní srovnání variant stále, pořád, furt a vždy.
J>
~
Synchronnl
11 ~ ,
~
_ _ ,I: ~
_ _ rl , II .
' ~
~
,,,.,,
('o!kj,""Y', ,"
.
Ps,anýJ3Z~
.,. .
. ,,'"
MllIVe"Ý' Ju y1(
.. '"",,.,.
.
."".,,'"
....
"",
""
I,,'k,
Celkové údaje pro psaný 8 mluvený Jazyk (které můžou být vzhledem k velké
obecnosti ZkreSlujfef, viz Rozlotenl). Plesné údaje o poměrech se zobrazl po kliknuU
na libovolnou oblast grafu
ÚdsJ Nedostetocná data wočf, že součet frekvenci rlech vanan! v daném
(sUb}kOrpU5U Je man!' než 5 výskytů .
Zadllnf dotazu 8 Jeho výsledek Je ulaZen na serveru a může být znovu vyvoliln
pomoci odkazu uvedeného v zéhlavf stránky Odkaz Je možné pou1:fll pro Cltačnf
ůčety.
Mluvený jnyk
--'--
--'-- --'----
Souhrn dotazu
[1] stále
[2J porád
[3] lurt
(4( "'<ly
Slov"1tvary
Frekvence v~ slovnfch tvarú odpovfdsJfcfcn Jednothvým dotazům v korpusu
psaných textů (SYN2010) a v korpusech mluvenych textů (OraI2006 8
Ora12008)
94
Stále
STÁLE
81
..........
i~~:~::}~:;····:
*
UCNK
*den vědy (2013)
II
SyD
• Srovnání kolokací variant statečný a odvážný v SyDu.
rl , r. •
"
,
•
• ochoi!r6jijj ,
• ochoi!ttijijj '
1t1l....i"'l·
. -~ý"'l·
.
~
"
Celkové Ud8je Pf O psany a mkNeoý J8ZYk (ktefé můlou být VZhledem k veIIé obecnostl
Zkleslujlcl, VIZ R<alo!enI ) Ptesné ůcIaje o poměfedl se zobrazl po kllknUtl na Ib:lVoInou
-"","
Ůdaj Nedostat9álá data ZMfi, .te souteI frekYendvYdl vaoant v daném (sub)koq)usu
Jl!1Tl(Iffl1 ne! 5 yYskytů
laděni dotaZu a JIIhO yYsIedek JI! uIo.ten na serveru a můle být ZtlOVU vyvoIMl pomcx:.f
odkazu UV9deoého v z6h18v1 stránky Odkaz je molné PQI..ItIt i !>fO otaCnl ůčeIy
KoIok.aca, tedy uslálené souvysIcyty slov, JSOU ~Im óopI/'lkem ke kofllIIexnrmu
hodnocen( vanant V&nanly, které IIfIIIk vykaz~1 velmi podobné 1orméJn(, yYznamové I
lrelNen61f char8lenstiky, se prévě v obIasb ~ často liš{
[1] odvážn [yáié]"
chytrý", dostatečně., experiment," ''''
('2)
rozhodný", skok.,"
vize"o)
[2]
,'0)
(O,
p oč in 'l)
'" state č n ý""
(52)
,u,
(o"
""
rozhodnutí""
tvrzen í""
štěstí,!') či n,U
)
Barya fontu (otl 5'iěC1e modré, ples tmaYě motIroo a.t po červenou) je odVoZena od
koIokačnf ml'ry zn6mé,lBko dc& \IlhIedem k)8ll koostfUoIo · nabývé hodnOt mtm Oa 1 a
nenl zévtsI:A na frekvenci kolokace · J8l81fnmim dopIc\kern k MIII-score
.,
PI
(~)
rytíř"" sedm".
odvážný(,e)
1(' 21
POStOjfll1
Čista v ůVOfCe UllWdým slovem pledslavU!l absOlulnf frekvenci kolokace vefl8ll1y a
daného slova (5 t'I\8XIIll6nl vzd6leoostf cJvě j)OZIC8)
(III
srdce"" statečny",
Do S8ZI'IIWllU JIl vybfráno a.t 20 kolokaci 5 n8!VYW hodooIou MLIt-score, dále pak
( I ')
"" velmi""
..........
i~~:~::}~:;····:
Zobrazeni kolokaci, IZv lermdoud, V)'J8dh.ite něIcoIik hodnoI PQPI5UI1dctI pavnos!a
Irekvena koIokacf soueasné Velikolt fontu JIl odVoZena otl hodnoIy koIokačnl mlry
známé)8ko AM-score (Evert 2004 90) Ta JIl delVlována,ako meMl hodnota z <tvo,ce
wrných měr Ml.soore al.score I<ombIn!.te lak vYhodY obou měf, kdy MI-score
nadhodnott.te koIokac.e s celkově nlzkoo frekwncf. zaUrroJ l-SaJte neúměrně vysoce
hodnoU kolokace 5 vysokou frekVencI
statoč n[yáié] "
(U J
DIagramy LMaz\lJf ke 1W(Jé vanafIIě II'jběr z ~ koIokadv psanérnJ8ZYC8
(korpus SYN20(0) Pf) ple,ezclJ ukaZatele ~ se koIoku!/d slova (1lBC)'1t v8ll8nl8l'l1l)
zvj'razni, coll.llTlOb'lt.te,tednodtM idonIJfIkoval koIokély spoIamé oběma (resp ~)
venanlM1 pti kllknUlf na sIeNo se zobrazí néhcldný vzorek kor*ordanCnfcn t6cI«i
(Il'I8XIrl'IAIně 25) dané V8f\8rl1y a koIok\.Ijiciho lemmatu
*den vědy (2013)
kolokace, které se obf8vuIf ve dvacítce 1lIIfd~ u InYdl vel'l8nl. Mlflm6lnl
frekvence IwIokátu pfiIom musf být 81espof1 3 ..yskyIy
"
"
SyD
• Diachronní srovnání variant stále, pořád a furt v SyDu.
Zkoumán! proměn poměru variant v čase je zalo1eno na korpusu Diakon. který Je
sestaven na základě texlI~ korpusu SYN a diachronnf s lOiky Č NK lak . aby v rámci
soueasnych mo!nostl co ne;lépe pokrýval cefě obdob( existence psané Če$ tlny .
Uživatele je treba upozornit na skutetnosl. ze texty diachrOnnl sloiky éNK zalazené 00
korpusu Diakon z velké časU nebyly dosud zkorigovany, a vySledI<y vyhledávAnI
konkurence variant nelze proto povai:ovat za zcela pt'esné. i kdyŽ: už. v soueasné době
umotr'lujl zrskat vysoce spolehlivou pfedstavu o celkovém vývojI. Dlakon zahrnuje texty
od nejslar!lch pamatet\: ze 14. stOletl (nejstar!l m je Alexandleida. dalovana do roku
1310) aJ: po publiclsllku z let 1991-2009. Vzhledem k proměnám plsemné produkce .
kterými če$tina za 7 stOlet' své existence pr~la. nenf mOlné klást na takOVý" korpus
stejné po1adavky stylové a tánrové vyvAtenosti, jaké mame na korpusy če$ llny
100
80
~
60
.G;
E
o
o..
40
soocasné.
20
ÚVodnl graf prezeOluje tendence výv~ poměru variant v prOběhu tasu. Kal:dá linie
reprezentujfcf jednu variantu je obklopena stejnobarevnou oblasti. jejl! ~ Ire značl
SpoIehlivOSI naměfenych dat (čim ~ir!1 oblast. Um vě(~f možná ChybOvost vysledkU) .
... vice
O
1400
1500
1600
1700
1800
1900
- stále - porAd - tun
Klouzavy p<Omér. 1
Cela historie
..-...
st~e
14-18. stol
.!6 zobrazit
19, stOi,
1900-1989
chybu
1990-2009
AbSOIutnf frekvence v~ech slovnfch
otakon.
Sl aJe
STÁLE
..........
i~~:~::}~:;····:
*den vědy (2013)
tv,w odpOvfdajfclCh fecjl10llivym dotazOm v
kOlpusu
10 – 15
minut
Všeříkající korpus
ukázka kontrastivní korpusové studie
stýkání a potýkání češtiny a němčiny
Výzkum participiálních adjektiv
Co je fascinující a co vielsagend?
• Kategoriální přechod od sloves k adjektivům
– (i dalším sl. druhům – související s, týkající se, cestující)
– kompozitní forma vše-/nicneříkající
– v němčině totožná nichts-/vielsagend
• POZOR! Je nutné kriticky analyzovat srovnání
lexikálních jednotek mezi jazyky
– někdy přehlédneme rozdíl v sémantickém rozpětí lex. jednotek
• Výchozí sloveso
– říkat i sagen = tranzitivní, stejné syntaktické chování
Přehled participiálních forem (CS)
• SYN
Lemma
Doklady
i.p.m.
Dohromady
Adv + přechodník
takříkajíc (sozusagen)
5,539
3,5
Zvlášť
Adv + přechodník
tak říkajíc (so zu sagen)
1,864
1,2
Zvlášť / dohromady
Adv + PA
tak říkající /takříkající (so
sagend)
4/4
0
Dohromady Pron+PA
všeříkající (*allessagend)
280
0,2
Zvlášť Pron + PA
vše říkající
40
0
Dohromady Pron + PA
nicneříkající (*nichtssagend)
593
0,4
Zvlášť Pron + PA
nic neříkající
862
0,5
PA
říkající
530**
0,4
Přechodník
říkajíc/e/říkaje
20/33/79
0
Přechodník
dohromady / zvlášť
Takřka / řka / tak řka
59724/ 419/ 4
** odstraněny formy, jimž na pozici -2 až -1 předcházelo vše, všechno, málo, nic
říkající – v 328 případech následuje “říkající si” - <Světlovlasá Češka říkající si Katja Zajcek>, v 79 případech “říkající, že”
Vliv textových typů a překladovosti
textový typ
počet výskytů
i.p.m.
1. publicistika
660
0.5
2. beletrie
131
1.1
3. odborná
71
0.8
zdrojový
jazyk
počet
výskytů
i.p.m.
1. ENG
50
0.8
2. GER
22
2.6
3. RUS
4
1.4
4. FRE
2
0.4
5. POL
1
0.5
Shrnutí přehledu českých forem
• takříkajíc – hodnotí se běžně jako adverbium, potřeba
samostatné analýzy, zda deiktická fce
– větná kondenzace: „Svět mi takříkajíc ležel u nohou.“ (Chmielewska,
Joanna: Zpráva od nebožtíka)
• tak říkající – slovesně se de facto neužívá
• inkorporace pronominální složky: volnější u negovaného
výrazu (nic neříkající)
• samostatné užití formy říkající vykazuje ponechání
slovesných doplnění (zvratné zájm., vedl. věty)
• nic neříkající (psáno zvlášť) se slovesně patrně neužívá
– 0 případů na 100 vět
– častá koordinace s jinými adjektivy: „zástěrkou pro vleklé , nic
neříkající a neřešící jednání vládní komise“ (LN 1992)
Přehled participiálních forem (DE)
zvlášť
Lemma: dohromady
vielsagend
3046 // 2 i.p.m.
viel s.
196 // 0,13 i.p.m.
nichtssagend
2345 // 1,6 i.p.m.
nichts s.
169 // 0,11 i.p.m.
wenigsagend
7
wenig s.
10 // 0,007 i.p.m.
wenigersagend
1
weniger s.
1
allessagend
6
alles s.
2
Lemma: aussagen – vypovídat (mít výpovědní hodnotu)
nichtsaussagend
40 // 0,27 i.p.m.
1 // 0 i.p.m.
• DeReKo (Deutsches Referenzkorpus) – 1,5 mld. slov
(komponenta TAGGED-T)
Výběr paralelních korpusů
(DE nastavíme jako výchozí)
Paralelní korpusy – zadávání dotazu
...
NOSketc~gine
Uživatel: neht.rov..
Korpus: int.rcorp d.
Popis: Nimčina - korpus int.rcorp d • . verze 6 z 8. 4. 2013
Velikost: 68 509 857 pozic l
Konkordance
Seznam stov
Korpus:
intercorp_de
?
Pokročil.
nastaveni:
Kontext ?
Typ dotazu :
Slovní tver
•
[[Nnl_ic_h_lS_s_og,..e:..:
nd"'.'-' _ _ _ _ _ _ _ _ _ _ _ _ _ _----1tRl Shoda velikosti: IE)
Slovní tvar:
Subkorpus ?
Zarovnané korpusy - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - ,
Uživatel :
Změna
I Přidet Ikorpus
hesla
intercorp_er
x
Obsahuje
Slovní tvar
T yp dotuu:
Slovní tv,.r:
!!III) Shoda ve likosti :
EI zobrazit prázdné řádky
Vytvořit konkordanci
II
Smazat formulář
..........
i~~:~::::!:>·\
*den vědy (2013)
I
I[}
Paralelní korpusy – zobrazení
P II
.. w
Vlastni
Vlevo I Vpravo
Er sa6 an seinem Schrelbtlsch , hatte den Entwurf fur e lne Belebung der
Kuhnschen BilderbOgen und die durftige Liste zusammeogeklaubter
ErsatzvlOrter \IQ( sich , blickte durchs Feoster uber das Innenhofkarree
GrilU, Guntllr ,dll
hlm'leg ln den nh;hts$o1.s"nd blauen Hi mmel, zog den Bltck ab und suchte an
der seitllch steheodeo Etagere voller Topfblumen Halt .
KWIC
Reference
Promíchat
Immer vlleder schrleb er nach Londoo , aber auBer elner ntcht uilCllnden
kam keine Antl'lort . <Ip>
Filtr
Vertrčistung
Frekv. distribuce
Vlastni
Značky
SIO\fflí tvary
Dokumenty
Typy tell:tu
B4r,mln, tn,mu,sv
Původní
Die folgende Szene im Theaterkorridor ist trocken und nlchtu ""end , laBt
sich aber nicht streichen .
thre Hande atlerdings l'Iaren kleln und zart ; aber man hatte sie auch
schv/ach und nichtssil,end nennen konnen .
Genauso n areo ihr Uicheln und die Art , \'!le sie Bergmann die Hand gab Konwltk, Hlllnz. Gunthllr,de perfekt und ltebenswurdlg, anmutlg auch , aber nlchtuiI,"nd vile eln
ganzer Dlplomatenempfang ,
KIIfkil, frlnz. ,de
Kolokace
Poois dotazu
Wolf, Chrisu,de
konk.
ZOIIěn I """' I ěni-....
_
••• _ _ • • • • _
••
__ . _ ••
___ .. w
•
_ _ . _ •• _ . _ ,
• __ w .. w
_ . _ •• _
••• _
Der visafrele Relseverkehr l'lar zwar noch nlcht eingefuhrt , aber schon
damals v/Urden dle Bestimmungen lal( gehandhabt , so daB der
nichtsJil,lInde Vermerk ~ Stadtbeskhtigung .. , in die dreifach
aU$2ufertlgenden Antragsformulare unter der Rubrik" Begrundung ..
eiogetragen , anstandsLos durchging .
Wolf, Christil,dll
Meln Hel?: schrleb ihnen mlttels Technik nur Papas nlcntswsend.
Brlbcova, ZULlnil,cs
Zlckzackllnlen aufs Papier .
Denn vile icn , nach Anforderung , mlt einem Gutachten zum EinneltsprozeB
in VorschLag gebracht nabe , hatte nach meiner OarLegung der Austausch
jener eher nichtssil,enden Parole .. Wir sind das Volk ! " durch den, wie
man sleht , dle Politik lOm Erfolg antreibenden Ruf .. Wlr sind ein Volk !
Simmel, Johilnnes Mlrio,d. Klagliche Worte , nichtsSI,lInde , eilige ,
<p > Er hatte in den vergangenen Wochen alte beruhmten Intemisten nach
Ne\'! York kommen lassen , von San Francisco bls Halifal( , von San Diego bis
K
l'k H ' G" n d Chicago, es halte ihn ein kLeines Vermc>gen gekostet . aber nur , um in
onJil 1 , e lnz unt er, e ratlose Gesic hter zu blicken , nicntsJil,end. Worte zu hčiren , zl'Ianzig
..........
*den vědy (2013)
Seděl.
u psaclho stolu , mě( před sebou nárys oživení Kulmových obrázkových
a ne - vydatný seznam poskládaných náhradních slov , oknem zadíval se
za čtve rhran \fflitřmho dvora kamsi na nic nmbjící modrou oblohu, pak
pohled odvrátil a hledal oporu na etažeru plném kořenáčovýc h květin, co
stál stranou.
Opakovaně psal do Londýna, ale až na jediný konejšlvY , ovšem ntcneřikAjki
dopis nepřišla žádná odpověd' . <Ip >
<p > NásLedující výstup na chodbě divadla je nezáživný a nlcneřibjicí , ale
vynechat se nedá.
listů
Její ruce byly, pravda, malé a jemné; ale dalo by se také nci sLabé a nic
neříkljící .
přesně takový byl její úsměv a způsob, jakým Bergmannovi podala ruku ·
Konwlik, HII;nz. Gunthllr,dll perfektní a laskavY, půvabný, avša k nic nenkAjící , úpl.ně jako na
dipLomatickém přijetí.
Der preuBlsche Konl g allerdlogs muBte erst dazu uberredet werden , dle
Kaiserkrone und den nach seiner Meinuog nicnts5ll,enden Titel "Deutscher Muller, Helmut et l l.
Kaiser" anzunehmen .
Brilbcova, ZUz.ilnl,cs
i~~:~::}~:;····:
__ o
jak se vede marná, dítě? · - , jeho pozdní zájem byt by ukOjen nanejvýš
zdvořilou a nic nenkljící odpovědí.
Simme-I, Johilnnes Mlrio,de
Tenkrát ještě nebyL bezvízový cestovní ruch, ale pokyny se daly vyložit
velice volně, takže nic neřibjicí poznámka .. prohlídka města" v rubrice ..
Účel cesty" na formuláři , který bylo třeba dvoj mo vyplnit, prošla bez
námitek .
Pruského krále musel ovšem teprve přemluvit, aby císařskou korunu a podLe
jeho mínění nic ne řibj ici titul" německý císař" přijal; ten považoval
pruské království za sobě přiměřený, Bohem mu svěřený vtadařský úřad,
jehož lesk neměL být novým titulem zastřen . <Ip >
Moje srdce jim jX)mOCí techniky psalo na papír jen tatínkovy nicneříbjíci
klikyháky.
Protože jak jsem na vyžádání ve svem posudku stran sjednocovacího procesu
navrhl, byLa by se podle mého vyjádření výměna nicneřibjiciho hesla· My
jIDle národ I • za výzvu , která, jak je vidět, žene politiku k úspěchu, totiž
• Jsme jeden národ! • , měla odbýt naprosto pokojně, ano kultiVO\laně .
Několik
ubohých, nic
neříkljícich
,
spěšných
slov ,
<p > V minulých týdnech pozval do Ne\'! Yorku viechny Špičkové intemisty ,
přijížděli lékaři ze San Franciska, z Halifa){u , ze San Diega i Chicaga. Vůbec
K
rk H ' G" n d ho nezajímala finanční stránka věci , zajímala ho jen Lora . Výsledkem
onJil 1, elOZ unt e r, e bohužeL byly jen bezradné pohLedy a nic neříkljici řeč i Lékařú . Musel si
Německé orig. / české překlady
Lemma nichtssagend
Fq
Lemma vielsagend
fq
až ztratilo význam
(*Bedeutung verlieren)
bezvýznamné
(*bedeutungslos, belanglos)
jalová (*leer)
1
mnohomluvně (*redselig)
1
2
mnohoznačně (*mehrdeutig,
vieldeutig)
2
1
2
neurčitě (*unbestimmt,
ungewiss)
nezávazný (*unverbindlich)
1
mnohoznačný (*mehrdeutig,
vieldeutig)
slibné (*vielversprechend)
3
nic nesděloval (*der/ die/ das
nichts mitteilte)
nic neříká (*der/ die/ das
nichts sagte)
nic neříkající (*nichts sagend)
1
výmluvný (*vielsagend,
aussagekräftig)
významně (*bedeutsam,
dedeutend, vielsagend)
významný (*bedeutsam,
dedeutend, vielsagend)
2
11
nicneříkající (*nichtssagend)
5
celkem
24
1
1
1
2
13
Předběžné shrnutí – překlady
• Dva extrémní póly vyjádřeny
– vše- a viel– nic- a nichts-
• vielsagend – v německých překladech z češtiny nalézáme ekvivalent
většinou (ca 70 %) ve formě významný/ě; někdy původní výraz vyjadřuje
negativní sémantiku:
– „Někteří tvrdili s úsměškem, že měl na svědomí čachry a šmelinu.“ (Kundera, M.: Žert)
– Překl. Erich Bertleff: „Manche behaupteten mit einem vielsagenden Lächeln, daß er Schachergeschäft
und Schwarzhandel auf dem Kerbholz gehabt hätte.“
• vielsagend – překlady do češtiny většinou obsahují mnohost
(mnohoznačně/ý, mnohomluvně, výmluvný), významný/ě jen ca ve
třetině případů
• Nebylo možné vysledovat rozdíl mezi psaním odděleně a
zvlášť – nevykazují tendenci k verbálním významům
Shrnutí – proč a nač korpus?
(Kromě výzkumu, výuky a překladu)
Pomůže vám při rozhodování
Opřete se o něj při zdůvodňování
Pobaví vás při prokrastinování 
Děkujeme za pozornost!
Máte nějaké otázky?
www.korpus.cz
*den vědy (2012)

Podobné dokumenty

ZAVERECNY UCET ZA ROK 2015

ZAVERECNY UCET ZA ROK 2015 PdpGovi rrziah osoby odpdbdiezasF,vnon

Více

veterinární opatření

veterinární opatření o Přj nixírn zamořenÍ vanoézou pouŽií chovat9lé !čel v letíi! obd;bí plípravek FoRMlDoL _.Ódpai!é desřy s kyselinou mřavenčí.Je vhodné a ' do'poručuje se aplikollat tento přlpmv€k jiŽ behem pozdnňo...

Více

stáhnout 8_sbornkbbb2015

stáhnout 8_sbornkbbb2015 jsem, co dostanu já. Konečně moje miska! „Hmm, voní to pěkně! Těstoviny s masem. Mňam!“ Sotva dojedl, vydal se Císař ke mně. „Takové dobré jídlo. Ale já našel něco lepšího! A může to být tvoje! Poj...

Více