Appendix to ces news 2012: Longest words

Transkript

Appendix to ces news 2012: Longest words
Technical Report Series
on
Corpus Building
Vol. 8
(June 2013)
Czech Corpora
Uwe Quasthoff
Dirk Goldhahn
Abteilung Automatische Sprachverarbeitung, Institut für Informatik,
Universität Leipzig
Affiliation of the authors:
Uwe Quasthoff, Dirk Goldhahn: Institut für Informatik,Universität Leipzig
{quasthoff, dgoldhahn}@informatik.uni-leipzig.de
Copyright: Abteilung Automatische Sprachverarbeitung, Institut für Informatik,
Universität Leipzig, http://asv.informatik.uni-leipzig.de/
Technical Report Series on Corpus Building
Vol. 1: Deutscher Wortschatz 2013
Vol. 2: Danish Corpora
Vol. 3: Dutch Corpora
Vol. 4: Icelandic Corpora
Vol. 5: Hungarian Corpora
Vol. 6: Ukrainian Corpora
Vol. 7: Indonesian Corpora
Vol. 8: Czech Corpora
This PDF document was created using the open source tool mwlib. For more infotmation,
see http://code.pediapress.com/
PDF generated at: 25. June 2013
Czech corpora
1
Introduction to corpus creation
1
CES - a processing related language description
2
CES corpora
3
CES corpus comparison
8
Processing details
9
Appendix to ces news 2005-2007: Database summary
9
Appendix to ces news 2008: Database summary
9
Appendix to ces news 2009: Database summary
10
Appendix to ces news 2010: Database summary
10
Appendix to ces news 2011: Database summary
11
Appendix to ces news 2012: Database summary
11
Appendix to ces newscrawl 2011: Database summary
12
Appendix to ces newscrawl 2012: Database summary
12
Appendix to ces wikipedia 2007: Database summary
13
Appendix to ces wikipedia 2012: Database summary
13
Appendix to ces web 2002: Database summary
14
Appendix to ces web 2011: Database summary
14
Appendix to ces web 2012: Database summary
15
Appendix to ces mixed 2012: Database summary
15
Content details
16
Appendix to ces news 2005-2007: Size of different TLDs
16
Appendix to ces news 2008: Size of different TLDs
16
Appendix to ces news 2009: Size of different TLDs
17
Appendix to ces news 2010: Size of different TLDs
17
Appendix to ces news 2011: Size of different TLDs
17
Appendix to ces news 2012: Size of different TLDs
18
Appendix to ces newscrawl 2011: Size of different TLDs
18
Appendix to ces newscrawl 2012: Size of different TLDs
18
Appendix to ces web 2002: Size of different TLDs
19
Appendix to ces web 2011: Size of different TLDs
19
Appendix to ces web 2012: Size of different TLDs
19
Appendix to ces mixed 2012: Size of different TLDs
20
Appendix to ces news 2005-2007: Size of largest domains
20
Appendix to ces news 2008: Size of largest domains
21
Appendix to ces news 2009: Size of largest domains
21
Appendix to ces news 2010: Size of largest domains
22
Appendix to ces news 2011: Size of largest domains
23
Appendix to ces news 2012: Size of largest domains
23
Appendix to ces newscrawl 2011: Size of largest domains
24
Appendix to ces newscrawl 2012: Size of largest domains
25
Appendix to ces web 2002: Size of largest domains
25
Appendix to ces web 2011: Size of largest domains
26
Appendix to ces web 2012: Size of largest domains
27
Appendix to ces mixed 2012: Size of largest domains
27
Appendix to ces news 2005-2007: Number of sources by time period
28
Appendix to ces news 2008: Number of sources by time period
29
Appendix to ces news 2009: Number of sources by time period
31
Appendix to ces news 2010: Number of sources by time period
32
Appendix to ces news 2011: Number of sources by time period
33
Appendix to ces news 2012: Number of sources by time period
35
Word details
37
Appendix to ces news 2005-2007: Words by length without multiplicity
37
Appendix to ces news 2008: Words by length without multiplicity
39
Appendix to ces news 2009: Words by length without multiplicity
41
Appendix to ces news 2010: Words by length without multiplicity
43
Appendix to ces news 2011: Words by length without multiplicity
45
Appendix to ces news 2012: Words by length without multiplicity
47
Appendix to ces newscrawl 2011: Words by length without multiplicity
49
Appendix to ces newscrawl 2012: Words by length without multiplicity
51
Appendix to ces wikipedia 2007: Words by length without multiplicity
53
Appendix to ces wikipedia 2012: Words by length without multiplicity
55
Appendix to ces web 2002: Words by length without multiplicity
57
Appendix to ces web 2011: Words by length without multiplicity
59
Appendix to ces web 2012: Words by length without multiplicity
61
Appendix to ces mixed 2012: Words by length without multiplicity
63
Appendix to ces news 2005-2007: Words by length with multiplicity
65
Appendix to ces news 2008: Words by length with multiplicity
67
Appendix to ces news 2009: Words by length with multiplicity
69
Appendix to ces news 2010: Words by length with multiplicity
71
Appendix to ces news 2011: Words by length with multiplicity
73
Appendix to ces news 2012: Words by length with multiplicity
75
Appendix to ces newscrawl 2011: Words by length with multiplicity
77
Appendix to ces newscrawl 2012: Words by length with multiplicity
79
Appendix to ces wikipedia 2007: Words by length with multiplicity
81
Appendix to ces wikipedia 2012: Words by length with multiplicity
83
Appendix to ces web 2002: Words by length with multiplicity
85
Appendix to ces web 2011: Words by length with multiplicity
87
Appendix to ces web 2012: Words by length with multiplicity
89
Appendix to ces mixed 2012: Words by length with multiplicity
91
Appendix to ces news 2005-2007: The most frequent 50 words
92
Appendix to ces news 2008: The most frequent 50 words
93
Appendix to ces news 2009: The most frequent 50 words
94
Appendix to ces news 2010: The most frequent 50 words
95
Appendix to ces news 2011: The most frequent 50 words
96
Appendix to ces news 2012: The most frequent 50 words
97
Appendix to ces newscrawl 2011: The most frequent 50 words
98
Appendix to ces newscrawl 2012: The most frequent 50 words
99
Appendix to ces wikipedia 2007: The most frequent 50 words
100
Appendix to ces wikipedia 2012: The most frequent 50 words
101
Appendix to ces web 2002: The most frequent 50 words
102
Appendix to ces web 2011: The most frequent 50 words
103
Appendix to ces web 2012: The most frequent 50 words
104
Appendix to ces mixed 2012: The most frequent 50 words
105
Appendix to ces news 2005-2007: Longest words in top-1.000 by rank
106
Appendix to ces news 2008: Longest words in top-1.000 by rank
107
Appendix to ces news 2009: Longest words in top-1.000 by rank
108
Appendix to ces news 2010: Longest words in top-1.000 by rank
109
Appendix to ces news 2011: Longest words in top-1.000 by rank
110
Appendix to ces news 2012: Longest words in top-1.000 by rank
111
Appendix to ces newscrawl 2011: Longest words in top-1.000 by rank
112
Appendix to ces newscrawl 2012: Longest words in top-1.000 by rank
113
Appendix to ces wikipedia 2007: Longest words in top-1.000 by rank
114
Appendix to ces wikipedia 2012: Longest words in top-1.000 by rank
115
Appendix to ces web 2002: Longest words in top-1.000 by rank
116
Appendix to ces web 2011: Longest words in top-1.000 by rank
117
Appendix to ces web 2012: Longest words in top-1.000 by rank
118
Appendix to ces mixed 2012: Longest words in top-1.000 by rank
119
Character N-gram details
120
Appendix to ces news 2005-2007: Alphabet as used in the top-100.000 words
120
Appendix to ces news 2008: Alphabet as used in the top-100.000 words
121
Appendix to ces news 2009: Alphabet as used in the top-100.000 words
123
Appendix to ces news 2010: Alphabet as used in the top-100.000 words
124
Appendix to ces news 2011: Alphabet as used in the top-100.000 words
126
Appendix to ces news 2012: Alphabet as used in the top-100.000 words
127
Appendix to ces newscrawl 2011: Alphabet as used in the top-100.000 words
129
Appendix to ces newscrawl 2012: Alphabet as used in the top-100.000 words
130
Appendix to ces wikipedia 2007: Alphabet as used in the top-100.000 words
132
Appendix to ces wikipedia 2012: Alphabet as used in the top-100.000 words
133
Appendix to ces web 2002: Alphabet as used in the top-100.000 words
135
Appendix to ces web 2011: Alphabet as used in the top-100.000 words
136
Appendix to ces web 2012: Alphabet as used in the top-100.000 words
138
Appendix to ces mixed 2012: Alphabet as used in the top-100.000 words
139
Abbreviation details
141
Appendix to ces news 2005-2007: Most frequent abbreviations
141
Appendix to ces news 2008: Most frequent abbreviations
142
Appendix to ces news 2009: Most frequent abbreviations
143
Appendix to ces news 2010: Most frequent abbreviations
144
Appendix to ces news 2011: Most frequent abbreviations
145
Appendix to ces news 2012: Most frequent abbreviations
146
Appendix to ces newscrawl 2011: Most frequent abbreviations
146
Appendix to ces newscrawl 2012: Most frequent abbreviations
147
Appendix to ces wikipedia 2007: Most frequent abbreviations
147
Appendix to ces wikipedia 2012: Most frequent abbreviations
148
Appendix to ces web 2002: Most frequent abbreviations
149
Appendix to ces web 2011: Most frequent abbreviations
150
Appendix to ces web 2012: Most frequent abbreviations
151
Appendix to ces mixed 2012: Most frequent abbreviations
152
Appendix to ces news 2005-2007: Left neighbors of the full stop
153
Appendix to ces news 2008: Left neighbors of the full stop
154
Appendix to ces news 2009: Left neighbors of the full stop
155
Appendix to ces news 2010: Left neighbors of the full stop
156
Appendix to ces news 2011: Left neighbors of the full stop
157
Appendix to ces news 2012: Left neighbors of the full stop
158
Appendix to ces newscrawl 2011: Left neighbors of the full stop
159
Appendix to ces newscrawl 2012: Left neighbors of the full stop
160
Appendix to ces wikipedia 2007: Left neighbors of the full stop
161
Appendix to ces wikipedia 2012: Left neighbors of the full stop
162
Appendix to ces web 2002: Left neighbors of the full stop
163
Appendix to ces web 2011: Left neighbors of the full stop
164
Appendix to ces web 2012: Left neighbors of the full stop
165
Appendix to ces mixed 2012: Left neighbors of the full stop
166
Appendix to ces news 2005-2007: Left neighbors of the full stop with additional internal full stops 167
Appendix to ces news 2008: Left neighbors of the full stop with additional internal full stops
168
Appendix to ces news 2009: Left neighbors of the full stop with additional internal full stops
169
Appendix to ces news 2010: Left neighbors of the full stop with additional internal full stops
170
Appendix to ces news 2011: Left neighbors of the full stop with additional internal full stops
171
Appendix to ces news 2012: Left neighbors of the full stop with additional internal full stops
172
Appendix to ces newscrawl 2011: Left neighbors of the full stop with additional internal full stops 173
Appendix to ces newscrawl 2012: Left neighbors of the full stop with additional internal full stops 174
Appendix to ces wikipedia 2007: Left neighbors of the full stop with additional internal full stops
175
Appendix to ces wikipedia 2012: Left neighbors of the full stop with additional internal full stops
176
Appendix to ces web 2002: Left neighbors of the full stop with additional internal full stops
177
Appendix to ces web 2011: Left neighbors of the full stop with additional internal full stops
178
Appendix to ces web 2012: Left neighbors of the full stop with additional internal full stops
179
Appendix to ces mixed 2012: Left neighbors of the full stop with additional internal full stops
180
Sentences details
181
Appendix to ces news 2005-2007: Shortest sentences
181
Appendix to ces news 2008: Shortest sentences
182
Appendix to ces news 2009: Shortest sentences
184
Appendix to ces news 2010: Shortest sentences
185
Appendix to ces news 2011: Shortest sentences
187
Appendix to ces news 2012: Shortest sentences
188
Appendix to ces newscrawl 2011: Shortest sentences
190
Appendix to ces newscrawl 2012: Shortest sentences
191
Appendix to ces wikipedia 2007: Shortest sentences
193
Appendix to ces wikipedia 2012: Shortest sentences
194
Appendix to ces web 2002: Shortest sentences
196
Appendix to ces web 2011: Shortest sentences
197
Appendix to ces web 2012: Shortest sentences
199
Appendix to ces mixed 2012: Shortest sentences
200
Appendix to ces news 2005-2007: Longest sentences
202
Appendix to ces news 2008: Longest sentences
204
Appendix to ces news 2009: Longest sentences
206
Appendix to ces news 2010: Longest sentences
208
Appendix to ces news 2011: Longest sentences
210
Appendix to ces news 2012: Longest sentences
212
Appendix to ces newscrawl 2011: Longest sentences
214
Appendix to ces newscrawl 2012: Longest sentences
216
Appendix to ces wikipedia 2007: Longest sentences
218
Appendix to ces wikipedia 2012: Longest sentences
220
Appendix to ces web 2002: Longest sentences
222
Appendix to ces web 2011: Longest sentences
224
Appendix to ces web 2012: Longest sentences
226
Appendix to ces mixed 2012: Longest sentences
228
Appendix to ces news 2005-2007: Length of sentences in characters
230
Appendix to ces news 2008: Length of sentences in characters
231
Appendix to ces news 2009: Length of sentences in characters
232
Appendix to ces news 2010: Length of sentences in characters
233
Appendix to ces news 2011: Length of sentences in characters
234
Appendix to ces news 2012: Length of sentences in characters
235
Appendix to ces newscrawl 2011: Length of sentences in characters
236
Appendix to ces newscrawl 2012: Length of sentences in characters
237
Appendix to ces wikipedia 2007: Length of sentences in characters
238
Appendix to ces wikipedia 2012: Length of sentences in characters
239
Appendix to ces web 2002: Length of sentences in characters
240
Appendix to ces web 2011: Length of sentences in characters
241
Appendix to ces web 2012: Length of sentences in characters
242
Appendix to ces mixed 2012: Length of sentences in characters
243
Appendix to ces news 2005-2007: Length of sentences in words
244
Appendix to ces news 2008: Length of sentences in words
245
Appendix to ces news 2009: Length of sentences in words
246
Appendix to ces news 2010: Length of sentences in words
247
Appendix to ces news 2011: Length of sentences in words
248
Appendix to ces news 2012: Length of sentences in words
249
Appendix to ces newscrawl 2011: Length of sentences in words
250
Appendix to ces newscrawl 2012: Length of sentences in words
251
Appendix to ces wikipedia 2007: Length of sentences in words
252
Appendix to ces wikipedia 2012: Length of sentences in words
253
Appendix to ces web 2002: Length of sentences in words
254
Appendix to ces web 2011: Length of sentences in words
255
Appendix to ces web 2012: Length of sentences in words
256
Appendix to ces mixed 2012: Length of sentences in words
257
Oddities details
258
Appendix to ces news 2005-2007: Longest words
258
Appendix to ces news 2008: Longest words
258
Appendix to ces news 2009: Longest words
259
Appendix to ces news 2010: Longest words
259
Appendix to ces news 2011: Longest words
260
Appendix to ces news 2012: Longest words
260
Appendix to ces newscrawl 2011: Longest words
261
Appendix to ces newscrawl 2012: Longest words
261
Appendix to ces wikipedia 2007: Longest words
262
Appendix to ces wikipedia 2012: Longest words
262
Appendix to ces web 2002: Longest words
263
Appendix to ces web 2011: Longest words
263
Appendix to ces web 2012: Longest words
264
Appendix to ces mixed 2012: Longest words
264
Appendix to ces news 2005-2007: Sentences with high average word length
265
Appendix to ces news 2008: Sentences with high average word length
266
Appendix to ces news 2009: Sentences with high average word length
267
Appendix to ces news 2010: Sentences with high average word length
268
Appendix to ces news 2011: Sentences with high average word length
269
Appendix to ces news 2012: Sentences with high average word length
270
Appendix to ces newscrawl 2011: Sentences with high average word length
271
Appendix to ces newscrawl 2012: Sentences with high average word length
272
Appendix to ces wikipedia 2007: Sentences with high average word length
273
Appendix to ces wikipedia 2012: Sentences with high average word length
274
Appendix to ces web 2002: Sentences with high average word length
275
Appendix to ces web 2011: Sentences with high average word length
276
Appendix to ces web 2012: Sentences with high average word length
277
Appendix to ces mixed 2012: Sentences with high average word length
278
Appendix to ces news 2005-2007: Problems with sentence segmentation - words ending in a
stopword
279
Appendix to ces news 2008: Problems with sentence segmentation - words ending in a stopword
279
Appendix to ces news 2009: Problems with sentence segmentation - words ending in a stopword
279
Appendix to ces news 2010: Problems with sentence segmentation - words ending in a stopword
280
Appendix to ces news 2011: Problems with sentence segmentation - words ending in a stopword
281
Appendix to ces news 2012: Problems with sentence segmentation - words ending in a stopword
281
Appendix to ces newscrawl 2011: Problems with sentence segmentation - words ending in a
stopword
282
Appendix to ces newscrawl 2012: Problems with sentence segmentation - words ending in a
stopword
283
Appendix to ces wikipedia 2007: Problems with sentence segmentation - words ending in a
stopword
284
Appendix to ces wikipedia 2012: Problems with sentence segmentation - words ending in a
stopword
284
Appendix to ces web 2002: Problems with sentence segmentation - words ending in a stopword
285
Appendix to ces web 2011: Problems with sentence segmentation - words ending in a stopword
286
Appendix to ces web 2012: Problems with sentence segmentation - words ending in a stopword
287
Appendix to ces mixed 2012: Problems with sentence segmentation - words ending in a stopword 288
1
Czech corpora
Introduction to corpus creation
The Leipzig Corpora Collection (LCC) collects Web based corpora for many different languages. The main text
genres are newspaper texts, Wikipedias and randomly collected web pages. All corpora are processed in the same
way:
•
•
•
•
•
•
•
Crawling Web pages
HTML stripping
Language identifikation
Sentence segmentation
Cleaning: Removal of ill-formed sentences
Duplicate removal
Calculation of word frequences and word co-occurrences
As result we have a corpus containing only well-formed sentences in the language under consideration. The
sentences are in random order; hence, sharing the corpus does not violate copyright law because it is impossible to
reconstruct the original texts.
The pre-processing steps contain both language independent steps (like HTML stripping and duplicate removal) and
language dependent steps (like language identification and sentence segmentation). Especially the language specific
parts are vulnerable to specific processing problems. The aim of the paper is to identify possible problems and
evaluate the results. The following problems are adressed:
•
•
•
•
•
•
A processing-focused language description
Language size: How much text is available for this language? What are the biggest sources?
Corpus description: Genre, size, crawling and processing date.
Possible problems in language identification: Which languages are similar?
Character set and alphabet
Inspecting the word list: Most frequent words, longer high frequent words and longest words at all. Word length
distribution.
• Can abbreviations confuse sentence segmentation? Information about the abbreviation list.
• Inspecting sentences: Inspect shortest and longest sentences to identify possible segmentation problems. Sentence
length distribution.
The paper describes the result of these inspections; the appendices show the exact results for the different corpora.
This helps to compare the corpora with respect to quality. In the section quality overview, an overall quality
description for each corpus is given. All corpora contain only minor problems which are irrelevant for most
applications. Otherwise the corpus creation has been iterated.
CES - a processing related language description
CES - a processing related language description
General properties of the Czech language
•
•
•
•
•
Native Name: Čeština
Classifiation: Indo-European, Slavic, West, Czech-Slovak
Total Number of Speakers: 12M
Largest countries with number of speakers: Czech Republic (10M)
Sources: http://www.ethnologue.com, Wikipedia
Processing summary
• Latin alphabet with some additional characters
• full stop is used as sentence boundary and for abbreviations
• apostrostophes used rarely
Properties important for processing
Alphabet and punctuation
• The alphabet is Latin based, with the following specialities (sources: http://en.wikipedia.org/wiki/
Alphabets_derived_from_the_Latin and http://de.wikipedia.org/wiki/Tschechische_Sprache#Alphabet):
• Czech includes all 26 base letters and Á, Č, Ď, É, Ě, Í, Ň, Ó, Ř, Š, Ť, Ú, Ů, Ý, Ž
• In foreign words some more
• Diphtongs: au, eu, ou
• Usual Latin punctuation
• Usage of uppercase letters:
• At sentence beginnings and
• for proper names (of persons, organisations, countries etc.).
Sentence segmentation and word tokenization
• Sentence beginnings
• Sentences begin with a capitalized first word.
• Abbreviations
• Abbreviations confusing with sentence boundaries: Special abbreviation list has to be inspected.
• Sources for abbreviations: ###
• Abbreviations with full stop may appear in the word list without full stop.
• Apostrophes
• Use of apostrophes: very infrequent (???)
2
CES - a processing related language description
Sources and ranking (2012)
• Estimated number of webpages containing text
•
•
•
•
•
• Google.com top-5 words: 121.000.000 results for "a" "se" "na" "v" "je"
• Google.com top-10 words: 1.280.000 results for "a" "se" "na" "v" "je" "že" "to" "z" "s" "o"
Rank according to number of speakers (Ethnologue): 75
Rank according to Wikipedia size (see http://de.wikipedia.org/wiki/Wikipedia:Sprachen, 01/2013): Rank 18
with 253.000 articles.
Rank according to number of newspapers as found by AbyZ (5/2012): 134 newspapers, rank 18.
Rank according to number of newspapers with RSS feeds (5/2012): 131 newspapers, rank 12.
Rank according to our corpus size (9/2012): 17
CES corpora
Quality Overview
Quality Ratings
• A: Very good quality. Ready to use (or already used) for frequency dictionary.
• Size as large as possible
• Only minimal errors
• Multiple genres (if possible)
• A-: Small problems identified. They should not affect usage.
• B: Native speaker quality.
• Information about abbreviations and sentence boundaries by native speaker
• Resulting statistics checked by native speaker, possible errors corrected
• C: Non-native speaker quality
• Obvious problems shown in corpus statistics are corrected
• D: First version
• Pre-processing with default abbreviation list and default sentence boundaries
• E: Poor Quality: Old, outdated or faulty.
Corpus Quality
The quality of the corpora differes slightly because the corpus processing toolchain changed slightly during several
years. Moreover, original data are often no more available. Hence, improvement of quality often means removing
incomplete or doubtful sentences. Forthcoming editions of all corpora thus might have a slightly smaller number of
sentences. This especially applies to near duplicate sentences which are removed only sparingly.
The following table shows the quality of the corpora. Minimal errors are still possible and described in the sections
below. All possible major improvements are mentioned here.
3
CES corpora
4
Corpus
Quality rating Known problems to-dos
ces_news_2005-2007 A
-
-
ces_news_2008
A
-
-
ces_news_2009
A
-
-
ces_news_2010
A
-
-
ces_news_2011
A
-
-
ces_news_2012
A
-
-
ces_newscrawl_2011 A
-
-
ces_newscrawl_2012 A
-
-
ces_web_2002
A
-
-
ces_web_2011
A
-
-
ces_web_2012
A
-
-
ces_wikipedia_2007
A
-
-
ces_wikipedia_2012
A
-
-
ces_mixed_2012
A
-
-
Processing Overview
For more details, see Appendix: Database Summary and Appendix: Number of sources by time period.
Corpus
Size (M sentences) Size (M running words) Multiwords Crawling date
Production date
ces_news_2005-2007 1.2
18
10.250
end of 2005-end of 2007 2010
ces_news_2008
1.9
30
13.314
daily 2008
2011
ces_news_2009
2.1
33
13.277
daily 2009
2011
ces_news_2010
2.2
34
12.862
daily 2010
2011
ces_news_2011
1.9
31
11.943
daily 2011
2012
ces_news_2012
1.9
29
11.727
daily 2012
2013
ces_newscrawl_2011 4.0
65
18.746
04/2012
2012
ces_newscrawl_2012 4.8
71
20.317
04/2013
2013
ces_web_2002
4.4
67
20.461
batch crawl 2002
2010
ces_web_2011
7.4
134
25.800
12/2010 - 12/2011
2012
ces_web_2012
9.4
137
26.015
1/2012 - 12/2012
2013
ces_wikipedia_2007
0.47
7.5
22.350
10/2007
2010
ces_wikipedia_2012
1.3
20
36.358
01/2012
2012
ces_mixed_2012
37
548
54.872
see above
2013
CES corpora
5
Content Overview
For more details, see Appendix: Size of different TLDs and Appendix: Size of different domains.
Corpus
Type of sources Countries
Number of sources Publishing date
Biggest source
ces_news_2005-2007 News
cs(93%), sk(7%)
75
mainly 3/2007-12/2007 ihned.cz/
ces_news_2008
News
cs(99%), sk(1%)
98
2008
HN.IHNED.CZ/
ces_news_2009
News
cs
78
2009
HN.IHNED.CZ/
ces_news_2010
News
cs
81
2010
hn.ihned.cz/
ces_news_2011
News
cs
119
2011
zpravy.idnes.cz/
ces_news_2012
News
cs(94%), com(6%)
105
2012
isport.blesk.cz/
ces_newscrawl_2011 News
cs
35
2011 and before
www.profit.cz/
ces_newscrawl_2012 News
cs
36
2012 and before
www.novinky.cz/
ces_web_2002
Web
cs (100%)
13.471
2002 and before
www.grimoar.cz/
ces_web_2011
Web
cs(92%), sk(2%), com(2%), eu(2%) 83.208
2011 and before
abc.blesk.cz/
ces_web_2012
Web
cs(93%), sk(1%), com(2%), eu(2%) 91.292
2012 and before
darren-shan.ic.cz/
ces_wikipedia_2007
Wikipedia
-
1
2007 and before
wikipedia.org
ces_wikipedia_2012
Wikipedia
-
1
2012 and before
wikipedia.org
ces_mixed_2012
Mixed Sources
cs(95%), sk(1%), com(1%), eu(1%) 117.779
2012 and before
HN.IHNED.CZ/
Words
Appendix: Words by Length without multiplicity shows a plot of the corresponding length distribution. A smooth
asymetric bell-shaped curve is expected.
Appendix: Words by Length with multiplicity shows a plot of the corresponding length distribution. A smooth
asymetric bell-shaped curve is expected.
Appendix: The Most Frequent 50 Words shows the most frequent stopwords as well as one or more words related
to the region.
Appendix: Longest Words in Top-1000 by rank shows the 25 longest words within the top-1000. The usually give
an impression of the main topics treated in the corpus.
Appendix: Longest Words with minimum frequency 2 should give an idea of very long words. In the case of
processing problems, different types of non-words may appear. This might help to improve the word definition.
Corpus
Word length graph
without multiplicity
Word length graph
with multiplicity
Most Frequent
50 Words
Longest Words in
Top-1000
Longest Words with
minimum frequency 2
ces_news_2005-2007 okay
okay
okay
okay
URLs, missing blanks
ces_news_2008
okay
okay
okay
okay
URLs
ces_news_2009
okay
okay
okay
okay
URLs
ces_news_2010
okay
okay
okay
okay
URLs, missing blanks,
junk
ces_news_2011
okay
okay
okay
okay
URLs, missing blanks
ces_news_2012
okay
okay
okay
okay
URLs, routes, missing
blanks
CES corpora
6
ces_newscrawl_2011 okay
okay
okay
okay
Missing blanks, routes,
chemicals, URLs
ces_newscrawl_2012 okay
okay
okay
okay
URLs, missing blanks,
junk, etc.
ces_web_2002
okay
okay
okay
okay
URLs, missing blanks
ces_web_2011
okay
okay
okay
okay
URLs, missing blanks
ces_web_2012
okay
okay
okay
okay
Routes, missing blanks,
URLs
ces_wikipedia_2007
okay
okay
okay
okay
okay
ces_wikipedia_2012
okay
okay
okay
okay
chemicals, URLs
ces_mixed_2012
okay
okay
okay
okay
all of the above
Abbreviations
Abbreviations are usually not used as sentence boundaries. Conversely, missing abbreviations can overgenerate
sentence boundaries. Due to limitations in the processing chain, the list of abbreviations used for sentence boundary
detection can differ from the abbreviations in the word list.
• Appendix: Most Frequent Abbreviations shows possible under-generation of sentence boundaries by wrong
abbreviations (i.e. words ending in a full stop) in the word list.
Sentences
Appendix: Shortest sentences shows the shortest declarative, exclamatory and interrogative sentences. In
preprocessing, a minimal length for sentences might be specified. And missing abbreviations are often visible as
faulty sentence engings.
Appendix: Longest sentences shows the longest declarative, exclamatory and interrogative sentences. Usually, the
maximun sentence length is defined as 256 characters (not 256 bytes). Very long exclamatory or interrogative
sentences often contain an overseen sentence boundary.
Appendix: Length of sentences in characters shows the distribution of the sentence length. A large and balanced
corpus will result in a smooth and bell-shaped curve. Isolated local maxima usually result from large sets of near
duplicate sentences.
Corpus
Shortest
sentences
Longest sentences
Length distribution (in
characters)
Length distribution (in
words)
ces_news_2005-2007 okay
max. 255 bytes instead
characters
several near duplicate peaks
okay
ces_news_2008
okay
okay
okay
okay
ces_news_2009
okay
okay
okay
okay
ces_news_2010
okay
okay
okay
okay
ces_news_2011
okay
okay
okay
okay
ces_news_2012
okay
okay
several near duplicate peaks
okay
ces_newscrawl_2011 okay
okay
okay
okay
ces_newscrawl_2012 okay
okay
okay
okay
ces_web_2002
okay
max. 255 bytes instead characters
okay
okay
CES corpora
7
ces_web_2011
okay
okay
okay
okay
ces_web_2012
okay
okay
okay
okay
ces_wikipedia_2007
okay
okay
several near duplicate peaks
several near duplicate peaks
ces_wikipedia_2012
okay
okay
several near duplicate peaks
okay
ces_mixed_2012
okay
okay
okay
okay
Oddities
Appendix: Sentences with high average word length: Average sentences contain many stopwords, and these
stopwords are usually short. Hence, they restrict the average word length in a sentence. Conversely, sentences with
high average word length are often ill formed. They may be used to improve pre-processing.
Appendix: Problems with sentence segmentation - Words ending in a stopword: If there are many ill-formed
word or sentence boundaries witout a blank between two words, they will generate new ill-formed words. The
appendix shows the most frequent words ending in an uppercase stopword. If they are infrequent then the date were
of high quality.
Corpus
Sentences with high average word length
Words ending in a stopword
ces_news_2005-2007 URLs
okay
ces_news_2008
URLs
okay
ces_news_2009
URLs, missing blanks
Numbers like 05:00Na,maxfreq=23
ces_news_2010
URLs, missing blanks, very long words
Numbers like 05:00Na,maxfreq=26
ces_news_2011
URLs, missing blanks, very long words, junk Numbers like 05:00Na,maxfreq=8
ces_news_2012
URLs, missing blanks, very long words, junk maxfreq=9
ces_newscrawl_2011 URLs, missing blanks, very long words
maxfreq=7
ces_newscrawl_2012 URLs, missing blanks, very long words
maxfreq=18
ces_web_2002
URLs, often: missing blanks
maxfreq=16
ces_web_2011
URLs, often: missing blanks, routes
maxfreq=16
ces_web_2012
URLs, missing blanks, routes
okay
ces_wikipedia_2007
URLs, chemicals, Russian words
okay
ces_wikipedia_2012
URLs, missing blanks, Chinese
okay
ces_mixed_2012
as above
as above
CES corpus comparison
CES corpus comparison
Automated Corpus comparison
For the following comparisons, the following tests on the top-1000 words are performed:
• Vectors based on the frequencies of the top-1000 words are created for the analysed languages. The cosine of the
angle between these vectors is computed. Identical languages receive a value of 0, distinct languages get a value
of 1.
• The same analysis is conducted using the frequencies of the top-1000 typical letter trigrams of the languages.
Monolingual word list comparison (top-1000 words)
As one can expect the comparisons show:
• The different news corpora have different word lists with maximum distance 0.16 (ces_newscrawl_2012 and
ces_news_2011)
• The wikipedia corpora are similar with maximum distance 0.07
• The web corpora have maximum distance 0.12 (ces_news_2012 and ces_news_2002)
• The mixed corpus ces_mixed_2012 holds a central position with maximum distances of 0.32 to the other corpora.
Multilingual word list comparison (top-1000 words)
Both the comparison of the top-1000 words and the comparison of the letter trigrams used in these words show that
there are similar languages in our data, all being members of the slavic family. The distance of the mixed corpus to
the next language, Slovak, is 0.54 for the words and 0.59 for the letter trigrams. Both distances are about average.
The average value for the most similar language is 0.58 for trigrams.
• The most similar languages based on words: Slovak, Polish, Crotian
+--------+---------------------+----------------+-------------+
| source | language_short_name | language_name | cos_logfreq |
+--------+---------------------+----------------+-------------+
| ces
| slk
| Slovak
|
0.541585 |
| ces
| pol
| Polish
|
0.658309 |
| ces
| hrv
| Croatian
|
0.744599 |
| ces
| hsb
| Sorbian, Upper |
0.74595 |
| ces
| slv
| Slovenian
|
0.754234 |
+--------+---------------------+----------------+-------------+
• The most similar languages based on letter trigrams: Slovak, Croatian, Slovenian
+--------+---------------------+-----------------+-------------+
| source | language_short_name | language_name
| cos_logfreq |
+--------+---------------------+-----------------+-------------+
| ces
| slk
| Slovak
|
0.595796 |
| ces
| hrv
| Croatian
|
0.731652 |
| ces
| slv
| Slovenian
|
0.75994 |
| ces
| srp-latn
| Serbian (Latin) |
0.764132 |
| ces
| pol
| Polish
|
0.773368 |
+--------+---------------------+-----------------+-------------+
8
9
Processing details
Appendix to ces news 2005-2007: Database
summary
Values for some general parameters
Parameter
Value
Number of sentences
1180422
Number of running word forms
18487116
Number of distinct word forms
580861
Number of multiwords
10250
Percentage of words with frequency=1
45.4012
Number of sentence based co-occurrences 5100404
Number of neighbour co-occurrences
664587
Appendix to ces news 2008: Database summary
Values for some general parameters
Parameter
Value
Number of sentences
1964452
Number of running word forms
30490884
Number of distinct word forms
679842
Number of multiwords
13314
Percentage of words with frequency=1
43.8117
Number of sentence based co-occurrences 8167016
Number of neighbour co-occurrences
1016121
Appendix to ces news 2009: Database summary
10
Appendix to ces news 2009: Database summary
Values for some general parameters
Parameter
Value
Number of sentences
2114181
Number of running word forms
32911080
Number of distinct word forms
695997
Number of multiwords
13277
Percentage of words with frequency=1
43.8546
Number of sentence based co-occurrences 9107518
Number of neighbour co-occurrences
1092894
Appendix to ces news 2010: Database summary
Values for some general parameters
Parameter
Value
Number of sentences
2154346
Number of running word forms
33990535
Number of distinct word forms
750971
Number of multiwords
12862
Percentage of words with frequency=1
44.7730
Number of sentence based co-occurrences 9945368
Number of neighbour co-occurrences
1152708
Appendix to ces news 2011: Database summary
11
Appendix to ces news 2011: Database summary
Values for some general parameters
Parameter
Value
Number of sentences
1909971
Number of running word forms
30748072
Number of distinct word forms
702495
Number of multiwords
11943
Percentage of words with frequency=1
44.5590
Number of sentence based co-occurrences 9853154
Number of neighbour co-occurrences
1089863
Appendix to ces news 2012: Database summary
Values for some general parameters
Parameter
Value
Number of sentences
1940717
Number of running word forms
28661212
Number of distinct word forms
680532
Number of multiwords
11727
Percentage of words with frequency=1
44.9491
Number of sentence based co-occurrences
7753538
Number of neighbour co-occurrences
960442
Number of distributional similar word pairs (NOT READY) 0
Number of similar sentence pairs (NOT READY)
0
Appendix to ces newscrawl 2011: Database summary
12
Appendix to ces newscrawl 2011: Database
summary
Values for some general parameters
Parameter
Value
Number of sentences
4073054
Number of running word forms
64752481
Number of distinct word forms
1271178
Number of multiwords
18746
Percentage of words with frequency=1
49.8621
Number of sentence based co-occurrences 19223320
Number of neighbour co-occurrences
2074562
Appendix to ces newscrawl 2012: Database
summary
Values for some general parameters
Parameter
Value
Number of sentences
4847073
Number of running word forms
71216871
Number of distinct word forms
1398252
Number of multiwords
20317
Percentage of words with frequency=1
50.9530
Number of sentence based co-occurrences 17637540
Number of neighbour co-occurrences
2098380
Appendix to ces wikipedia 2007: Database summary
13
Appendix to ces wikipedia 2007: Database
summary
Values for some general parameters
Parameter
Value
Number of sentences
468368
Number of running word forms
7468623
Number of distinct word forms
498904
Number of multiwords
22350
Percentage of words with frequency=1
52.4802
Number of sentence based co-occurrences 1901412
Number of neighbour co-occurrences
261746
Appendix to ces wikipedia 2012: Database
summary
Values for some general parameters
Parameter
Value
Number of sentences
1270501
Number of running word forms
20126736
Number of distinct word forms
923691
Number of multiwords
36358
Percentage of words with frequency=1
52.7002
Number of sentence based co-occurrences 5137322
Number of neighbour co-occurrences
677076
Appendix to ces web 2002: Database summary
14
Appendix to ces web 2002: Database summary
Values for some general parameters
Parameter
Value
Number of sentences
4402068
Number of running word forms
66959742
Number of distinct word forms
1753989
Number of multiwords
20461
Percentage of words with frequency=1
52.4787
Number of sentence based co-occurrences 17884722
Number of neighbour co-occurrences
2125253
Appendix to ces web 2011: Database summary
Values for some general parameters
Parameter
Value
Number of sentences
6581096
Number of running word forms
100087964
Number of distinct word forms
2038980
Number of multiwords
24793
Percentage of words with frequency=1
52.8270
Number of sentence based co-occurrences 25451492
Number of neighbour co-occurrences
2885270
Appendix to ces web 2012: Database summary
15
Appendix to ces web 2012: Database summary
Values for some general parameters
Parameter
Value
Number of sentences
7421871
Number of running word forms
111154082
Number of distinct word forms
2200205
Number of multiwords
25045
Percentage of words with frequency=1
53.3842
Number of sentence based co-occurrences 27948258
Number of neighbour co-occurrences
3146617
Appendix to ces mixed 2012: Database summary
Values for some general parameters
Parameter
Value
Number of sentences
31524632
Number of running word forms
487761861
Number of distinct word forms
4860819
Number of multiwords
53539
Percentage of words with frequency=1
54.0793
Number of sentence based co-occurrences 109930766
Number of neighbour co-occurrences
11172425
16
Content details
Appendix to ces news 2005-2007: Size of different
TLDs
TLDs larger than 1%
TLD # of sources
%
.cz/
66938
93.00
.sk/
4984
6.92
Appendix to ces news 2008: Size of different
TLDs
TLDs larger than 1%
TLD # of sources
%
.cz/
118161
98.61
.sk/
1597
1.33
Appendix to ces news 2009: Size of different TLDs
17
Appendix to ces news 2009: Size of different
TLDs
TLDs larger than 1%
TLD # of sources
.cz/
124324
%
99.73
Appendix to ces news 2010: Size of different
TLDs
TLDs larger than 1%
TLD # of sources
.cz/
141509
%
99.85
Appendix to ces news 2011: Size of different
TLDs
TLDs larger than 1%
TLD # of sources
.cz/
151144
%
99.56
Appendix to ces news 2012: Size of different TLDs
18
Appendix to ces news 2012: Size of different
TLDs
TLDs larger than 1%
TLD # of sources
.cz/
112567
com/ 7132
%
94.03
5.96
Appendix to ces newscrawl 2011: Size of different
TLDs
TLDs larger than 1%
TLD # of sources
.cz/
284115
%
100.00
Appendix to ces newscrawl 2012: Size of different
TLDs
TLDs larger than 1%
TLD # of sources
.cz/
288877
%
100.00
Appendix to ces web 2002: Size of different TLDs
19
Appendix to ces web 2002: Size of different TLDs
TLDs larger than 1%
TLD # of sources
.cz/
13471
%
100.00
Appendix to ces web 2011: Size of different TLDs
TLDs larger than 1%
TLD # of sources
%
.cz/
688666
92.39
.eu/
14169
1.90
.sk/
13776
1.85
com/ 13095
1.76
Appendix to ces web 2012: Size of different TLDs
TLDs larger than 1%
TLD # of sources
.cz/
704776
%
92.59
com/ 17167
2.26
.eu/
17089
2.24
.sk/
8105
1.06
Appendix to ces mixed 2012: Size of different TLDs
20
Appendix to ces mixed 2012: Size of different
TLDs
TLDs larger than 1%
TLD # of sources
.cz/
2352875
%
95.62
com/ 33470
1.36
.eu/
1.11
27191
Appendix to ces news 2005-2007: Size of largest
domains
Largest domains
Source
# of sentences
ihned.cz/
252872
www.halonoviny.cz/
186261
HN.IHNED.CZ/
178129
zpravy.idnes.cz/
88880
www.blisty.cz/
82650
EKONOM.IHNED.CZ/
56186
HNonline.sk/
50817
www.financninoviny.cz/ 47354
pes.eunet.cz/
35674
www.mobilmania.cz/
28825
# of distinct sources
75
Appendix to ces news 2008: Size of largest domains
21
Appendix to ces news 2008: Size of largest
domains
Largest domains
Source
# of sentences
HN.IHNED.CZ/
369105
www.halonoviny.cz/
331577
zpravy.idnes.cz/
291675
deniksport.blesk.cz/
183546
www.blesk.cz/
173152
www.blisty.cz/
127803
www.financninoviny.cz/ 112839
ihned.cz/
87217
Domaci.iHNed.cz/
41656
Zahranicni.iHNed.cz/
39427
# of distinct sources
98
Appendix to ces news 2009: Size of largest
domains
Largest domains
Source
# of sentences
HN.IHNED.CZ/
355253
zpravy.idnes.cz/
315590
www.halonoviny.cz/
309624
deniksport.blesk.cz/
270186
www.blesk.cz/
200648
www.blisty.cz/
119844
www.financninoviny.cz/ 118557
EKONOM.IHNED.CZ/
68067
Domaci.iHNed.cz/
56867
Sport.iHNed.cz/
47277
# of distinct sources
78
Appendix to ces news 2009: Size of largest domains
22
Appendix to ces news 2010: Size of largest
domains
Largest domains
Source
# of sentences
hn.ihned.cz/
424157
zpravy.idnes.cz/
343312
www.blesk.cz/
225124
www.blisty.cz/
134746
www.financninoviny.cz/ 133354
www.halonoviny.cz/
126680
deniksport.blesk.cz/
125441
EKONOM.IHNED.CZ/
100145
isport.blesk.cz/
95268
Domaci.iHNed.cz/
75706
# of distinct sources
81
Appendix to ces news 2011: Size of largest domains
23
Appendix to ces news 2011: Size of largest
domains
Largest domains
Source
# of sentences
zpravy.idnes.cz/
325754
isport.blesk.cz/
248174
rssfeeds.ihned.cz/
203344
www.blesk.cz/
186302
HN.IHNED.CZ/
158698
www.financninoviny.cz/ 139827
www.blisty.cz/
118766
byznys.ihned.cz/
78120
zpravy.ihned.cz/
74046
sport.ihned.cz/
73746
# of distinct sources
119
Appendix to ces news 2012: Size of largest
domains
Largest domains
Source
# of sentences
isport.blesk.cz/
223166
zpravy.idnes.cz/
210435
zpravy.ihned.cz/
190895
www.blesk.cz/
148323
www.financninoviny.cz/
144899
HN.IHNED.CZ/
120971
byznys.ihned.cz/
112814
www.blisty.cz/
105750
sport.ihned.cz/
95252
idnes.cz.feedsportal.com/ 91465
# of distinct sources
105
Appendix to ces news 2012: Size of largest domains
24
Appendix to ces newscrawl 2011: Size of largest
domains
Largest domains
Source
# of sentences
www.profit.cz/
658633
ekonom.ihned.cz/
643031
www.blesk.cz/
472907
www.novinky.cz/
463174
www.rozhlas.cz/
401231
www.iprima.cz/
339979
plzensky.denik.cz/ 213952
www.tyden.cz/
188189
www.denik.cz/
125213
www.pressweb.cz/ 107812
# of distinct sources
35
Appendix to ces newscrawl 2012: Size of largest domains
25
Appendix to ces newscrawl 2012: Size of largest
domains
Largest domains
Source
# of sentences
www.novinky.cz/
846859
www.rozhlas.cz/
751087
www.denik.cz/
509684
www.iprima.cz/
509423
plzensky.denik.cz/ 340130
www.blesk.cz/
327380
ekonom.ihned.cz/
316357
www.pressweb.cz/ 185080
www.lidovky.cz/
166900
www.tyden.cz/
156609
# of distinct sources
36
Appendix to ces web 2002: Size of largest
domains
Largest domains
Source
# of sentences
www.grimoar.cz/
39963
www.env.cebin.cz/
36147
www.regionalist.cz/
29871
www.musicpage.cz/
28566
www.harry.cz/
28399
krystal.op.cz/
25860
www.automa.cz/
24608
www.radioservis-as.cz/ 20718
www.baraka.cz/
19823
osz.cmkos.cz/
19688
# of distinct sources
13471
Appendix to ces web 2002: Size of largest domains
26
Appendix to ces web 2011: Size of largest
domains
Largest domains
Source
# of sentences
abc.blesk.cz/
149583
abicko.avcr.cz/
58200
www.automatizace.cz/ 22526
sw.gurroa.cz/
11893
osz.cmkos.cz/
9179
www.hutka.cz/
9045
www.skyfly.cz/
8831
www.zitova.cz/
8678
www.jesuit.cz/
8370
www.chorvatsko.cz/
7650
# of distinct sources
78437
Appendix to ces web 2012: Size of largest domains
27
Appendix to ces web 2012: Size of largest
domains
Largest domains
Source
# of sentences
darren-shan.ic.cz/
12594
sw.gurroa.cz/
11381
oficialnistranky.cz/
9019
www.zitova.cz/
7926
synopse.startrek.cz/
7167
www.hutka.cz/
6289
www.chorvatsko.cz/ 6257
www.dvs.cz/
6220
www.hcjb.cz/
6180
web.meulovo.cz/
5980
# of distinct sources
87781
Appendix to ces mixed 2012: Size of largest
domains
Largest domains
Source
# of sentences
1403681
HN.IHNED.CZ/
1396933
zpravy.idnes.cz/
1386734
www.blesk.cz/
1153560
www.novinky.cz/
920413
www.rozhlas.cz/
911077
www.halonoviny.cz/
838714
www.financninoviny.cz/ 625736
EKONOM.IHNED.CZ/
614566
www.blisty.cz/
598923
# of distinct sources
112486
Appendix to ces mixed 2012: Size of largest domains
28
Appendix to ces news 2005-2007: Number of
sources by time period
Number of sources by year, month, and day
Number of sources per year
year # of sources
2007 70541
Number of sources per month
%
98.01
Appendix to ces news 2005-2007: Number of sources by time period
month
# of sources
29
%
2007-03 4682
6.51
2007-04 5049
7.02
2007-05 7837
10.89
2007-06 8182
11.37
2007-07 5342
7.42
2007-08 9287
12.90
2007-09 6940
9.64
2007-10 8719
12.11
2007-11 7909
10.99
2007-12 6594
9.16
Appendix to ces news 2008: Number of sources by
time period
Number of sources by year, month, and day
Appendix to ces news 2008: Number of sources by time period
30
Number of sources per year
year # of sources
2008 119822
%
100.00
Number of sources per month
month
# of sources
%
2008-01 9230
7.70
2008-02 7197
6.01
2008-03 8948
7.47
2008-04 9372
7.82
2008-05 9019
7.53
2008-06 10926
9.12
2008-07 11006
9.19
2008-08 10870
9.07
2008-09 10990
9.17
2008-10 11238
9.38
2008-11 10650
8.89
2008-12 10376
8.66
Appendix to ces news 2009: Number of sources by time period
31
Appendix to ces news 2009: Number of sources by
time period
Number of sources by year, month, and day
Number of sources per year
year # of sources
2009 124661
%
100.00
Number of sources per month
month
# of sources
%
2009-01 11480
9.21
2009-02 10899
8.74
2009-03 11591
9.30
2009-04 11206
8.99
2009-05 10750
8.62
2009-06 10810
8.67
2009-07 9650
7.74
2009-08 9697
7.78
2009-09 10585
8.49
Appendix to ces news 2009: Number of sources by time period
32
2009-10 11049
8.86
2009-11 7155
5.74
2009-12 9789
7.85
Appendix to ces news 2010: Number of sources by
time period
Number of sources by year, month, and day
Number of sources per year
year # of sources
2010 141726
Number of sources per month
%
100.00
Appendix to ces news 2010: Number of sources by time period
month
# of sources
33
%
2010-01 10941
7.72
2010-02 9541
6.73
2010-03 10922
7.71
2010-04 10180
7.18
2010-05 9264
6.54
2010-06 9821
6.93
2010-07 9497
6.70
2010-08 20936
14.77
2010-09 14054
9.92
2010-10 12548
8.85
2010-11 12044
8.50
2010-12 11978
8.45
Appendix to ces news 2011: Number of sources by
time period
Number of sources by year, month, and day
Appendix to ces news 2011: Number of sources by time period
34
Number of sources per year
year # of sources
2011 151807
%
100.00
Number of sources per month
month
# of sources
%
2011-01 12754
8.40
2011-02 12172
8.02
2011-03 12396
8.17
2011-04 13242
8.72
2011-05 12895
8.49
2011-06 10990
7.24
2011-07 11982
7.89
2011-08 14006
9.23
2011-09 13964
9.20
2011-10 13646
8.99
2011-11 13939
9.18
2011-12 9821
6.47
Appendix to ces news 2012: Number of sources by time period
35
Appendix to ces news 2012: Number of sources by
time period
Number of sources by year, month, and day
Number of sources per year
year # of sources
2012 119720
%
100.00
Number of sources per month
month
# of sources
%
2012-01 10313
8.61
2012-02 9728
8.13
2012-03 10194
8.51
2012-04 9627
8.04
2012-05 9069
7.58
2012-06 10022
8.37
2012-07 10317
8.62
2012-08 10338
8.64
2012-09 9475
7.91
Appendix to ces news 2012: Number of sources by time period
36
2012-10 11159
9.32
2012-11 10468
8.74
2012-12 9010
7.53
37
Word details
Appendix to ces news 2005-2007: Words by
length without multiplicity
Percentage of words of fixed length in characters, counted without multiplicty
Average word length
8.6512
word length percentage
1
0.0303
2
0.2577
3
1.5527
4
3.7561
5
7.2599
6
10.2580
7
13.4530
8
14.9797
9
14.2247
Appendix to ces news 2005-2007: Words by length without multiplicity
10
11.6258
11
8.4237
12
5.6885
13
3.7248
14
2.3295
15
1.4544
16
0.8926
17
0.5905
18
0.3815
19
0.2551
20
0.1802
21
0.1229
22
0.0878
23
0.0615
24
0.0406
25
0.0267
26
0.0213
27
0.0172
28
0.0138
29
0.0114
30
0.0102
31
0.0065
32
0.0067
33
0.0048
34
0.0041
35
0.0036
36
0.0036
37
0.0028
38
0.0026
39
0.0031
40
0.0009
41
0.0015
42
0.0010
43
0.0007
44
0.0003
45
0.0009
46
0.0005
47
0.0002
48
0.0002
38
Appendix to ces news 2005-2007: Words by length without multiplicity
49
0.0003
50
0.0002
Appendix to ces news 2008: Words by length
without multiplicity
Percentage of words of fixed length in characters, counted without multiplicty
Average word length
8.6512
word length percentage
1
0.0219
2
0.2562
3
1.5304
4
3.7354
5
7.3829
6
10.2906
7
13.5971
8
14.9076
9
14.1834
39
Appendix to ces news 2008: Words by length without multiplicity
10
11.5650
11
8.3600
12
5.6757
13
3.6386
14
2.3635
15
1.4980
16
0.9476
17
0.6372
18
0.4205
19
0.2795
20
0.1955
21
0.1291
22
0.0968
23
0.0621
24
0.0447
25
0.0304
26
0.0238
27
0.0190
28
0.0153
29
0.0129
30
0.0088
31
0.0069
32
0.0056
33
0.0041
34
0.0029
35
0.0029
36
0.0021
37
0.0013
38
0.0012
39
0.0013
40
0.0006
41
0.0009
42
0.0010
43
0.0007
44
0.0001
45
0.0003
46
0.0006
47
0.0004
48
0.0004
40
Appendix to ces news 2008: Words by length without multiplicity
49
0.0001
50
0.0003
Appendix to ces news 2009: Words by length
without multiplicity
Percentage of words of fixed length in characters, counted without multiplicty
Average word length
8.6738
word length percentage
1
0.0257
2
0.2483
3
1.5323
4
3.7438
5
7.3252
6
10.1683
7
13.5597
8
14.8502
9
14.0771
41
Appendix to ces news 2009: Words by length without multiplicity
10
11.5877
11
8.4352
12
5.7270
13
3.7265
14
2.3864
15
1.5252
16
0.9684
17
0.6228
18
0.4335
19
0.2843
20
0.2006
21
0.1293
22
0.0989
23
0.0651
24
0.0427
25
0.0300
26
0.0237
27
0.0197
28
0.0152
29
0.0125
30
0.0102
31
0.0065
32
0.0047
33
0.0056
34
0.0036
35
0.0032
36
0.0030
37
0.0026
38
0.0019
39
0.0010
40
0.0007
41
0.0011
42
0.0006
43
0.0009
44
0.0001
45
0.0003
46
0.0011
47
0.0004
49
0.0001
42
Appendix to ces news 2009: Words by length without multiplicity
50
0.0006
Appendix to ces news 2010: Words by length
without multiplicity
Percentage of words of fixed length in characters, counted without multiplicty
Average word length
8.6394
word length percentage
1
0.0217
2
0.2642
3
1.5441
4
3.8288
5
7.7353
6
10.6764
7
13.4317
8
14.5833
9
13.8176
10
11.3818
43
Appendix to ces news 2010: Words by length without multiplicity
11
8.2327
12
5.6181
13
3.6875
14
2.3711
15
1.5286
16
0.9640
17
0.6396
18
0.4553
19
0.2732
20
0.1939
21
0.1276
22
0.0919
23
0.0605
24
0.0430
25
0.0289
26
0.0209
27
0.0170
28
0.0160
29
0.0116
30
0.0108
31
0.0075
32
0.0057
33
0.0049
34
0.0040
35
0.0036
36
0.0028
37
0.0023
38
0.0013
39
0.0012
40
0.0008
41
0.0015
42
0.0008
43
0.0005
44
0.0003
45
0.0011
46
0.0008
47
0.0003
49
0.0003
50
0.0003
44
Appendix to ces news 2011: Words by length without multiplicity
Appendix to ces news 2011: Words by length
without multiplicity
Percentage of words of fixed length in characters, counted without multiplicty
Average word length
8.5428
word length percentage
1
0.0272
2
0.2776
3
1.6195
4
3.9452
5
7.9659
6
10.8862
7
13.7527
8
14.8728
9
13.8839
10
11.2869
11
8.0072
12
5.3637
45
Appendix to ces news 2011: Words by length without multiplicity
13
3.4776
14
2.2118
15
1.4007
16
0.8968
17
0.5845
18
0.3953
19
0.2528
20
0.1730
21
0.1164
22
0.0749
23
0.0575
24
0.0367
25
0.0280
26
0.0206
27
0.0151
28
0.0149
29
0.0117
30
0.0102
31
0.0068
32
0.0048
33
0.0060
34
0.0026
35
0.0033
36
0.0037
37
0.0014
38
0.0016
39
0.0019
40
0.0004
41
0.0009
42
0.0004
43
0.0007
44
0.0004
45
0.0003
46
0.0009
47
0.0009
48
0.0004
49
0.0001
50
0.0001
46
Appendix to ces news 2012: Words by length without multiplicity
Appendix to ces news 2012: Words by length
without multiplicity
Percentage of words of fixed length in characters, counted without multiplicty
Average word length
8.5798
word length percentage
1
0.0256
2
0.2696
3
1.5376
4
3.8107
5
7.5196
6
10.6283
7
13.9478
8
15.1542
9
14.1920
10
11.3335
11
8.0663
12
5.4096
47
Appendix to ces news 2012: Words by length without multiplicity
13
3.4652
14
2.2086
15
1.4051
16
0.8896
17
0.5970
18
0.3938
19
0.2595
20
0.1712
21
0.1217
22
0.0845
23
0.0575
24
0.0373
25
0.0279
26
0.0191
27
0.0165
28
0.0150
29
0.0125
30
0.0097
31
0.0091
32
0.0046
33
0.0065
34
0.0034
35
0.0044
36
0.0025
37
0.0025
38
0.0024
39
0.0019
40
0.0003
41
0.0010
42
0.0006
43
0.0009
44
0.0003
45
0.0003
46
0.0009
47
0.0003
48
0.0001
49
0.0003
50
0.0003
48
Appendix to ces newscrawl 2011: Words by length without multiplicity
Appendix to ces newscrawl 2011: Words by
length without multiplicity
Percentage of words of fixed length in characters, counted without multiplicty
Average word length
8.8969
word length percentage
1
0.0155
2
0.2115
3
1.3724
4
3.4722
5
6.8852
6
9.8244
7
13.0798
8
14.5243
9
13.8725
10
11.4490
11
8.5052
12
5.9704
49
Appendix to ces newscrawl 2011: Words by length without multiplicity
13
4.0253
14
2.6758
15
1.7888
16
1.2123
17
0.7792
18
0.5206
19
0.3499
20
0.2448
21
0.1767
22
0.1263
23
0.0854
24
0.0629
25
0.0476
26
0.0353
27
0.0274
28
0.0228
29
0.0208
30
0.0153
31
0.0111
32
0.0111
33
0.0074
34
0.0056
35
0.0206
36
0.0035
37
0.0032
38
0.0022
39
0.0022
40
0.0016
41
0.0017
42
0.0012
43
0.0009
44
0.0009
45
0.0006
46
0.0012
47
0.0011
48
0.0002
49
0.0003
50
0.0002
50
Appendix to ces newscrawl 2012: Words by length without multiplicity
Appendix to ces newscrawl 2012: Words by
length without multiplicity
Percentage of words of fixed length in characters, counted without multiplicty
Average word length
8.9502
word length percentage
1
0.0147
2
0.1922
3
1.2630
4
3.2694
5
6.6540
6
9.6037
7
12.9597
8
14.5409
9
14.0955
10
11.6300
11
8.6876
12
6.0720
51
Appendix to ces newscrawl 2012: Words by length without multiplicity
13
4.1071
14
2.7197
15
1.8201
16
1.2024
17
0.7991
18
0.5319
19
0.3638
20
0.2482
21
0.1761
22
0.1214
23
0.0894
24
0.0621
25
0.0508
26
0.0378
27
0.0267
28
0.0222
29
0.0169
30
0.0138
31
0.0119
32
0.0094
33
0.0072
34
0.0054
35
0.0044
36
0.0043
37
0.0029
38
0.0024
39
0.0026
40
0.0021
41
0.0018
42
0.0013
43
0.0013
44
0.0006
45
0.0010
46
0.0011
47
0.0007
48
0.0006
49
0.0006
50
0.0004
52
Appendix to ces wikipedia 2007: Words by length without multiplicity
Appendix to ces wikipedia 2007: Words by length
without multiplicity
Percentage of words of fixed length in characters, counted without multiplicty
Average word length
8.4461
word length percentage
1
0.0756
2
0.4915
3
2.1397
4
4.4020
5
7.6548
6
10.8339
7
13.8229
8
14.7796
9
14.1711
10
11.0915
11
8.0244
12
5.5011
53
Appendix to ces wikipedia 2007: Words by length without multiplicity
13
3.6722
14
2.4317
15
1.5887
16
1.0738
17
0.7208
18
0.4817
19
0.3488
20
0.2610
21
0.1890
22
0.1469
23
0.1155
24
0.0886
25
0.0663
26
0.0585
27
0.0437
28
0.0411
29
0.0321
30
0.0265
31
0.0220
32
0.0142
33
0.0134
34
0.0098
35
0.0084
36
0.0086
37
0.0062
38
0.0054
39
0.0046
40
0.0038
41
0.0040
42
0.0028
43
0.0026
44
0.0012
45
0.0018
46
0.0010
47
0.0004
48
0.0004
49
0.0006
50
0.0008
54
Appendix to ces wikipedia 2012: Words by length without multiplicity
Appendix to ces wikipedia 2012: Words by length
without multiplicity
Percentage of words of fixed length in characters, counted without multiplicty
Average word length
8.6120
word length percentage
1
0.0633
2
0.3804
3
1.9652
4
4.2982
5
7.5878
6
10.4072
7
13.3367
8
14.3628
9
14.0146
10
11.1379
11
8.2491
12
5.7558
55
Appendix to ces wikipedia 2012: Words by length without multiplicity
13
3.9618
14
2.5794
15
1.7157
16
1.1504
17
0.7717
18
0.5362
19
0.3931
20
0.2818
21
0.2052
22
0.1638
23
0.1201
24
0.0920
25
0.0718
26
0.0589
27
0.0429
28
0.0389
29
0.0328
30
0.0240
31
0.0201
32
0.0147
33
0.0150
34
0.0106
35
0.0092
36
0.0092
37
0.0073
38
0.0064
39
0.0060
40
0.0056
41
0.0040
42
0.0047
43
0.0031
44
0.0028
45
0.0035
46
0.0016
47
0.0022
48
0.0014
49
0.0017
50
0.0011
56
Appendix to ces web 2002: Words by length without multiplicity
Appendix to ces web 2002: Words by length
without multiplicity
Percentage of words of fixed length in characters, counted without multiplicty
Average word length
8.8888
word length percentage
1
0.0128
2
0.2200
3
1.6476
4
3.9946
5
7.3535
6
9.8608
7
12.7821
8
13.9897
9
13.6271
10
11.0933
11
8.3553
12
5.8517
57
Appendix to ces web 2002: Words by length without multiplicity
13
3.9777
14
2.6345
15
1.7555
16
1.1692
17
0.7990
18
0.5351
19
0.3739
20
0.2632
21
0.1933
22
0.1427
23
0.1071
24
0.0777
25
0.0527
26
0.0478
27
0.0363
28
0.0294
29
0.0245
30
0.0182
31
0.0177
32
0.0132
33
0.0116
34
0.0118
35
0.0099
36
0.0126
37
0.0080
38
0.0055
39
0.0066
40
0.0045
41
0.0055
42
0.0044
43
0.0035
44
0.0026
45
0.0035
46
0.0029
47
0.0027
48
0.0018
49
0.0018
50
0.0025
58
Appendix to ces web 2011: Words by length without multiplicity
Appendix to ces web 2011: Words by length
without multiplicity
Percentage of words of fixed length in characters, counted without multiplicty
Average word length
8.8826
word length percentage
1
0.0170
2
0.2016
3
1.6738
4
4.0326
5
7.3805
6
9.8748
7
12.7449
8
13.9552
9
13.5379
10
11.0459
11
8.2947
12
5.8425
59
Appendix to ces web 2011: Words by length without multiplicity
13
3.9900
14
2.6772
15
1.8007
16
1.2049
17
0.8361
18
0.5783
19
0.4034
20
0.2856
21
0.2110
22
0.1528
23
0.1090
24
0.0831
25
0.0606
26
0.0463
27
0.0340
28
0.0258
29
0.0208
30
0.0156
31
0.0139
32
0.0109
33
0.0094
34
0.0073
35
0.0059
36
0.0047
37
0.0041
38
0.0036
39
0.0031
40
0.0030
41
0.0026
42
0.0021
43
0.0017
44
0.0010
45
0.0014
46
0.0012
47
0.0007
48
0.0005
49
0.0005
50
0.0007
60
Appendix to ces web 2012: Words by length without multiplicity
Appendix to ces web 2012: Words by length
without multiplicity
Percentage of words of fixed length in characters, counted without multiplicty
Average word length
8.8816
word length percentage
1
0.0165
2
0.1933
3
1.6069
4
3.9598
5
7.4079
6
9.9556
7
12.7912
8
14.0263
9
13.5548
10
11.0756
11
8.2850
12
5.8132
61
Appendix to ces web 2012: Words by length without multiplicity
13
3.9312
14
2.6298
15
1.7855
16
1.1821
17
0.8294
18
0.5731
19
0.3961
20
0.2870
21
0.2071
22
0.1491
23
0.1062
24
0.0825
25
0.0622
26
0.0479
27
0.0353
28
0.0266
29
0.0203
30
0.0165
31
0.0148
32
0.0112
33
0.0096
34
0.0073
35
0.0063
36
0.0050
37
0.0046
38
0.0039
39
0.0031
40
0.0030
41
0.0028
42
0.0022
43
0.0018
44
0.0015
45
0.0015
46
0.0014
47
0.0008
48
0.0005
49
0.0005
50
0.0007
62
Appendix to ces mixed 2012: Words by length without multiplicity
Appendix to ces mixed 2012: Words by length
without multiplicity
Percentage of words of fixed length in characters, counted without multiplicty
Average word length
9.2379
word length percentage
1
0.0165
2
0.1320
3
1.1371
4
3.2277
5
6.8530
6
9.5172
7
12.1181
8
13.2914
9
13.2992
10
11.1220
11
8.6660
12
6.3584
63
Appendix to ces mixed 2012: Words by length without multiplicity
13
4.5098
14
3.1476
15
2.2163
16
1.5539
17
1.0853
18
0.7687
19
0.5445
20
0.3925
21
0.2868
22
0.2075
23
0.1508
24
0.1109
25
0.0810
26
0.0625
27
0.0472
28
0.0356
29
0.0300
30
0.0219
31
0.0196
32
0.0145
33
0.0120
34
0.0099
35
0.0085
36
0.0079
37
0.0056
38
0.0043
39
0.0043
40
0.0035
41
0.0033
42
0.0027
43
0.0021
44
0.0017
45
0.0017
46
0.0014
47
0.0013
48
0.0007
49
0.0007
50
0.0010
64
Appendix to ces news 2005-2007: Words by length with multiplicity
Appendix to ces news 2005-2007: Words by
length with multiplicity
Percentage of words of fixed length in characters, counted with multiplicty
Average word length
5.5147
word length percentage
1
8.1616
2
12.4253
3
7.4234
4
11.1105
5
13.5752
6
11.1536
7
10.9223
8
8.9959
9
6.5209
10
4.2285
11
2.4517
12
1.3184
65
Appendix to ces news 2005-2007: Words by length with multiplicity
13
0.7655
14
0.3998
15
0.2368
16
0.1200
17
0.0668
18
0.0359
19
0.0263
20
0.0165
21
0.0107
22
0.0074
23
0.0057
24
0.0034
25
0.0020
26
0.0031
27
0.0026
28
0.0016
29
0.0010
30
0.0017
66
Appendix to ces news 2008: Words by length with multiplicity
67
Appendix to ces news 2008: Words by length with
multiplicity
Percentage of words of fixed length in characters, counted with multiplicty
Average word length
5.4241
word length percentage
1
8.1434
2
12.7536
3
7.7157
4
11.5316
5
13.9041
6
11.3590
7
10.8237
8
8.5796
9
6.2163
10
3.9279
11
2.2514
12
1.2026
Appendix to ces news 2008: Words by length with multiplicity
68
13
0.7066
14
0.3676
15
0.2213
16
0.1153
17
0.0658
18
0.0365
19
0.0257
20
0.0131
21
0.0095
22
0.0066
23
0.0048
24
0.0033
25
0.0021
26
0.0026
27
0.0023
28
0.0015
29
0.0008
30
0.0011
Appendix to ces news 2009: Words by length with multiplicity
69
Appendix to ces news 2009: Words by length with
multiplicity
Percentage of words of fixed length in characters, counted with multiplicty
Average word length
5.4174
word length percentage
1
8.0797
2
12.8077
3
7.8126
4
11.5257
5
13.9517
6
11.3320
7
10.8151
8
8.6167
9
6.1522
10
3.9040
11
2.2280
12
1.1908
Appendix to ces news 2009: Words by length with multiplicity
70
13
0.6996
14
0.3674
15
0.2216
16
0.1113
17
0.0663
18
0.0395
19
0.0241
20
0.0143
21
0.0098
22
0.0069
23
0.0054
24
0.0028
25
0.0019
26
0.0025
27
0.0022
28
0.0014
29
0.0010
30
0.0011
Appendix to ces news 2010: Words by length with multiplicity
71
Appendix to ces news 2010: Words by length with
multiplicity
Percentage of words of fixed length in characters, counted with multiplicty
Average word length
5.3959
word length percentage
1
7.9550
2
12.9430
3
7.8991
4
11.5937
5
14.0281
6
11.4542
7
10.8665
8
8.5558
9
6.0672
10
3.8020
11
2.1630
12
1.1474
Appendix to ces news 2010: Words by length with multiplicity
72
13
0.6669
14
0.3515
15
0.2156
16
0.1103
17
0.0667
18
0.0359
19
0.0229
20
0.0139
21
0.0095
22
0.0066
23
0.0057
24
0.0029
25
0.0019
26
0.0033
27
0.0030
28
0.0012
29
0.0008
30
0.0019
Appendix to ces news 2011: Words by length with multiplicity
73
Appendix to ces news 2011: Words by length with
multiplicity
Percentage of words of fixed length in characters, counted with multiplicty
Average word length
5.3767
word length percentage
1
7.9779
2
13.0135
3
7.9139
4
11.4830
5
14.1525
6
11.6046
7
10.9058
8
8.5456
9
6.0271
10
3.7303
11
2.0860
12
1.1022
Appendix to ces news 2011: Words by length with multiplicity
74
13
0.6448
14
0.3301
15
0.1980
16
0.1062
17
0.0647
18
0.0356
19
0.0220
20
0.0136
21
0.0092
22
0.0058
23
0.0054
24
0.0039
25
0.0018
26
0.0034
27
0.0031
28
0.0009
29
0.0009
30
0.0040
Appendix to ces news 2012: Words by length with multiplicity
75
Appendix to ces news 2012: Words by length with
multiplicity
Percentage of words of fixed length in characters, counted with multiplicty
Average word length
5.3657
word length percentage
1
8.2146
2
13.1706
3
7.8236
4
11.4594
5
13.9697
6
11.4367
7
10.9173
8
8.5502
9
6.0496
10
3.7578
11
2.0944
12
1.1035
Appendix to ces news 2012: Words by length with multiplicity
76
13
0.6264
14
0.3364
15
0.2009
16
0.1074
17
0.0684
18
0.0356
19
0.0233
20
0.0137
21
0.0101
22
0.0057
23
0.0057
24
0.0035
25
0.0016
26
0.0032
27
0.0031
28
0.0011
29
0.0009
30
0.0011
Appendix to ces newscrawl 2011: Words by length with multiplicity
Appendix to ces newscrawl 2011: Words by
length with multiplicity
Percentage of words of fixed length in characters, counted with multiplicty
Average word length
5.3356
word length percentage
1
8.1290
2
13.5146
3
7.9098
4
11.8447
5
13.9570
6
11.2666
7
10.7425
8
8.3535
9
5.9379
10
3.7085
11
2.0676
12
1.1126
77
Appendix to ces newscrawl 2011: Words by length with multiplicity
13
0.6283
14
0.3326
15
0.1987
16
0.1082
17
0.0634
18
0.0346
19
0.0239
20
0.0166
21
0.0103
22
0.0090
23
0.0062
24
0.0038
25
0.0025
26
0.0038
27
0.0029
28
0.0016
29
0.0017
30
0.0012
78
Appendix to ces newscrawl 2012: Words by length with multiplicity
Appendix to ces newscrawl 2012: Words by
length with multiplicity
Percentage of words of fixed length in characters, counted with multiplicty
Average word length
5.2916
word length percentage
1
8.4696
2
13.7758
3
7.9461
4
11.8023
5
13.8514
6
11.2854
7
10.6257
8
8.1904
9
5.8677
10
3.6844
11
2.0278
12
1.0838
79
Appendix to ces newscrawl 2012: Words by length with multiplicity
13
0.5952
14
0.3249
15
0.1879
16
0.1047
17
0.0636
18
0.0335
19
0.0225
20
0.0145
21
0.0095
22
0.0069
23
0.0060
24
0.0036
25
0.0024
26
0.0030
27
0.0026
28
0.0014
29
0.0012
30
0.0011
80
Appendix to ces wikipedia 2007: Words by length with multiplicity
Appendix to ces wikipedia 2007: Words by length
with multiplicity
Percentage of words of fixed length in characters, counted with multiplicty
Average word length
5.5553
word length percentage
1
9.1472
2
10.9398
3
6.8374
4
12.4758
5
13.0412
6
11.0763
7
11.2262
8
8.8676
9
6.4638
10
4.0775
11
2.4140
12
1.3514
81
Appendix to ces wikipedia 2007: Words by length with multiplicity
13
0.8003
14
0.4724
15
0.2770
16
0.1709
17
0.1055
18
0.0646
19
0.0466
20
0.0359
21
0.0227
22
0.0174
23
0.0147
24
0.0107
25
0.0074
26
0.0076
27
0.0053
28
0.0054
29
0.0031
30
0.0029
82
Appendix to ces wikipedia 2012: Words by length with multiplicity
Appendix to ces wikipedia 2012: Words by length
with multiplicity
Percentage of words of fixed length in characters, counted with multiplicty
Average word length
5.5194
word length percentage
1
9.2457
2
10.8939
3
7.0212
4
12.5939
5
12.9801
6
11.0353
7
11.2667
8
8.8864
9
6.4246
10
4.0686
11
2.3943
12
1.3220
83
Appendix to ces wikipedia 2012: Words by length with multiplicity
13
0.7551
14
0.4338
15
0.2486
16
0.1461
17
0.0827
18
0.0535
19
0.0378
20
0.0268
21
0.0173
22
0.0137
23
0.0104
24
0.0077
25
0.0059
26
0.0049
27
0.0037
28
0.0041
29
0.0029
30
0.0021
84
Appendix to ces web 2002: Words by length with multiplicity
85
Appendix to ces web 2002: Words by length with
multiplicity
Percentage of words of fixed length in characters, counted with multiplicty
Average word length
5.5130
word length percentage
1
9.0642
2
11.7659
3
7.5255
4
11.2303
5
12.6948
6
11.0180
7
11.0701
8
9.0421
9
6.7077
10
4.3706
11
2.4831
12
1.3882
Appendix to ces web 2002: Words by length with multiplicity
86
13
0.7202
14
0.3911
15
0.2320
16
0.1129
17
0.0649
18
0.0349
19
0.0228
20
0.0150
21
0.0105
22
0.0072
23
0.0060
24
0.0045
25
0.0026
26
0.0026
27
0.0023
28
0.0017
29
0.0013
30
0.0010
Appendix to ces web 2011: Words by length with multiplicity
87
Appendix to ces web 2011: Words by length with
multiplicity
Percentage of words of fixed length in characters, counted with multiplicty
Average word length
5.4670
word length percentage
1
9.1734
2
11.9433
3
7.5141
4
11.2472
5
12.7761
6
11.1804
7
11.1656
8
8.9590
9
6.6142
10
4.2760
11
2.3738
12
1.2823
Appendix to ces web 2011: Words by length with multiplicity
88
13
0.6757
14
0.3489
15
0.2102
16
0.1009
17
0.0581
18
0.0309
19
0.0206
20
0.0132
21
0.0085
22
0.0062
23
0.0046
24
0.0036
25
0.0025
26
0.0022
27
0.0017
28
0.0015
29
0.0010
30
0.0008
Appendix to ces web 2012: Words by length with multiplicity
89
Appendix to ces web 2012: Words by length with
multiplicity
Percentage of words of fixed length in characters, counted with multiplicty
Average word length
5.4236
word length percentage
1
9.1543
2
12.1202
3
7.6576
4
11.4906
5
12.8585
6
11.2412
7
11.0961
8
8.8313
9
6.4797
10
4.1472
11
2.2884
12
1.2228
Appendix to ces web 2012: Words by length with multiplicity
90
13
0.6399
14
0.3282
15
0.1990
16
0.0950
17
0.0546
18
0.0291
19
0.0192
20
0.0126
21
0.0083
22
0.0060
23
0.0043
24
0.0035
25
0.0024
26
0.0021
27
0.0016
28
0.0013
29
0.0009
30
0.0008
Appendix to ces mixed 2012: Words by length with multiplicity
91
Appendix to ces mixed 2012: Words by length
with multiplicity
Percentage of words of fixed length in characters, counted with multiplicty
Average word length
5.4282
word length percentage
1
8.6538
2
12.4297
3
7.6323
4
11.5040
5
13.4282
6
11.2773
7
10.9849
8
8.7292
9
6.3215
10
4.0263
11
2.2645
12
1.2193
Appendix to ces mixed 2012: Words by length with multiplicity
92
13
0.6711
14
0.3561
15
0.2123
16
0.1096
17
0.0643
18
0.0350
19
0.0233
20
0.0148
21
0.0099
22
0.0069
23
0.0056
24
0.0038
25
0.0024
26
0.0029
27
0.0023
28
0.0015
29
0.0012
30
0.0013
Appendix to ces news 2005-2007: The most
frequent 50 words
Rank in Wordlist Word Rank in Wordlist Word
1
a
26
od
2
v
27
bude
3
se
28
který
4
na
29
podle
5
je
30
už
6
že
31
také
7
o
32
má
8
z
33
než
9
s
34
však
10
to
35
aby
11
do
36
jeho
12
i
37
jen
13
by
38
nebo
14
ale
39
až
15
za
40
která
Appendix to ces news 2005-2007: The most frequent 50 words
93
16
pro
41
byl
17
ve
42
Na
18
k
43
roku
19
si
44
ze
20
V
45
u
21
tak
46
co
22
jako
47
být
23
které
48
jsem
24
po
49
jak
25
jsou
50
před
Appendix to ces news 2008: The most frequent 50
words
Rank in Wordlist Word Rank in Wordlist Word
1
a
26
které
2
se
27
jsou
3
v
28
od
4
na
29
bude
5
že
30
podle
6
je
31
jsem
7
o
32
také
8
to
33
jen
9
s
34
má
10
z
35
než
11
do
36
jeho
12
i
37
byl
13
ale
38
aby
14
za
39
nebo
15
by
40
až
16
si
41
která
17
ve
42
před
18
pro
43
A
19
k
44
však
20
V
45
co
21
po
46
Na
22
tak
47
jsme
23
jako
48
ze
Appendix to ces news 2008: The most frequent 50 words
94
24
který
49
jak
25
už
50
být
Appendix to ces news 2009: The most frequent 50
words
Rank in Wordlist Word Rank in Wordlist Word
1
a
26
které
2
se
27
od
3
v
28
bude
4
na
29
jsou
5
že
30
podle
6
je
31
jsem
7
to
32
jen
8
o
33
také
9
s
34
má
10
z
35
než
11
do
36
jeho
12
i
37
až
13
ale
38
byl
14
by
39
aby
15
za
40
nebo
16
si
41
před
17
ve
42
která
18
pro
43
A
19
k
44
jsme
20
V
45
co
21
po
46
Na
22
tak
47
však
23
jako
48
ze
24
už
49
jak
25
který
50
být
Appendix to ces news 2010: The most frequent 50 words
95
Appendix to ces news 2010: The most frequent 50
words
Rank in Wordlist Word Rank in Wordlist Word
1
a
26
které
2
se
27
od
3
v
28
bude
4
na
29
jsou
5
je
30
podle
6
že
31
jen
7
to
32
jsem
8
o
33
má
9
s
34
také
10
z
35
než
11
do
36
nebo
12
i
37
jeho
13
ale
38
až
14
si
39
byl
15
za
40
A
16
by
41
aby
17
ve
42
před
18
pro
43
která
19
k
44
co
20
tak
45
Na
21
po
46
jak
22
V
47
ze
23
jako
48
u
24
už
49
však
25
který
50
jsme
Appendix to ces news 2011: The most frequent 50 words
96
Appendix to ces news 2011: The most frequent 50
words
Rank in Wordlist Word Rank in Wordlist Word
1
a
26
který
2
se
27
bude
3
v
28
které
4
na
29
jsou
5
je
30
jsem
6
že
31
podle
7
to
32
jen
8
o
33
má
9
z
34
jeho
10
s
35
nebo
11
do
36
také
12
i
37
byl
13
ale
38
než
14
si
39
co
15
za
40
až
16
by
41
před
18
pro
43
Na
19
k
44
aby
20
po
45
která
21
tak
46
jak
22
V
47
ze
23
už
48
A
24
jako
49
jsme
25
od
50
u
26
který
51
být
Appendix to ces news 2012: The most frequent 50 words
97
Appendix to ces news 2012: The most frequent 50
words
Rank in Wordlist Word Rank in Wordlist Word
1
a
26
od
2
se
27
které
3
v
28
bude
4
na
29
jsou
5
je
30
jsem
6
že
31
podle
7
to
32
jen
8
s
33
má
9
z
34
jeho
10
o
35
nebo
11
do
36
byl
12
i
37
také
13
ale
38
než
14
si
39
před
15
za
40
která
16
ve
41
až
17
by
42
co
18
pro
43
Na
19
k
44
aby
20
po
45
ze
21
tak
46
jak
22
už
47
A
23
V
48
u
24
jako
49
když
25
který
50
jsme
Appendix to ces newscrawl 2011: The most frequent 50 words
98
Appendix to ces newscrawl 2011: The most
frequent 50 words
Rank in Wordlist Word Rank in Wordlist Word
1
a
26
od
2
se
27
které
3
na
28
jsem
4
v
29
bude
5
je
30
nebo
7
to
32
který
8
z
33
co
9
s
34
jen
10
o
35
A
11
do
36
má
12
i
37
také
13
si
38
jak
14
ale
39
Na
15
by
40
u
16
za
41
byl
17
pro
42
ze
18
ve
43
podle
19
tak
44
jeho
20
jako
45
než
21
k
46
až
22
po
47
aby
23
V
48
která
24
jsou
49
když
25
už
50
–
26
od
51
být
Appendix to ces newscrawl 2012: The most frequent 50 words
99
Appendix to ces newscrawl 2012: The most
frequent 50 words
Rank in Wordlist Word Rank in Wordlist Word
1
a
26
jsou
2
se
27
od
3
v
28
které
4
na
29
který
5
je
30
nebo
6
že
31
bude
7
to
32
co
8
s
33
A
9
z
34
také
10
do
35
jen
11
o
36
jak
12
i
37
má
13
si
38
byl
14
ale
39
u
15
ve
40
jeho
16
by
41
ze
17
za
42
Na
18
pro
43
která
19
tak
44
když
20
k
45
až
21
jako
46
aby
22
po
47
podle
23
V
48
než
24
už
49
jsme
25
jsem
50
před
Appendix to ces wikipedia 2007: The most frequent 50 words
100
Appendix to ces wikipedia 2007: The most
frequent 50 words
Rank in Wordlist Word Rank in Wordlist Word
1
a
26
ale
2
se
27
které
3
v
28
nebo
4
na
29
který
5
je
30
také
6
z
31
až
7
s
32
bylo
8
do
33
však
9
V
34
to
10
byl
35
tak
11
jako
36
která
12
i
37
–
13
ve
38
Na
14
o
39
u
15
k
40
mezi
16
roce
41
při
17
že
42
má
18
pro
43
byly
19
jsou
44
ze
20
jeho
45
století
21
byla
46
si
22
roku
47
kde
23
od
48
zde
24
za
49
Po
25
po
50
své
Appendix to ces wikipedia 2012: The most frequent 50 words
101
Appendix to ces wikipedia 2012: The most
frequent 50 words
Rank in Wordlist Word Rank in Wordlist Word
1
a
26
ale
2
se
27
které
3
v
28
nebo
4
na
29
také
5
je
30
bylo
6
z
31
který
7
s
32
až
8
do
33
však
9
V
34
tak
10
byl
35
to
11
ve
36
Na
12
jako
37
byly
13
i
38
u
14
o
39
která
15
k
40
si
16
že
41
–
17
pro
42
ze
18
roce
43
při
19
jsou
44
mezi
20
byla
45
má
21
jeho
46
Po
22
od
47
let
23
po
48
zde
24
roku
49
své
25
za
50
být
Appendix to ces web 2002: The most frequent 50 words
102
Appendix to ces web 2002: The most frequent 50
words
Rank in Wordlist Word Rank in Wordlist Word
1
a
26
od
2
se
27
by
3
v
28
jsem
4
na
29
byl
5
je
30
který
6
s
31
při
7
z
32
jsme
8
do
33
u
9
pro
34
jeho
10
že
35
také
11
o
36
byla
12
i
37
bude
13
k
38
bylo
14
to
39
být
15
ve
40
Na
16
jsou
41
co
17
V
42
jak
18
si
43
ze
19
za
44
aby
20
ale
45
která
21
jako
46
jen
22
nebo
47
má
23
které
48
až
24
po
49
jejich
25
tak
50
však
Appendix to ces web 2011: The most frequent 50 words
103
Appendix to ces web 2011: The most frequent 50
words
Rank in Wordlist Word Rank in Wordlist Word
1
a
26
od
2
se
27
jsme
3
na
28
jsem
4
v
29
který
5
je
30
také
6
s
31
při
7
pro
32
u
8
z
33
by
9
do
34
jak
10
i
35
bude
11
že
36
Na
12
o
37
byl
13
to
38
co
14
si
39
která
15
k
40
jen
16
ve
41
až
17
jsou
42
být
18
V
43
byla
19
nebo
44
má
20
ale
45
už
21
za
46
ze
22
které
47
jeho
23
jako
48
či
24
tak
49
–
25
po
50
bylo
Appendix to ces web 2012: The most frequent 50 words
104
Appendix to ces web 2012: The most frequent 50
words
Rank in Wordlist Word Rank in Wordlist Word
1
a
26
od
2
se
27
jsem
3
na
28
jsme
4
v
29
také
5
je
30
který
6
s
31
u
7
pro
32
při
8
z
33
by
9
do
34
jak
10
i
35
co
11
že
36
bude
12
to
37
byl
13
o
38
Na
14
si
39
až
15
k
40
jen
16
ve
41
která
17
jsou
42
má
18
V
43
byla
19
nebo
44
být
20
ale
45
jeho
21
za
46
ze
22
které
47
už
23
tak
48
aby
24
jako
49
bylo
25
po
50
či
Appendix to ces mixed 2012: The most frequent 50 words
105
Appendix to ces mixed 2012: The most frequent
50 words
Rank in Wordlist Word Rank in Wordlist Word
1
a
26
od
2
se
27
nebo
3
v
28
který
4
na
29
jsem
5
je
30
také
6
že
31
bude
7
s
32
už
8
z
33
byl
9
to
34
jsme
10
do
35
jen
11
o
36
jeho
12
i
37
u
13
pro
38
má
14
si
39
co
15
ve
40
až
16
ale
41
jak
17
k
42
která
18
za
43
Na
19
V
44
při
20
jsou
45
aby
21
by
46
ze
22
jako
47
než
23
tak
48
podle
24
po
49
byla
25
které
50
být
Appendix to ces news 2005-2007: Longest words in top-1.000 by rank
106
Appendix to ces news 2005-2007: Longest words
in top-1.000 by rank
The 20 words of maximal string length ordered by rank
Local Rank Rank in Wordlist
Word
Length
1
89
společnosti
11
2
180
společnost
10
3
279
posledních
10
4
284
rozhodnutí
10
5
332
prezidenta
10
6
348
ministerstva
12
7
469
ministerstvo
12
8
548
společností
11
9
575
zdravotnictví
13
10
579
mezinárodní
11
11
611
zaměstnanců
11
12
658
souvislosti
11
13
682
prostřednictvím 15
14
722
jednotlivých
12
15
783
současnosti
11
16
814
Ministerstvo
12
17
820
zahraničních
12
18
909
mistrovství
11
19
943
bezpečnosti
11
20
949
představuje
11
Appendix to ces news 2008: Longest words in top-1.000 by rank
107
Appendix to ces news 2008: Longest words in
top-1.000 by rank
The 20 words of maximal string length ordered by rank
Local Rank Rank in Wordlist
Word
Length
1
101
společnosti
11
2
255
posledních
10
3
257
společnost
10
4
346
prezidenta
10
5
459
ministerstva
12
6
508
zdravotnictví
13
7
562
organizace
10
8
607
ministerstvo
12
9
642
mezinárodní
11
10
672
zaměstnanců
11
11
722
mistrovství
11
12
735
souvislosti
11
13
779
společností
11
14
844
finančních
10
15
858
současnosti
11
16
870
veřejnosti
10
17
873
amerického
10
18
955
Zpravodajství
13
19
959
jednotlivých
12
20
982
prostřednictvím 15
Appendix to ces news 2009: Longest words in top-1.000 by rank
108
Appendix to ces news 2009: Longest words in
top-1.000 by rank
The 20 words of maximal string length ordered by rank
Local Rank Rank in Wordlist
Word
Length
1
109
společnosti
11
2
457
ministerstva
12
3
497
samozřejmě
10
4
544
zaměstnanců
11
5
545
ministerstvo
12
6
661
zdravotnictví
13
7
687
mistrovství
11
8
760
evropských
10
9
763
mezinárodní
11
10
772
hospodářské
11
11
799
souvislosti
11
12
823
pokračovat
10
13
837
prohlášení
10
14
840
konferenci
10
15
863
společností
11
16
870
současnosti
11
17
901
Afghánistánu
12
18
982
prostřednictvím 15
19
994
finančních
10
20
995
Zpravodajství
13
Appendix to ces news 2010: Longest words in top-1.000 by rank
109
Appendix to ces news 2010: Longest words in
top-1.000 by rank
The 20 words of maximal string length ordered by rank
Local Rank Rank in Wordlist
Word
Length
1
100
společnosti
11
2
246
společnost
10
3
277
posledních
10
4
323
rozhodnutí
10
5
463
ministerstva
12
6
498
ministerstvo
12
7
527
prezidenta
10
8
634
zaměstnanců
11
9
672
mistrovství
11
10
767
společností
11
11
785
zdravotnictví
13
12
899
současnosti
11
13
913
mezinárodní
11
14
936
souvislosti
11
15
947
spolupráci
10
16
948
zahraniční
10
17
969
pokračovat
10
18
972
prohlášení
10
19
983
evropských
10
20
988
prostřednictvím 15
Appendix to ces news 2011: Longest words in top-1.000 by rank
110
Appendix to ces news 2011: Longest words in
top-1.000 by rank
The 20 words of maximal string length ordered by rank
Local Rank Rank in Wordlist
Word
Length
1
102
společnosti
11
2
257
společnost
10
3
268
posledních
10
4
346
rozhodnutí
10
5
432
prezidenta
10
6
447
ministerstva
12
7
490
ministerstvo
12
8
504
samozřejmě
10
9
661
zdravotnictví
13
10
688
mistrovství
11
11
780
zaměstnanců
11
12
803
společností
11
13
835
organizace
10
14
923
mezinárodní
11
15
940
Ministerstvo
12
16
949
evropských
10
17
959
současnosti
11
18
976
pokračovat
10
19
982
prostřednictvím 15
20
984
prohlášení
10
Appendix to ces news 2012: Longest words in top-1.000 by rank
111
Appendix to ces news 2012: Longest words in
top-1.000 by rank
The 20 words of maximal string length ordered by rank
Local Rank Rank in Wordlist
Word
Length
1
111
společnosti
11
2
228
společnost
10
3
247
posledních
10
4
336
rozhodnutí
10
5
366
prezidenta
10
6
460
samozřejmě
10
7
474
ministerstva
12
8
541
ministerstvo
12
9
790
mistrovství
11
10
799
organizace
10
11
830
společností
11
12
834
zaměstnanců
11
13
888
spolupráci
10
14
901
mezinárodní
11
15
919
pokračovat
10
16
932
Společnost
10
17
943
prostřednictvím 15
18
967
vyšetřování
11
19
981
souvislosti
11
20
987
pravděpodobně 13
Appendix to ces newscrawl 2011: Longest words in top-1.000 by rank
112
Appendix to ces newscrawl 2011: Longest words
in top-1.000 by rank
The 20 words of maximal string length ordered by rank
Local Rank Rank in Wordlist
Word
Length
1
114
společnosti
11
2
248
společnost
10
3
347
samozřejmě
10
4
363
posledních
10
5
453
zpravodajství
13
6
512
rozhodnutí
10
7
610
ministerstva
12
8
732
zaměstnanců
11
9
733
ministerstvo
12
10
744
prezidenta
10
11
759
jednotlivých
12
12
860
společností
11
13
861
Ministerstvo
12
14
864
Společnost
10
15
918
prostřednictvím 15
16
926
zdravotnictví
13
17
927
organizace
10
18
931
spolupráci
10
19
968
mezinárodní
11
20
970
amerického
10
Appendix to ces newscrawl 2012: Longest words in top-1.000 by rank
113
Appendix to ces newscrawl 2012: Longest words
in top-1.000 by rank
The 20 words of maximal string length ordered by rank
Local Rank Rank in Wordlist
Word
Length
1
133
společnosti
11
2
300
společnost
10
3
331
samozřejmě
10
4
396
posledních
10
5
509
rozhodnutí
10
6
582
prezidenta
10
7
727
Společnost
10
8
732
internetu
9
9
734
kilometrů
9
10
765
spolupráci
10
11
845
policisté
9
12
858
ministerstva
12
13
870
mezinárodní
11
14
872
tentokrát
9
15
874
minulosti
9
16
900
organizace
10
17
926
veřejnosti
10
18
930
mistrovství
11
19
940
souvislosti
11
20
979
prostřednictvím 15
Appendix to ces wikipedia 2007: Longest words in top-1.000 by rank
114
Appendix to ces wikipedia 2007: Longest words
in top-1.000 by rank
The 20 words of maximal string length ordered by rank
Local Rank Rank in Wordlist
Word
Length
1
98
především
9
2
116
například
9
3
251
společnosti
11
4
380
současnosti
11
5
413
pravděpodobně 13
6
447
společnost
10
7
554
jednotlivých
12
8
626
království
10
9
665
organizace
10
10
715
železniční
10
11
735
skutečnosti
11
12
748
mezinárodní
11
13
749
nejčastěji
10
14
772
univerzitě
10
15
838
posledních
10
16
895
vzdálenosti
11
17
906
představuje
11
18
924
rozhodnutí
10
19
937
vlastnosti
10
20
999
náboženství
11
Appendix to ces wikipedia 2012: Longest words in top-1.000 by rank
115
Appendix to ces wikipedia 2012: Longest words
in top-1.000 by rank
The 20 words of maximal string length ordered by rank
Local Rank Rank in Wordlist
Word
Length
1
209
společnosti
11
2
334
současnosti
11
3
338
společnost
10
4
446
pravděpodobně 13
5
497
jednotlivých
12
6
596
království
10
7
623
organizace
10
8
662
železniční
10
9
734
nejčastěji
10
10
749
mezinárodní
11
11
766
skutečnosti
11
12
786
vzdálenosti
11
13
813
posledních
10
14
888
rozhodnutí
10
15
893
vlastnosti
10
16
905
obyvatelstva
12
17
955
představuje
11
18
964
mistrovství
11
19
972
společností
11
20
973
následující
11
Appendix to ces web 2002: Longest words in top-1.000 by rank
116
Appendix to ces web 2002: Longest words in
top-1.000 by rank
The 20 words of maximal string length ordered by rank
Local Rank Rank in Wordlist
Word
Length
1
121
společnosti
11
2
226
jednotlivých
12
3
327
samozřejmě
10
4
375
organizace
10
5
390
rozhodnutí
10
6
400
prostřednictvím 15
7
574
prostředky
10
8
657
posledních
10
9
668
informační
10
10
674
prostředků
10
11
709
technologie
11
12
738
společností
11
13
740
představuje
11
14
743
souvislosti
11
15
759
mezinárodní
11
16
811
skutečnosti
11
17
865
komunikace
10
18
934
veřejnosti
10
19
947
vzdělávání
10
20
981
skutečnost
10
Appendix to ces web 2011: Longest words in top-1.000 by rank
117
Appendix to ces web 2011: Longest words in
top-1.000 by rank
The 20 words of maximal string length ordered by rank
Local Rank Rank in Wordlist
Word
Length
1
121
společnosti
11
2
256
samozřejmě
10
3
274
společnost
10
4
278
jednotlivých
12
5
398
spolupráci
10
6
412
prostřednictvím 15
7
496
zkušenosti
10
8
499
zpracování
10
9
552
fotografie
10
10
554
organizace
10
11
577
Společnost
10
12
688
jednotlivé
10
13
719
pravidelně
10
14
745
společností
11
15
757
technologie
11
16
785
mezinárodní
11
17
870
představuje
11
18
934
profesionální
13
19
954
technologií
11
20
962
současnosti
11
Appendix to ces web 2012: Longest words in top-1.000 by rank
118
Appendix to ces web 2012: Longest words in
top-1.000 by rank
The 20 words of maximal string length ordered by rank
Local Rank Rank in Wordlist
Word
Length
1
143
společnosti
11
2
276
samozřejmě
10
3
285
společnost
10
4
309
jednotlivých
12
5
441
prostřednictvím 15
6
461
spolupráci
10
7
478
zkušenosti
10
8
543
zpracování
10
9
551
fotografie
10
10
624
Společnost
10
11
631
organizace
10
12
715
pravidelně
10
13
755
jednotlivé
10
14
761
společností
11
15
808
posledních
10
16
810
objednávky
10
17
821
technologie
11
18
841
prostředky
10
19
894
profesionální
13
20
974
mezinárodní
11
Appendix to ces mixed 2012: Longest words in top-1.000 by rank
119
Appendix to ces mixed 2012: Longest words in
top-1.000 by rank
The 20 words of maximal string length ordered by rank
Local Rank Rank in Wordlist
Word
Length
1
109
společnosti
11
2
247
společnost
10
3
316
samozřejmě
10
4
404
posledních
10
5
464
jednotlivých
12
6
470
rozhodnutí
10
7
600
organizace
10
8
602
spolupráci
10
9
618
prostřednictvím 15
10
762
společností
11
11
787
zkušenosti
10
12
805
mezinárodní
11
13
820
prezidenta
10
14
832
Společnost
10
15
871
současnosti
11
16
895
zaměstnanců
11
17
908
ministerstva
12
18
933
souvislosti
11
19
990
představuje
11
20
996
pravděpodobně 13
120
Character N-gram details
Appendix to ces news 2005-2007: Alphabet as
used in the top-100.000 words
Characters and their frequencies with and without repetition. All converted to lowercase.
Character Frequency without repetition Frequency with repetition
2.27
0.79
,
0.77
0.3
-
0.46
0.16
.
0.51
0.58
:
0.14
0.07
a
67.22
66.11
b
14.56
16.3
c
26.42
24.21
d
32.33
37.33
e
69.37
78.77
f
4.37
3.38
g
5.22
2.82
h
24.91
21.12
i
51.72
45.86
j
14.58
19.89
k
36.69
36.36
l
46.79
41.15
m
32.14
31.3
n
68.1
64.97
o
81.1
80.55
p
33.57
34.02
q
0.12
0.03
r
43.99
39.37
s
40.24
45.18
t
50.42
54.52
u
32.09
30.88
v
43.49
41.81
w
0.85
0.37
x
1.03
0.56
Appendix to ces news 2005-2007: Alphabet as used in the top-100.000 words
y
15.46
17.15
z
20.16
20.75
á
23.91
20.6
é
11.43
11.68
í
28.22
29.81
ó
0.48
0.26
ô
0.2
0.09
ú
2.22
1.82
ý
10.65
8.7
č
9.65
10.44
ď
0.24
0.25
ě
11.21
15.09
ľ
0.34
0.19
ň
0.93
0.64
ř
10.38
11.26
š
8.28
8.34
ť
1.12
0.55
ů
4.63
5.52
ž
6.28
10.22
Appendix to ces news 2008: Alphabet as used in
the top-100.000 words
Characters and their frequencies with and without repetition. All converted to lowercase.
Character Frequency without repetition Frequency with repetition
2.55
0.87
,
0.49
0.23
-
0.42
0.13
.
0.42
0.61
:
0.24
0.12
a
67.77
66.56
b
15.1
16.49
c
26.25
24.05
d
32.25
37.88
e
68.99
79.64
f
4.36
3.22
g
5.31
2.79
121
Appendix to ces news 2008: Alphabet as used in the top-100.000 words
h
25.18
21.19
i
50.67
45.63
j
14.3
20.32
k
37.48
36.45
l
48.8
42.96
m
32.21
31.78
n
67.62
63.99
o
80.47
79.32
p
33.03
33.66
r
43.15
38.32
s
39.95
45.51
t
50.6
54.84
u
32.84
31.05
v
43.59
41.32
w
0.9
0.4
x
0.99
0.54
y
15.98
17.34
z
20.18
20.6
á
24.55
20.94
é
11.43
11.18
í
28.92
29.86
ó
0.34
0.22
ú
1.38
1.46
ý
10.57
8.38
č
9.32
9.89
ď
0.22
0.23
ě
11.95
15.55
ň
0.91
0.59
ř
11.49
11.93
š
7.92
8.02
ť
0.46
0.32
ů
4.9
5.61
ž
6.28
10.54
122
Appendix to ces news 2009: Alphabet as used in the top-100.000 words
Appendix to ces news 2009: Alphabet as used in
the top-100.000 words
Characters and their frequencies with and without repetition. All converted to lowercase.
Character Frequency without repetition Frequency with repetition
2.54
0.92
,
0.54
0.26
-
0.4
0.13
.
0.42
0.6
:
0.31
0.15
a
68.07
66.56
b
14.99
16.43
c
26.2
23.81
d
32.12
38.09
e
69.22
80.01
f
4.48
3.41
g
5.26
2.79
h
25.11
21.07
i
50.62
45.47
j
14.17
20.09
k
37.19
36.31
l
49.05
43.17
m
32.12
31.86
n
67.22
63.87
o
80.51
79.38
p
33.01
33.9
q
0.12
0.03
r
43.15
38.11
s
39.75
45.35
t
50.95
55.07
u
32.96
30.91
v
43.51
41.1
w
0.95
0.42
x
1.05
0.56
y
16.07
17.25
z
20.1
20.64
á
24.41
20.89
é
11.24
11.03
123
Appendix to ces news 2009: Alphabet as used in the top-100.000 words
í
28.77
29.68
ó
0.36
0.23
ú
1.35
1.51
ý
10.49
8.4
č
9.32
9.85
ď
0.22
0.25
ě
11.81
15.56
ň
0.87
0.6
ř
11.49
12.09
š
7.88
7.99
ť
0.43
0.3
ů
4.84
5.62
ž
6.3
10.62
Appendix to ces news 2010: Alphabet as used in
the top-100.000 words
Characters and their frequencies with and without repetition. All converted to lowercase.
Character Frequency without repetition Frequency with repetition
2.47
0.93
,
0.61
0.26
-
0.4
0.14
.
0.53
0.62
:
0.34
0.14
a
68.48
66.91
b
15.12
16.47
c
26.17
23.82
d
32.2
38.08
e
69.22
80.13
f
4.49
3.52
g
5.31
2.85
h
25.15
21.13
i
50.46
45.36
j
14.14
20.24
k
37.17
36.26
l
49.14
43.22
m
31.84
31.63
124
Appendix to ces news 2010: Alphabet as used in the top-100.000 words
n
67.05
63.9
o
80.48
79.35
p
33.3
33.85
q
0.11
0.03
r
43.34
38.16
s
39.63
45.16
t
51.01
55.26
u
32.87
30.81
v
42.9
40.71
w
0.99
0.49
x
1.07
0.6
y
16.1
17.43
z
20.29
20.51
á
24.2
20.71
é
10.97
10.83
í
28.64
29.5
ó
0.34
0.23
ú
1.36
1.48
ý
10.36
8.28
č
9.24
9.79
ď
0.21
0.25
ě
11.73
15.52
ň
0.88
0.63
ř
11.44
12.1
š
7.82
7.95
ť
0.44
0.31
ů
4.86
5.68
ž
6.36
10.63
125
Appendix to ces news 2011: Alphabet as used in the top-100.000 words
Appendix to ces news 2011: Alphabet as used in
the top-100.000 words
Characters and their frequencies with and without repetition. All converted to lowercase.
Character Frequency without repetition Frequency with repetition
2.6
0.96
,
0.55
0.25
-
0.43
0.15
.
0.58
0.73
:
1.02
0.27
a
69.05
67.58
b
15.35
16.58
c
25.71
23.38
d
32.42
38.14
e
69.49
80.89
f
4.63
3.8
g
5.42
3.04
h
24.89
21.06
i
50.14
45.23
j
14.02
20.07
k
37.4
36.24
l
49.43
43.78
m
31.6
31.37
n
66.13
63.51
o
79.7
78.48
p
32.91
33.53
q
0.11
0.03
r
43.35
38.55
s
39.57
44.83
t
50.77
55.04
u
33.04
31.13
v
42.64
40.46
w
1.08
0.54
x
1.16
0.63
y
16.21
17.43
z
19.97
20.63
á
24.21
21.04
é
10.82
10.64
126
Appendix to ces news 2011: Alphabet as used in the top-100.000 words
í
27.91
29.25
ó
0.36
0.3
ú
1.37
1.43
ý
10.17
8.16
č
9.2
9.87
ď
0.2
0.27
ě
11.48
15.25
ň
0.83
0.61
ř
11.3
11.98
š
7.73
7.93
ť
0.45
0.31
ů
4.77
5.49
ž
6.24
10.27
Appendix to ces news 2012: Alphabet as used in
the top-100.000 words
Characters and their frequencies with and without repetition. All converted to lowercase.
Character Frequency without repetition Frequency with repetition
2.37
0.88
,
0.64
0.26
-
0.44
0.13
.
0.24
0.11
:
0.17
0.14
a
69.36
67.73
b
15.34
16.48
c
26.11
23.64
d
32.44
38.33
e
69.59
80.66
f
4.61
3.48
g
5.39
2.87
h
25.37
21.38
i
50.37
45.33
j
13.69
19.94
k
37.77
36.35
l
49.88
44.28
m
31.86
31.5
127
Appendix to ces news 2012: Alphabet as used in the top-100.000 words
n
66.41
63.46
o
80.41
79.12
p
33.17
34.01
q
0.13
0.03
r
43.33
38.2
s
39.78
45.05
t
50.97
54.89
u
33.01
31.38
v
42.96
40.81
w
1.11
0.54
x
1.13
0.6
y
16.32
17.34
z
19.92
20.4
á
24.17
20.65
é
11.16
10.82
í
28.09
29.36
ó
0.36
0.29
ú
1.33
1.45
ý
10.35
8.41
č
9.29
9.63
ď
0.21
0.24
ě
11.63
15.52
ň
0.86
0.62
ř
11.38
11.9
š
7.8
7.87
ť
0.43
0.31
ů
4.75
5.38
ž
6.25
10.64
128
Appendix to ces newscrawl 2011: Alphabet as used in the top-100.000 words
Appendix to ces newscrawl 2011: Alphabet as
used in the top-100.000 words
Characters and their frequencies with and without repetition. All converted to lowercase.
Character Frequency without repetition Frequency with repetition
2.39
0.82
,
0.4
0.17
-
0.33
0.13
.
1.61
1.03
:
1.48
0.41
a
66.78
68.21
b
15.07
16.51
c
26.31
23.42
d
32.04
38.03
e
69.04
80.05
f
4.21
3.13
g
4.69
2.4
h
25.07
20.99
i
48.76
43.93
j
14.11
21.46
k
38.22
37.23
l
47.74
41.24
m
31.58
31.74
n
66.08
63.27
o
79.33
79.18
p
33.22
33.29
r
41.96
36.72
s
39.09
45.07
t
50.88
56
u
33.22
30.6
v
43.07
40.91
w
0.82
0.42
x
1.07
0.57
y
16.64
17.82
z
20.24
20.34
á
25.06
21.2
é
11
10.8
í
29.06
30.09
129
Appendix to ces newscrawl 2011: Alphabet as used in the top-100.000 words
ó
0.34
0.18
ú
1.33
1.35
ý
10.11
8.13
č
9.36
9.56
ď
0.21
0.24
ě
11.85
15.95
ň
0.86
0.68
ř
11.52
11.66
š
7.98
7.98
ť
0.44
0.35
ů
4.9
5.2
ž
6.59
10.69
Appendix to ces newscrawl 2012: Alphabet as
used in the top-100.000 words
Characters and their frequencies with and without repetition. All converted to lowercase.
Character Frequency without repetition Frequency with repetition
2.12
0.68
,
0.36
0.13
-
0.28
0.09
.
0.22
0.09
:
0.14
0.08
a
67.59
68.55
b
15.2
16.74
c
26.41
23.45
d
32.16
38.46
e
69.7
80.88
f
4.11
2.8
g
4.7
2.31
h
25.52
21.61
i
49.03
43.61
j
14.06
21.79
k
39.27
37.13
l
48.64
42.35
m
32.21
32.46
n
66.34
62.6
130
Appendix to ces newscrawl 2012: Alphabet as used in the top-100.000 words
o
79.94
79.07
p
33.44
33.18
r
42.12
36.18
s
39.61
45.53
t
51.39
56.07
u
33.86
31.29
v
43.39
41.31
w
0.72
0.33
x
0.98
0.52
y
16.87
17.86
z
20.27
19.96
á
25.28
21.19
é
11.47
11.21
í
29.4
30.12
ó
0.41
0.24
ú
1.3
1.31
ý
10.49
8.21
č
9.69
9.37
ď
0.24
0.25
ě
12.16
16.65
ň
0.9
0.76
ř
11.88
11.93
š
8.3
8.18
ť
0.46
0.34
ů
4.92
5.07
ž
6.64
11.18
131
Appendix to ces wikipedia 2007: Alphabet as used in the top-100.000 words
Appendix to ces wikipedia 2007: Alphabet as used
in the top-100.000 words
Characters and their frequencies with and without repetition. All converted to lowercase.
Character Frequency without repetition Frequency with repetition
3.93
0.96
,
0.25
0.09
-
0.77
0.2
.
0.48
1.84
/
0.12
0.07
a
69.38
67.44
b
15.84
17.4
c
28.18
24.04
d
30.04
33.6
e
66.74
76.1
f
5.25
3.16
g
7.39
3.17
h
26.07
22.61
i
51.75
41.2
j
12.2
20.83
k
37.29
37.1
l
47.15
43.73
m
33.47
30.18
n
68.74
61.92
o
80.55
80.9
p
30.18
31.44
q
0.15
0.04
r
46.06
39.03
s
43.29
46.75
t
49.2
51.34
u
32.85
29.95
v
40.3
44.07
w
1.33
0.57
x
1.34
0.86
y
16.91
19.08
z
17.97
21.28
á
21.97
20.48
é
12.06
12.2
132
Appendix to ces wikipedia 2007: Alphabet as used in the top-100.000 words
í
26.28
29.43
ó
0.76
0.33
ú
1.28
1.43
ý
10.95
9.08
č
7.97
8.54
ď
0.17
0.17
ě
10.96
15.35
ň
0.78
0.51
ř
10.15
11.14
š
6.91
7.18
ť
0.41
0.36
ů
4.85
5.03
ž
5.85
9.47
Appendix to ces wikipedia 2012: Alphabet as used
in the top-100.000 words
Characters and their frequencies with and without repetition. All converted to lowercase.
Character Frequency without repetition Frequency with repetition
1.87
0.48
,
0.25
0.12
-
0.62
0.15
.
0.44
1.72
/
0.17
0.06
a
67.45
67.05
b
15.46
17.56
c
28.42
24.13
d
30.81
34.66
e
66.35
75.2
f
4.95
3.03
g
6.6
2.87
h
25.88
22.45
i
50.7
41.26
j
11.98
20.1
k
36.31
35.98
l
46.97
43.86
m
32.59
29.71
133
Appendix to ces wikipedia 2012: Alphabet as used in the top-100.000 words
n
69.21
62.1
o
81.13
81.18
p
31.58
31.95
q
0.13
0.03
r
45.29
38.45
s
42.56
46.32
t
49.88
51.67
u
32.85
30.02
v
41.92
44.42
w
1.21
0.49
x
1.32
0.78
y
17.43
19.6
z
18.97
21.75
á
22.9
20.41
é
12.16
12.09
í
27.79
29.96
ó
0.55
0.27
ú
1.35
1.47
ý
11.17
8.81
č
8.26
8.63
ď
0.16
0.17
ě
11.54
15.56
ň
0.77
0.5
ř
10.66
11.23
š
6.76
7.15
ť
0.39
0.34
ů
4.93
5.29
ž
6.11
9.74
134
Appendix to ces web 2002: Alphabet as used in the top-100.000 words
135
Appendix to ces web 2002: Alphabet as used in
the top-100.000 words
Characters and their frequencies with and without repetition. All converted to lowercase.
Character Frequency without repetition Frequency with repetition
0.97
0.29
,
0.34
0.12
-
0.58
0.26
.
1.13
1.49
/
0.21
0.07
:
0.11
0.05
a
62.07
64.55
b
14.34
16.75
c
27.77
24.52
d
31.63
36.4
e
68.26
77.57
f
4.13
3.04
g
4.69
2.66
h
25.63
22.03
i
47.61
40.56
j
13.41
21.14
k
37.06
35.89
l
44.48
37.77
m
32.59
31.9
n
69.23
65.41
o
81.36
81.86
p
34.44
34.68
r
40.88
36.3
s
39.36
45.35
t
51.41
54.69
u
32.6
31.27
v
44.23
42.69
w
0.63
0.36
x
1.05
0.67
y
16.59
18.14
z
20.56
21.21
á
24.51
21.25
é
12.5
12.17
Appendix to ces web 2002: Alphabet as used in the top-100.000 words
136
í
31.82
32.34
ó
0.41
0.2
ú
1.51
1.65
ý
11.33
8.83
ą
0.92
0.45
č
10.61
10.44
ď
0.21
0.18
ě
13.23
16.17
ľ
1.02
0.68
ň
0.9
0.63
ř
11.81
11.83
š
7.31
7.9
ť
0.49
0.39
ů
5.06
5.55
ž
6.3
9.71
Appendix to ces web 2011: Alphabet as used in
the top-100.000 words
Characters and their frequencies with and without repetition. All converted to lowercase.
Character Frequency without repetition Frequency with repetition
0.86
0.23
,
0.29
0.09
-
0.55
0.24
.
1.56
1.36
/
0.15
0.04
:
0.12
0.05
a
62.48
64.99
b
14.52
16.89
c
27.62
24.18
d
31.33
36.28
e
68.87
79.18
f
4.18
3.1
g
4.66
2.54
h
25.77
21.81
i
46.5
39.91
j
13.56
21.54
Appendix to ces web 2011: Alphabet as used in the top-100.000 words
137
k
38.25
36.79
l
43.97
37.01
m
32.99
32.03
n
68.65
65.71
o
81.31
80.81
p
34.34
34.7
r
40.96
36.31
s
38.6
44.34
t
51.76
54.85
u
33.18
31.48
v
44.26
42.74
w
0.73
0.43
x
1.08
0.69
y
17.19
17.93
z
20.82
20.96
á
24.74
21.73
é
12.55
12.42
í
32.09
33.21
ó
0.4
0.19
ú
1.39
1.44
ý
11.51
8.88
č
10.79
10.29
ď
0.21
0.19
ě
12.93
16.23
ň
0.91
0.65
ř
11.79
11.56
š
7.82
9.03
ť
0.46
0.35
ů
5.1
5.59
ž
6.56
10.56
Appendix to ces web 2012: Alphabet as used in the top-100.000 words
138
Appendix to ces web 2012: Alphabet as used in
the top-100.000 words
Characters and their frequencies with and without repetition. All converted to lowercase.
Character Frequency without repetition Frequency with repetition
0.84
0.23
,
0.29
0.09
-
0.55
0.24
.
1.6
1.33
/
0.15
0.04
:
0.13
0.06
a
62.61
65.3
b
14.62
17.12
c
27.19
23.79
d
31.41
36.45
e
68.8
79.54
f
4.07
2.96
g
4.47
2.42
h
25.84
21.77
i
46.3
39.72
j
13.62
21.82
k
38.49
36.95
l
44.56
37.3
m
32.78
32.27
n
68.49
65.4
o
81.03
80.65
p
34.42
34.59
r
40.49
35.84
s
38.38
44.44
t
51.68
54.9
u
33.32
31.45
v
44.26
42.62
w
0.7
0.41
x
1.08
0.67
y
17.25
18.04
z
20.78
20.83
á
24.8
21.84
é
12.41
12.34
Appendix to ces web 2012: Alphabet as used in the top-100.000 words
139
í
32.19
33.1
ó
0.39
0.19
ú
1.4
1.43
ý
11.43
8.73
č
11.06
10.31
ď
0.22
0.2
ě
13.07
16.39
ň
0.92
0.65
ř
11.82
11.5
š
7.95
9.21
ť
0.49
0.38
ů
5.12
5.54
ž
6.69
10.77
Appendix to ces mixed 2012: Alphabet as used in
the top-100.000 words
Characters and their frequencies with and without repetition. All converted to lowercase.
Character Frequency without repetition Frequency with repetition
1.57
0.48
,
0.35
0.14
-
0.39
0.15
.
0.87
0.98
/
0.11
0.03
:
0.19
0.09
a
64.97
66.1
b
14.83
16.71
c
26.88
23.76
d
31.87
37.31
e
68.66
79.29
f
4.25
3.1
g
4.78
2.51
h
25.61
21.53
i
48.42
42.4
j
13.76
21.09
k
38.28
36.62
l
46.71
40.38
Appendix to ces mixed 2012: Alphabet as used in the top-100.000 words
m
32.26
31.79
n
67.79
64.43
o
80.53
79.94
p
33.88
34.08
r
41.74
36.8
s
39.41
45.06
t
51.36
54.96
u
33.02
31.02
v
43.58
42
w
0.75
0.38
x
1.05
0.6
y
16.83
17.86
z
20.46
20.78
á
24.86
21.16
é
12.09
11.94
í
30.8
31.39
ó
0.39
0.21
ú
1.42
1.48
ý
10.86
8.52
ą
0.13
0.04
č
10.34
10.18
ď
0.21
0.21
ě
12.64
16.59
ľ
0.17
0.07
ň
0.9
0.64
ř
11.81
11.84
š
7.92
8.52
ť
0.44
0.34
ů
5.07
5.48
ž
6.56
10.59
140
141
Abbreviation details
Appendix to ces news 2005-2007: Most frequent
abbreviations
Top 20 words ending with period
Rank Abbreviation Frequency
1408
eur.
1488
1933
mil.
1129
3018
mj.
740
3213
atd.
696
3278
se.
683
3337
Sk.
669
3547
resp.
629
4273
r.
519
5765
s.
383
6304
aut.
348
7312
Sb.
297
9125
bank.
233
9338
a.
227
10106 St.
209
10470 red.
201
11225 p.
186
11654 km.
178
11827 dat.
175
11902 m.
174
12356 Ing.
166
Appendix to ces news 2008: Most frequent abbreviations
142
Appendix to ces news 2008: Most frequent
abbreviations
Top 20 words ending with period
Rank Abbreviation Frequency
1625
eur.
2178
2462
se.
1472
3290
mj.
1126
3982
atd.
929
4456
r.
825
4900
mil.
746
5187
aut.
706
5664
resp.
641
6517
St.
555
6530
bank.
554
6698
red.
537
8717
s.
399
8882
Sb.
390
11147 Dr.
302
11684 Ing.
286
12292 km.
270
13768 tam.
238
14238 min.
228
14754 dr.
218
14807 m.
217
Appendix to ces news 2009: Most frequent abbreviations
143
Appendix to ces news 2009: Most frequent
abbreviations
Top 20 words ending with period
Rank Abbreviation Frequency
1331
eur.
2795
2388
se.
1649
4026
atd.
982
4353
mj.
903
4487
r.
875
5013
aut.
784
5256
mil.
749
5494
resp.
717
6439
red.
599
6807
bank.
566
6898
St.
558
10574 Ing.
347
10586 off.
347
10617 s.
346
11133 Sb.
327
12353 km.
291
12572 Dr.
285
14098 dat.
249
14530 tam.
241
14713 min.
237
Appendix to ces news 2010: Most frequent abbreviations
144
Appendix to ces news 2010: Most frequent
abbreviations
Top 20 words ending with period
Rank Abbreviation Frequency
1452
eur.
2666
2474
se.
1643
4463
mil.
911
4600
atd.
883
4826
aut.
834
4865
r.
828
5269
resp.
768
5518
mj.
733
5801
bank.
697
7024
red.
565
9050
St.
426
9267
Ing.
415
11339 Sb.
331
11357 s.
331
11882 Dr.
313
13081 dat.
281
13359 tam.
275
15235 km.
234
15408 min.
231
15983 off.
221
Appendix to ces news 2011: Most frequent abbreviations
145
Appendix to ces news 2011: Most frequent
abbreviations
Top 20 words ending with period
Rank Abbreviation Frequency
1416
eur.
2457
2281
se.
1616
3838
mil.
973
4658
atd.
796
5306
resp.
695
5459
bank.
673
5696
aut.
644
6882
St.
532
7100
r.
515
7358
red.
495
7679
mj.
472
9941
Ing.
354
10714 off.
326
10859 s.
321
12331 Dr.
276
13539 min.
247
13659 Sb.
244
13967 m.
238
14576 tam.
226
15740 dat.
206
Appendix to ces news 2012: Most frequent abbreviations
146
Appendix to ces news 2012: Most frequent
abbreviations
Appendix to ces newscrawl 2011: Most frequent
abbreviations
Top 20 words ending with period
Rank Abbreviation Frequency
2083
atd.
3471
2088
se.
3467
2835
eur.
2651
4421
r.
1689
4472
mil.
1666
4719
Ing.
1577
5186
p.
1424
5221
s.
1414
5979
resp.
1237
6121
aut.
1207
6223
Sb.
1185
7060
mj.
1030
7074
hl.
1028
7172
m.
1011
7634
Dr.
942
8801
a.
806
8891
bank.
796
9513
Mgr.
739
10084 Ch.
692
10108 cm.
690
Appendix to ces newscrawl 2012: Most frequent abbreviations
147
Appendix to ces newscrawl 2012: Most frequent
abbreviations
Appendix to ces wikipedia 2007: Most frequent
abbreviations
Top 20 words ending with period
Rank Abbreviation Frequency
255
n.
2202
319
l.
1776
334
r.
1721
477
m.
1334
923
resp.
752
1019
km.
693
1142
atd.
633
1524
s.
504
1649
mj.
477
2010
Kr.
406
2436
mm.
341
2441
ha.
340
2612
Sb.
319
2740
kg.
303
2815
cm.
296
3201
Dr.
261
3218
St.
260
3813
ev.
222
4142
se.
205
4227
v.
201
Appendix to ces wikipedia 2012: Most frequent abbreviations
148
Appendix to ces wikipedia 2012: Most frequent
abbreviations
Top 20 words ending with period
Rank Abbreviation Frequency
250
s.
5924
308
n.
4879
370
str.
4248
421
r.
3853
448
l.
3712
585
m.
3035
919
km.
2056
1165
resp.
1681
1519
mm.
1366
1579
atd.
1329
1629
cm.
1303
1925
Sb.
1121
2129
mj.
1033
2477
kg.
890
2486
Dr.
886
3706
se.
616
3746
Ing.
610
4075
mil.
560
4318
St.
526
4614
ha.
494
Appendix to ces web 2002: Most frequent abbreviations
149
Appendix to ces web 2002: Most frequent
abbreviations
Top 20 words ending with period
Rank Abbreviation Frequency
287
r.
17814
481
s.
11502
486
Sb.
11397
499
Ing.
11194
578
atd.
10006
966
p.
6701
1043
mil.
6336
1122
resp.
6043
1463
m.
4796
1760
ul.
4099
2083
prof.
3523
2159
n.
3391
2228
min.
3283
2245
mm.
3264
2289
Dr.
3220
2491
Mgr.
2989
2642
dat.
2825
2725
se.
2754
2778
cm.
2715
2953
dr.
2593
Appendix to ces web 2011: Most frequent abbreviations
150
Appendix to ces web 2011: Most frequent
abbreviations
Top 20 words ending with period
Rank Abbreviation Frequency
515
atd.
17060
565
r.
15872
1099
Sb.
9379
1388
Ing.
7740
1462
s.
7417
1608
resp.
6861
2040
m.
5562
2252
mm.
5065
2405
prof.
4788
2453
cm.
4693
2663
se.
4342
2798
p.
4145
2806
Mgr.
4135
2973
Dr.
3936
3023
min.
3889
3520
km.
3357
3676
max.
3211
3892
o.
3038
3903
mil.
3032
4320
mj.
2724
Appendix to ces web 2012: Most frequent abbreviations
151
Appendix to ces web 2012: Most frequent
abbreviations
Top 20 words ending with period
Rank Abbreviation Frequency
538
atd.
18365
623
r.
15959
1101
Sb.
10259
1445
Ing.
8104
1722
s.
7006
1745
resp.
6950
2007
m.
6164
2011
se.
6155
2242
p.
5556
2255
cm.
5533
2332
mm.
5344
2852
Mgr.
4421
2908
min.
4340
3185
Dr.
4012
3559
km.
3643
3683
max.
3528
3873
prof.
3341
4231
o.
3052
4517
ul.
2866
4685
mil.
2759
Appendix to ces mixed 2012: Most frequent abbreviations
152
Appendix to ces mixed 2012: Most frequent
abbreviations
Top 20 words ending with period
Rank Abbreviation Frequency
977
r.
49297
1068
atd.
45730
1874
s.
28491
1916
Sb.
28029
2017
Ing.
26816
2347
se.
23377
2412
resp.
22819
2846
m.
19419
3190
p.
17531
3245
mil.
17250
3693
eur.
15316
3894
n.
14522
4187
cm.
13502
4381
mm.
12935
4433
mj.
12775
4442
Dr.
12758
4848
prof.
11680
4927
min.
11482
5045
Mgr.
11224
5149
km.
10998
Appendix to ces news 2005-2007: Left neighbors of the full stop
153
Appendix to ces news 2005-2007: Left neighbors
of the full stop
Top 25 left neighbour co-occurrences of full stop
Rank Word Frequency before Full Stop Frequency overall Amount
54
korun 9581
22451
43
453
tzv
3733
3738
100
998
např
1975
1979
100
1306
mld
1541
1582
97
2437
tj
895
901
99
2696
II
532
821
65
2863
korún 422
775
54
2952
č
752
755
100
3940
apod
556
564
99
4599
barel
216
482
45
4872
Černý 184
457
40
4889
pryč
206
454
45
5022
M
393
442
89
5498
J
377
402
94
5570
tis
391
397
98
6485
Michl 263
337
78
6546
SKK
199
334
60
6669
sv
327
327
100
6857
P
248
317
78
6866
pozn
315
317
99
7253
km/h
132
300
44
7306
L
148
297
50
7450
W
276
291
95
7514
odst
287
288
100
7515
opak
134
288
47
Appendix to ces news 2008: Left neighbors of the full stop
154
Appendix to ces news 2008: Left neighbors of the
full stop
Top 25 left neighbour co-occurrences of full stop
Rank Word Frequency before Full Stop Frequency overall Amount
67
korun
13090
32214
41
592
tzv
5080
5086
100
1059
např
3139
3148
100
1517
iHNed 1905
2315
82
2985
tj
1226
1229
100
3082
barel
556
1189
47
3383
č
1094
1097
100
3611
II
776
1031
75
3691
pryč
439
1007
44
3788
mld
846
979
86
4687
sv
780
780
100
4689
J
752
779
97
4697
pozn
775
778
100
4952
apod
723
738
98
5478
akcii
271
664
41
6169
M
507
589
86
6376
D
288
568
51
6806
jinam
211
527
40
6941
km/h
215
514
42
7247
W
454
491
92
7502
E
250
471
53
7570
Urban 196
466
42
7710
Cikrt
270
457
59
8144
F
351
431
81
8664
odst
400
402
100
Appendix to ces news 2009: Left neighbors of the full stop
155
Appendix to ces news 2009: Left neighbors of the
full stop
Top 25 left neighbour co-occurrences of full stop
Rank Word Frequency before Full Stop Frequency overall Amount
672
tzv
5074
5083
100
1188
např
3092
3099
100
2254
2011
700
1747
40
2947
mld
1241
1340
93
3399
II
858
1167
74
3509
tj
1131
1133
100
3568
pryč
480
1116
43
4136
č
948
955
99
4393
C
418
894
47
4606
pozn
847
852
99
4628
B
350
848
41
4863
Nečas 327
806
41
4942
apod
786
797
99
5131
J
738
766
96
6008
M
560
646
87
6149
Vít
260
631
41
6402
D
281
601
47
6503
sv
593
594
100
6795
akcii
231
567
41
6853
Urban 242
562
43
6910
barel
263
557
47
7345
spol
498
519
96
7433
jinam 207
512
40
7446
XVI
504
511
99
7974
odst
474
475
100
Appendix to ces news 2010: Left neighbors of the full stop
156
Appendix to ces news 2010: Left neighbors of the
full stop
Top 25 left neighbour co-occurrences of full stop
Rank Word Frequency before Full Stop Frequency overall Amount
58
korun 16865
41264
41
879
tzv
4070
4084
100
1310
např
2913
2929
99
3221
pryč
550
1276
43
3340
II
793
1232
64
3688
mld
977
1117
87
3882
C
431
1057
41
4196
č
961
972
99
4299
tj
940
950
99
4549
D
482
892
54
5016
pozn
801
802
100
5286
spol
736
766
96
5588
J
694
724
96
5608
Vlk
475
722
66
5800
apod
678
697
97
5922
P
577
682
85
6322
M
517
636
81
6525
km/h
260
617
42
6867
JPY
246
578
43
6932
jinam 246
573
43
8314
T
383
468
82
8417
tyč
208
463
45
8511
sv
454
457
99
8546
tis
442
455
97
9385
E
183
409
45
Appendix to ces news 2011: Left neighbors of the full stop
157
Appendix to ces news 2011: Left neighbors of the
full stop
Top 25 left neighbour co-occurrences of full stop
Rank Word Frequency before Full Stop Frequency overall Amount
1044
bodu
1322
3275
40
1121
tzv
3045
3068
99
1379
např
2484
2509
99
2014
USD
731
1814
40
2387
II
896
1537
58
2728
pryč
566
1351
42
3693
mld
870
1015
86
4021
č
909
924
98
4184
tj
876
886
99
4296
spol
827
863
96
4412
odst
842
843
100
4436
T
760
840
90
5052
pozn
731
732
100
5537
J
612
663
92
6023
litr
264
607
43
6106
E
256
600
43
6251
M
487
587
83
6487
P
459
565
81
6540
apod
533
561
95
7689
barel
219
471
46
7780
jinam 194
465
42
8259
JPY
211
435
49
8710
H
277
411
67
9032
dech
177
394
45
9356
unci
171
380
45
Appendix to ces news 2012: Left neighbors of the full stop
158
Appendix to ces news 2012: Left neighbors of the
full stop
Top 25 left neighbour co-occurrences of full stop
Rank Word Frequency before Full Stop Frequency overall Amount
59
korun
15066
33834
45
265
1
4069
8864
46
804
bodu
1727
3690
47
972
19
1365
3198
43
1038
tzv
3029
3042
100
1071
90
1254
2939
43
1317
např
2396
2422
99
1341
9
1128
2381
47
1696
USD
792
1939
41
1845
31
793
1789
44
1993
29
695
1671
42
2471
II
842
1367
62
2879
pryč
554
1181
47
3357
Novák 464
1012
46
3420
mil
849
991
86
3546
C
408
957
43
4056
tj
828
836
99
4189
atd
779
807
97
4642
pozn
727
730
100
4660
resp
726
727
100
4808
spol
685
707
97
5094
mld
615
664
93
5199
č
645
650
99
5467
J
518
618
84
5634
D
302
600
50
Appendix to ces newscrawl 2011: Left neighbors of the full stop
159
Appendix to ces newscrawl 2011: Left neighbors
of the full stop
Top 25 left neighbour co-occurrences of full stop
Rank Word Frequency before Full Stop Frequency overall Amount
597
J
10386
10531
99
729
tzv
8753
8875
99
879
např
7481
7628
98
1065
M
6070
6420
95
1297
D
3450
5381
64
1512
II
2867
4656
62
1650
P
4025
4340
93
1718
DVD
2881
4202
69
1735
B
2279
4158
55
1955
T
3079
3682
84
2004
č
3559
3592
99
2059
R
3295
3508
94
2253
iPad
2610
3235
81
2271
C
1860
3204
58
2469
L
2574
2965
87
2774
apod
2515
2694
93
3018
sv
2472
2495
99
3037
E
2021
2472
82
3175
pryč
1014
2370
43
3442
tj
2137
2196
97
3448
N
1252
2189
57
3562
mld
1810
2123
85
3719
hod
1539
2031
76
3832
G
1737
1964
88
4200
H
1562
1778
88
Appendix to ces newscrawl 2012: Left neighbors of the full stop
160
Appendix to ces newscrawl 2012: Left neighbors
of the full stop
Top 25 left neighbour co-occurrences of full stop
Rank Word Frequency before Full Stop Frequency overall Amount
102
korun 23144
53799
43
227
1
14280
25013
57
301
2
8467
19883
43
362
3
6941
16842
41
452
4
5774
14030
41
606
tzv
11258
11354
99
612
14
4674
11271
41
619
18
4883
11117
44
623
11
5186
11082
47
657
6
4887
10638
46
692
17
4689
10144
46
695
16
4643
10089
46
711
19
5950
9894
60
738
13
4577
9589
48
752
např
9291
9431
99
754
8
4695
9397
50
770
7
4660
9178
51
829
9
4956
8651
57
847
21
4542
8444
54
891
J
8018
8134
99
1042
22
3452
7042
49
1257
23
3037
5969
51
1306
hlasů
2927
5736
51
1331
28
3263
5635
58
1428
26
2895
5278
55
Appendix to ces wikipedia 2007: Left neighbors of the full stop
161
Appendix to ces wikipedia 2007: Left neighbors
of the full stop
Top 25 left neighbour co-occurrences of full stop
Rank Word Frequency before Full Stop Frequency overall Amount
72
např
6212
6263
99
97
tzv
4856
4888
99
119
I
2118
4046
52
181
II
2436
2797
87
270
př
2039
2043
100
297
sv
1866
1870
100
349
tj
1646
1664
99
495
pahýl
1267
1277
99
602
III
928
1093
85
693
č
950
960
99
738
IV
831
914
91
787
J
802
852
94
1024
R
613
691
89
1094
apod
645
656
98
1270
Rusku 252
583
43
1416
B
240
532
45
1625
ročně
231
482
48
1918
F
330
420
79
1936
tzn
416
418
100
2222
stol
355
372
95
2239
M
282
368
77
2262
D
204
363
56
2269
Např
360
362
99
2308
P
260
356
73
2354
G
271
350
77
Appendix to ces wikipedia 2012: Left neighbors of the full stop
162
Appendix to ces wikipedia 2012: Left neighbors
of the full stop
Top 25 left neighbour co-occurrences of full stop
Rank Word Frequency before Full Stop Frequency overall Amount
78
např
14365
14508
99
107
tzv
11754
11827
99
114
I
4979
11248
44
215
II
5541
6681
83
272
světě
2373
5467
43
350
sv
4365
4377
100
511
př
3370
3371
100
538
č
3222
3249
99
562
tj
3127
3151
99
636
III
2231
2817
79
772
J
2257
2409
94
960
IV
1701
1961
87
1308
M
1023
1543
66
1340
km/h
701
1510
46
1451
apod
1382
1415
98
1462
R
1130
1408
80
1486
kol
574
1390
41
1849
P
969
1160
84
1944
D
679
1109
61
1956
E
770
1104
70
1978
F
857
1096
78
2225
L
781
991
79
2290
H
640
965
66
2320
G
670
951
70
2440
T
507
907
56
Appendix to ces web 2002: Left neighbors of the full stop
163
Appendix to ces web 2002: Left neighbors of the
full stop
Top 25 left neighbour co-occurrences of full stop
Rank Word Frequency before Full Stop Frequency overall Amount
150
např
28690
28884
99
152
č
28227
28689
98
281
tzv
17916
18002
100
485
tj
11354
11461
99
500
apod
10903
11182
98
522
J
10062
10733
94
568
sv
10149
10187
100
572
II
6983
10114
69
691
hod
7092
8613
82
991
P
5464
6603
83
1042
M
5043
6348
79
1052
odst
6266
6310
99
1282
aj
2736
5400
51
1543
obr
4397
4576
96
1555
CSc
4426
4555
97
1615
MUDr 4346
4396
99
1646
III
2825
4330
65
1743
tis
4001
4127
97
1765
kol
1650
4093
40
1797
ing
3991
4021
99
2068
spol
3434
3539
97
2170
D
1375
3367
41
2198
L
2444
3320
74
2315
R
2101
3184
66
2344
popř
3127
3145
99
Appendix to ces web 2011: Left neighbors of the full stop
164
Appendix to ces web 2011: Left neighbors of the
full stop
Top 25 left neighbour co-occurrences of full stop
Rank Word Frequency before Full Stop Frequency overall Amount
137
např
48552
49001
99
298
tzv
26867
27059
99
383
č
21052
21433
98
434
apod
19360
19620
99
706
hod
10433
13168
79
707
tj
12954
13163
98
732
sv
12687
12781
99
952
II
7616
10513
72
1179
J
8023
8944
90
1745
P
4699
6372
74
1824
M
4174
6130
68
2083
D
2426
5460
44
2384
spol
4679
4821
97
2526
popř
4524
4575
99
2556
aj
4068
4526
90
2633
vč
4336
4392
99
2956
tzn
3900
3954
99
3087
III
2735
3814
72
3136
L
2296
3750
61
3290
obr
3305
3579
92
3406
R
2224
3444
65
3451
E
1750
3406
51
3744
T
1686
3164
53
3942
MUDr 2942
2997
98
3943
IV
2996
78
2347
Appendix to ces web 2012: Left neighbors of the full stop
165
Appendix to ces web 2012: Left neighbors of the
full stop
Top 25 left neighbour co-occurrences of full stop
Rank Word Frequency before Full Stop Frequency overall Amount
154
např
48367
48877
99
327
tzv
27233
27451
99
434
č
21022
21572
97
444
apod
20917
21208
99
663
hod
11837
15188
78
682
sv
14792
14876
99
794
tj
12706
13113
97
914
II
8669
11695
74
1396
J
7248
8353
87
1754
P
4996
6919
72
2108
M
3866
5865
66
2301
vč
5349
5418
99
2436
spol
4996
5140
97
2544
popř
4885
4933
99
2641
aj
4286
4764
90
2952
III
3084
4268
72
3006
tzn
4147
4207
99
3113
pryč
1758
4095
43
3284
L
2319
3900
59
3643
R
2229
3564
63
3784
IV
2707
3424
79
3817
E
1522
3385
45
3961
MUDr 3194
3266
98
3985
T
1643
3248
51
4359
odst
2935
2965
99
Appendix to ces mixed 2012: Left neighbors of the full stop
166
Appendix to ces mixed 2012: Left neighbors of
the full stop
Top 25 left neighbour co-occurrences of full stop
Rank Word Frequency before Full Stop Frequency overall Amount
116
korun 115347
280513
41
277
např
136093
137343
99
387
tzv
103455
104080
99
652
č
67307
68451
98
1010
apod
47060
47774
99
1061
II
33770
46165
73
1161
J
40456
43117
94
1211
tj
40478
41166
98
1214
sv
40947
41140
100
1485
hod
27113
34532
79
1965
M
21949
27541
80
2161
P
20489
25122
82
2451
D
10997
22477
49
3086
III
11853
18048
66
3302
pryč
7455
16938
44
3586
L
10519
15731
67
3603
R
11755
15684
75
3772
spol
14421
15006
96
3959
aj
10360
14261
73
3987
T
9567
14138
68
4037
E
8064
13953
58
4041
odst
13846
13938
99
4408
IV
10119
12858
79
4550
mld
11120
12475
89
4789
F
8703
11829
74
Appendix to ces news 2005-2007: Left neighbors of the full stop with additional internal full stops
Appendix to ces news 2005-2007: Left neighbors
of the full stop with additional internal full stops
Top 25 left neighbors of full stop already containing full stops
Rank
Word
Frequency
1529
iDNES.cz
1371
2989
iHNed.cz
745
5920
a.s
372
6898
Aktuálně.cz
315
7748
E.ON
279
10553 s.r.o
199
17591 Centrum.cz
109
23917 Seznam.cz
74
30079 Novinky.cz
55
32630 p.a
50
33016 iDnes.cz
49
34446 Atlas.cz
46
38953 Gipsy.cz
39
39062 U.S
39
40650 Týden.cz
37
41453 PENÍZE.CZ
36
43649 p.b
34
45216 Stream.cz
32
49656 LG.Philips
28
50991 N-Joy.cz
27
52171 B.V
26
52470 Stahuj.cz
26
55161 Amazon.com 24
56964 Invia.cz
23
57038 Mall.cz
23
167
Appendix to ces news 2008: Left neighbors of the full stop with additional internal full stops
Appendix to ces news 2008: Left neighbors of the
full stop with additional internal full stops
Top 25 left neighbors of full stop already containing full stops
Rank
Word
Frequency
1048
iDNES.cz
3173
2408
iHNed.cz
1503
6647
a.s
542
10544 E.ON
322
13721 s.r.o
239
14260 Aktuálně.cz
227
15087 Blesk.cz
212
25512 Blesku.cz
110
26254 Týden.cz
106
28204 profimedia.cz 97
28739 Novinky.cz
94
30302 iDnes.cz
88
30515 Seznam.cz
87
36129 tn.cz
70
37779 Centrum.cz
65
37789 Ekonom.cz
65
39135 Kasa.cz
62
40095 Profimedia.cz 60
41283 p.a
58
42632 Gipsy.cz
55
43989 iDNES.tv
53
47071 R.E.M
48
52976 wikipedia.org 41
53075 B.V
40
54255 Severočeši.cz 39
168
Appendix to ces news 2009: Left neighbors of the full stop with additional internal full stops
Appendix to ces news 2009: Left neighbors of the
full stop with additional internal full stops
Top 25 left neighbors of full stop already containing full stops
Rank
Word
Frequency
962
iDNES.cz
3693
3205
Blesk.cz
1239
4787
iHNed.cz
820
8596
a.s
438
10826 E.ON
338
12404 Aktuálně.cz
289
14260 profimedia.cz 246
16524 iDnes.cz
205
17788 s.r.o
188
22725 Týden.cz
137
22795 tn.cz
137
27310 Libertas.cz
108
28560 Novinky.cz
102
29167 Ekonom.cz
99
31200 iDNES.tv
91
35624 Profimedia.cz 76
36250 Blesku.cz
74
36613 Euro.cz
73
36706 deniksport.cz 73
43838 Seznam.cz
57
44974 TMZ.com
55
46156 U.S
53
46866 idnes.cz
52
47389 SME.sk
51
50129 Gipsy.cz
47
169
Appendix to ces news 2010: Left neighbors of the full stop with additional internal full stops
Appendix to ces news 2010: Left neighbors of the
full stop with additional internal full stops
Top 25 left neighbors of full stop already containing full stops
Rank
Word
Frequency
841
iDNES.cz
4238
1694
Blesk.cz
2316
3149
Kuptofoto.cz
1303
5612
iHNed.cz
722
7450
a.s
529
8032
Profimedia.cz
487
10283 E.ON
368
10416 profimedia.cz
364
11029 Aktuálně.cz
342
11903 s.r.o
313
16256 iDnes.cz
216
21149 Týden.cz
156
21871 iSport.cz
150
23601 MobilMania.cz 136
25323 youtube.com
125
25355 Isifa.com
124
27778 automodul.cz
110
29095 tn.cz
104
29826 Novinky.cz
100
30093 idnes.cz
99
30546 SEMania.cz
97
31105 Youtube.com
95
32884 SME.sk
88
33426 Čas.sk
87
34432 P.S
83
170
Appendix to ces news 2011: Left neighbors of the full stop with additional internal full stops
Appendix to ces news 2011: Left neighbors of the
full stop with additional internal full stops
Top 25 left neighbors of full stop already containing full stops
Rank
Word
Frequency
896
iDNES.cz
3692
2092
Blesk.cz
1753
3278
IHNED.cz
1128
5060
Profimedia.cz
730
6351
iSport.cz
577
7140
profimedia.cz
511
7146
iHNed.cz
510
7428
a.s
489
8956
Aktuálně.cz
397
9361
Kuptofoto.cz
379
9470
s.r.o
375
11168 E.ON
311
18356 iDnes.cz
171
20978 Seznam.cz
145
22627 E.coli
132
24968 m.mobilmania.cz 117
25068 D.O.S.T
116
25254 Týden.cz
115
26983 Youtube.com
106
34326 Jobs.cz
77
36045 Mall.cz
72
38760 Novinky.cz
65
39241 P.S
64
40045 youtube.com
63
40415 r.o
62
171
Appendix to ces news 2012: Left neighbors of the full stop with additional internal full stops
Appendix to ces news 2012: Left neighbors of the
full stop with additional internal full stops
Top 25 left neighbors of full stop already containing full stops
Rank
Word
Frequency
856
iDNES.cz
3499
2171
IHNED.cz
1543
4345
Blesk.cz
779
8194
a.s
400
10315 iSport.cz
312
12988 s.r.o
239
13122 E.ON
235
16530 Seznam.cz
179
17769 Aktuálně.cz
164
22904 iDnes.cz
120
28112 Mall.cz
92
28344 Ekonom.cz
91
33920 Lidovky.cz
72
35824 Týden.cz
67
35826 Ulož.to
67
36197 P.S
66
41180 r.o
56
41403 Novinky.cz
55
41804 www.italiedoskrine.cz 55
45669 Super.cz
48
47075 Sleviště.cz
46
49981 Heureka.cz
42
49996 Jobs.cz
42
52043 iHNed.cz
40
52768 SME.sk
39
172
Appendix to ces newscrawl 2011: Left neighbors of the full stop with additional internal full stops
Appendix to ces newscrawl 2011: Left neighbors
of the full stop with additional internal full stops
Top 25 left neighbors of full stop already containing full stops
Rank
Word
Frequency
1509
Denik.cz
4661
2032
iHNed.cz
3551
2246
Blesk.cz
3246
4365
a.s
1708
6439
s.r.o
1138
11951 P.S
575
12853 IHNED.cz
529
15206 Aktuálně.cz
436
16231 č.II
405
17339 E.ON
376
21086 Novinky.cz
295
21319 Seznam.cz
291
22243 Ekonom.cz
276
25239 iDnes.cz
236
26190 Lidovky.cz
225
27495 D.O.S.T
212
30323 E.coli
187
31650 Mapy.cz
177
34282 o.p.s
160
35306 Sauto.cz
154
35805 www.rozhlas.cz/praha 152
36050 Smoto.cz
150
36210 I.H
149
37614 o.s
142
37947 Mediafax.cz
140
173
Appendix to ces newscrawl 2012: Left neighbors of the full stop with additional internal full stops
Appendix to ces newscrawl 2012: Left neighbors
of the full stop with additional internal full stops
Top 25 left neighbors of full stop already containing full stops
Rank
Word
Frequency
3445
a.s
2287
4299
s.r.o
1835
4839
Blesk.cz
1628
11441 P.S
654
11808 IHNED.cz
631
12916 Seznam.cz
572
14061 Lidovky.cz
521
14613 M.A.T
499
25292 r.o
259
26924 o.p.s
239
27528 Aktuálně.cz 232
27847 E.ON
229
29789 I.H
210
34662 Novinky.cz 174
36088 o.s
166
42715 t.j
133
43413 iDnes.cz
130
46658 Ekonom.cz
118
52769 iDNES.cz
100
53573 iHNed.cz
98
54661 D.I.C
95
56842 D.O.S.T
90
56887 Mall.cz
90
62305 č.p
80
65392 S.A
74
174
Appendix to ces wikipedia 2007: Left neighbors of the full stop with additional internal full stops
Appendix to ces wikipedia 2007: Left neighbors
of the full stop with additional internal full stops
Top 25 left neighbors of full stop already containing full stops
Rank
Word
Frequency
2409
template.gif
345
3361
face.png
250
6080
pahýl.png
139
6503
stub.svg
130
8113
př.n.l
104
8944
n.m
93
11297 a.s
72
15605 m.n.m
51
19343 n.l
40
23010 t.j
33
23264 U.S
32
24499 R.E.M
30
24863 s.r.o
30
25809 č.p
29
26824 S.VII
27
29459 D.C
24
29460 D.III
24
32958 D.VII
21
33119 Papež-pahýl.png 21
36792 s.š
19
38633 t.m
18
39711 flag.svg
17
39917 m.j
17
40272 př.Kr
17
41324 Praha-pahýl.png 16
175
Appendix to ces wikipedia 2012: Left neighbors of the full stop with additional internal full stops
Appendix to ces wikipedia 2012: Left neighbors
of the full stop with additional internal full stops
Top 25 left neighbors of full stop already containing full stops
Rank Word Frequency
8811
a.s
253
13335 př.n.l
163
13715 n.m
158
15175 s.r.o
141
17312 n.l
121
23001 U.S
87
23121 t.j
87
26162 č.p
75
41377 R.E.M 42
41784 s.l
42
44773 S.VII
38
47479 D.C
35
48976 m.j
34
50440 r.o
33
52367 S.A
31
53575 L.A
30
53832 c.k
30
54930 I.A
29
54931 I.B
29
57889 F.C
27
60659 s.š
26
61212 D.VII
25
61588 T.G
25
66015 n.p
23
69995 U.S.A 21
176
Appendix to ces web 2002: Left neighbors of the full stop with additional internal full stops
Appendix to ces web 2002: Left neighbors of the
full stop with additional internal full stops
Top 25 left neighbors of full stop already containing full stops
Rank
Word
Frequency
557
a.s
10290
663
s.r.o
8855
2075
k.ú
3535
4031
r.o
1928
6345
p.č
1227
8479
t.j
909
9014
p.p.č
852
9242
č.p
828
11660 n.m
647
12243 č.j
611
14470 ev.č
506
15393 m.n.m
473
16609 o.p.s
431
18132 s.p
390
18914 t.r
372
22576 mil.Kč
300
23336 př.n.l
288
23346 tis.Kč
288
25452 parc.č
259
26318 Seznam.cz 248
27003 v.o.s
241
27049 m.j
240
28238 n.l
228
29964 str./min
212
30859 v.r
204
177
Appendix to ces web 2011: Left neighbors of the full stop with additional internal full stops
Appendix to ces web 2011: Left neighbors of the
full stop with additional internal full stops
Top 25 left neighbors of full stop already containing full stops
Rank
Word
Frequency
526
s.r.o
16778
1079
a.s
9526
3653
r.o
3231
6150
o.s
1863
9155
o.p.s
1199
11932 n.m
896
13929 t.j
756
15639 č.p
660
16721 P.S
609
16824 m.n.m
605
21678 E.ON
447
24584 KEK.cz
383
25528 s.p
367
27996 r.v
327
32436 k.ú
271
33173 v.v.i
264
36482 př.n.l
233
38406 m.j
218
40145 hl.m
206
42560 n.L
191
43136 SenzaPujcky.cz
187
43882 n.l
183
44124 v.o.s
182
44413 facebook-stranka.cz 180
44754 V.I.P
178
178
Appendix to ces web 2012: Left neighbors of the full stop with additional internal full stops
Appendix to ces web 2012: Left neighbors of the
full stop with additional internal full stops
Top 25 left neighbors of full stop already containing full stops
Rank
Word
Frequency
511
s.r.o
19221
1158
a.s
9852
3755
r.o
3452
5990
o.s
2132
10393 o.p.s
1167
11085 n.m
1086
12254 č.p
972
14829 m.n.m
782
15645 t.j
735
16336 P.S
699
20765 KEK.cz
525
23089 E.ON
463
27209 s.p
377
31237 k.ú
317
33540 SenzaPujcky.cz 289
33588 r.v
289
35412 př.n.l
270
38092 v.v.i
246
38671 n.l
241
38806 m.j
240
41787 c.k
218
42627 V.I.P
212
42972 n.L
210
43612 hl.m
206
46632 v.o.s
188
179
Appendix to ces mixed 2012: Left neighbors of the full stop with additional internal full stops
Appendix to ces mixed 2012: Left neighbors of
the full stop with additional internal full stops
Top 25 left neighbors of full stop already containing full stops
Rank
Word
Frequency
1400
s.r.o
35952
1931
a.s
27847
3005
iDNES.cz
18526
7714
Blesk.cz
7178
7920
iHNed.cz
6988
8326
r.o
6622
12037 Denik.cz
4427
13467 k.ú
3902
15943 o.s
3218
17562 IHNED.cz
2879
18332 E.ON
2745
19923 o.p.s
2481
21851 n.m
2222
22039 t.j
2200
22588 č.p
2138
22698 P.S
2124
23106 Aktuálně.cz
2075
28564 Kuptofoto.cz
1581
29076 Seznam.cz
1548
29747 m.n.m
1506
32289 p.č
1359
32437 Profimedia.cz 1351
37809 profimedia.cz 1110
40583 iDnes.cz
1012
42863 s.p
943
180
181
Sentences details
Appendix to ces news 2005-2007: Shortest
sentences
The shortest sentences by string length
Shortest declarative sentences
Length
Sentence
15
Nic zvláštního.
15
Oranžové penze.
15
Zarazilo mě to.
15
Zdraží všichni.
15
Záleží a hodně.
15
A můžete začít.
15
Peníze zvítězí.
15
Oni že špatnou.
15
Je vzdělanější.
15
A požadují čas.
Shortest exclamatory sentences
Length
Sentence
15
To byl večírek!
15
Změny na Yahoo!
15
Sešívané srdce!
15
Míšov má smůlu!
15
Je nutná změna!
15
Tušíte správně!
15
Prostě milenci!
15
Strašlivá muka!
15
Ani si neškrtl!
15
Jak romantické!
Appendix to ces news 2005-2007: Shortest sentences
182
Shortest interrogative sentences
Length
Sentence
15
A možné řešení?
15
Dokážeme čekat?
15
Co lze zlepšit?
15
Nic zajímavého?
15
Vítěz bere vše?
15
Promýšlet, nač?
15
To bylo účelem?
15
Každý má šanci?
15
Který je lepší?
15
Že by čínských?
Appendix to ces news 2008: Shortest sentences
The shortest sentences by string length
Shortest declarative sentences
Length
Shortest exclamatory sentences
Sentence
15
Ale zvyknou si.
15
Ale zůstal sám.
15
Samozřejmě ano.
15
A možná i sobě.
15
A možná až moc.
15
Bohužel nemají.
15
Z věže skočila.
15
Ode zdi ke zdi.
15
Teď zase vážně.
15
To už se stalo.
Appendix to ces news 2008: Shortest sentences
183
Length
Sentence
15
Ty byly krásné!
15
To bylo krásné!
15
To byl koncert!
15
Ze světa Bacha!
15
Je tu televize!
15
Ono to funguje!
15
V hotelu Praha!
15
Měl tam i syna!
15
Vzhůru na moře!
15
Tu přece známe!
Shortest interrogative sentences
Length
Sentence
15
Co lze spatřit?
15
Kdo za to může?
15
Kdo za ni může?
15
Jak z toho ven?
15
I když, kdo ví?
15
Co byste chtěl?
15
Co nyní píšete?
15
Co bylo špatně?
15
Co by se stalo?
15
Kdo vede válku?
Appendix to ces news 2009: Shortest sentences
184
Appendix to ces news 2009: Shortest sentences
The shortest sentences by string length
Shortest declarative sentences
Length
Sentence
15
K vozu se hodí.
15
Samozřejmě ano.
15
Mám změny ráda.
15
Měl zlaté ruce.
15
Bohužel už ano.
15
Bohužel nebylo.
15
V lize nic moc.
15
A může být hůř.
15
Ani zdaleka ne.
15
Tereza je jiná.
Shortest exclamatory sentences
Length
Shortest interrogative sentences
Sentence
15
A pozor, změna!
15
"Ať žije Papež!
15
"Ať žije Klaus!
15
"Hlavně k sobě!
15
Opravdu to jde!
15
Za dva miliony!
15
CZ BUDE U TOHO!
15
Budou tu pořád!
15
Půjdu na testy!
15
Ve čtvrtek Aha!
Appendix to ces news 2009: Shortest sentences
185
Length
Sentence
15
Kdy že to bylo?
15
Kdo za to pyká?
15
Kdo za to může?
15
Kdo za to mohl?
15
Kdo za Grabera?
15
Jak z toho ven?
15
D: Už jsou tam?
15
I když, kdo ví?
15
Co byste řekla?
15
Co bylo špatně?
Appendix to ces news 2010: Shortest sentences
The shortest sentences by string length
Shortest declarative sentences
Length
Shortest exclamatory sentences
Sentence
15
Samozřejmě nic.
15
Ale zpět ke 3G.
15
Ale zpět k NFC.
15
Ale znáte svět.
15
Bez zkušeností.
15
Vydrží pět let.
15
Záleží na čase.
15
Bohužel nikoli.
15
Bohužel nemají.
15
Jen ze začátku.
Appendix to ces news 2010: Shortest sentences
186
Length
Sentence
15
No, že konečně!
15
Nedivím se jim!
15
Odpověď zní ne!
15
Poprvé v Česku!
15
Opravdu to jde!
15
Teď už to víme!
15
Tak to je síla!
15
Tak to byl gól!
15
Tak tedy zrůda!
15
Zkuste to i vy!
Shortest interrogative sentences
Length
Sentence
15
Kdo za to může?
15
Kdo za Růžičku?
15
Ale za pár let?
15
Kdo za ně může?
15
Jak z toho ven?
15
A když ji mají?
15
Co nyní děláte?
15
Co bylo špatně?
15
Co bych dělala?
15
To by také šlo?
Appendix to ces news 2011: Shortest sentences
187
Appendix to ces news 2011: Shortest sentences
The shortest sentences by string length
Shortest declarative sentences
Length
Sentence
15
Samozřejmě mám.
15
Samozřejmě ano.
15
A možná i více.
15
A možná i doma.
15
Ale žijeme dál.
15
A cizí také ne.
15
Záleží na vůli.
15
Mám ženu, děti.
15
A můžeme začít.
15
Bohužel nebylo.
Shortest exclamatory sentences
Length
Shortest interrogative sentences
Sentence
15
To bylo štěstí!
15
To by byl skok!
15
Ale vynikající!
15
Je uvnitř rudé!
15
Omlouvá se vám!
15
Je nutná změna!
15
Vystupte z něj!
15
Vzadu je místo!
15
Jde to z kopce!
15
Ale to jsem já!
Appendix to ces news 2011: Shortest sentences
188
Length
Sentence
15
Jak že to bylo?
15
Kdo za to sedi?
15
Kdo za to může?
15
Kdo za Rampulu?
15
Jak z toho ven?
15
Co bylo špatně?
15
Za týden znovu?
15
Že by ze zvyku?
15
Co by se stalo?
15
Kde vzít akcie?
Appendix to ces news 2012: Shortest sentences
The shortest sentences by string length
Shortest declarative sentences
Length
Shortest exclamatory sentences
Sentence
15
Dokážu být sám.
15
Samozřejmě bez.
15
Hm, zřejmě ano.
15
Samozřejmě ano.
15
Železný má tři.
15
Jak známo, tak.
15
A možná i dřív.
15
Dorazí za námi.
15
A rozhodčí nic.
15
Bohužel nebyly.
Appendix to ces news 2012: Shortest sentences
189
Length
Sentence
15
Dík za odpověď!
15
Nález na mozku!
15
To bylo utkání!
15
A kdyby jen to!
15
Z: Ty mně taky!
15
Holky je volný!
15
To kvůli tlaku!
15
Nedivím se jim!
15
Po své mamince!
15
Miloval jsi mě!
Shortest interrogative sentences
Length
Sentence
15
Kdo za to může?
15
Jak z toho ven?
15
Že už je pozdě?
15
Co bylo špatně?
15
A kdy to půjde?
15
Že by spolužák?
15
Co by se stalo?
15
Že by nový pár?
15
Že by kolotoče?
15
Co by bylo dál?
Appendix to ces newscrawl 2011: Shortest sentences
190
Appendix to ces newscrawl 2011: Shortest
sentences
The shortest sentences by string length
Shortest declarative sentences
Length
Sentence
15
Ale zvedáme se.
15
Samozřejmě ano.
15
Ale zpět k vám.
15
A možná i děje.
15
Nabízím vám ji.
15
Vydrží pět let.
15
Bohuzel pro CR.
15
Bohužel právem.
15
Bohužel nikoli.
15
Bohužel nejsem.
Shortest exclamatory sentences
Length
Shortest interrogative sentences
Sentence
15
Samozřejmě ano!
15
A pozor, změna!
15
No, že se ptám!
15
Ode zdi ke zdi!
15
Dík za odpověď!
15
To už vůbec ne!
15
Vítěz bere vše!
15
To byly metody!
15
To byl koncert!
15
Je výborná věc!
Appendix to ces newscrawl 2011: Shortest sentences
191
Length
Sentence
15
Kdo získá Opel?
15
Kdo za to pyká?
15
Kdo za to může?
15
Kdo za to mohl?
15
Jak z toho ven?
15
D: Už jsou tam?
15
I když, kdo ví?
15
A když tak kdy?
15
I když proč ne?
15
A když ji mají?
Appendix to ces newscrawl 2012: Shortest
sentences
The shortest sentences by string length
Shortest declarative sentences
Length
Shortest exclamatory sentences
Sentence
15
Z vozu do vozu.
15
Samozřejmě nic.
15
Samozřejmě mám.
15
Samozřejmě ano.
15
Ale zpět k vám.
15
Tak zní zadání.
15
V Plzni to vře.
15
Své zkušenosti.
15
Ano zkáza trvá.
15
Ale zjevně ano.
Appendix to ces newscrawl 2012: Shortest sentences
192
Length
Sentence
15
Tak zvoňte dál!
15
Samozřejmě ano!
15
No, že se ptám!
15
Dík za odpověď!
15
To už vůbec ne!
15
Nález na mozku!
15
To byl náš hit!
15
To byl koncert!
15
A kdyby jen to!
15
Dluhy se platí!
Shortest interrogative sentences
Length
Sentence
15
Jak žije a kde?
15
Co lze zlepšit?
15
Kde že to jsme?
15
Kdo za to může?
15
Kdo za ni může?
15
Je už vše dáno?
15
Jak z toho ven?
15
Kdo z kola ven?
15
I když, kdo ví?
15
A když tak kdy?
Appendix to ces wikipedia 2007: Shortest sentences
193
Appendix to ces wikipedia 2007: Shortest
sentences
The shortest sentences by string length
Shortest declarative sentences
Length
Sentence
15
Zde zde pod ev.
15
Převzato z ČTK.
15
D. (za jménem).
15
On byl Kristus.
15
Bůh Vám žehnej.
15
Teď už to víme.
15
Má kulatý tvar.
15
Nemáte kam jít.
15
Ve stáří měkne.
15
Má troje dveře.
Shortest exclamatory sentences
Length
Shortest interrogative sentences
Sentence
15
Vždy se zdarem!
15
Bože naší země!
16
To už je snadné!
16
Ať žijí Španělé!
17
Plnou silou zpět!
17
Já jsem Hospodin!
17
Je to překvapení!
17
Jsem snad zloděj!
18
“ * „Piš sám sebe!
18
Jsi tím co hledáš!
Appendix to ces wikipedia 2007: Shortest sentences
194
Length
Sentence
15
Co to je sláva?
16
Co to je odúmrť?
16
Kde jsou odbory?
16
Co říci závěrem?
16
Co jí můžu říct?
16
Nebo se ukrýval?
16
Jaký je váš věk?
17
Jak se jmenujete?
17
A jsme jím vůbec?
17
V čem je princip?
Appendix to ces wikipedia 2012: Shortest
sentences
The shortest sentences by string length
Shortest declarative sentences
Length
Shortest exclamatory sentences
Sentence
15
Je vždy veselá.
15
Zde začal psát.
15
D. (za jménem).
15
In: Z hor jsme.
15
Poprvé veřejně.
15
Bůh Vám žehnej.
15
Je Múzou hudby.
15
Teď už to víme.
15
Má kulatý tvar.
15
Měl tři stupně.
Appendix to ces wikipedia 2012: Shortest sentences
195
Length
Sentence
15
Strhni to dolů!
15
Ať žije Mexiko!
15
Půjdeš za mnou!
15
Bylo to hrozné!
15
Vždy se zdarem!
16
Mám ženu a děti!
16
Ať žijí duchové!
16
Už je to 10 let!
17
Já jsem Hospodin!
17
Je to překvapení!
Shortest interrogative sentences
Length
Sentence
15
Kdy to praskne?
15
Co jsou monády?
15
Co to je sláva?
15
Kdo je autorem?
15
Co je workcamp?
15
Co je agnostik?
15
Proč tak těžko?
16
Kdo založil Řím?
16
Jak se to stalo?
16
Nikdo je nechce?
Appendix to ces web 2002: Shortest sentences
196
Appendix to ces web 2002: Shortest sentences
The shortest sentences by string length
Shortest declarative sentences
Length
Sentence
15
“ — „Deš rubli.
15
“Ne.” odtušila.
15
Tobě» neotewru.
15
Nic zvláštního.
15
Nerozuměl tomu.
15
Nerozuměl jsem.
15
Samozřejmě lež.
15
Samozřejmě ano.
15
Nebezpečný jez.
15
Obrazové úlohy.
Shortest exclamatory sentences
Length
Shortest interrogative sentences
Sentence
15
Moěn‡ o postup!
15
Vítězství zdar!
15
Samozřejmě nic!
15
AL) Zmáčkni to!
15
Nabízené zboží!
15
Invaze kytiček!
15
Mít zdravé psy!
15
Tak začni dnes!
15
To bylo úžasné!
15
To bylo skvělé!
Appendix to ces web 2002: Shortest sentences
197
Length
Sentence
15
Nerozuměla jsi?
15
Nepoznáváte mě?
15
Nepoznáváš mne?
15
A rozloučit se?
15
Tvé zkušenosti?
15
Vydrží to něco?
15
A Boží odpověď?
15
Dokážeme čekat?
15
Kdo že to dělá?
15
Řetězce příčin?
Appendix to ces web 2011: Shortest sentences
The shortest sentences by string length
Shortest declarative sentences
Length
Shortest exclamatory sentences
Sentence
15
Povezu asi dvě.
15
Nalézt na Mapy.
15
Samozřejmě, že.
15
Samozřejmě ano.
15
Ale zpět k USA.
15
Záleží na ceně.
15
A můžete začít.
15
192 zemí světa.
15
38. zemí světa.
15
A můžeme začít.
Appendix to ces web 2011: Shortest sentences
198
Length
Sentence
15
Samozřejmě ano!
15
Tak že konečně!
15
Již žádné pády!
15
Dík za odpověď!
15
Dík za ocenění!
15
Já už se těšim!
15
Vítěz bere vše!
15
To bylo krásné!
15
Dííky za účast!
15
Útěky na desku!
Shortest interrogative sentences
Length
Sentence
15
Jak zvýšit FPS?
15
Jak žít zdravě?
15
Kde žijí čerti?
15
Je výběr dobrý?
15
Jak vzniká deš?
15
Jak vzniká déš?
15
Kde všude žila?
15
Jak vše vzniká?
15
Jak vše vlastn?
15
Z důvodu zajiš?
Appendix to ces web 2012: Shortest sentences
199
Appendix to ces web 2012: Shortest sentences
The shortest sentences by string length
Shortest declarative sentences
Length
Sentence
15
Zavažte si oči.
15
Nalézt na Mapy.
15
Samozřejmě, že.
15
Samozřejmě nic.
15
Samozřejmě ano.
15
Ale zpívá lépe.
15
Ale zpět k USA.
15
Ale zpět k nám.
15
Tak zní pověst.
15
Vyřízli mi oči.
Shortest exclamatory sentences
Length
Shortest interrogative sentences
Sentence
15
Samozřejmě ano!
15
A můžeme začít!
15
Tak že konečně!
15
Tak zase někdy!
15
Vše zase dobré!
15
Vše za polovic!
15
Dík za odpověď!
15
Dík za ocenění!
15
Já už se těšim!
15
Vítěz bere vše!
Appendix to ces web 2012: Shortest sentences
200
Length
Sentence
15
Jak zvýšit FPS?
15
Jak žít zdravě?
15
Kde žijí čerti?
15
Kdo že to dělá?
15
Mám začít nový?
15
Jak začít hrát?
15
Kdo za ně může?
15
I když s náměš?
15
Co bych změnil?
15
Je výběr dobrý?
Appendix to ces mixed 2012: Shortest sentences
The shortest sentences by string length
Shortest declarative sentences
Length
Shortest exclamatory sentences
Sentence
15
“ — „Deš rubli.
15
“Ne.” odtušila.
15
Tobě» neotewru.
15
Nic zvláštního.
15
Nerozuměl tomu.
15
Nerozuměl jsem.
15
Povezu asi dvě.
15
Zavažte si oči.
15
Nalézt na Mapy.
15
Samozřejmě, že.
Appendix to ces mixed 2012: Shortest sentences
201
Length
Sentence
15
Moěn‡ o postup!
15
Vítězství zdar!
15
Samozřejmě nic!
15
Samozřejmě ano!
15
A pozor, změna!
15
AL) Zmáčkni to!
15
Nabízené zboží!
15
A můžeme začít!
15
Invaze kytiček!
15
No, že konečně!
Shortest interrogative sentences
Length
Sentence
15
Jak zvýšit FPS?
15
Nerozuměla jsi?
15
Nepoznáváte mě?
15
Nepoznáváš mne?
15
A rozloučit se?
15
Tvé zkušenosti?
15
Jak žít zdravě?
15
Kde žijí čerti?
15
Vydrží to něco?
15
A Boží odpověď?
Appendix to ces news 2005-2007: Longest sentences
202
Appendix to ces news 2005-2007: Longest
sentences
The longest sentences by string length
Longest declarative sentences
Length
Sentence
248
Za 15 rokov pôsobenia v SR sa vo fabrike v Devínskej Novej Vsi vyprodukovalo takmer 25 000 automobilov značky VW Passat, viac ako
575 000 modelu VW Golf, 15 000 kusov áut VW Bora, viac ako 740 000 vozidiel VW Polo a takmer 500 000 kusov VW Touareg.
246
Doterajšia celková bilancia oboch tenistiek bola vyrovnaná 1:1, v roku 2005 na tvrdom povrchu v Luxemburgu triumfovala Slovenka (6:4,
6:1), vlani na varšavskej antuke rovnako v osemfinálovej fáze sa jej Moskovčanka revanšovala a vyhrala 6:4, 6:3.
245
Podle informací listu Le Figaro by se jednalo o třicet souprav rychlovlaku TGV, které by trať dlouhou 444 kilometrů urazily za necelé tři
hodiny rychlostí 300 km/hod. Dosud jsou obě města spojena jen desetihodinovou autobusovou linkou a letecky.
243
Duo z Ferrari sprevádzal na stupni víťazov obhajca titulu Fernando Alonso, ktorý tak stiahol na okruhu Spa-Francorchamps náskok svojho
tímového kolegu Lewisa Hamiltona (v Belgicku 4. miesto) na čele svetového šampionátu na rozdiel dvoch bodov.
243
Federer sa v "Cincy" bude usilovať nielen o nadviazanie na svoj predvlaňajší miestny celkový triumf a odčinenie lanskej rýchlej prehry s
Britom Andym Murraym, ale aj vybojovanie svojej jubilejnej 50. singlovej trofeje v profesionálnej kariére.
243
Delegáti na štvrtkovom zasadnutí Medzinárodnej obchodnej komory (MOK) v Paríži opätovne zvolili predsedu Slovenskej obchodnej a
priemyselnej komory (SOPK) Petra Mihóka za podpredsedu Svetovej komorovej federácie Medzinárodnej obchodnej komory.
243
Straussa-Kahna navrhol v júli tohto roku nový francúzsky prezident Nicolas Sarkozy, ktorý v socialistovi ocenil "jeho osobné kvality,
skúsenosti a kompetentnosť vo finančnej oblasti", čo prejavil najmä ako minister financií v rokoch 1997-1999.
242
Medzi 32 najlepšími sa stretne s postupujúcou zo súboja medzi 32-ročnou domácou veteránkou Jill Craybasovou (72. v renkingu, proti
Slovenke bilancia 0:3) a takisto nenasadenou 19-ročnou Ruskou Allou Kudriavcevovou (67. v rebríčku, skóre 0:0).
242
Návštevníci opery sa môžu tešiť na predstavenia Madama Butterfly od Pucciniho, Lucrezia Borgia od Donizettiho, ďalej na inscenáciu
Borisa Godunova z pera Modesta Petroviča Musorgského a na hru Orfeus a Eurydika od Christopha Wilibalda Glucka.
242
ECM se za nízké likvidity sesunula o 1,63 procenta na 1745 korun. Klesal také druhý developer, Orco ztratilo 0,89 procenta na 3335
korun. Philip Morris ubral 0,73 procenta na 10946 korun. Zentiva odepsala 0,35 procenta na 1417 korun za akcii.
Longest exclamatory sentences
Length
Sentence
239
Obyvatel Uruguaye je Uruguayec, vyslovujeme -gvajec, ač se píše -u-, obdobně Paraguayec s vysloveným -v- na místě -u-, kdežto
obyvatel státu Nikaragua se česky nazývá Nikaragujec a vyslovuje se tu -u-, nikoli - gvajec s -a- před koncovkou!
233
Co je to princip solidarity pan Eisman vůbec nepochopil a místo toho nám vypravuje cosi o prosté směně, jak probíhala za prvobytně
pospolné společnosti – já tobě kus mamuta (dnes dům), ty mně pazourek (dnes obraz) a to ještě bez DPH!
232
Ve jménech několika latinskoamerických států se vyskytuje psané -gu-, které česky vyslovujeme stejně jako v těchto zemích -gv-, ale v
písmu se -v- neobjeví, např. Guatemala, Guayana, Paraguay, Uruguay - a pozor u obyvatelských jmen!
232
Znovu bych chtěl vyzvat pana předsedu vlády, aby zde pouze neseděl, aby zde pouze nemlčel, aby nevysílal jiné ministry a jiné koaliční
poslance, aby zde vystoupil sám, postavil se k problému čelem a řekl nám svůj názor na celou věc!
231
Rozhodl se po dlouhých průtazích a mnoha opakovaně nezdařených návratech na trávník v dresu Chelsea, kam odešel v roce 1998 z Lazia
Řím, ale vinou zpřetrhaných kolenních vazů za londýnský klub nastoupil za čtyři roky jen desetkrát!
229
Není divu - od první řady VyVolených na podzim 2005 Prima v souboji s Novou nezaznamenala žádný výraznější úspěch, naopak mezi
propadáky musela postupně zařadit druhou řadu VyVolených, reality show Bar, reality dokument Pane Joo!
229
Nedivím se, že po převratu v roce 1989 právě zemědělství bylo první na řadě k likvidaci, aby bylo možno přebytky z krize nadvýroby v
západních zemích exportovat do naší ČR, ale i do ostatních zemí bývalého socialistického tábora!
Appendix to ces news 2005-2007: Longest sentences
203
229
Do jeho časového limitu však vystoupí jiný milý host, slovenský politolog a publicista, známá tvář slovenské TV obrazovky Mgr. Braňo
Ondruš, který přednese poznámku na téma: Slovensko za Dzurindy a Slovensko za Fica - vyberte si!
229
Z vlád menších států nese odpovědnost za úspěch nacismu v první válečné etapě zejména ona polská svojí zaslepenou
protičeskoslovenskou, protikomunistickou, protisovětskou, proti demokratickou politikou, objektivně pronacistickou!
229
Stál tehdy v čele nedávno založeného, mohutného Konžského národního hnutí (Mouvement National Gongolais - MNG) a svůj akkerský
projev Lumumba zakončil zvoláním: Pryč s kolonialismem a imperialismem, pryč s rasismem a tribalismem!
Longest interrogative sentences
Length
Sentence
233
To má naplňovat § 109 odst. 4 zákoníku práce o tom, že "mzda a plat se poskytují podle složitosti, odpovědnosti a namáhavosti práce,
podle obtížnosti pracovních podmínek, podle pracovní výkonnosti a dosahovaných pracovních výsledků"?
232
Takže přesto, že, jak v pondělí Hutka uvedl, Nohavica pro něho přestal existovat, nezajímal se o něj, nekontaktoval jej od roku 1991, kdy
se dozvěděl, že Nohavica údajně spolupracoval s STB, tak proč v roce 2007 najednou ta potřeba?
231
Není to náhodou tak, že ono globální oteplování narazilo na určitou zamrzlost politiků, kterým jde o něco jiného než o zelenou politiku, že
jim jde o jejich vlastní pozice a mají problémy vysvětlovat, co chtějí i ve vlastní straně?
231
Kdo jiný by si mohl v současném světě dovolit vyvézt především do Iráku a menší měrou do Afghánistánu plnou čtvrtinu pozemních
dopravních prostředků a celou pětinu helikoptér vlastní armády (podle Government Accountability Office)?
231
Jakáže je doba k uvedení sila a radaru z "klidového stavu" (ve kterém by celý komplex měl být stále do chvíle, než družice zjistí odpal
nepřátelské rakety) do bojové pohotovosti (připravenosti raketového nosiče k okamžitému odpalu?
230
Jakou motivaci má tedy pracovník, odvádějící svou práci v obvyklém standardu, bez špetky osobní iniciativy a pouze v rámci svých
povinností, když se dočká stejného platového navýšení jako jeho kolega, který je jeho přesným opakem?
230
Prý v ní doznívá Stalin" (HN 16. dubna) si kladu dvě otázky: kde zjistila, že v Československu se za minulého režimu stal ideálním
oděvem stejnokroj, a jak ji napadlo, že se Češi nedokážou oblékat tak elegantně jako třeba Italové?
230
Starosta Trokavce zaznamenal a komentoval tuto premiérem vyřčenou větu slovy: "Z této naprosto nezvládnuté, šokující a nehorázné
odpovědi lze dovodit, že premiér ví a počítá s tím, že zde v souvislosti s radarem budou umírat lidé?
230
Dívám se na záběry pořízené v pražských ulicích 10. listopadu a nemohu se neptat: Jak je možné, že se v Čechách (ale bohužel nejen tam)
opětně rekrutují nacistické spolky, a dokonce si zakládají (po vzoru SA) organizované bojůvky?
230
A podobne, viete si predstaviť, že by sa s árijským Nemeckom alebo bielou Juhoafrickou republikou zaobchádzalo ako s primeraným
alebo férovým partnerom na rokovanie pre tých, ktorých chceli tieto krajiny zneužívať alebo odstrániť?
Appendix to ces news 2008: Longest sentences
204
Appendix to ces news 2008: Longest sentences
The longest sentences by string length
Longest declarative sentences
Length
Sentence
255
Čtěte také: Nejvyšší soud USA se opět postavil za práva vězňů z Guantánama Vězni na Guantánamu jsou podezřelí ze spolupráce s
afghánským radikálním hnutím Taliban nebo s mezinárodní teroristickou sítí Al-Káida a často jsou zde drženi bez soudního příkazu.
255
Nebudu se zmiňovat o známých negativních národohospodářských dopadech působení Strany zelených při prosazování biopaliv,
kamionové dopravě, neekonomických zdrojích energie, vodních cestách, (ne)zákonných normách, nesmyslné ekologické dani a mnoha
dalších.
255
Nikdo z návštěvníků nevynechá jihoamerické drápkaté opičky lvíčky zlaté nebo čilé lemury z Madagaskaru, zoologičtí nadšenci se určitě
zastaví u neobvyklé cibetkovité šelmy fosy nebo mývala jižního, který je v zoologických zahradách poměrně vzácným hostem.
255
" Scarlett, která je nazývána Marilyn Monroe 21. století a která by měla filmově ztvárnit postavu princezny Diany, je ale ve skutečnosti
zasnoubená s hercem Ryanem Reynoldsem (31, Dokud nás smrt nerozdělí), od něhož se jí na ruce třpytí diamantový prsten.
255
Přesto dostali nabídku z Ministerstva obrany, aby si mohli celou tu stavbu prohlédnout, aby mohli být seznámeni s tím, co se tam buduje,
jak to bude vypadat a podle těch informací, které mám, byli a tak jak jsem nakoupil, prodávám, až arogantně odmítnuti.
255
Zatímco v roce 2006 přišlo na brněnské výstaviště 105 000 lidí, loni jich bylo jen asi 80 000. Podle průzkumů klesl počet organizovaných
školních zájezdů a nejmladších návštěvníků, odborné dny veletrhů byly naopak o deset procent navštěvovanější než loni.
255
Historicky největší úspěch českého florbalu v roce 2004, kde český tým podlehl až ve finále Švédsku, prožili Kafka, obránci Aleš Jakůbek,
Tomáš Trnavský a útočníci Radim Cepek, Pavel Kožušník, Martin Ostřanský, Vojtěch Skalík, Radek Sikora a Aleš Zálesný.
255
Dosluhující prezident George Bush udělal nedávno rozhovor, ve kterém označil za největší chybu svého prezidentování to, že uvěřil v
existenci zbraní hromadného ničení v Iráku Saddáma Husajna, což - jak řekl - pro něj bylo hlavním důvodem k zahájení války.
255
"Předseda sociální demokracie, který tuto stranu převzal v tak žalostném stavu jako já a dovedl ji do pozice, ve které má poměrně vysoký
náskok před ODS ve volebních preferencích, se nemá čeho obávat," reagoval na dotaz, zda se necítí v roli šéfa ohrožen.
255
Přes dílčí negativa (drogové závislosti, domácí násilí, alkoholismus, gamblerství apod., kdy rodina ohroženou osobu vždy „udrží“ a
toleruje třeba i drobné krádeže, nejsou-li peníze na drogy, alkohol či automaty) by nám všem romská rodina mohla být vzorem.
Longest exclamatory sentences
Length
Sentence
255
Přitom vám prozradí několik sexuálních vzpomínek ze světa newyorské intelektuální smetánky, která si navzájem ráda tiskne ramena, ale
hlavně upozorní na pár voňavých skvostů - taková Jasmine et Cigarette, francouzská zákeřnost ve flakonu, musí být úžasná!
255
Pokud bychom k dohodě nedospěli v následujících třech týdnech, budeme nuceni předložit tento případ přímo vašim akcionářům, včetně
zahájení jednání o zastupování (proxy contest) pro výběr alternativního obsazení ředitelů do správní rady společnosti Yahoo!
255
A čtvrteční dopolední happening opravdu přitáhl pozornost, nejen v klidu přihlížejících občanů, ale též několika provokatérů, kteří
nemohli přenést přes srdce, že si někdo troufá i 21. srpna sbírat podpisy pod petici za referendum o radarové základně USA!
255
" Nové náměstí v Uhříněvsi prodáno Poslední byt projektu "Nové bydlení na Novém náměstí" v Uhříněvsi, který realizovala developerská
divize společnosti Metrostav a. s., byl prodán, a to pouhé dva měsíce po kolaudaci, která proběhla na konci loňského roku!
255
Ale každý soudný člověk ví, že způsoby, kterými se ohání politická garnitura, vznikaly - řečeno s teologem - od chvíle prvotního hříchu
17. listopadu 1989, kdy si jedna politická třída přivlastnila heslo: "Pravda a láska musí zvítězit nad lží a nenávistí!
255
Banka Baltinvest lákala vkladatele úroky z uspořených částech ve výši 14 nebo snad 17 procent ročně (obě úrokové míry jsou naprosto
nerealistické) - snad aby zdůraznila naprostou ireálnost takové nabídky, bylo na plakátě zdůrazněno: Vklady jsou pojištěny!
255
Autor David Kolaja: Tisková zpráva - Justiční konference na Invexu 2007 Partneři Ejustice.cz - ASPI a.s. Jan Sváček: S pouhým apelem
na zloděje soudních dokumentů nevystačíme Ministr spravedlnosti Jiří Pospíšil varuje: Pozor na krádeže v soudních spisech!
Appendix to ces news 2008: Longest sentences
205
254
Pokud byste nehodu zavinili vy, bezprostředně po nehodě (nejlépe ještě v době pobytu v zahraničí) kontaktujte příslušnou národní
Kancelář "povinného ručení" (adresy jsou uvedeny na zadní straně zelené karty - tu si rozhodně nezapomeňte na cestu přibalit!
254
O podnikání už nechce ani slyšet Určitá skupina lidí si nedovede představit, že by měla mít nějakého nadřízeného, a přes různé problémy
dává přednost podnikání, na druhé straně však existují i tací, kteří si podnikání vyzkoušeli, a nyní tvrdí - už nikdy!
254
Pojištěnci tak budou od 30. 6. 2008 v prvých třech dnech pobírat nemocenské dávky ve výši 60 % redukovaného výpočtového základu; od
1. 9. 2008 již jen 25 % a od 1. 1. 2009 opět nebudou zaměstnanci za prvé 3 dny pracovní neschopnosti pobírat žádnou dávku!
Longest interrogative sentences
Length
Sentence
255
Jak se zviditelňuje ČR před světem, když oficiální návštěva z Číny v Poslanecké sněmovně Parlamentu ČR musí čelit provokaci jistých
poslanců a dokonce i členů vlády, pózujících při této příležitosti s rozvinutým tibetským praporem nebo vlajkou Tchaj-wanu?
255
Ale i jestliže měl Blair pravdu při své argumentaci, že nespravedlivá vláda v dalekých zemích ospravedlňuje ozbrojenou invazi - je to
nebezpečně otevřená zásada, v jejímž důsledku jsme byli zataženi do katastrofy v Iráku - a co to má co společného s NATO?
255
Představte si, vážení čtenáři, že by mně vzali i nově koupenou ledničku, protože hlásají, tedy ti komunisté, jakousi nespecifikovanou
rovnost a co když někdo v našem nejbližším okolí ledničku ještě nemá a já mám další (i když starou) na chalupě, čili dvě?
255
Velmi ilustrativní je v této souvislosti vzpomenout Nohavicovu výtečnou píseň Pane prezidente, jejíž ironický a ostře satirický charakter
(„vy přece všechno víte“, „vy se mnou soucítíte“, „víš co on má starostí s celú tú Evropú, s vesmírem a vůbec všecko?
255
Dobrý den, chci se zeptat, když je někumu na Aukru zablokov án účet, proč je automaticky zablokován i jeho rodinnému příslušníkovi,
který siúčet chce založit až několik měsíců po zablokování a navíc ani nebydlí ve stejné domácnosti, např. s otcem, matkou?
255
Zřejmě si nevěděl rady s úkolem, který jemu, jako kompetentnímu predátorovi, uložil jeho stvořitel nebo evoluce, a který se v něm
probouzel: „Jak ozdravně očistit tak velkou tlupu hostitelů od samolibých, zkažených, nemocných a předčasně přestárlých kusů?
255
Nabízí se otázka, jestli to, co se nyní děje v Pobaltí (Lotyšsko má podle studie Hansabanky na tom být nejhůře na konci letošního roku),
není předobrazem toho, co může krize přinést třeba do Česka a dalších zemí, doposud si užívajících ekonomického růstu?
255
Je předpokládán základní politický a především všeobecný rozhled kandidátů do senátu, původně koncipovaného spíše jako jakási rada
moudrých, nebo nyní o přední pozici v hierarchii rozhoduje jako kdysi poslušnost, stranická knížka a nejasné pletivo vztahů?
255
Jak mám odpovídat na dotazník, který mi ukládá pravdivě odpovědět na otázku, kolik mám finančních prostředků na výživu svou a svého
dítěte, když alimenty, které mi stát ukládá dát na výživu dvou dětí žijících v jiné domácnosti, prokazatelně nemohu využít?
255
Šedesátník Nathan Glass se v úvodu románu stěhuje k přátelům, mezi nimiž by mohl v klidu umřít, poněvadž kdo lépe než vysloužilý
prodejce životních pojistek a klamných nadějí může docenit náruč rodné čtvrti poté, co překonal rakovinu a uleželé manželství?
Appendix to ces news 2009: Longest sentences
206
Appendix to ces news 2009: Longest sentences
The longest sentences by string length
Longest declarative sentences
Length
Sentence
255
Průměrný důchod v roce 2009 poprvé přesáhne 10 tisíc - ZDE Tvrdá léčba v Pobaltí: důchody a platy se snižují, daně zvyšují - čtěte ZDE
Ženy obvykle pracují v hůře ohodnocených oborech a profesích, často také dostávají za stejnou práci méně peněz než muži.
255
Zpravodajství Dráhy zrušily výběrové řízení PRAHA - České dráhy zrušily soutěž na dodávku 34 řídicích vozů, jejichž předpokládaná
hodnota byla téměř miliarda korun. Podle Petra Šťáhlavského z tiskového oddělení ČD se do soutěže přihlásila jen jedna firma.
255
Výběrčí místa na tramvajových tratích byla například v Sokolovské ulici u dnešní zastávky Florenc, v Křižíkově ulici u Městského muzea,
v Hybernské před Bulharem, v Bolzanově ulici, u Národního muzea v úrovni Vinohradské ulice či na náměstí I. P. Pavlova.
255
Cameron označil za "výstřední" výroky britského konzervativního europoslance Daniela Hannana, který v rozhovoru pro americkou
ultrapravicovou televizi Fox News uvedl, že by britské státní zdravotnictví "nepřál nikomu" a že je to "šedesát let stará chyba".
255
Chce jejím prostřednictvím popularizovat novou dvaapadesátičlennou europoslaneckou frakci evropských konzervativců a reformistů, v
níž působí, a také kandidaturu Madridu jako jediného evropského města na pořadatelství letních olympijských her v roce 2016.
255
Proto jakékoli další úvahy o umístění jiných prvků protiraketové obrany USA nebo dalších vojenských zařízení v ČR, byť údajně v rámci
NATO, HS považuje za nepřijatelné pokračování konfrontační politiky předchozích administrativ USA a ČR jinými prostředky.
255
"Všeobecně platí, že jsme otevřeni jednání o sdílení sítí se všemi potenciálními partnery na trhu, protože z dlouhodobého hlediska se jedná
o nejefektivnější řešení pro zákazníky, operátory i životní prostředí," uvedl dnes pro ČTK mluvčí Miroslav Čepický.
255
Vypreparovat jednu složku bez ohledu na ostatní je podobné jako postavit stůl na dvě nohy s argumentem, že to přece připomíná stůl na
nohou čtyřech: jistě, jakási vnější podobnost by tu byla, ale první stůl zkrátka stojí, zatímco druhý se bohužel překotí.
255
Sprostí Hadamczik a Müller pokutováni Trenér hokejistů Vítkovic Alois Hadamczik a jeho kladenský kolega Zdeněk Müller dostali od
disciplinární komise Asociace profesionálních klubů ledního hokeje (APK LH) pokuty 30.000 korun za vulgární urážky rozhodčích.
255
Rath vše popřel Hejtman David Rath (ČSSD) popřel informaci dnešních Lidových novin (LN), že v době, kdy zastával funkci ministra
zdravotnictví, vydal sobě a svému příteli Milanu Kubkovi lékařskou atestaci, díky níž si oba mohli otevřít soukromou ordinaci.
Longest exclamatory sentences
Length
Sentence
255
Alfa Romeo láká reklamou na neexistující vůz Billboardy a tisíce reklamních letáků automobilky Alfa Romeo zaplavily Švýcarsko, aby
propagovaly nový vůz MiTo v přepočtu za 370 tisíc korun. Jenže tenhle laciný čtyřkolý mazel ve skutečnosti vůbec neexistuje!
255
Foto: INT Dnes 05:00 Jedenáctý ročník Festivalu české a slovenské filmové veselohry, který se v dubnu konal v Novém Městě nad
Metují, přinesl jednu závažnou informaci: S českou veselohrou to jde od desíti k pěti a to, co se točí, není vůbec žádná legrace!
255
"Vy jste řekl, že premiér nabízel ČT kompromitující materiály na šéfa koaliční strany, to už není chlívek, ale estébácké techniky, omluvte
se předsedovi vlády a všem slušným lidem, v opačném případě jste účelový lhář, kterému nelze věřit ani dnešní datum!
255
Takže se například o dva měsíce zkrátilo zpracování konstrukční dokumentace základních celků automatického manipulátoru nebo
mikropočítač TNS, který evidoval vulkanizační a vstřikovací formy k obuvnické technice, začal sloužit dokonce o celý půlrok dříve!
255
Neví jistě ani nic o korunovačních klenotách císaře a krále Karla IV. – a Karel přitom nebyl jen takový beznárodní „feudál“, ale sám se,
jak se přesvědčí každý, kdo si přečte jeho vlastní životopis Vita Caroli, považoval jako potomek Přemyslovců za Čecha!
255
Oni prostě nedokáží pochopit, že ti lidé, ti Palestinci - kočovní Arabové si za svůj úděl, násilnou smrt svých dětí a život v ghettu mohou
sami, když si v demokratické volbě zvolili nekompromisní radikály, teroristy, se kterými se nevyjednává, ale bojuje!
254
Sobotní příloha Haló novin Nejčtenější články Ke dni Vláda nevládne, krizi jen přihlíží Rozhovor Haló novin s Vojtěchem Filipem,
místopředsedou Poslanecké sněmovny a předsedou ÚV KSČM Děsivá ironie Kabinet utratil 14 miliard - kvůli okupaci Afghánistánu!
254
Novinář či politik ve zralé demokracii se nesnaží neustále přesvědčit voliče, že pravdu má on a oni se mu musejí přizpůsobit (na
konferenci v Bostonu jsem vyprávěl před americkým publikem, jak Alexander Vondra řekl na peróně v Ostravě "Ale já radar chci!
Appendix to ces news 2009: Longest sentences
207
254
"Vyzýváme Václava Klause, aby uznal, že jako reprezentant okrajového politického postoje ztratil legitimitu nadále vykonávat
prezidentskou funkci, a aby z této funkce odstoupil," řek student historie na FF UK Matěj Spurný z pořádající iniciativy Už dost!
254
Máme v dobré paměti, že nám záviděl celý svět naše vyspělé národní hospodářství, hlavně zemědělství, zdravotnictví, školství atd. Věřící
říkávali: dejž bůh, aby láska přišla k nám a svět, aby nás měl rád a těm našim krásným krajinám, rač hojně úrody dát!
Longest interrogative sentences
Length
Sentence
255
Protože Granič byl ministrem v letech 1991-95 a zasvěcen byl do všeho, co se týkalo vztahů Chorvatska s USA, mělo by být jeho
svědectví považováno za věrohodné, ale kdo se odváží, jako takové je přijmout, když se v tak nepříjemném světle ocitá Washington?
255
Už teď se politici těchto zemí odvolávají na to, že ve svých parlamentech nejsou schopni účast v Afghánistánu obhájit Jaká asi bude jejich
argumentace - a Obamova pozice - přinesou-li agentury zprávu, že američtí demokraté odmítli posílení afghánské mise?
255
Že by měl pravdu Marián Hossa, který po loňském finále odmítl nabídku Pittsburghu, že se mu za ohromné prachy na několik let
prodlouží smlouva, a vzal jeden rok za mnohem méně peněz v Detroitu řka, že chce mít naději, že si konečně sáhne na vysněný pohár?
255
Jsou soudy, policie, státní úřady či parlament, tedy jiné oblasti (navíc inherentně méně zatížené nejistotou, složitostí a
nepředpověditelností svých výsledků) placené z peněz daňových poplatníků takto důkladně podrobovány takovýmto hodnotícím
procedurám?
255
Proč však rovněž média vytrvale hovoří týmž jazykem uražené svatosti, když jsou to USA, nikoliv KLDR, kdo právě způsobil smrt více
než milionu Asiatů v Iráku, vypuzení a uvalení statutu uprchlíků na další tři miliony a mnohem více těch, kteří byli raněni?
255
Neměly by se tudíž závěry velkého senátu Nejvyššího soudu ČR vykládat tak, že se společnost může zákonnému zmocnění k
samostatnému jednání dle tohoto ustanovení vyhnout jedině tak, že své statutární orgány či jejich členy takovou činností prostě nepověří?
255
Učitelé se musí neustále vzdělávat, to je naprosto správné, proč ale mladí učitelé neprocházejí užitečnými kurzy a specializovaným
vzděláváním v oblasti globální výchovy, kritického myšlení, čtenářské gramotnosti, osobnostní výchovy atp. již na fakultách?
255
Cožpak lze, při dnešních nárocích katolické církve na majetek opomenout například období po roce 1620, kdy velká část českých pánů
musela svou vlast opustit z důvodu náboženského vyznání a jejich majetek si rozdělila katolická šlechta s katolickou církví?
255
Mezi těmito navzájem oscilujícími krajními póly vnímání novodobé rozhlasové hry se povětšinou pohybovala většina ostatních
představených titulů včetně vítězného snímku s poněkud komplikovaným názvem Rádio Ivo - Život nedoceníš aneb Měl byste dvacet
minut?
255
Nebo snad někdy pochybovali demokratičtí novináři, že mučení elektrickým proudem alžírských vlastenců za války s Francií, mučení
vězňů v Guantánamu aj. vyžadují změnu politických systémů v zemích, jejichž bezpečnostní složky se dopouštěly těchto zvěrstev?
Appendix to ces news 2010: Longest sentences
208
Appendix to ces news 2010: Longest sentences
The longest sentences by string length
Longest declarative sentences
Length
Sentence
255
To bylo například v šílené jízdě po dálnici D1 při stíhání sportovního klání, zneužíváním vrtulníku pro „zalyžování si“ cestou z Itálie v
Alpách, či v neposlední řadě jeho faux pas v Toskánsku na jachtě či vile jistého nejmenovaného švýcarského „dělníka“.
255
Odhaluje propracované a institucionalizované aberace ve vnímání politiky jejími vlastními aktéry, kteří – dnes již zcela nepochybně –
více či méně participují na utužování stále sílící amorální integrity, skutečně konstituující platformy politického dění.
255
Škodovka zahájí výrobu druhé generace modelu Octavia Tour Škoda se chlubí nejnižšími emisemi Škoda Auto zvýšila prodej, rekordní
bylo září Automobil větší než Škoda Fabia Combi a menší než Octavia už je prakticky vyvinutý a nyní směřuje do sériové výroby.
255
Je mi líto, že to Al Gore nechce slyšet - ZDE Sněmovna: ČSSD a zelení prosadili v prvním čtení návrh na zrušení anonymních akciíí čtěte ZDE "My prezidentovy názory nesdílíme dlouhodobě," řekl k možné kontroverzi mezi českým prezidentem a Gorem Paroubek.
255
Minulý týden byla americká profesorka neurologie, která cestovala z Cambridge na vědeckou konferenci v Izraeli, považována leteckou
společností El Al na londýnském letišti Luton za teroristu: ukázalo se, že má stejné jméno jako známý proíránský aktivista.
255
Tramvaje by měla hostit pankrácká vozovna, a první cestující se s ní tedy svezou na linkách, jež tato vozovna vypravuje - třeba číslo 3.
Pokud pražský Dopravní podnik stihne upravit na trati místa, kterými nová, plně nízkopodlažní tramvaj zatím neprojede.
255
Je to česká kronika vyhřezlé malosti, sekernictví a pomstychtivosti, nekonečných schůzí, sestavování oběžníků, kádrových posudků,
slepého přizpůsobování se sovětskému vzoru, autokratického rozhodování neumětelů, ustavičného žvanění, pracovní demoralizace.
255
Většina těchto stimulů zadluženosti však v době hospodářské krize bere za své, což je také příčinou výrazné ztráty tempa úvěrování
českých domácností a pozorovatelné redukce nových přírůstků, u úvěrů na spotřebu dochází dokonce k faktickému snížení stavů.
255
Statické záběry dvou HDV kamer, snímajících v polodetailech a detailech zpovídané osobnosti, oživují ukázky z filmů i archivní
materiály, které zaznamenávají například návrat režisérského tandemu Kadár-Klos z USA po získání Oscara za film Obchod na korze.
255
Jedná se o soubor opatření umožňujících větší šance místním zapojit se do společenského a hospodářského života v regionu, dětem pak
větší úspěch ve vzdělávání, zejména setrvání ve vzdělávání na střední škole, ale i nastolení pořádku a dodržování pravidel.
Longest exclamatory sentences
Length
Sentence
255
Na nahrávce z roku 2005, manželka oplakává mrtvého manžele, který se zastřelil, poté co ho navštívil ČEZVideo: ČEZ Komando ČEZu
natočilo sebevraždu zákazníka Přidej svůj komentář Dnes 19:46Mrtvý muž leží v kaluži krve a nad ním se sklání plačící manželka!
255
Přitom před olympijským turnajem televizní kamery sportovních zpravodajství vyzdvihovaly několikavteřinové záběry českých
hokejových reprezentantů v utkáních zámořské ligy a vytvářely tak falešnou a hlavně lživou realitu o »vyvolenosti« těch »nejlepších«!
255
Čtěte Britské listy speciálně upravené pro vaše mobilní telefony a PDA Karel Dolejší, Štěpán Kotrba Redaktor anglické mutace Focus on
the Czech Republic: deník o všem, o čem se v České republice příliš nemluví Dech beroucí odhalení pozadí aféry WikiLeaks!
254
František Matějka, Přečteno: 16914Dnešní projev prezidenta jsem si vyslechl před obrazovkou v pozoru Josef Kudrna, Přečteno:
13630Lidice si musí počkat, máme přeci komedie David Rektorys, Přečteno: 12552Mladí lidé na Facebooku nejsou tupé ovce, Paroubku!
254
Zatímco ty, které jsou z velké části financovány ze zahraničí, jako je poskytování zdravotních a vzdělávacích, případně i obchodních
služeb, rostly loni o celých 24 procent, u stavebnictví je to »jen« asi deset procent, avšak u výroby pouhá dvě procenta!
253
Cesko-zlodejsko stred EU s tou miliardou co ukradl se nemusi moc honit po licencich (anonym) proste socan jak se patri a Rimana a
ostatni pakaz z ODS (anonym) Taky nezapomente napsat, ze obcas chodi nakupovat do Tesca, (anonym) a to je hrozne podezrele!
253
Ten schválený deficit byl nakonec překročen ne pětkrát, ale sedmkrát, a ten ministr byl Miroslav Kalousek; přesto dnes právě Kalousek
představuje v českém veřejném mínění (bohužel, pozn. JB) skálu, na které bude stát pevná vláda rozpočtové odpovědnosti!
253
Vilhelmová v objetí s Čadkem Když na afterparty po premiéře dorazila Tatiana Vilhelmová v doprovodu manžela Zdeňka Janáčka, která
ve snímku hraje právničkou Kajínka, Čadek jí přivítal objetím a slovy: "Byla jsi neskutečná, jedna z tvých nejlepších rolí!
Appendix to ces news 2010: Longest sentences
209
253
Když jste 8.4.2010 uveřejnili článek s titulkem "Krajské průzkumy: zmatek jak v židovské škole" (týkal se, pokud si pamatuji, českého
školství a přirovnání použité v titulku bylo na úrovni "Španělská vesnice", "Böhmisches Dorfer" nebo "It's Greek to me!
253
Foto: Zbyněk Schnapka Přidej svůj komentář Dnes 12:58"Studenti si za školné mohou sami, jen ať se snaží," reagují čtenáři na komentář o
plánovaném školném na vysokých školách, zveřejněný na Blesk.cz. Názorů je ale víc a diskuse je místy pořádně vášnivá!
Longest interrogative sentences
Length
Sentence
255
Jak by k tomu přišli ti, co jezdí svými drahými auty po této silnici, kdyby zase znovu tady u nás byla »uzákoněna rovnost« (ani ta sice
uzákoněna nebyla, ale často je nám všem ve spojení s minulostí předhazována), tedy nejen »příležitostí«, ale i »platů«?
255
Rozhodne sjezd Chtěli byste občanský průkaz s uvedenou adresou a rodinným stavem, nebo raději bez nich? s těmito údaji 12510 bez
těchto údajů 3488 NejnovějšíNejčtenějšíVýběr Limassol - evropská Dubaj Sociální stát není pro sociální demokraty dobrou ideou?
255
Jednání muzea prověří policie Extremisté se v Česku bojí, přesunuli se do ciziny a zajímá je hip hop Pospíšil chce zákon o mediátorech,
podle advokátů ale za jejich peníze Poškozuje českou diplomacii, že poslanci nejezdí kvůli úsporám na zahraniční cesty?
255
Budou jako ty pro dospělé Chystá se český WikiLeaks, „piráti“ chtějí zveřejnit dokumenty ministerstev Slováci kupují v Česku hlavně
garsonky, Vietnamci domy na předměstí Souhlasíte s ministrem životního prostředí, že by zálohování PET lahví byla hloupost?
255
Honza 20.7. 10:56 Co si myslíte o rozhodnutí Nejvyššího soudu, který naznal, že jízdou 120km/h místo 80km/h a tím znemožnění
správného odhadu řidiče před značkou "dej přednost v jízdě" dal plnou vinu tomuto řidiči a ne tomu, kdo jel o 50% vyšší rychlostí?
255
Čtěte Britské listy speciálně upravené pro vaše mobilní telefony a PDA Karel Dolejší, Štěpán Kotrba Redaktor anglické mutace Focus on
the Czech Republic: deník o všem, o čem se v České republice příliš nemluví Prosinec 2010: ztratí ODS pravicového voliče?
255
Čtěte Britské listy speciálně upravené pro vaše mobilní telefony a PDA Karel Dolejší, Štěpán Kotrba Redaktor anglické mutace Focus on
the Czech Republic: deník o všem, o čem se v České republice příliš nemluví Kdy se probudí mrtvý brouk v českých médiích?
255
Jak se se školou dohodl, tají Soukromé jídelny rozšiřují školákům menu, města věří v úspory Falšované třídnice stály ředitele místo, roky
za něj učila kolegyně Končící děkan Pospíšil: Plzeňská práva slezla hrobníkovi z lopaty Státní maturity od roku 2011?
255
Je-li nějaké právě vydané dílo, ať už se jedná o knihu, film nebo nějaký hudební počin, propíráno na veřejnosti na můj vkus až přespříliš,
rozhodnu se počkat si a vychutnat jej v klidu, nerušen vřavou aktuálnosti, osvobozen od otázek typu „Tak co, viděls?
255
Odpovědí na tuto otázku přinášejí některé odstavce Marjanovičova článku, např.: V moskevském metru se odehrál odporný zločin, ale
jakou spřízněnost bude česká společnost pociťovat vůči zemi, které vládne autoritářské duo Vladimir Putin - Dmitrij Medveděv?
Appendix to ces news 2011: Longest sentences
210
Appendix to ces news 2011: Longest sentences
The longest sentences by string length
Longest declarative sentences
Length
Sentence
255
Investor Marc Faber předpovídá návrat indexu S&P 500 o 40 až 50 bodů výše „Trhy jsou extrémně přeprodané“, řekl Marc Faber v
rozhovoru pro Bloomberg Television s tím, že očekává skokovou rally indexu, ačkoli již zřejmě nedojde k prolomení letošních maxim.
255
Pokud lid přijme prozatímní vládu, pokud do dvou měsíců proběhnou řádné demokratické volby a pokud nově zvolený - věřme že
demokraticky - prezident vypíše v brzké době demokratické volby parlamentní, pak léto v Tunisku může být stejné jako v minulém roce.
255
"Nerad hodnotím své vlastní fotografie, ale je pravda, že už v době, kdy ten soubor vznikal, jsem to konzultoval se svými kolegy fotografy
a už tehdy jsme měli pocit, že se nám líbí ze všech nejvíc," řekl Krupař před zvětšenou reprodukcí vítězného snímku.
255
"Pokud největší americké firmy investují v Polsku stovky milionů dolarů, samy budou mít zájem na naší bezpečnosti, zadarmo získáme
bezplatné lobbisty ve Washingtonu," řekl listu Dziennik-Gazeta Prawna Zbigniew Lewicki, amerikanista z Varšavské univerzity.
255
Funkce se zřejmě zruší - čtěte ZDE Vzájemné partnerství bezpečnostních agentur zajišťujících ochranu drážního majetku pro železniční
podniky a policie, která zajišťuje ostrahu dráhy a vlaků jako státní orgán, je běžnou praxí ve většině zemí Evropské unie.
255
Každý občan má povinnosti Jan Čulík Ještě jedna věc: Uvědomil jsem si, že protože upozorňuju, že není možné z asociálního chování
vinit celé romské etnikum, někteří čtenáři z toho extrapolují, že snad argumentuji, že má být romské etnikum nějak omlouváno.
255
K souběhu pobírání příjmu a vyloučené době v praxi dochází např. v těchto případech: osoba pečující o bezmocnou osobu nebo maminka
na rodičovské či mateřské dovolené si příležitostně přivydělává na zkrácený úvazek, dohodu o pracovní činnosti nebo podniká.
255
Hodnocení vzájemných vztahů mezi Romy a ostatními obyvateli ČR v procentech Při zpětném ohlédnutí za průzkumy veřejného mínění
lze vyčíst, že nejvíce byli lidé nespokojeni se soužitím s Romy v roce 2009, kdy je jako špatné hodnotilo 85 procent dotázaných.
255
"Problém je v tom, že naši předchůdci, předcházející akcionáři a management už v lednu letošního roku rozkrojili medvěda, který ještě
nebyl uloven a oni už ty odvody udělali v částce, která bude evidentně větší než skutečně vytvořený odvod," řekl Ziegler.
255
Důležitější se mi ovšem jeví, že komplexní definice sociobjektu by nás mohla uchránit před strašidelným zjednodušováním v otázce
"změn já" - lze například spekulovat o tom, že "postmoderní subjekt" je formován síťovými médii, zejména prostředím internetu.
Longest exclamatory sentences
Length
Sentence
255
“ Další související články Jaromír Jágr: 9. největší gambler v dějinách sportu Nedvěd: Džegr to měl promyšlené, schvaluju mu to
Červenka: Rusky už to zvládnu i bez Jágra Kouč Říha: Jágr mě svým přístupem zklamal Jágr odhalil pravdu: Pittsburgh mě nechtěl!
255
Řidič nepřežil, spolujezdec je zraněný Za pád auta z mostu do řeky na Šumpersku mohla rychlá jízda Svitavská lupička neuspěla v jedné
bance, policie si ji vyzvedla ve vedlejší Policisté už vědí, koho v Ostravě přejel jejich kolega Tvá partnerka je tlustá!
255
Pastor dostal padáka za sex v kostele Dcera Otta Weitera (55) Nikola (19): Sexy fotografie s přítelem Ženatý Kanaďan cestuje po světě s
nafukovacími pannami Novinářku, kterou v Egyptě zneužil dav mužů, propustili z nemocnice Puritáni šílí: 3D porno je tu!
255
Rath dále ke své teorii, že za únikem je exmanažer strany Jaroslav Tvrdík, říká: "Vždycky, když někdo měl něco vydat nebo napsat v době
předvolební kampaně, tak Jaroslav Tvrdík běhal po Lidovém domě, lomil rukama, chytal se za hlavu a křičel: To je konec!
255
Vedle toho Chello Central Europe obchodně a distribučně zastupuje okolo 20 zahraničních tematických stanic a televizních společností,
mj. Fine Living Network (FLN), Zone Romantica, Zone Reality, JimJam, Extreme Sports Channel, History, Hustler TV, Daring!
255
Nyní již světoznámé tenistce přály významné osobnosti nejen sportovního světa, čeká ji návštěva u prezidenta Klause, ale takové
blahopřání ještě nedostala – známý zpěvák a bavič vystupující pod jménem Ruda z Ostravy složil fulnecké rodačce oslavnou píseň!
255
Přemýšlel nad sebevraždou, ale kvůli synovi ji nespáchal Další související články Poslední přání Bořivoje Navrátila (†78): Chci zemřít
doma Připomeňte si slavnou roli Bořivoje Navrátila (†78) v Návštěvnících Hana Maciuchová (65): Zemřela jí životní láska!
255
Kateřina Šlégrová trvá na rychlém rozvodu s manželemFoto: archiv Kateřina Šlégrová Přidej svůj komentář Dnes 05:00Manželce
bývalého hokejisty Jiřího Šlégra (39) Kateřině (39) došla trpělivost a rozhodla se hodně rychle vyřešit rozvod se záletným manželem!
Appendix to ces news 2011: Longest sentences
211
255
Vrbata dvěma góly zařídil výhru Phoenixu, Pavelec slaví výhru nad Flyers Floridu trápí marodka, povolala z farmy útočníka Řepíka Na
výhře Calgary nad Chicagem se asistencí podílel Roman Horák Carolina údajně zvažuje výměnu obránce Kaberleho To je střelec!
255
Další související články V kabině Jaroslavli: Tady se Rachůnek, Vašíček a Marek chystali na zápasy Miloš Holaň: Měl trénovat Jaroslavl,
potřetí unikl smrti Rachůnkův kamarád Kristek: Karlova smrt hrozně bolí Demitrova manželka zkolabovala na pietním aktu!
Longest interrogative sentences
Length
Sentence
255
Proč ne ve formuli 1? Zlatý dolar na klávesnici Týden mobilně 92: Huawei v předpremiéře Odečtěte si dárky aneb ušetřete na propagaci
Toyota Land Cruiser - všestranný šedesátník Flash disk s číselným zámkem Nové BlackBerry Torch a Bold: QWERTY nebo doteky?
255
V případě Abraháma máme jen jedno svědectví, Bibli, ale cožpak celá historie umění, na kterém to naše současné ať chceme nebo
nechceme stojí, není nic jiného, než nekonečná řada autentických tvořivých činů, svědčících exaktně nepřesvědčivě o našem životě?
255
Související články Těhotná Beyoncé zavařila Twitter: Padl rekord příspěvků za vteřinu Budoucnost telefonů: Podívejte se na koncept
iPhonu 5! Steve Jobs: Adoptovaný chlapec bez vysoké školy, který ovlivnil svět 100 věcí, které nesnášíme na internetu: A vy?
255
“ (Lékař týmu Petr Krejčí po čtvrtečním tréninku oznámil, že Čech do utkání půjde, pozn. aut.) Čech v baráži s Černou Horou nastoupí,
potvrdil lékař Krejčí ONLINE: Ptejte se na baráž bývalého kouče repre Dušana Uhrina Kapitán Rosický burcuje: Co si přeji?
255
TOP 09 ale trvá na vyhazovu - čtěte ZDE Schwarzenberg: Bátora na školství je jako pedofil v dívčí škole Osobnosti o Bátorovi: Na
ministerstvu školství nemá takový člověk co dělat Klaus ml. se zastal Bátory: Když nevadí exkomunistka Dvořáková, tak proč on?
255
Tom Waits má namířeno do rokenrolové Síně slávy, kam ho uvede Neil Young Rockový písničkář Elvis Costello neztratil břitký jazyk,
kritizuje národní výpalné Taylor Swiftová, country, pop Universal Music 2010 Existuje vůbec ještě hudební žánr country music?
255
Pražané jasně podlehli Kladnu Třineckého Hrabala připravila o hattrick „dvojnásobná“ tyčka Plzeňský hrdina Straka: Jsem rád, že se Čája
hádal Liberec zůstává v čele extraligy, Třinec rozstřílel Litvínov Boleslavský Podkonický: Proč mě Kometa podepisovala?
255
Spotřebitelská důvěra v USA klesla nejníže za tři desetiletí V USA rostou obavy z recese, ekonomice zřejmě dochází dech Obama opět
požaduje zrušení daňových výjimek pro bohaté Obama má plán proti dluhům, do 12 let chce ušetřit čtyři biliony Oživení v USA?
255
Čtěte Britské listy speciálně upravené pro vaše mobilní telefony a PDA Karel Dolejší, Štěpán Kotrba Redaktor anglické mutace Focus on
the Czech Republic: deník o všem, o čem se v České republice příliš nemluví Povinné očkování – kdo rozhoduje o kom a jak?
255
Čtěte Britské listy speciálně upravené pro vaše mobilní telefony a PDA Karel Dolejší, Štěpán Kotrba Redaktor anglické mutace Focus on
the Czech Republic: deník o všem, o čem se v České republice příliš nemluví Postaví se Duka za ducha (dějinného pokroku)?
Appendix to ces news 2012: Longest sentences
212
Appendix to ces news 2012: Longest sentences
The longest sentences by string length
Longest declarative sentences
Length
Sentence
255
A státní zástupkyně Lenka Bradáčová dala najevo, že je pro ni klíčové, aby Rath a jeho právníci nemohli zpochybňovat u soudu proceduru
jeho stíhání - a že je to důležitější, než zda bude u řečnického pultíku ve Sněmovně svým vystoupením ovlivňovat svědky.
255
"Šetření v době deprese, jak ukazují dějiny, má fatální následky," varuje Neue Osnabrücker Zeitung a upozorňuje i na politické důsledky,
neboť v Řecku se v dubnu uskuteční parlamentní volby a favority jsou krajně levicové strany odmítající politiku úspor.
255
Fischerová je mezi osmi kandidáty na hlavu státu, jejichž přihlášky do boje o Hrad ministerstvo vnitra uznalo za regulérní na rozdíl od
petic pro kandidaturu Jany Bobošíkové, Vladimíra Dlouhého a Tomia Okamury (o rozhodnutí ministerstva najdete více zde).
255
Kdyby ve volbách vhodilo do uren platné hlasy jen 10 občanů ČR, z toho 6 pro ODS, pak by ODS ve volbách získala 60 procent hlasů a
do sněmovny by napochodovalo 120 poslanců ODS (nebude-li těch 10 hlasů z jednoho obvodu, ale tyhle nuance nechávám stranou).
255
Zatímco dnes se nové stanice metra jmenují takřka výhradně podle lokalit či ulic a náměstí, u kterých leží, dříve tyto místní názvy často
přebila snaha tehdejších "mocipánů" dostat do společenského povědomí významné komunistické představitele či události.
255
Český telekomunikační úřad (ČTÚ) ústy svého předsedy Pavla Dvořáka v minulosti deklaroval, že se vynasnaží dostat na tuzemský trh 4.
síťového operátora a jeho prostřednictvím tak roztočí zrezivělé soukolí konkurence, které se u nás zastavilo už před léty.
255
"K 1. lednu budou naše systémy připraveny na novou základní sazbu DPH. 21. prosince byl pro správné nasazení nové sazby hraniční
termín, ale přesto jsme dokázali systémy s novou sazbou před nasazením řádně ozkoušet," uvedl mluvčí Telefóniky Hany Farghali.
255
Třináctiletý Vojta, žák osmé třídy základní školy Červený Vrch v Praze 6, při dvouhodinovce finančního vzdělávání oznámil, jaké auto a
za co si pořídí jeho skupinka - neboli modelová rodina složená z rodičů a dvou dětí, která řeší různé situace ze života.
255
Minimálně v rámci zmiňovaných ročních pohovorů je téma budoucí kariéry diskutováno podrobněji, hlavně u zaměstnanců, jejichž
pracovní výkony na stávajících pozicích jsou uspokojivé, zároveň projevují potenciál a také zájem o svůj rozvoj a kariérní postup.
255
Přesto si ale myslím, že skutečnou šanci na úspěch má jen nějaké univerzální, mezinárodní systém, který zajistí propojení platební karty s
mobilem, jako to nyní chystá třeba MasterCard," hodnotí vyhlídky Mobita Jan Lodl, konzultant a spolupracovník Mobil.
Longest exclamatory sentences
Length
Sentence
255
Elektronická učebnice, kterou představila například firma Hewlett Packard s OS Windows se hodí pro žáky základních škol nebo nižších
ročníků gymnázií a tudíž zde nemá tolik smyslu představovat její funkce, nám starším postačí klasický počítač či notebook!
255
Média budou po vzoru služebníků různým zájmům ukazovat jejich vzájemný volební boj, vývoj preferencí a celé drama bude jen
stínohrou v zájmu obskurního přesvědčování: to je přece demokracie, je více kandidátů a občané si slavně volí svého prezidenta sami!
255
Představte si vejmutovku stojící na břehu jezera Chesuncook, jejíž větve sténají pod náporem větrů ze všech stran a každičká jehlice se
chvěje ve slunečním svitu — a představte si, jak si asi stojí teď, prodaná sirkárně New England Friction-Match Company!
255
O chvíli později totiž zazářila zlatem v novém světovém rekordu ve stejném polohovém závodě na 400 metrů teprve šestnáctiletá Číňanka
Jie Š'-wen, která navíc na mezičasech posledních dvou bazénů plavala rychleji než Ryan Lochte, nebo právě Michael Phelps!
253
Jinak jsem osobně velice naštvanej, představ si, právě jsem dostal zprávu, že chlap, kterýho nejvíc nenávidim a kterej v zimě nešel učit,
půl roku se flákal a ulejval, teď dostal místo v pražskym kraji na gymnáziu a vyšší sociální a učí jenom filozofii!
253
V aplikaci Kies, která slouží pro správu telefonu a instalaci nových verzí firmwaru u vybraných modelů se aktuálně objevil nový firmware
pro uživatele Samsungu Wave II. Verze nese označení XXLA1 a přináší telefonům z české distribuce oficiální Badu 2.0!
252
Porovnání výskytu bakterií Escherichia coli na jednom vejci (KTJ/vejce - Kolonie Tvořící Jednotka) je pozoruhodné: konvenční (dnes již
zakázané) klece: 5 881 jednotek KTJ, obohacené klece povolené v EU od 1.1.2012): 12 831 KTJ, voliéra 2 344 443 KTJ (!
252
Takže já vyzývám paní státní zástupkyni Bradáčovou, všechny ty úžasné policisty, pana Almera s jeho odposlouchávací technikou, pusťte
se do těch ministrů, pusťte se do jejich náměstků, pusťte se do vedení policie, pusťte se do vedení státních zástupců!
Appendix to ces news 2012: Longest sentences
213
252
Ale abychom „nestranili“ jen slečně konzultantce bude na místě zmínit i další velkorysou spolupráci PF, resp. pana Zíky s jistým panem
Kittnerem z Liberce, se kterým byla uzavřena smlouva na poradenskou činnost bratru za 720 tisíc ročně (60 tis./měs.)!
252
Panička od necek nebo mandlu, chichotá se v parlametní židli za naše poplatnické drobné, jakoby sledovala kabaret a vesele přitom
komunikuje se žirafákem, též rozvášněným hrubými výroky kolegy Geschlechtsglied-a – kdo nemá rád humor, ať se jde bodnout!
Longest interrogative sentences
Length
Sentence
255
Související články Hulváti „S“: Fanoušci propadli, po Kiselovi hodili světlici, po Kweukem banán Trefil mě telefon a pivo, tohle na
stadiony nepatří, zlobí se na fanoušky Vaclík Hušbauer po derby: Je to strašný, měli bychom se vzpamatovat Přerušené derby?
255
Jak se ale lidé mají dozvídat něco víc, než jen zevšednělé skandální story o tom, kdo s kterou, která s kterým - a proč ten který politický
prostitut opět sehrál svou špinavou, vyskrze odpudivou roli, aby zachránil vládu národní skázy a její zhoubné dílo?
255
Pan Savov je sice v českých médiích spojován s ne příliš legitimními causami kolem majetku, ale za Vaši konkurenci v Budějovicích bylo
požadováno 1,5 miliardy Kč (a to ještě za 97% akcií), není náhodou v pozadí některý z velkých obrů-třeba Anheuser Busch?
255
No, posuďte sami – bývalý prominentní politický vězeň poražené supervelmoci jakoby symbolicky rozhrnul železnou oponu a zvěstoval
vítězství „sil světla nad silami temnoty“ – co víc si vítěz studené války a od té doby jediná skutečná supervelmoc mohl přát?
255
Je Petr Nečas zásadový bojovník za zdravější veřejné finance, a tudíž neváhá položit premiérskou hlavu na špalek a žádat schválení vyšší
DPH, nebo je to slaboch, který veřejná silácká prohlášení bere ve vší tichosti zpět a omlouvá se "tatíčkovi" Klausovi?
255
Je vůbec možné, aby kabinet, který obměnil rekordní počet ministrů kvůli selháním, chybám a podezřením z korupčního a jinak
podvodného jednání, a který dostal ve volbách jasnou zpětnou vazbu (jak neopomněl zdůraznit ani prezident Klaus), dělal jakoby nic?
254
Dovedete si představit firmu v problémech, do jejíhož vedení je přijat schopný člověk, který má určitou vizi a nápady a zkušenosti, a taky
chuť něco změnit k lepšímu, ale v době přijímacího pohovoru ještě nezná všechny detaily, nemá přístup k informacím?
254
Co kdybychom místo toho abychom investovali do zneprůhlednění systému, jej omezili pouze na komunální volby, kde figurují lidé, který
každý má šanci poznat a na parlamentní volby, kde se nebudou volit pouze lidi, ale hlavně programové priority této země?
254
Jejich pečovatelské instinkty k níže postaveným jsou dokonce tak silné, že zavdávají příčinu k podezírání ze škodolibosti: Nechce snad
česká vládní pravice přeplácením svých zaměstnanců zaútočit na jejich konkurenceschopnost a tím se jim nadobro pomstít?
254
A co když jsme přišli o práci, o blízkého člověka, naše děti, které spolutvořily náš domov, dospěly a odešly, co když jsme onemocněli, co
když nás zklamali naši nejbližší, když se nám rozpadla rodina a před sebou nevidíme pro zbytek života žádnou naději?
Appendix to ces newscrawl 2011: Longest sentences
214
Appendix to ces newscrawl 2011: Longest
sentences
The longest sentences by string length
Longest declarative sentences
Length
Sentence
255
Investor Marc Faber předpovídá návrat indexu S&P 500 o 40 až 50 bodů výše „Trhy jsou extrémně přeprodané“, řekl Marc Faber v
rozhovoru pro Bloomberg Television s tím, že očekává skokovou rally indexu, ačkoli již zřejmě nedojde k prolomení letošních maxim.
255
Lore Buscher – Ředitelka Hong Kong Trade Development Council pro střední a východní Evropu Karl Wiesmer – Od roku 1999 předseda
představenstva BVV, a. s., ČR, dceřiné společnosti Messe Düsseldorf GmBH, od roku 2001 generální ředitel Messe Düsseldorf GmBH.
255
FOTO: Ondřej Lazar Krynek, Novinky čtvrtek 8. července 2010, 13:11 - New York Podle Americké asociace rozvodových právníků
(AAML) se 81 procent jejích členů ve svých případech setkalo s důkazy získanými pomocí sítí Facebook, MySpace, Twitter nebo
YouTube.
255
MfD: Podle poslanců by karta na penzi neměla být povinná Poslanci ze sociálního výboru se shodli, že takzvaná důchodová karta, na
kterou má seniorům podle plánu ministerstva práce a sociálních věcí už za rok a půl chodit penze, nebude povinná pro všechny.
255
Vrány jsou chytré, dovedou bez tréninku použít tři nástroje po sobě Myším díky vědcům vyrostly náhradní zuby Vědci tvrdí, že tento druh
kaloňů na malajském poloostrově vyhyne, pokud bude pokračovat jejich lov se stávající, neudržitelně vysokou intenzitou.
255
Purpurový plán byl vydražen za 959 650 liber (26,3 miliónu korun, cena, stejně jako u následujících obrazů, zahrnuje přirážku), Bílý
kotouč za 690 850 liber (18,9 miliónu korun), a Le Sourire I - Z mechanického cyklu za 385 250 liber (10,5 miliónu korun).
255
"Podívám se na záznam na internetu, i když možná se dívat nemusím, já vlastně vím, co se tam dělo a dokážu si Jakuba představit," svěřila
se herečka, která se o víkendu "vdala" ve Františkánské zahradě pod Pražským hradem v projektu studentů pražské FAMU.
255
Klávesové zkratky na tomto webu Na obsah stránky [email protected] Nasazení potápěčů nalézt ztraceného bagristu
nepomohlo Desítky policistů, hasičů i kynologů pátrají od pátku po devětatřicetiletém Václavu Opluštilovi z Bohuňovic na Olomoucku.
255
Realizace této formy podpory je přímo závislá na objemu prostředků určených pro tyto účely ve státním rozpočtu roku 1999, v jehož
návrhu je částka 1,45 miliard korun. Padesát metrů čtverečních není nic moc, ale dá se takto postavit slušný byt řekněme 1+2.
255
"Pokud největší americké firmy investují v Polsku stovky milionů dolarů, samy budou mít zájem na naší bezpečnosti, zadarmo získáme
bezplatné lobbisty ve Washingtonu," řekl listu Dziennik-Gazeta Prawna Zbigniew Lewicki, amerikanista z Varšavské univerzity.
Longest exclamatory sentences
Length
Sentence
255
Inu,česká tvořivot je v kuchyni spíš na škodu,protože pomazánkové máslo nikdy nenahradí mascarpone a řezy Rafaelo nebo různé
zakyspuding hrníčkové buchty pod různými tajuplnými názvy jsou možná dobrou rychlovkou ke kávě ale od desertu očekávám mnohem
víc!
255
Lékaři přijali stotisíc odměny a podali výpověď Klaus kritizuje lékaře: Jsou arogantní a nezodpovědní Zrušíme lůžka, ale lékařům NIC,
shodl se Heger a pojišťovny Heger našel 2 miliardy na platy lékařů, výpovědi platí dál Lékařská elita se baví za miliony!
255
Detektivní případ Davida Ratha: Zmizení skleněné sochy Vztahy špiček ČSSD jsou plné nenávisti i lásky Naštvaní hejtmani sesadili Ratha
z funkce v asociaci krajů Komentář Ondřeje Höppnera: Paroubek má patku jako Rath Bárta k Rathovi: Přestaňme tu onanovat!
255
Přednášky budou v pátek 23. 6.: 17 hod. – Vít Havránek / Tranzit 18 hod. – Alexis Zavialoff / Motto Distribution 19 hod. – časopisy –
shrnutí časopisů, které ve své době přišly s něčím novým a jak to dopadlo Postsurrealista Karel Hynek: Žer nehty stranou!
255
" Premiér Petr Nečas v projevu k poslancům při hlasování o nedůvěře Místopředseda sněmovny a ČSSD Lubomír Zaorálek: "Rozumíte,
vy poslanci nejste žádní chudáci, aby se mezi vámi roznášely příspěvky 50-, 170-, 500tisícové, abyste přežili do dalšího měsíce!
255
Navíc je podivné, co výbor vlastně kontroloval, když čísla, o nichž hovořil a představoval je na počítačové prezentaci pan Pitín, byla dána
dohromady, dle jeho vlastních slov adresovaných na setkání novináři O. Černému z MFDnes, teprve čtyři hodiny stará!
Appendix to ces newscrawl 2011: Longest sentences
215
255
Štědrý: Selhalo mu srdce, těžká operace, bypass Klip kapely Rybičky 48: Pomeje si vytírá s Ivetou Bartošová skončila v blázinci, spala
přikurtovaná Domenico přiznal: Iveta pila alkohol a brala prášky Nejbližší muži Bartošové: Iveto, tohle už není legrace!
255
Tam Berounka zaplavila již několik domů Počasí zabilo v Praze 17 lidí za den: Nejdříve vražedná vedra, potom děsivá bouřka Pařáky
vylákaly Pražáky k vodě Noční bouře lámala stromy, blokovala dopravu a zaplavovala sklepy Prázdniny zakončí tropické teploty!
255
Pokud tohle Plesk zdokumentuje, měl by podat trestní oznamení a pak to PK sdělit: Nachytali jsme Vás a podali jsme na Vás trestní
oznámení Budoucnost telefonů: Podívejte se na koncept iPhonu 5! Belgický starosta souložil na věži: Takhle se tráví dovolená!
255
Pan Mikkelsen napíchl zloděje na radlici Tragédie ve Studénce: Zachránil lidi, teď nemá ani režijku Je to hrdina, řekl Vondra o vojákovi
zabitém v Afghánistánu Hrdina Nekonečného příběhu je potetovaný ranař Princ hrdina: William zachránil důchodce z hory!
Longest interrogative sentences
Length
Sentence
255
Klávesové zkratky na tomto webu Na obsah stránky [email protected] Podrubriky: Vztahy a sex Zdraví Styl Děti Jak
poznat, kdy špatná nálada přejde v depresi Necítíte se dobře, přepadá vás pesimistická nálada a je vám smutno snad úplně ze všeho?
255
Klávesové zkratky na tomto webu Na obsah stránky [email protected] Podrubriky: Vztahy a sex Zdraví Styl Děti Inspirujte
se netradičními recepty na lehké a teplé večeře Chcete udělat večer rodině či partnerovi radost a uvařit jim teplou večeři?
255
Klávesové zkratky na tomto webu Na obsah stránky [email protected] Podrubriky: Vztahy a sex Zdraví Styl Děti Drsné
diety mohou mladistvým zkrátit život Máte doma dceru, která sice připomíná spíše Heduš Homolkovou, ale občas zatouží být Twiggy?
255
Parta z Kouzelníka se sešla: Nechyběla ani Jaruš Když vám chutná sex a pití tak proč s tím přestávat když vám chutná tak jste prostě
zdravej, ještě hodně úspěchů v dalším životě Kdo dnes nechlasta a kdo z chlapu si obcas nenajde nejakou tu pani na sex ze?
255
V té době už byla jeho politika appeasementu v troskách, ale on stál za svým, trval na tom, že Mnichov byl nejen moudrým, ale také
etickým rozhodnutím: „Já necítím potřebu obhájit své loňské cesty do Německa, protože, dámy a pánové, jaká byla alternativa?
255
Úplně normálně byl přitlačen ke zdi viz BLESK: Jsem jen kašpárek, J.K. vysvětluje svůj vztah k I.Bartošové a jak byl donucen vedením
TV Prima ke spolupráci s I.Bartošovou, nechce se mi hledat datum, ale budete li ho chtít tak se podivám A je to podstatné?
255
Označit příspěvek jako nevhodný EU je proti úplnému odstřižení ilegálních stahovačů od internetu Pokud budu konat trestnou cinnost
vyuzitim elektriny (napriklad me napada, ze budu mit tiskarnu na padelani penez), tak me za to nekdo odstrihne od elektriny?
255
Do momentu, než vláda přijme jeho protikorupční strategii a nepřikývne na fungl nové policejní vedení, bude klást naprosto příhodnou
otázkou: Jak dlouho ještě mají lidé chodit za novinářem Jankem Kroupou místo toho, aby šli kvůli spravedlnosti na policii?
255
2011 15:33 Daro, to je zvláštní reakce, nemístná, tiana reagovala v diskusi - a slušně - zato vy nekomentujete pořad (k tomu účelu slouží
tohle forum), ale skoro jako byste sama vydávala ne rady, ale přímo pokyny;-), smím se zeptat, co vás tak podráždilo?
255
Jeden z mnoha pavilónů Psychiatrické léčebny Bohnice FOTO: Psychiatrická léčeba Bohnice Policie hledá šestnáctiletého mladíka, který
komunikuje jen s kurátorkou středa 22. června 2011, 13:11 - Praha Víte už, jak se podařilo Janu Burianovi z léčebny utéci?
Appendix to ces newscrawl 2012: Longest sentences
216
Appendix to ces newscrawl 2012: Longest
sentences
The longest sentences by string length
Longest declarative sentences
Length
Sentence
255
Mluvčí ÚOOZ Pavel Hanták totiž v pondělní tiskové zprávě přímo zmínil, že detektivové v pátek dopoledne „zadokumentovali předávku
peněz, které podezřelý převzal jako všimné za přidělení několikamiliónového kontraktu na poskytování služeb městské policii“.
255
Když už jsme u těch centrismů, měl bych upřesnit, že je přebírá z USA, protože Kanada je také v Americe – jak nás, studenty angličtiny,
kdysi upozornila učitelka, když jsme na otázku, kam bychom se v Americe chtěli podívat, jmenovali výhradně místa v USA.
255
S hvězdami to sice už dávno nemá nic společného (kdysi opravdu mělo), ale názvy znamení jsou shodné s názvy souhvězdí, takže si je
lidé stále ještě spojují dohromady a pletou si astronomii s astrologií (pozoruhodné je, že ekonomii s ekologií si nepletou).
255
Elektronické občanské průkazy neboli e-OP budou oproti dosavadním průkazům obsahovat na zadní straně takzvaný 2D kód a pokud bude
mít občan zájem, může zažádat zároveň o nepovinný kontaktní elektronický čip, na který bude možné nahrát elektronický podpis.
255
Dozvěděl jsem se taky, že kosti pravěkého muže, šamana z Francouzské ulice, byly napadeny těžkou nemocí zvanou kostižer a že možná i
díky překonávání své vlastní bolesti byl tenhle pradávný obyvatel dnešního Brna schopen vyhánět jiným lidem z těla nemoci.
255
Příběh líčený ve dvou časových rovinách přibližuje bolestnou současnost i dvacet let staré drama, které zůstává v domácnosti osleplého
filmaře a spisovatele Mateo Blanca alias Harry Caineho (Lluís Homar) schované na dně šuplíku s roztrhanými fotografiemi.
255
"Z dotazů mimo diagnózu se lidé ptají ponejvíce na výživu onkologického pacienta a možnosti léčby či konzultace na naší klinice,"
upřesnila mluvčí kliniky, kterou čeští pacienti minulý týden opakovaně zvolili za nejlepší českou nemocnici v péči o nemocné.
255
Purpurový plán byl vydražen za 959 650 liber (26,3 miliónu korun, cena, stejně jako u následujících obrazů, zahrnuje přirážku), Bílý
kotouč za 690 850 liber (18,9 miliónu korun), a Le Sourire I - Z mechanického cyklu za 385 250 liber (10,5 miliónu korun).
255
"Podívám se na záznam na internetu, i když možná se dívat nemusím, já vlastně vím, co se tam dělo a dokážu si Jakuba představit," svěřila
se herečka, která se o víkendu "vdala" ve Františkánské zahradě pod Pražským hradem v projektu studentů pražské FAMU.
255
Problem je v to svinstvu, ze rozvozce s Tranzitem koupi 20 flasek na doklad,tedy takovych,ktere jsou jakztakz OK a proda 300 flasek,
delanych ve sklepe z tresti a ten nakupni doklad na 20 flasek ukazuje kazdemu kontrolorovi,dokud se ten doklad nerozpadne.
Longest exclamatory sentences
Length
Sentence
255
Inu,česká tvořivot je v kuchyni spíš na škodu,protože pomazánkové máslo nikdy nenahradí mascarpone a řezy Rafaelo nebo různé
zakyspuding hrníčkové buchty pod různými tajuplnými názvy jsou možná dobrou rychlovkou ke kávě ale od desertu očekávám mnohem
víc!
255
Člověk když se někdy koukne do zrdcadla tak si možná mnohdy řekne, ty jo mohla bych být ještě lepším člověkem, ale když pak vidí, co
je na světe blbců, kteří mají ještě tu odvahu se předvést před kamerou, tak si myslím, že jsme na tom všichni ještě dobře!
255
A dále uveřejnit základní body programu: 1) podpora zkorumpovaného Nečase 2) pokud nebudete s koruocí souhlasit, platí bod 1. 3) držet
se u koryt co nejdéle - cílem je zaopatřit sebe, své fagany, a min.10 generací dopředu. 4) partajní heslo: přes mrtvoly!
255
Navíc je podivné, co výbor vlastně kontroloval, když čísla, o nichž hovořil a představoval je na počítačové prezentaci pan Pitín, byla dána
dohromady, dle jeho vlastních slov adresovaných na setkání novináři O. Černému z MFDnes, teprve čtyři hodiny stará!
255
Pokud bychom k dohodě nedospěli v následujících třech týdnech, budeme nuceni předložit tento případ přímo vašim akcionářům, včetně
zahájení jednání o zastupování (proxy contest) pro výběr alternativního obsazení ředitelů do správní rady společnosti Yahoo!
255
Už tehdy se vědělo, že je tu nějaká ženská, která chce pana psa a jen se čekalo, až si bude moct vybrat mezi případnými adepty (z řad
pejsků - kluků) a tady se projevila má schopnost se zviditelnit - narodil jsem se jediný - prostě žádné přebírání nebude!
Appendix to ces newscrawl 2012: Longest sentences
217
255
Jedna kapitolka mi na třetí obtížnost při spíše hbitém průchodu bez lelkování a kochání zabrala mezi hodinou až necelými dvěma, což
znamená, že už jedna část by mohla zabrat velmi solidních 5-8 hodin dle zvolené obtížnosti, a to si vynásobte ještě čtyřmi!
255
Mnoho lidí má příležitost navštívit Amsterdam, jako hlavní město Nizozemí je jedním z nejlepších obchodních center v Evropě a nabízí
širokou škálu dobrodružství pro cestovatele - přesně ten druh dobrodružství, o kterých by zaměstnavatel vůbec neměl vědět!
255
Teda vazeni, ja myslelze je to soutez o vareni a hodnoceni toho co kazdy pro druhe pripravi, ale kazdy den nekdo knoura a omlouva se, ze
tohle neji a tohle neji a na tohle a na tohle je alergicky, proc tedy krucinal ty lidi tam lezou, kdyz skoro nic neji!
255
Nemluvím o natáčení do top glassu,ale o tom,jak je zmalovaná v prostřenu,a je to děs,na to,že má 20,vypadá na 35.Takže nebuď trapná a
zakomplexovaná a neukájeje se misskama a čti názory i ostatních,ty kritizérko,očividně se její makeup nelíbí nikomu tady!
Longest interrogative sentences
Length
Sentence
255
Varující je i fakt, že tato firma není uváděna v běžných dostupných srovnáních cen plynu i elektřiny, viz například Ceny plynu 2011:
Velké srovnání dodavatelů nebo tam, kde se vyskytuje pod názvem Energetické centrum - Kolik zaplatíte za plyn v roce 2011?
255
Copak jsme již zapomněli,že jsme lidé,toto mladé děvče již nikdy nezažije nic krásné,neuvidí vycházet slunce,nebude mít
děti,přátele,rodinu která by ji milovala nebude mít nic,my ostatní toto vše múžeme mít tak skusme být trošku slušní,nebo to už neumíme?
255
Do momentu, než vláda přijme jeho protikorupční strategii a nepřikývne na fungl nové policejní vedení, bude klást naprosto příhodnou
otázkou: Jak dlouho ještě mají lidé chodit za novinářem Jankem Kroupou místo toho, aby šli kvůli spravedlnosti na policii?
255
Pokud začnete od absurdního předpokladu, že vláda je morálně aktivní silou a lidé jsou pasivní, nevydáváte snad morálku, názory,
bohatství, všechno z čeho se sestává život jednotlivce, na milost a nemilost lidem, kteří se jeden po druhém dostávají k moci?
255
Je tedy tak obtížné pochopit, že obchodník srovnává běžné ceny na rozličných trzích a rozhoduje se provést transakci jen tehdy, když má
jistotu anebo alespoň více nebo méně pravděpodobnou naději, že se k němu vrátí víc, než je hodnota exportovaného zboží?
255
A z hlediska tedy dopadu na Českou republiku, tedy se neustále hovoří o tom, co se může změnit, jestli právě přes ty mateřské banky,
které svým způsobem vlastní ty české banky, jestli tam může dojít k nějakému zásadnímu posunu, takže nic takového nehrozí?
255
Sama se urážíš,když napíšu,že máš prsa jak když veverka vykulí oči a nebo jako víčka od maggi,ale to že píšeš že je "Andrea dvěstěkilový
monstrum" a že Jitka je diabetik ale "ale šlehačičku a pohárečky - to si dávala do nosu až až" to jako urážku nebereš?
255
Pak se tedy nezlobte,ale nestovnatelně lepší byl mladý Honza,navíc když přihlédneme k charakteru těch dvou lidí,opět je na výši
Honza,takže nechte si ty plky o vítězi Štěpánovi a jděte se bodnout,nejste náhodou budoucí paní Pospíšilová,že ho tak chválíte?
255
A kdybychom se vrátili k té myšlence, kterou právě tedy publikoval, myslím, v Hospodářských novinách původně ministr financí, že by
právě pracujícím důchodcům od příštího roku zrušil slevu na dani, neodradí takové opatření část lidí od snahy o přivýdělek?
255
Host (Jana Reichlová): Já bych se tedy zeptala pana doktora, protože je veterinární lékař, je tady povinnost všechny psy očkovat proti
vzteklině, dokážete odhadnout, jestli se z vaší obce, z vašeho města dostaví všichni psi na očkování, ačkoli je povinné?
Appendix to ces wikipedia 2007: Longest sentences
218
Appendix to ces wikipedia 2007: Longest
sentences
The longest sentences by string length
Longest declarative sentences
Length
Sentence
255
Botnický záliv je mimořádně zajímavý z přírodovědeckého hlediska, neboť díky četným řekám (přítok 135 km³ vody za rok) a srážkám
(26 km³ za rok), které jej vydatně zásobují, jeho slanost se vzdáleností od hrdla zálivu (tedy směrem k severu) výrazně klesá.
255
Nejvyšší celoroční soutěží travních lyžařů je již od roku 1999 Světový pohár, který se v průběhu celé sezóny boduje a po skončení celé
soutěže ve finále dochází k vyhodnocení nejlepších jednotlivců a národních družstev sečtením bodů ve všech disciplínách.
255
Umisťují v lomových bodech hranice obvodu pozemků, v přímých úsecích hranice obvodu pozemků mohou být mezníky vzdáleny nejvýše
200 m. * Staničníky (kilometrovníky, hektometrovníky) vyznačují kilometrickou polohu kolejí od začátku do konce příslušné trati.
255
Max More: Transhumanismus je filozofie života usilující o pokračování a zrychlení vývoje inteligentního života překonáním jeho nynější
humánní (lidské) formy a omezenosti, prostřednictvím vědy a technologie řízené životem - podporující principy a hodnoty.
255
Spolu s evropsky významnými lokalitami vyhlášenými podle směrnice o ochraně přírodních stanovišť, volně žijících živočichů a planě
rostoucích rostlin č. 92/43 EHS vytvářejí soustavu Natura 2000, jejíž vybudování je jednou z povinností Česka jako člena EU.
255
Správný význam dal kvantům až roku 1905 Albert Einstein, který Planckovu myšlenku rozvinul a prohlásil, že světlo samotné jsou kvanta
a přispěl tak k pochopení duální podstaty hmoty, která zdánlivě v rozporu vykazuje současně vlnové i kvantové vlastnosti.
255
Jinými slovy, první písmeno je nahrazeno posledním, druhé předposledním atd. Princip šifry je naznačen už v samotném názvu, neboť
písmena A-T-B-Š jsou postupně prvním (alef), posledním (thav), druhým (bet) a předposledním (šin) písmenem hebrejské abecedy.
255
Microsoft Windows převládá na poli operačních systému určených pro desktop, ale co se týče serverových systémů jsou daleko
populárnější systémy jako FreeBSD, Solaris a GNU/Linux – tyto systémy jsou odvozené nebo jsou součástí Unixových operačních
systémů.
255
Proud z trakčního alternátoru po usměrnění pohání původní trakční elektromotory TE 005. Místo řídícího systému Intelo Rego je v této
verzi použit digitální regulátor výkonu RV 08 NES Nová Dubnica, původní stupňová regulace otáček motoru zůstala zachována.
255
Naproti kostela stojí socha sv. Jana Nepomuckého z r. 1860, na křižovatce u odbočky na Valšovice u budovy sokolovny socha Panny
Marie s Ježíškem, na dolním konci dřevěný kříž, v obci a okolí můžete najít ještě několik dalších malých kapliček a Božích muk.
Longest exclamatory sentences
Length
Sentence
255
Hlavní stránka tradičně obsahovala jeho heslo a „obrázek pro tento okamžik“ (jak zněl popis v tagu ALT), fotomontáž týkající se nějaké
nedávné události, v posledních letech zejména úmrtí celebrity (často pouze její fotografie s bublinou pronášející „fuck!
254
Skins (1980 až dodnes) V roce 1980 se začíná několik rockových kapel vracet k formě hospodských popěvků, tzv. Oi (Oi! je hudba
antinacistického stylu, která vznikla kolem roku 1980 a je podobná punk-rocku, u zrodu stály Cockney Rejects se svym songem Oi!
251
Ozón Strukturní vzorec Registrační číslo CAS 10028-15-6 Sumární vzorec O3 Molární hmotnost 48,00 g/mol Teplota tání −192,2 °C
Teplota varu −111,9 °C Kritická teplota −12,1 °C Kritický tlak 5,38 MPa Hustota g/cm3 Rozpustnost ve vodě 10 mg/l Pozor, jed!
250
V roce 1964 se na tři roky vrátil do Německa a hrál v řadě německých filmů a westernů natočených podle novel Karla Maye, jako
například Vinnetou II, Rampage at Apache Wells atd. V roce 1967 se vrátil do Itálie a hrál ve filmu Bůh odpouští, ale já ne!
246
AYBABTU All Your Base Are Belong to Us prohrál jsi (jedná se o velmi špatný překlad věty „dobyli jsme všechny tvé základny“ z
japonštiny do angličtiny, něco jako „Všechny vaše základna jsou patřit nám“) AYOR At Your Own Risk na vlastní nebezpečí!
243
Díky jeho mimořádné imaginaci a schopnosti své vize kreativně scénicky realizovat byl Lébl mnohokrát nařčen z marnotratného hýření
efekty a artistnosti, z „plýtvání talentem“… Kdo si však mohl dovolit obviňovat génia, který předběhl svou dobu!
Appendix to ces wikipedia 2007: Longest sentences
219
237
Netanulo mně ani na mysli, že by kdo z mých zemanů, zejména těch, kteří mně ve službě a věrnosti zavázáni jsou a kterých všechen rod
odnepaměti předkům mým výhradně poddán býval, měl do úmluvy Vaší pod jakýmikoli přikrytím pojímán býti…!
235
Pragmatické řešení rozdělení moci a kontrast s předcházející výrazně protilevicovou kampaní se staly předmětem ostré kritiky médií a
vedlo k nespokojenosti významné části veřejnosti, vyjádřené například iniciativou „Děkujeme, odejděte!
233
Pokyn ke stání po pravé straně postupně vymizel ze zveřejněných výňatků z přepravního řádu a zůstal jen na nepříliš jednoznačném
vyobrazení červených a zelených šipek na piktogramech nad schody, doplněných slovním nápisem „Neběhejte!
231
Musíte potrestat nejenom zrádce, ale i lhostejné, musíte potrestat každého, kdo je vzhledem k republice nečinný a nic pro ni nedělá… Je
třeba vládnout železem těm, kterým není možno vládnout spravedlností, je třeba potlačit tyrany!
Longest interrogative sentences
Length
Sentence
255
KAROSERIE typ karoserie dvoudveřová, samonosná, uzavřená, coupe, ručně stahovatelná okna v předních dveřích, 2 přední + 2 zadní
(nouzová) dělená sedadla barevné varianty včetně interieru bílá - 1001 / černá i béžová, tabáková - 2290 / černá, sluneční žlu?
254
Byl ochráncem Říma po tři desítky let, jak ho líčí Gibbon, Norwich nebo Bury, hrdinou bitvy na Katalaunských polích, anebo ho snad lze
činit odpovědným za ztrátu Afriky (ačkoliv většina historiků tvrdí, že neměl žádné možnosti jak Vandalům účinně čelit)?
250
Referendum se uskutečnilo v sobotu 9. října 2003 od 8 do 16 hodin o otázce „Souhlasíte s tím, aby město Brno v samostatné působnosti
podniklo všechny kroky k modernizaci železniční stanice Brno-hlavní nádraží ve stávající poloze podél ulice Nádražní?
248
Cílem je dosáhnout i na dřevárnách vyšší kostýmové úrovně a roleplayingu (jako na LARPech), a proto jsou vyžadované kostýmy, které
se k dané postavě (rase) hodím svým stylem a provedením - proč by třeba elf nemohl mít honosné červenozlaté oblečení?
241
Kromě toho se infinitiv používal v několika následujících infinitivních vazbách: Vazba akuzativu s infinitivem Vazba se skládá z infinitivu
a některého jména (především podstatného nebo zájména) v akuzativu (kogo mę nepьštjujǫtъ narodi byti?
240
Dodejme ještě, že již na úrovni zdánlivě jednoduché struktury, jako jsou přirozená čísla, klade teorie množin některé netriviální filosofické
otázky - například má smysl existence (nekonečné) množiny, která obsahuje všechna přirozená čísla?
238
Není jisté, zda se tak stalo na přímý rozkaz krále, nebo zda si královi rytíři jen iniciativně vyložili jeden z králových výbuchů vzteku (král
měl na veřejnosti pronést větu: Copak se nenajde nikdo, kdo by mne zbavil toho otravného kněze?
237
Říkejte si tomu extrém, ale navrhuji, abychom šli tvrdě a bez prodlení zaútočili skutečně masovou letákovou kampaní, a zatímco se z ní
bude sbírat, nasadíme cirkusáky, alegorické vozy, pouliční divadlo a možná i dobročinné koncerty, ano?
236
Poslední důvěrný přítel pražského bohéma, Jan Mikolášek, který žil s Haškem několik týdnů na Lipnici, před tím než humorista 1923
zemřel, o tom vypovídá: Jednou jsem se Haška zeptal, „Poslyš Jardo, znal jsi vůbec nějakého Josefa Švejka?
235
Kde je opoziční strana, která by nebyla svými vládnoucími odpůrci vykřičena jako komunistická, kde je opoziční strana, která by opět
potupnou výtku komunismu nevmetla ve tvář jak pokrokovějším opozičníkům, tak i svým reakčním odpůrcům?
Appendix to ces wikipedia 2012: Longest sentences
220
Appendix to ces wikipedia 2012: Longest
sentences
The longest sentences by string length
Longest declarative sentences
Length
Sentence
255
Z tohoto hlediska je třeba rozlišit obě uvedené formulace Zlatého pravidla: zatímco první z nich otázku „kdo si začal“ neřeší a jen
vyžaduje, jakého jednání se člověk má zdržet, druhá vyžaduje, aby člověk sám jednal tak, jak si přeje, aby jednali ostatní.
255
Rozšíření v Česku Sekvojovec obrovský, Chabaně * Sekvojovce v Ratměřicích – Ratměřice ( okres Benešov ) – 2 sekvojovce, oba cca 40
m. * Sekvojovec v Chabaních – obec Chabaně (část obce Břestek ) ( okres Uherské Hradiště ) – výška 32 m, obvod kmene 612 cm.
255
Botnický záliv je mimořádně zajímavý z přírodovědeckého hlediska, neboť díky četným řekám (přítok 135 km³ vody za rok) a srážkám
(26 km³ za rok), které jej vydatně zásobují, jeho slanost se vzdáleností od hrdla zálivu (tedy směrem k severu) výrazně klesá.
255
Transhumanismus zdůrazňuje především evoluční perspektivu a připouští i vytvoření vysoce inteligentních zvířecích druhů díky vylepšení
jejich kognitivních schopností, ale tíhne především k „budoucnosti po člověku“ jako konečnému cíli lidmi vedené evoluce.
255
Kč) tehdy do podniku vložili akcionáři rakouský pojišťovací koncern Bundeslaender Versicherung (celým názvem Versicherungsanstalt
der Oesterreichischen Bundeslaender AG) a česká Agrobanka Praha,a.s. Podíl Agrobanky byl posléze odkoupen, později během cca.
255
Podmínky pro přijetí svátosti Tuto svátost může přijmout každý pokřtěný člověk, který nemá na svědomí těžký hřích (jelikož těžký hřích
je blíže specifikován jako porušení Božího zákona v „závažné věci“, je jen na našem svědomí, kdy přijmeme tuto svátost).
255
Na uvolněný trh později vstoupily vysíláním sestřihů jiné německé stanice SAT1 a PRO7, ale vzhledem k nízké sledovanosti (průměrně
710 tisíc diváků na etapu proti loňským 1,81 milionu či téměř 3 milionům v roce 2005) o vysílání v dalších letech neuvažují.
255
Mapa historické Horní Lužice Historický znak Horní Lužice, štít je dnes součástí znaku Budyšína Horní Lužice ( hornolužicky Hornja
Łužica, německy Oberlausitz) je historické území, rozdělené od roku 1945 mezi Německo (většina území) a Polsko (menší část).
255
Zájem studentů zcela naplnil plánované třídy prvního školního roku: v rámci čtyřletého gymnázia byly zřízeny dvě třídy prvního ročníku a
jedna třída druhého ročníku, dvouleté studium s teologickým zaměřením obsahovalo dvě třídy prezenční a jednu dálkovou.
255
Geografie Území celé republiky je poměrně velmi ploché, průměrná nadmořská výška je pouze zhruba 100 m. Zemi lze rozdělit od jihu na
sever do čtyř hlavních oblastí: * nízko položené, písčité pobřežní roviny (do 10 m n.m.), maximálně 10 kilometrů do šířky.
Longest exclamatory sentences
Length
Sentence
255
Hlavní stránka tradičně obsahovala jeho heslo a „obrázek pro tento okamžik“ (jak zněl popis v tagu ALT), fotomontáž týkající se nějaké
nedávné události, v posledních letech zejména úmrtí celebrity (často pouze její fotografie s bublinou pronášející „fuck!
254
Vysílá na frekvenci 91,3 FM v Liberci, na 102,3 FM v Jablonci a Turnově, na 97,4 FM ve Frýdlantu, na 107,9 FM v Harrachově
Liberecké studio Českého rozhlasu Sever pro vás vysílá každý všední den od 6.00 do 9.00 hodin tříhodinový blok Dobré ráno, Ještěde!
254
V tomto období publikoval své básně v časopisu Komsomolec Donbasu (Комсомолец Донбасса), patřil ke kruhu tamních literátů a
přátelil se s ukrajinským básníkem Vasilem Stusem, který byl později z politických důvodů dvakrát dlouhodobě vězněn a roku 1985 (!
250
Největšího úspěchu v krátké historii českého speed badmintonu dosáhla 21. 5. 2011 na historicky největším mezinárodním turnaji Slovak
Open v Bratislavě Jana Scholzová (SK Speedminton Pardubice), když v kategorii ženy 35+ vybojovala senzační 2. místo!
248
Ohlasy v umění a kultuře Banjo Band Ivana Mládka měl ve svém repertoáru písničku Praha-Prčice, která začíná „Určitě nejsem sportovní
typ, papuče s dýmkou sluší mi líp“, jejíž postava se však rozhodne svůj život změnit („jednoho rána řekl jsem dost!
247
Reference Tento článek v sobě z velké části zahrnuje informace čerpané z dokumentu „Ĝisdate pri Esperanto“ („Aktuálně o esperantu“), se
svolením jeho vydavatele, Světového esperantského svazu : : Související články * Ludvík Lazar Zamenhof * lernu!
242
Preromantismus v národních literaturách Anglická literatura James Macpherson Anglie je považována za místo zrodu preromantismu,
jehož významnými představiteli jsou básníci * James Thomson ( 1700 - 1748 ), mimo jiné autor ódy Vládni, Británie!
Appendix to ces wikipedia 2012: Longest sentences
221
242
V čele svého kmene, aby vyhledal zemi zaslíbenou, putuje přes řeky, hory a louky, až dorazí do krajiny nástrojem nedotčené, dojde k hoře
Říp uprostřed roviny, vyleze na vrchol a zaplesá: „To je ona, země zaslíbená, mlékem a strdím oplývající!
241
The Bat! je e-mailový klient pro operační systém Windows, který je již třináctým rokem vyvíjen společností RITLABS S.R.L. z Moldávie
a distribuovaný v České republice společností IPEX a.s. Unikátní funkce V mnoha ohledech má program The Bat!
241
“ Poslední 2 minuty předehry přebírají zvukovou nahrávku George Carlina a prostředky animovaného filmu ilustrují jeho slova, že „ Bůh
je absolutně mocný, zcela dokonalý, vševědoucí a moudrý, ale tak nějak… si prostě nedokáže zajistit peníze!
Longest interrogative sentences
Length
Sentence
255
Kolektivní inteligence ovšem přesahuje tyto metody svým podílem sociální složky zkoumaných systémů a tak se snaží hledat odpovědi
mj. na následující otázky: * Jak lze pomocí informačních technologií dosáhnout zvýšení schopnosti řešit problémy v kolektivu?
254
Byl ochráncem Říma po tři desítky let, jak ho líčí Gibbon, Norwich nebo Bury, hrdinou bitvy na Katalaunských polích, anebo ho snad lze
činit odpovědným za ztrátu Afriky (ačkoliv většina historiků tvrdí, že neměl žádné možnosti jak Vandalům účinně čelit)?
252
Hudba: Josef Zíma (Dneska nepůjdeme spát), Karel Gult & Josef Oplt (Tvé jméno sladce zní), Bedřich Čuba (Rozmary lásky), Lenka
Kořínková (Demo Austrálie 1983-1989), Jiří Helekal (Co jsem dělal, jak jsem žil, Zlatá Trampská oáza), Wizard (Co se děje se?
252
Kariéra Šedesátá léta Scorsese se zapsal na newyorskou universitu (v roce 1964 získal bakalářský titul z angličtiny, v roce 1966
magisterský z režie), kde natočil svá studentská díla: krátké filmy What's a Nice Girl Like You Doing in a Place Like This?
251
Hrdlička, Jaroslav: Československá (husitská) a římskokatolická církev, in: Církevní dějiny č.2, poznámka č. 61; Piškula, Jiří" Německá
evangelická církev v Čechách, na Moravě a ve Slezsku v letech 1945–1948: Boj o budoucnost církve či o její majetek?
250
Společnost je také známá pro originální přístup k příjímání nových zaměstnanců, který jiné společnosti napodobují, a který je zvaný
Microsoft interview a obsahuje i nepodstatné otázky, jako např. „Proč jsou poklopy od kanálů (a podobných děr) kulaté?
249
Gaia k sobě přilákala také síly obou Nadací a postavila Golana Trevize před volbu - jaká má být budoucnost Galaxie : druhou galaktickou
říši má nastolit první Nadace, druhá Nadace nebo se celá Galaxie má stát jedním superorganizmem podle vzoru Gaie?
248
Nepředává toto šílenství, jež svazuje a rozděluje čas, jež stáčí svět do smyčky noci a je zcela cizí zkušenosti své doby, nepředává těm, kdo
jsou mu otevřeni - Nietzche a Artaud - onen šepot osvíceneckého ne-rozumu, v němž byla řeč o noci a nicotě?
248
Robert Groden, soukromý vyšetřovatel atentátu, vyslovil ve své knize The Killing of a President dvě hlavní otázky: „Měl snad být tento
deštník nějakou formou vizuálního signálu, kterým by případnému střelci či střelcům dával pokyn k zahájení palby?
247
Mezi Emilem a Danou byl hravý vztah, když se Zátopek například pokoušel ukrojit si trochu z Danina vítězství a na tiskové konferenci
prohlásil, že jeho vítězství v běhu na 5 km jeho ženu inspirovalo”, Dana na to rozzlobeně reagovala slovy: „Vážně?
Appendix to ces web 2002: Longest sentences
222
Appendix to ces web 2002: Longest sentences
The longest sentences by string length
Longest declarative sentences
Length
Sentence
253
Před časem vyvolalo diskusi nasazeni policejnich provokateru v boji proti korupci, a to zejmene proto, ze provokateri byli v minulosti
nasazovani zejmena proti osobam nepohodlnym rezimu a ze provokater nezadouci jednani kolikrat sam sugeruje a vyvolava.
252
Na věži jsou 4 zvony: 1. z r. 1693 s nápisy: In honorem S. Jacobi Apostoli et patroni ecclesiae Wittischka fusa est haec campana de novo
metallo, a dole nad obrubou: Mit grossen Fleis durch Gottes Gnadt Johann Baptista Melleck in Brinn mich Gossen hat.
251
Izrada spoja traje vrlo dugo, rizik nehermetičnosti spoja je direktno srazmjeran iskustvu radnika i kvalitetu upotrebljenih dodatnih
materijala. mapress Vam garantira 100 % pouzdanost spoja sa atraktivnom cenom fitinga a produktivnost je viša i do 4x.
249
Nemohu se zdrzet komentare k casti projevu prezidenta republiky Vaclava Havla na konferenci "Europe's New Democracies: Leadership
and Responsibility" (Nase evropska demokracie: vudcovstvi a zodpovednost), ktery prednesl v Bratislave 11. května 2001.
249
Ten zahrnuje všechny vlastnosti Structural Modeler a Structural 3D a dále je rozšiřuje o schopnost automaticky generovat z 3D modelu
NC (Numerically Controlled) a PPS (Project, Planning, and Control System) / ERP (Enterprise Resource Planning) data.
248
Na webu Interplay se objevily volně dostupné (po registraci) manuály pro hry které v minulosti vydali, mimo jiné Fallout, Baldur's Gate,
Icewind Dale, Forgotten Real Archives, Sacrifice, Ultimate Wizardry Archives, Ultimate RPG Archives a tak dále.
248
Ediční projekty Regesta diplomatica nec non epistolaria Bohemiae et Moraviae, Regesta Bohemiae et Moraviae aetatis Venceslai IV.,
Monumenta Vaticana res gestas Bohemicas illustrantia, spolupráce na obnově řad Archiv český, Fontes rerum Bohemicarum.
247
Dobre higijenske osobine nerdajućeg čelika X5 Cr Ni Mo 17-12 2 ( AISI TP 316) i pouzdana otpornost na koroziju stvaraju od plemenitog
čelika mapress jasnog favorita za ovu od najvažnijiu i najcenjeniju, za život neophodnu, tekućinu - vodu za piće.
247
Chcete-li distribuovat vlastní soubory syncer.ini a servers.def na stanice, vytvořte k nim soubory syncer.tm a servers.tm a všechny je
nahrajte do adresáře, do kterého ukládáte soubory pro aktualizaci programu Avast32 (soubory sp32.tm a sp32.tmd).
247
O Splitu se moľe mnogo toga napisati, a mi ćemo samo spomenuti da je područje grada Splita bilo naseljeno već u 2. i 3. stoljeću prije
Krista, a sam grad se formira gradnjom Dioklecijanove palače (koja je pod zaątitom UNESCO-a) krajem 3. stoljeća.
Longest exclamatory sentences
Length
Sentence
243
Na konci epizody jdou Al a ostatní do striptýzu. 1019 - Jefferson oslavuje své výročí svatby s Marcy v Jiggly room 1020 - Ředitel Kyoto
National bank jde pak v doprovodu Marcy, Ala a Buda do Jiggly room, kde pak dokonce Marcy tancuje na pódiu!
243
Okrem toho pri odchode z Československa dôstojníci sa báli, že po odchode vláda im nič neposkytne (tak sa naozaj stalo - niektoré
sovietske pluky vyhodili do Sibiri, kde pre nich neboli pripravené ani byty, ani kasárne pre vojakov, proste nič!
240
Na našem serveru se hraje furt, z odkazů v servers se mužete podívat jestli je sever on-line, a kdo tam hraje, a jaká mapa atd. Klidně se
připojte a hrajte, heslo se dozvíte na ICQ všech členu nebo napište do guestbooku a někdo se vam ozve!
239
Ale teď něco pro nadšence: Nový Sherlock umí oproti nové předchozí variantě vyhledávat lidi (tedy jejich adresy, e-mail, zkrátka
vyhledávat na LDAP serveru), dotazovat se na e-commerce serveru (Amazon, Barns&Noble) a to vše v jediném okně!
237
Shortcarver, nebo co nejkratší extremcarver (do 140cm) je asi tou nejlepší lyží pro člověka, který jede na jeden týden ročně na hory a
potřebuje se postavit na lyže a prostě sjet kopec a ne se někde trápit na nevykrojených easycarverech!
236
Mezi vrcholy mixu patří skladby od Marca Caroly, Adama Beyera, Christiana Smitha & Johna Selwaye, Planetary Assault Systems (aka
Luke Slater), Umeka, Bena Simse, Gaeteka, Gayle San, Thomase Kromeho a daląích, které netřeba představovat!
236
Takže kdybych měla shodnotit celý "sportovní kurz" nebo spíše Itálii - tak ta se mi moc líbila a když se tady podívám z okna, tak bych se
tam nejraději vrátila a opalovala se na pláži, kde jsem byla bezstarostná a bylo mi tam moc hezky!
235
Solidarita medzi poľovníkmi roznych regiónov a krajín, solidarita medzi roznymi spo sobmi lovu ako je lov malej zveri a raticovej zveri,
sokoliarstvo, áno dokonca rybárstvo - lebo vlastne aj rybári sú v širokom zmysle slova poľovníkmi!
Appendix to ces web 2002: Longest sentences
223
234
K vidění ovšem nebyly jen monoposty Formule 1 ale i mnoho zajímavých jak závodních tak civilních verzí vozů Ferrari.Za zmínku stojí
Ferrari 166 Barchetta,zavodní F 330 P,či kompletní série vozu Ferrari Dino včetně závodního monopostu!
234
Hostující kapitán zatím nenominoval do dvouher prvního kola světové skupiny Davisova poháru bývalou světovou jedničku Jevgenije
Kafelnikova (momentálně 25. v ATP Entry), ale Michaila Južného (27.) a 62. hráče světa Nikolaje Davyděnka!
Longest interrogative sentences
Length
Sentence
241
NSA je pak prostřednictvím jistéoddělení na ministerstvu obchodu předala americkým firmám Raytheon, Boening a McDonnel Douglas,
které pak tendry proti francouzským firmám vyhrály (citováno podle The Sunday times).: "1984" nebo Orwell: 1998"?
240
Te le Romen na domuken paš o feder sikhľariben, akorestar imar len na domuken paš e buťi, ta avel pro Roma bida the goďakeri the
fizicko - te imar o plinova komori nane, sošaj buter anel le manušen kijo fizicko skerďipen, maj naexistencija?
238
®ák muľe naprosto zlomit nad sebou hul, jak se lidovi oíká, a úplni zrezignovat, ale pokud se vydal opravdovi na duchovní cestu, to
opravdovi podtrhávám, milost Boľí eistoty a ochrany ho bude vnitoni nutit a také ho poivede k vítizství a?
237
Být konformní, nemít žádný názor, nevyčuhovat, abych nemusel na nic odpovídat, neptat se, aby se člověk neztrapnil (nebo aby neztrapnil
učitele) – hodilo se to totalitnímu režimu, ale v demokracii by to mohlo být trochu jinak, nemyslíte?
235
Jedna z autorek této studie, Gina Kolata, zpravodajka New York Times Science, sama již 22 let vdaná, má za to, že je to dáno "láskou,
odevzdáním se a pečováním" mezi sexuálními partnery. 11. Přispívá pornografie k porozumění sexuality?
235
Proč se tedy, pane předsedo, ODS viditelněji nepokusila tento záměr prosadit - když už ne u voleb do Poslanecké sněmovny, tak alespoň v
zákonech o volbách do krajů a naposledy minulý týden v zákoně o volbách do obecních zastupitelstev?
235
Klasický text v avantgardním divadle, in: Sborník prací filozofické fakulty brněnské univerzity, řada Q 4, Theatralia et cinematographica,
Brno (Masarykova univerzita) H. Pospěchová (Kraflová): Film-Star revue: pokus takřka Osvobozený?
234
Najednou jsme si méně jisti svojí bezpečností, najednou je zde množství strachu a zla, které k nám proniká z Ameriky, Afghanistánu, z
Izraele, a my se ptáme: budeme pořád v klidu, nestane se nám nikdy nic, vyhne se vždy zlo naší zemi?
234
Z desítek možností, jak znamení tohoto typu číst, uvedu jedinou: nedopustili jsme se - byť třeba v dobré víře - velkého omylu, když jsme z
člověka udělali pouhého tvůrce zisku, jehož iniciativa povede automaticky k obecnému prospěchu?
233
Nenastal čas pro tvrdou a neústupnou křesťankou akci složenou z těch, kdo už po domácích i zahraničních zkušenostech rozpoznali
křesťanskou demokracii jako slepou cestu, na jejímž konci je jen zkáza všech nezpochybnitelných principů?
Appendix to ces web 2011: Longest sentences
224
Appendix to ces web 2011: Longest sentences
The longest sentences by string length
Longest declarative sentences
Length
Sentence
255
Podle ministerstva lze jen obtížně kontrolovat účelnost vynaložených prostředků z těchto fondů, protože „výdajové programy fondů
nemusí soutěžit s ostatními výdajovými programy a fondy často disponují finanční nezávislostí (v podobě pravidelných příjmů)“.
255
V jejich setu nechyběly vály jako „Teror“, „Vytí vlků“, „Zpověď“, „Společenská hra“, nebo „Pod pokličkou“, škoda jen, že nebylo přítomno
víc lidí, protože by mohli být svědky jednoho z mnoha divadelních vystoupení Bártyho, kterej to sázel úplně nehorázně.
255
Motor a jízdní vlastnosti: Stroj je poháněn čtyřdobým, kapalinou chlazeným dvouválcem o objemu 125ccm 90° do V. Motor nezapře zvuk
bublajícího dvouválce a to i přes to, že pro nejvyšší výkon, který činí 15 koní, je nutno vytočit otáčky až na 11000 ot/min.
255
Mimo hlavní prohlídku je možné shlédnout expozici Okresního muzea (za samostatné vstupné) – barokní obrazy, veduty děčínska,
zámecká zbrojnice obsahující část zbraní a exponátů zachráněných před devastací, je zdobena původními freskami a dřevěným stropem.
255
Creatine Plus - velmi efektivní kombinace účinných látek zabezpečující nejmodernější transportní systém zvyšování objemu buněk a
zároveň dokonalou produkci inzulínu potřebného na vytvoření k zabudování do svalové hmoty ve formě kapslí pro lepší dávkování.
255
Creatine Plus – velmi efektivní kombinace účinných látek zabezpečující nejmodernější transportní systém zvyšování objemu buněk a
zároveň dokonalou produkci inzulínu potřebného na vytvoření k zabudování do svalové hmoty ve formě kapslí pro lepší dávkování.
255
Po odstranění příčiny stačí stěny zasažené plísní nechat důkladně vyschnout, použít Savo proti plísni a zvolit vrchní nátěr, např. Primalex
Fungicidní penetraci a nátěr Primalex Mykostop – materiály, které obsahují přípravky omezující šíření hub a plísní.
255
Symbol YMCA - červený trojúhelník přetnutý pásem s písmeny YMCA je vyjádřením naší snahy o všestranný rozvoj lidské osobnosti a
harmonické spojení duchovní, tělesné a mravní stránky člověka, ke kterému vede vlastní pevná vůle, symbolizovaná příčným pásem.
255
V této souvislosti je vhodné uvést, že obecní zřízení zmiňuje cenovou regulaci státu, kterou je třeba rozumět též regulaci cen prováděnou
územními samosprávnými celky v přenesené působnosti, a to formou nařízení obce nebo kraje (viz § 10 zákona o cenách).
255
Rádi bychom, abyste věděli, že odmítáme jakékoli spojování naší organizace s aktivitami, které jsou v rozporu s Božím slovem, a že nám
velmi záleží na tom, aby naše organizace zůstala neposkvrněná a my jsme mohli mít vždy čisté svědomí před Bohem i lidmi.
Longest exclamatory sentences
Length
Sentence
255
Svojí pečlivou přípravou na BTZM – branně turistický závod mládeže – dosahovali každoročně vynikajících výsledků, ale v roce 1976 se
dařilo v závodě tak dobře, že jsme měli kromě 5 okresních a 3 krajských přeborníků také finalisty na přeborech ČSR a ČSSR!
255
Špičkové celoobvodové BEZPEČNOSTNÍ kování rakouské firmy MACO vybavené: mikroventilací, pojistkou proti vyklopení, zvedačem
křídla a základní bezpečností je doplňkem našeho plastového okna, kombinace kterou opravdu oceníte - v našich oknech bez příplatku!
255
Vedla k tomu samozřejmě dlouhá cesta přes desítky více či méně hrozných filmů, v nichž se z původně děsivých monster stávali čím dál
větší strašáci do zelí, kteří se v některých snímcích všichni potkávali a bojovali s mimozemšťany, nebo se dokonce ženili!
255
19. Treo 750 repas bílé - Zcela ojedinělá nabídka Windows Mobile Trea v bílém provedení za 3699,- Kč včetně konečného pouzdra Top
Open, 512MB miniSD karty s adaptérem na SD, headsetem, propisky s logem Palm, PC/Mac hry Argo adventure + malého dárku navíc!
255
Mezináboženský dialog Fóra připomněl křesťanům u nás, aby církve usilovaly o to, co ve své konfesní sebestřednosti tak nerady slyší:
Zůstávat v globalizujícím se světě otevřeným prostorem pro znovu prožití ducha k vlastní nepřenosné náboženské zkušenosti!
255
I když Petr chtěl v surrealismu trochu napodobovat, žít tak, jak se žilo: já jsem třeba sehnal v antikvariátu knihu s reprodukcemi Cézanna a
povídám mu, jaká to je nádhera, a Petr, protože věděl, že Breton Cézanna nenáviděl, řekl: „Na to se vůbec nedívej!
255
Bary a hospůdky i dnes vzpomínají na slavné hosty, jakými byli Marlene Dietrich, Ava Gardner, Gary Cooper a - samozřejmě Ernest
Hemingway, který s uznáním o místních barech napsal "moje nejlepší Mojito je v El Bodeguita a nejlepší Daiquire v La Floridita!
255
Je opravdu nutné tento formulář vyplnit, protože všichni víte, že pro dobrý servis divákům (v podobě informačních tabulek pro každý
přijatý model) potřebujeme předem vědět všechny data, aby se tabulky mohly předem připravit a při prezentaci vám je předat!
Appendix to ces web 2011: Longest sentences
225
255
Vyzýváme všechny, kterým není Máriův osud, stejně jako důsledky Máriova případného odsouzení pro sebevědomí neonacistů, lhostejný,
aby šířili informace o případu, posílali protestní dopisy, e-maily, faxy slovenským úřadům a zúčastnili se protestních akcí!
255
Od 19.00 v klubu Roxy vystoupí na prvním koncertu tradiční hudby takové hvězdy jako je Esma Redžepova z Makedonie, úchvatní Puerto
Flamenco ze Španělska, hudebně-divadelní představení ukrajinských Romans a česká legendární kapela Bengas v původní sestavě!
Longest interrogative sentences
Length
Sentence
255
Když se však začal povrch cesty měnit v malou cestičku v poli a která byla „označena“ jen tím způsobem, že jsme se drželi spadlé řepky
kterou někdo před námi projížděl zřejmě nějakým traktůrkem bylo nám jasné, že tato celá off-road vložka nebyla tak nejš?
255
K peripetiím, které je od osudového setkání před Orlojem dovedou až k svatebnímu ragby s prasátkem, jim zapěje Naďa Urbánková i
slizký boyband Plavci a Zdeněk Srstka si natrénuje svou budoucí roli zachránce pejsků coby muž, který opakuje větu „Chceš pivo?
255
V práci, v jejímž úvodu mimo jiné píšu, že “neskromně doufám, že se mi podařilo sepsat alespoň něco nepatrně přínosného, něco, co může
přispět k objasnění i prevenci té hrůzy, k níž na konci minulého století došlo v nepochybně přenádherné zemi našich neš?
255
Zúčastnili jsme se krajského kola soutěže odborných dovedností v oboru Opravář zemědělských strojů v Horšovském Týně, v zastoupení
Martinem Valným a Alešem Mrkosem, abychom porovnali vědomosti a dovednosti našich žáků s žáky ostatních zúčastněných učiliš?
255
V sobotu také dorazili další, po šichtě Šakali s Funěm, Rosťa se Šrámkou z Prahy, Kvark se přidal do další otočky dodávky, Radim atd.
Pracovalo se až do večera, kdy byly uvařeny špagety a postaveno teepee, kde se pobylo dlouho do noci, nebo spíše do rána?
255
Dále pak realizační činnost v oblasti výstavby, modernizací a rekonstrukcí stavebních objektů v oblasti průmyslových, občanských a
bytových staveb, dodavatelskou činnost, dodávky stavební i technologické včetně všeho navazujícího zázemí nutného pro zajiš?
255
Senát ČR, Czech trade, Ministerstvo obrany, Ministerstvo zahraničních věcí, Letecká služba policie, Vojenský technický ústav výzbroje a
munice Slavičín, Vojenský technický ústav letectva Praha-Kbely, Vojenský technický ústav PV Vyškov, Česká správa letiš?
255
Zkusit využití všech obnovitelných zdrojů, třeba nahradit většinu plynových kotlů kogeneračními jednotkami a teprve nakonec investovat
do několika rozsáhlých, technicky dokonalých jaderných elektráren, které by síť výkonově zastřešovaly a dostabilizovaly?
255
Atlas vydaný v souvislosti s Mezinárodním rokem biodiverzity 2010, který Organizace spojených národů vyhlásila pro letošní rok, byl
představen 23. září 2010 na konferenci EK nesoucí příznačný název: Půda, klimatické změny a biodiverzita – kudy se ubíráme?
255
Na pomoc mám žezla síly, epamy, energetickou přikrývku, "fantastickou rozcvičku" Mistra Borise Tichanovského na páteř a klouby, od
Ivy vím, že o pomoc a podporu můžu žádat vesmír i svého anděla strážného; vyvolává to ve vás pobavení nebo dokonce nedůvěru?
Appendix to ces web 2012: Longest sentences
226
Appendix to ces web 2012: Longest sentences
The longest sentences by string length
Longest declarative sentences
Length
Sentence
255
V jejich setu nechyběly vály jako „Teror“, „Vytí vlků“, „Zpověď“, „Společenská hra“, nebo „Pod pokličkou“, škoda jen, že nebylo přítomno
víc lidí, protože by mohli být svědky jednoho z mnoha divadelních vystoupení Bártyho, kterej to sázel úplně nehorázně.
255
Motor a jízdní vlastnosti: Stroj je poháněn čtyřdobým, kapalinou chlazeným dvouválcem o objemu 125ccm 90° do V. Motor nezapře zvuk
bublajícího dvouválce a to i přes to, že pro nejvyšší výkon, který činí 15 koní, je nutno vytočit otáčky až na 11000 ot/min.
255
Mimo hlavní prohlídku je možné shlédnout expozici Okresního muzea (za samostatné vstupné) – barokní obrazy, veduty děčínska,
zámecká zbrojnice obsahující část zbraní a exponátů zachráněných před devastací, je zdobena původními freskami a dřevěným stropem.
255
Creatine Plus – velmi efektivní kombinace účinných látek zabezpečující nejmodernější transportní systém zvyšování objemu buněk a
zároveň dokonalou produkci inzulínu potřebného na vytvoření k zabudování do svalové hmoty ve formě kapslí pro lepší dávkování.
255
Na základě individuálního složení těla a poměru svalů a tuků doporučuje přístroj InBody170 snížení nebo zvýšení množství tuku (Fat) a
také zvýšení množství svalů (Muscle), protože snížení množství kosterního svalstva přístroj InBody170 nikdy nedoporučuje.
255
Téma bude vždy přizpůsobeno potřebě jednotlivých oborů tak, aby tato mezioborová spolupráce vyústila ve zvýšení
konkurenceschopnosti studentů, k rozvoji pregraduální studentské vědecké odborné činnosti i ke zkvalitnění vzdělávání postgraduálních
studentů.
255
Po odstranění příčiny stačí stěny zasažené plísní nechat důkladně vyschnout, použít Savo proti plísni a zvolit vrchní nátěr, např. Primalex
Fungicidní penetraci a nátěr Primalex Mykostop – materiály, které obsahují přípravky omezující šíření hub a plísní.
255
Symbol YMCA - červený trojúhelník přetnutý pásem s písmeny YMCA je vyjádřením naší snahy o všestranný rozvoj lidské osobnosti a
harmonické spojení duchovní, tělesné a mravní stránky člověka, ke kterému vede vlastní pevná vůle, symbolizovaná příčným pásem.
255
Dne 23. října 1647 vyrazil velitel Plzně plukovník Lawon de la Coronna s 500 jezdci a 7000 pěšáky ke Kynžvartu, při čemž dobyl za
pochodu Šanci, obklíčil a ostřeloval hrad Kynžvart ze dvou polních děl a dvou moždířů tak intenzivně, že ho za dva dny dobyl.
255
Vznik kapely je datován zářím 2004, kdy žáci tehdejšího osmého ročníku rozšířené hudební výchovy v ZŠ a ZUŠ Kalovy Vary (Jakub
Smutný, Jan Horych a Vašek Širatovský) požádali učitele ZUŠ Mgr.Jindřicha Volfa o odborné vedení kapely, kterou hodlali založit.
Longest exclamatory sentences
Length
Sentence
255
Rozveselte se s námi při vytváření svítilen z dýní, veselých masek, při procházce podzimní přírodou a rozjímání u svařeného vínka, zažijte
aktivní odpočinek a odreagování nejen při zážitkovém sobotním programu, ale i při společném "helouvínském" programu!
255
Ahoj, chtěl bych se zeptat, jednou jsem měl kazetu a na tom nahrávku nějáký Punkový kapely a tam ani nebyl napsanej název tý kapely a
hráli tam písničku jak hrajete vy Ty jsi vůl, můžete mi prosim napsat co je to za kapelu, když je to Cover, zdraví Majkl!
255
Umíme kotvit do jakékoliv konstrukce - jsme na to vybaveni - v případě betonu, /panelové konstrukce/ provádíme kotvení pro ochranné
sítě s maximálním výkonem pro profesionály - vsazovacím přístrojem - žádná prašnost během kotvení - rychlost, spolehlivost!
255
Mezináboženský dialog Fóra připomněl křesťanům u nás, aby církve usilovaly o to, co ve své konfesní sebestřednosti tak nerady slyší:
Zůstávat v globalizujícím se světě otevřeným prostorem pro znovu prožití ducha k vlastní nepřenosné náboženské zkušenosti!
255
S radostí jsem vyslechla informační zprávu informačního rádia a hned ji štěkla našemu kotěti, co ondyno stálo na dvorku v slepičím
hovínku a radostně mňoukalo, že vstoupilo do Evropy, že naše vláda vyhlásila rok 2001 za Rok vzdělanosti a podpory vzdělání!
255
Společnost Forrester Research zveřejnila v jedné ze svých posledních studií, že je dokonce až 50x vyšší pravděpodobnost zobrazení ve
výsledku vyhledávání ve vyhledávači Google u stránek, na kterých je umístěna videoprezentace oproti stránce pouze textové!
255
O nás Nabízíme Materiály Fotogalerie Poptávka Virtuální prohlídky Informace pro Vás Novinky Nové sekce Nové dekory lamin Nové
dekory eco Lamin Nové rámy pro posuvné dveře Kusové šatní skříně Lidovka "levná kvalita" eshop kutil šikula Platby v eurech Akce!
Appendix to ces web 2012: Longest sentences
227
255
Je opravdu nutné tento formulář vyplnit, protože všichni víte, že pro dobrý servis divákům (v podobě informačních tabulek pro každý
přijatý model) potřebujeme předem vědět všechny data, aby se tabulky mohly předem připravit a při prezentaci vám je předat!
255
Vyzýváme všechny, kterým není Máriův osud, stejně jako důsledky Máriova případného odsouzení pro sebevědomí neonacistů, lhostejný,
aby šířili informace o případu, posílali protestní dopisy, e-maily, faxy slovenským úřadům a zúčastnili se protestních akcí!
255
Od studentů, kteří na konci letního semestru přijdou ke zkoušce z české literatury po roce 1945, očekávám, že budou znát nejenom
literárněhistorická fakta dosažitelná v běžně dostupných příručkách určených vysokoškolským studentům (nikoliv středoškolským!
Longest interrogative sentences
Length
Sentence
255
V Jáchimově knize chybí širší politické a sociální poukazy, ale i podrobnější vystižení kulturního kontextu, které se v knize omezuje
takřka jen na údajný svár vědy a církve: Co třeba širší kulturní jevy jako renesance, reformace, humanismus, baroko atp.?
255
Do hrdla za vědrem vědro Slunce v masce klauna ucedí: TOHLE je sauna vážené publikum Vedro Půl noci zkouším usnout Ani list se
nehne Ať ta cikáda zhebne nadmíru brutálně Dusno Ptáci padají nadmutí Dvojitý mojito dvakrát Kde je ta fronta sakra Zákopčaníku?
255
Máte z toho unavené oči, neustálou chuť jít si lehnout, bolí Vás hlava, ale v celém koloběhu povinností si prostě nevzpomenete dělat si
pravidelné přestávky v práci nebo Vás obtěžuje stále si nastavovat minutku či mobil, aby Vás za určitou dobu upozornil?
255
Dále pak realizační činnost v oblasti výstavby, modernizací a rekonstrukcí stavebních objektů v oblasti průmyslových, občanských a
bytových staveb, dodavatelskou činnost, dodávky stavební i technologické včetně všeho navazujícího zázemí nutného pro zajiš?
255
Není rozumné předpokládat, že taková nekonečně moudrá a dobrá Bytost, poté, co stvořila bytost schopnou ocenit jej a jeho plán, by byla
pohnuta jeho láskou a spravedlností a chtěla by uspokojit vnitřní potřeby tohoto stvoření tím, že mu dá nějaké ZJEVENÍ?
255
Senát ČR, Czech trade, Ministerstvo obrany, Ministerstvo zahraničních věcí, Letecká služba policie, Vojenský technický ústav výzbroje a
munice Slavičín, Vojenský technický ústav letectva Praha-Kbely, Vojenský technický ústav PV Vyškov, Česká správa letiš?
255
Vznikla nám celá plejáda příslovcí začínajících touto předponou, mnohdy úplně nadbytečnou: nanovo, navážno (místo vážně) natvrdo,
napřímo, naprudko, nadrzo, nakolmo (místo prostě kolmo!) atp. Titulek jednoho článku se dokonce táže: Nasladko nebo nazdravo?
255
Zkusit využití všech obnovitelných zdrojů, třeba nahradit většinu plynových kotlů kogeneračními jednotkami a teprve nakonec investovat
do několika rozsáhlých, technicky dokonalých jaderných elektráren, které by síť výkonově zastřešovaly a dostabilizovaly?
255
Na pomoc mám žezla síly, epamy, energetickou přikrývku, "fantastickou rozcvičku" Mistra Borise Tichanovského na páteř a klouby, od
Ivy vím, že o pomoc a podporu můžu žádat vesmír i svého anděla strážného; vyvolává to ve vás pobavení nebo dokonce nedůvěru?
255
Víte, že postele na obalu alba A Momentary Lapse Of Reason jsou skutečné a je jich asi 800? Víte, že Pink Floyd chystali v roce 1974
album s názvem "Household Objects", kde jedinými hudebními nástroji byly domácí pomůcky (příbor, lepící páska, kýbl atd.)?
Appendix to ces mixed 2012: Longest sentences
228
Appendix to ces mixed 2012: Longest sentences
The longest sentences by string length
Longest declarative sentences
Length
Sentence
255
To bylo například v šílené jízdě po dálnici D1 při stíhání sportovního klání, zneužíváním vrtulníku pro „zalyžování si“ cestou z Itálie v
Alpách, či v neposlední řadě jeho faux pas v Toskánsku na jachtě či vile jistého nejmenovaného švýcarského „dělníka“.
255
Mluvčí ÚOOZ Pavel Hanták totiž v pondělní tiskové zprávě přímo zmínil, že detektivové v pátek dopoledne „zadokumentovali předávku
peněz, které podezřelý převzal jako všimné za přidělení několikamiliónového kontraktu na poskytování služeb městské policii“.
255
Podle ministerstva lze jen obtížně kontrolovat účelnost vynaložených prostředků z těchto fondů, protože „výdajové programy fondů
nemusí soutěžit s ostatními výdajovými programy a fondy často disponují finanční nezávislostí (v podobě pravidelných příjmů)“.
255
Z tohoto hlediska je třeba rozlišit obě uvedené formulace Zlatého pravidla: zatímco první z nich otázku „kdo si začal“ neřeší a jen
vyžaduje, jakého jednání se člověk má zdržet, druhá vyžaduje, aby člověk sám jednal tak, jak si přeje, aby jednali ostatní.
255
V jejich setu nechyběly vály jako „Teror“, „Vytí vlků“, „Zpověď“, „Společenská hra“, nebo „Pod pokličkou“, škoda jen, že nebylo přítomno
víc lidí, protože by mohli být svědky jednoho z mnoha divadelních vystoupení Bártyho, kterej to sázel úplně nehorázně.
255
Investor Marc Faber předpovídá návrat indexu S&P 500 o 40 až 50 bodů výše „Trhy jsou extrémně přeprodané“, řekl Marc Faber v
rozhovoru pro Bloomberg Television s tím, že očekává skokovou rally indexu, ačkoli již zřejmě nedojde k prolomení letošních maxim.
255
Lore Buscher – Ředitelka Hong Kong Trade Development Council pro střední a východní Evropu Karl Wiesmer – Od roku 1999 předseda
představenstva BVV, a. s., ČR, dceřiné společnosti Messe Düsseldorf GmBH, od roku 2001 generální ředitel Messe Düsseldorf GmBH.
255
Když už jsme u těch centrismů, měl bych upřesnit, že je přebírá z USA, protože Kanada je také v Americe – jak nás, studenty angličtiny,
kdysi upozornila učitelka, když jsme na otázku, kam bychom se v Americe chtěli podívat, jmenovali výhradně místa v USA.
255
Odhaluje propracované a institucionalizované aberace ve vnímání politiky jejími vlastními aktéry, kteří – dnes již zcela nepochybně –
více či méně participují na utužování stále sílící amorální integrity, skutečně konstituující platformy politického dění.
255
Rozšíření v Česku Sekvojovec obrovský, Chabaně * Sekvojovce v Ratměřicích – Ratměřice ( okres Benešov ) – 2 sekvojovce, oba cca 40
m. * Sekvojovec v Chabaních – obec Chabaně (část obce Břestek ) ( okres Uherské Hradiště ) – výška 32 m, obvod kmene 612 cm.
Longest exclamatory sentences
Length
Sentence
255
Rozveselte se s námi při vytváření svítilen z dýní, veselých masek, při procházce podzimní přírodou a rozjímání u svařeného vínka, zažijte
aktivní odpočinek a odreagování nejen při zážitkovém sobotním programu, ale i při společném "helouvínském" programu!
255
Elektronická učebnice, kterou představila například firma Hewlett Packard s OS Windows se hodí pro žáky základních škol nebo nižších
ročníků gymnázií a tudíž zde nemá tolik smyslu představovat její funkce, nám starším postačí klasický počítač či notebook!
255
Přitom vám prozradí několik sexuálních vzpomínek ze světa newyorské intelektuální smetánky, která si navzájem ráda tiskne ramena, ale
hlavně upozorní na pár voňavých skvostů - taková Jasmine et Cigarette, francouzská zákeřnost ve flakonu, musí být úžasná!
255
“ Další související články Jaromír Jágr: 9. největší gambler v dějinách sportu Nedvěd: Džegr to měl promyšlené, schvaluju mu to
Červenka: Rusky už to zvládnu i bez Jágra Kouč Říha: Jágr mě svým přístupem zklamal Jágr odhalil pravdu: Pittsburgh mě nechtěl!
255
Ahoj, chtěl bych se zeptat, jednou jsem měl kazetu a na tom nahrávku nějáký Punkový kapely a tam ani nebyl napsanej název tý kapely a
hráli tam písničku jak hrajete vy Ty jsi vůl, můžete mi prosim napsat co je to za kapelu, když je to Cover, zdraví Majkl!
255
Inu,česká tvořivot je v kuchyni spíš na škodu,protože pomazánkové máslo nikdy nenahradí mascarpone a řezy Rafaelo nebo různé
zakyspuding hrníčkové buchty pod různými tajuplnými názvy jsou možná dobrou rychlovkou ke kávě ale od desertu očekávám mnohem
víc!
255
Svojí pečlivou přípravou na BTZM – branně turistický závod mládeže – dosahovali každoročně vynikajících výsledků, ale v roce 1976 se
dařilo v závodě tak dobře, že jsme měli kromě 5 okresních a 3 krajských přeborníků také finalisty na přeborech ČSR a ČSSR!
Appendix to ces mixed 2012: Longest sentences
229
255
Špičkové celoobvodové BEZPEČNOSTNÍ kování rakouské firmy MACO vybavené: mikroventilací, pojistkou proti vyklopení, zvedačem
křídla a základní bezpečností je doplňkem našeho plastového okna, kombinace kterou opravdu oceníte - v našich oknech bez příplatku!
255
Vedla k tomu samozřejmě dlouhá cesta přes desítky více či méně hrozných filmů, v nichž se z původně děsivých monster stávali čím dál
větší strašáci do zelí, kteří se v některých snímcích všichni potkávali a bojovali s mimozemšťany, nebo se dokonce ženili!
255
Řidič nepřežil, spolujezdec je zraněný Za pád auta z mostu do řeky na Šumpersku mohla rychlá jízda Svitavská lupička neuspěla v jedné
bance, policie si ji vyzvedla ve vedlejší Policisté už vědí, koho v Ostravě přejel jejich kolega Tvá partnerka je tlustá!
Longest interrogative sentences
Length
Sentence
255
Když se však začal povrch cesty měnit v malou cestičku v poli a která byla „označena“ jen tím způsobem, že jsme se drželi spadlé řepky
kterou někdo před námi projížděl zřejmě nějakým traktůrkem bylo nám jasné, že tato celá off-road vložka nebyla tak nejš?
255
K peripetiím, které je od osudového setkání před Orlojem dovedou až k svatebnímu ragby s prasátkem, jim zapěje Naďa Urbánková i
slizký boyband Plavci a Zdeněk Srstka si natrénuje svou budoucí roli zachránce pejsků coby muž, který opakuje větu „Chceš pivo?
255
Parta z Kouzelníka se sešla: Nechyběla ani Jaruš Když vám chutná sex a pití tak proč s tím přestávat když vám chutná tak jste prostě
zdravej, ještě hodně úspěchů v dalším životě Kdo dnes nechlasta a kdo z chlapu si obcas nenajde nejakou tu pani na sex ze?
255
Varující je i fakt, že tato firma není uváděna v běžných dostupných srovnáních cen plynu i elektřiny, viz například Ceny plynu 2011:
Velké srovnání dodavatelů nebo tam, kde se vyskytuje pod názvem Energetické centrum - Kolik zaplatíte za plyn v roce 2011?
255
V té době už byla jeho politika appeasementu v troskách, ale on stál za svým, trval na tom, že Mnichov byl nejen moudrým, ale také
etickým rozhodnutím: „Já necítím potřebu obhájit své loňské cesty do Německa, protože, dámy a pánové, jaká byla alternativa?
255
Proč ne ve formuli 1? Zlatý dolar na klávesnici Týden mobilně 92: Huawei v předpremiéře Odečtěte si dárky aneb ušetřete na propagaci
Toyota Land Cruiser - všestranný šedesátník Flash disk s číselným zámkem Nové BlackBerry Torch a Bold: QWERTY nebo doteky?
255
V Jáchimově knize chybí širší politické a sociální poukazy, ale i podrobnější vystižení kulturního kontextu, které se v knize omezuje
takřka jen na údajný svár vědy a církve: Co třeba širší kulturní jevy jako renesance, reformace, humanismus, baroko atp.?
255
Úplně normálně byl přitlačen ke zdi viz BLESK: Jsem jen kašpárek, J.K. vysvětluje svůj vztah k I.Bartošové a jak byl donucen vedením
TV Prima ke spolupráci s I.Bartošovou, nechce se mi hledat datum, ale budete li ho chtít tak se podivám A je to podstatné?
255
Jak by k tomu přišli ti, co jezdí svými drahými auty po této silnici, kdyby zase znovu tady u nás byla »uzákoněna rovnost« (ani ta sice
uzákoněna nebyla, ale často je nám všem ve spojení s minulostí předhazována), tedy nejen »příležitostí«, ale i »platů«?
255
Jak se zviditelňuje ČR před světem, když oficiální návštěva z Číny v Poslanecké sněmovně Parlamentu ČR musí čelit provokaci jistých
poslanců a dokonce i členů vlády, pózujících při této příležitosti s rozvinutým tibetským praporem nebo vlajkou Tchaj-wanu?
Appendix to ces news 2005-2007: Length of sentences in characters
Appendix to ces news 2005-2007: Length of
sentences in characters
Sentence length in characters: Distribution, average, and standard diviation
Percentage of sentences for fixed sentence length
Average sentence length
102.8185
Standard deviation
46.7120
230
Appendix to ces news 2008: Length of sentences in characters
Appendix to ces news 2008: Length of sentences
in characters
Sentence length in characters: Distribution, average, and standard diviation
Percentage of sentences for fixed sentence length
Average sentence length
99.7967
Standard deviation
49.1707
231
Appendix to ces news 2009: Length of sentences in characters
Appendix to ces news 2009: Length of sentences
in characters
Sentence length in characters: Distribution, average, and standard diviation
Percentage of sentences for fixed sentence length
Average sentence length
99.9996
Standard deviation
49.4892
232
Appendix to ces news 2010: Length of sentences in characters
Appendix to ces news 2010: Length of sentences
in characters
Sentence length in characters: Distribution, average, and standard diviation
Percentage of sentences for fixed sentence length
Average sentence length
99.9640
Standard deviation
49.6758
233
Appendix to ces news 2011: Length of sentences in characters
Appendix to ces news 2011: Length of sentences
in characters
Sentence length in characters: Distribution, average, and standard diviation
Percentage of sentences for fixed sentence length
Average sentence length
100.4478
Standard deviation
50.0646
234
Appendix to ces news 2012: Length of sentences in characters
Appendix to ces news 2012: Length of sentences
in characters
Sentence length in characters: Distribution, average, and standard diviation
Percentage of sentences for fixed sentence length
Average sentence length
94.2653
Standard deviation
47.1478
235
Appendix to ces newscrawl 2011: Length of sentences in characters
Appendix to ces newscrawl 2011: Length of
sentences in characters
Sentence length in characters: Distribution, average, and standard diviation
Percentage of sentences for fixed sentence length
Average sentence length
97.9689
Standard deviation
50.5041
236
Appendix to ces newscrawl 2012: Length of sentences in characters
Appendix to ces newscrawl 2012: Length of
sentences in characters
Sentence length in characters: Distribution, average, and standard diviation
Percentage of sentences for fixed sentence length
Average sentence length
91.5185
Standard deviation
47.1044
237
Appendix to ces wikipedia 2007: Length of sentences in characters
Appendix to ces wikipedia 2007: Length of
sentences in characters
Sentence length in characters: Distribution, average, and standard diviation
Percentage of sentences for fixed sentence length
Average sentence length
104.7915
Standard deviation
49.2984
238
Appendix to ces wikipedia 2012: Length of sentences in characters
Appendix to ces wikipedia 2012: Length of
sentences in characters
Sentence length in characters: Distribution, average, and standard diviation
Percentage of sentences for fixed sentence length
Average sentence length
103.7941
Standard deviation
48.2652
239
Appendix to ces web 2002: Length of sentences in characters
Appendix to ces web 2002: Length of sentences in
characters
Sentence length in characters: Distribution, average, and standard diviation
Percentage of sentences for fixed sentence length
Average sentence length
99.8277
Standard deviation
48.4020
240
Appendix to ces web 2011: Length of sentences in characters
Appendix to ces web 2011: Length of sentences in
characters
Sentence length in characters: Distribution, average, and standard diviation
Percentage of sentences for fixed sentence length
Average sentence length
99.4825
Standard deviation
48.3500
241
Appendix to ces web 2012: Length of sentences in characters
Appendix to ces web 2012: Length of sentences in
characters
Sentence length in characters: Distribution, average, and standard diviation
Percentage of sentences for fixed sentence length
Average sentence length
97.3365
Standard deviation
47.7816
242
Appendix to ces mixed 2012: Length of sentences in characters
Appendix to ces mixed 2012: Length of sentences
in characters
Sentence length in characters: Distribution, average, and standard diviation
Percentage of sentences for fixed sentence length
Average sentence length
100.4669
Standard deviation
48.4998
243
Appendix to ces news 2005-2007: Length of sentences in words
Appendix to ces news 2005-2007: Length of
sentences in words
Sentence length in words: Distribution, average, and standard diviation
Percentage of sentences for fixed sentence length
Average sentence length
15.7015
Standard deviation
7.0041
244
Appendix to ces news 2008: Length of sentences in words
Appendix to ces news 2008: Length of sentences
in words
Sentence length in words: Distribution, average, and standard diviation
Percentage of sentences for fixed sentence length
Average sentence length
15.4539
Standard deviation
7.3327
245
Appendix to ces news 2009: Length of sentences in words
Appendix to ces news 2009: Length of sentences
in words
Sentence length in words: Distribution, average, and standard diviation
Percentage of sentences for fixed sentence length
Average sentence length
15.5087
Standard deviation
7.3935
246
Appendix to ces news 2010: Length of sentences in words
Appendix to ces news 2010: Length of sentences
in words
Sentence length in words: Distribution, average, and standard diviation
Percentage of sentences for fixed sentence length
Average sentence length
15.5363
Standard deviation
7.4441
247
Appendix to ces news 2011: Length of sentences in words
Appendix to ces news 2011: Length of sentences
in words
Sentence length in words: Distribution, average, and standard diviation
Percentage of sentences for fixed sentence length
Average sentence length
15.6555
Standard deviation
7.5365
248
Appendix to ces news 2012: Length of sentences in words
Appendix to ces news 2012: Length of sentences
in words
Sentence length in words: Distribution, average, and standard diviation
Percentage of sentences for fixed sentence length
Average sentence length
14.7050
Standard deviation
7.0828
249
Appendix to ces newscrawl 2011: Length of sentences in words
Appendix to ces newscrawl 2011: Length of
sentences in words
Sentence length in words: Distribution, average, and standard diviation
Percentage of sentences for fixed sentence length
Average sentence length
15.3846
Standard deviation
7.6559
250
Appendix to ces newscrawl 2012: Length of sentences in words
Appendix to ces newscrawl 2012: Length of
sentences in words
Sentence length in words: Distribution, average, and standard diviation
Percentage of sentences for fixed sentence length
Average sentence length
14.4479
Standard deviation
7.1506
251
Appendix to ces wikipedia 2007: Length of sentences in words
Appendix to ces wikipedia 2007: Length of
sentences in words
Sentence length in words: Distribution, average, and standard diviation
Percentage of sentences for fixed sentence length
Average sentence length
15.9940
Standard deviation
7.3907
252
Appendix to ces wikipedia 2012: Length of sentences in words
Appendix to ces wikipedia 2012: Length of
sentences in words
Sentence length in words: Distribution, average, and standard diviation
Percentage of sentences for fixed sentence length
Average sentence length
15.9341
Standard deviation
7.2826
253
Appendix to ces web 2002: Length of sentences in words
Appendix to ces web 2002: Length of sentences in
words
Sentence length in words: Distribution, average, and standard diviation
Percentage of sentences for fixed sentence length
Average sentence length
15.2163
Standard deviation
7.2838
254
Appendix to ces web 2011: Length of sentences in words
Appendix to ces web 2011: Length of sentences in
words
Sentence length in words: Distribution, average, and standard diviation
Percentage of sentences for fixed sentence length
Average sentence length
15.2771
Standard deviation
7.2574
255
Appendix to ces web 2012: Length of sentences in words
Appendix to ces web 2012: Length of sentences in
words
Sentence length in words: Distribution, average, and standard diviation
Percentage of sentences for fixed sentence length
Average sentence length
15.0417
Standard deviation
7.2060
256
Appendix to ces mixed 2012: Length of sentences in words
Appendix to ces mixed 2012: Length of sentences
in words
Sentence length in words: Distribution, average, and standard diviation
Percentage of sentences for fixed sentence length
Average sentence length
15.5388
Standard deviation
7.3133
257
258
Oddities details
Appendix to ces news 2005-2007: Longest words
The 10 longest words with frequency>1, ordered by length
Length Frequency
Word
36
2
jmeno,prijmeni,ulice,cislo,mesto,psc
32
6
www.nokia.com/batteryreplacement
31
3
anesteziologicko-resuscitačního
30
2
anesteziologicko-resuscitačním
30
2
Zaměstnavatelsko-zaměstnanecké
30
9
Win32/TrojanDownloader.Ani.Gen
29
6
anesteziologicko-resuscitační
29
2
www.kidsmartearlylearning.org
28
2
socialisticko-komunistických
28
2
http:/ / www. unicorncollege. cz
Appendix to ces news 2008: Longest words
The 10 longest words with frequency>1, ordered by length
Length Frequency
Word
36
2
francouzsko-československosovětského
33
2
ach-můj-bože-ta-nestydatá-Britney
31
2
anesteziologicko-resuscitačních
31
2
www.olomouc.eu/uzemni-planovani
31
10
anesteziologicko-resuscitačního
30
9
anesteziologicko-resuscitačním
30
2
www.ceskatelevize.cz/mezipatra
30
2
Ludwig-Maximilians-Universität
29
2
www.kidsmartearlylearning.org
29
8
anesteziologicko-resuscitační
Appendix to ces news 2009: Longest words
259
Appendix to ces news 2009: Longest words
The 10 longest words with frequency>1, ordered by length
Length Frequency
Word
32
2
www.googleblog.cz/streetviewtipy
31
10
anesteziologicko-resuscitačního
30
15
anesteziologicko-resuscitačním
29
10
anesteziologicko-resuscitační
29
2
společensko-kulturně-výchovné
29
2
Československo-východoněmecký
29
2
izraelsko-německo-francouzské
28
2
www.tondach.cz/palenastrecha
28
6
francouzsko-německo-japonský
27
8
pedagogicko-psychologických
Appendix to ces news 2010: Longest words
The 10 longest words with frequency>1, ordered by length
Length Frequency
Word
40
3
NajčítanejšieNajnovšieNajdiskutovanejšie
40
2
http://www.tomasjulinek.cz/o-mne/reforma
36
2
T-O-P-0-9-s-p-o-d-p-o-r-o-u-STAROSTŮ
36
2
www.oracle.com/goto/cz/oracleday2010
36
2
zámečníci,elektrikáři,učitelé,doktoř
35
2
www.hochtief-projectdevelopment.com
35
2
konzervativně-liberálnědemokratické
35
2
liberálnědemokraticko-konzervativní
33
2
Leutheusserová-Schnarrenbergerová
33
3
www.zahranicni.ihned.cz/WikiLeaks
Appendix to ces news 2011: Longest words
260
Appendix to ces news 2011: Longest words
The 10 longest words with frequency>1, ordered by length
Length Frequency
Word
49
2
RychlostOdpověďDěkováníDoručeníKontaktKvalitaInfo
44
2
www.facebook.com/CaptainMorganCeskaRepublika
40
2
www.dpp.cz/soutez-namalujte-svou-tramvaj
36
2
www.facebook.com/kraftfoodscorporate
35
2
www.shopper-marketing.retailinfo.cz
35
3
konzervativně-liberálnědemokratické
35
2
czechpseudopolitikuspragenthalensis
34
4
www.facebook.com/industrialnistopy
33
2
Zemědělsko-potravinářsko-chemický
32
2
finančně-poradensko-personálních
Appendix to ces news 2012: Longest words
The 10 longest words with frequency>1, ordered by length
Length Frequency
Word
39
2
Praha-Pardubice-Olomouc-Ostrava-Bohumín
39
2
stranaFotbalZahraničíŠpanělskoGuardiola
38
2
www.naturhouse-cz.cz/metoda-naturhouse
38
2
www.wineofczechrepublic.cz/certifikace
36
2
stranaFotbalZahraničíAnglieBalotelli
35
2
stranaFotbalZahraničíAnglieMourinho
33
3
Leutheusserová-Schnarrenbergerová
32
5
stranaFotbalZahraničíAnglieVIDEO
31
2
anesteziologicko-resuscitačního
31
3
stranaFotbalZahraničíAnglieČech
Appendix to ces newscrawl 2011: Longest words
261
Appendix to ces newscrawl 2011: Longest words
The 10 longest words with frequency>1, ordered by length
Length Frequency
Word
53
2
Lískovec–Pisárky–Kohoutovice–Žebětín–Ostrovačice–Nový
49
2
Student-Agency-včetně-vagónen-express-huikarii-ČD
43
2
2,3,7,8-tetrachloro-dibenzo(b,e)(1,4)dioxin
38
2
polistopadové,rozdováděné,polovzdělané
37
6
Jindřichohradecku,Svitavsku,Vyškovsku
36
5
www.facebook.com/knihy.kanzelsberger
36
2
www.cipa.cz/hodnoceni-alergicke-rymy
36
2
www.letitroll.cz/chaseandstatus.html
35
2
www.odturoveckychrybniku.webnode.cz
35
2
tlumiče,alternátor,relé,ložiska,těs
Appendix to ces newscrawl 2012: Longest words
The 10 longest words with frequency>1, ordered by length
Length Frequency
Word
135
2
O''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''Bamovi
71
2
O''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''Bamovi
53
2
Lískovec–Pisárky–Kohoutovice–Žebětín–Ostrovačice–Nový
50
2
Schöneck-Mühlleithen-Carlsfeld-Johann-Georgenstadt
39
2
O''''''''''''''''''''''''''''Bamovi
39
2
orchestrálních,koncertantních,vokálních
38
2
www.wineofczechrepublic.cz/certifikace
37
2
japonsko-ukrajinsko-izraelsko-českého
37
2
Jindřichohradecku,Svitavsku,Vyškovsku
36
5
www.facebook.com/knihy.kanzelsberger
Appendix to ces wikipedia 2007: Longest words
262
Appendix to ces wikipedia 2007: Longest words
The 10 longest words with frequency>1, ordered by length
Length Frequency
Word
58
2
Llanfairpwllgwyngyllgogerychwyrndrobwllllantysiliogogogoch
37
2
Dickinson/Harris/Murray/Smith/McBrain
36
2
filozoficko-analyticko-sociologickým
33
8
Blacksmith-hammer-anvil-50x50.png
30
2
Friedrich-Wilhelms-Universität
29
2
Württembersko-Hohenzollernsko
28
2
Serpuchovsko-Timirjazevskaja
28
2
Nicaeno-Constantinopolitanum
28
3
Nicejsko-konstantinopolského
28
2
nicejsko-konstantinopolského
Appendix to ces wikipedia 2012: Longest words
The 10 longest words with frequency>1, ordered by length
Length Frequency
Word
58
2
Llanfairpwllgwyngyllgogerychwyrndrobwllllantysiliogogogoch
47
2
http://www.cestyapamatky.cz/pasinka-drobna.html
40
2
SS-Freiwilligen-Panzergrenadier-Division
39
3
http://www.volny.cz/zkorinek/vlakna.pdf
36
2
http://www.petice-prehrada.cz/petice
35
2
http://www.kosovo.net/default2.html
35
2
3,4-methylendioxy-N-methylamfetamin
34
2
delta-8-trans-tetrahydrocannabinol
32
2
hypothalamus-hypofýza-nadledviny
32
2
imperialisticko-revizionistickém
Appendix to ces web 2002: Longest words
263
Appendix to ces web 2002: Longest words
The 10 longest words with frequency>1, ordered by length
Length Frequency
Word
60
2
Kavčiak,Vladimír,1947-Kavčiak,Vladimír,1948-Kaverin,Veniamin
60
2
http://codecentral.borland.com/codecentral/ccweb.exe/listing
59
2
Brussig,Thomas,1965-Brussolo,Serge,1951-Bruštejn,Aleksandra
56
2
Gasparič,Jiří,1926-Gassert,Philipp,1965-Gassmann,Florian
54
2
http://www.microsoft.com/truetype/fontpack/default.htm
51
2
Macháčková,Jitka,1939-Machačová,Helena,1941-Machado
51
2
02.01.02NázevBICISINKurzZměnaAlokaceStavPřevisUNION
50
2
Gerloch,Aleš,1955-Germain,Sylvie,1954-German,Jurij
48
2
1-mononatrium-3,5-dichloro-s-triazin-2,4,6-trion
48
2
http://www.vlada.cz/rady/sip/forum/forum.win.htm
Appendix to ces web 2011: Longest words
The 10 longest words with frequency>1, ordered by length
Length Frequency
Word
55
2
Word,Excel,Outlook,Publisher,Access,PowerPoint,Business
53
2
www.msmt.cz/vzdelavani/nove-formulare-prihlasek-vzory
52
2
chetitsko-anticko-křižácko-mittansko-asyrsko-persko-
52
2
pěkné-krásné-výtečné-výborné-skvělé-bezva-fajn-super
46
3
Wölsendorf-Pertolzhofen-Oberviechtach-Schönsee
45
2
chceme-prahu-kulturni-usneseni-zastupitelstva
42
2
www.otevrenaspolecnost.cz/nevladky-a-krize
42
2
MíruVaníčkovaVejdovskéhoVelkomoravskáVelký
41
2
prohlížejte,komentujte,chvalte,kritizujte
40
2
zaútočí,okradou,ublíží,znásilní,zavraždí
Appendix to ces web 2012: Longest words
264
Appendix to ces web 2012: Longest words
The 10 longest words with frequency>1, ordered by length
Length Frequency
Word
52
2
pěkné-krásné-výtečné-výborné-skvělé-bezva-fajn-super
49
2
Oldřišov-Hněvošice-Kobeřice-Štěpánkovice-Svoboda-
47
2
www.americanexpress.com/uk/tc/custservice.shtml
46
2
Wölsendorf-Pertolzhofen-Oberviechtach-Schönsee
46
3
shromažďování,sběru,přepravy,třídění,využívání
45
2
chceme-prahu-kulturni-usneseni-zastupitelstva
44
2
www.jezekbelobrichy-pichlavaklubicka.webnode
44
2
zahrnuje:materiál,oplechování,montáž,dopravu
42
2
www.otevrenaspolecnost.cz/nevladky-a-krize
41
2
výcvikuČlenovéZávodyFoto-Video-galerieMám
Appendix to ces mixed 2012: Longest words
The 10 longest words with frequency>1, ordered by length
Length Frequency
Word
58
7
Llanfairpwllgwyngyllgogerychwyrndrobwllllantysiliogogogoch
55
2
Word,Excel,Outlook,Publisher,Access,PowerPoint,Business
53
2
Lískovec–Pisárky–Kohoutovice–Žebětín–Ostrovačice–Nový
53
2
www.msmt.cz/vzdelavani/nove-formulare-prihlasek-vzory
52
2
Česko-Lidskost-Odpovědnost-Všichni-Evropa-Křesťanská
52
2
pěkné-krásné-výtečné-výborné-skvělé-bezva-fajn-super
52
2
chetitsko-anticko-křižácko-mittansko-asyrsko-persko-
51
2
02.01.02NázevBICISINKurzZměnaAlokaceStavPřevisUNION
50
2
www.fei.vsb.cz/cs/okruhy/studium-a-vyuka/formulare
50
2
Schöneck-Mühlleithen-Carlsfeld-Johann-Georgenstadt
Appendix to ces news 2005-2007: Sentences with high average word length
Appendix to ces news 2005-2007: Sentences with
high average word length
25 sentences with highest average word length
avg. word
length
sentence
16.4000
Turistické informace: www.spain.info, www.illesbalears.es, www.mallorcaonline.com.
15.7778
Informační materiály, on-line text na již zrušených stránkách:
(http://www.stranazelenych.cz/html/imformujeme-vas-informacni-materialy.shtml).
15.7500
Podobně můžeme pochopit http://www.ods.cz/zpravy/prispevek.php
14.3333
Jednodušší, přehlednější, transparentnější.
14.3333
Šabach/Jarkovský/Hřebejk/Hlas: Šakalí léta.
14.0000
Možná srozumitelnějším, předvídatelnějším.
14.0000
Pouze ho pobavilo Ujfalušiho dětské "nic-jsem-neplatil-a-ta-částka-také-nesouhlasí".
13.2500
Představovala jeden z produktů stejnojmenného sympatického projektu (www.livskompetens.com/competence50+).
12.7143
Nejnavštěvovanější českobudějovický veletrh doprovodí Mezinárodní výstava družstevnictví.
12.6000
Komunismus vystřídalo nebezpečí ambiciózního environmentalismu.
12.6000
Mnohopolárnost neobsahuje jakoukoliv konfrontační předurčenost.
12.5000
Vývoj a struktura německých Zelených, on-line text: (http://www.hejrup.sk/LindnerNemectiZeleni.PDF).
12.3333
Léky jsou kategorizovány podle anatomicko-terapeuticko-chemického třídění.
12.2857
Vždyť představuje něco jako indický TelekomSiemensSAPVolkswagenThyssenKrupp dohromady.
12.2500
Nejčastěji prostřednictvím organizovaných náborů.
12.2500
Vystudoval Vysokou školu chemicko-technologickou.
12.1429
Průjezdné byly na společné hranici jen přechody Halámky/Neunagelberg, Vratěnín/Oberthürnau, Hnanice/Mitterretzbach,
Hatě/Kleinhaugsdorf, Hevlín/Laa a Mikulov/Drasenhofen.
12.1000
Jmenoval tratě Čížkovice-Obrnice, Děčín-Oldřichov, Žatec-Deštnice, Chomutov-Vejprty, Žatec západ-Podbořany a Louny-Peruc.
12.0909
Na webu Českého hydrometeorologického ústavu začala fungovat stránka sněhového zpravodajství
http://www.chmi.cz/meteo/om/aktinf.html.
12.0000
Autorka je analytičkou budapešťského konzervativně-liberálního think-tanku Nezöpont.
12.0000
Byl místopředsedou představenstva vytunelované Ekoagrobanky.
12.0000
Čtyřicet nemocných, pokřivených, pokroucených, poslintaných, malomyslných, osamělých, zbloudilých, neorientovaných duší.
12.0000
Devětačtyřicetiletý Jaroslav Krabec vystudoval Matematicko-fyzikální fakultu Univerzity Karlovy.
12.0000
Konstatoval degeneraci zastupitelské demokracie.
12.0000
Následoval několikahodinový, nepříjemný výslech.
265
Appendix to ces news 2008: Sentences with high average word length
Appendix to ces news 2008: Sentences with high
average word length
25 sentences with highest average word length
avg. word
length
sentence
27.3333
Více na www.rada-severovychod.cz/data/sharedfiles/2750/plan-vyzev-na-rok-2009.pdf.
13.2500
Triádou předchozí bylo Německo-Portugalsko-Slovinsko.
12.6250
Jiřetín, Postoloprty–Tuchořice, SK Kopisty–Březno, Ledvice–Louny, Ervěnice–Domoušice (všichni 16.30).
12.5000
Budějovice, Hartvíkovice-Janovice (všichni 16.30).
12.5000
Materiály jsou voleny na základě filozofie symboliky země-kámen-gabion, dům-zeď-omítka, střecha-trám-dřevo,
transparence-okno-sklo, zeleň-zeleň-zeleň.
12.4000
Vybudování areálu představuje několikasetmilionovou investici.
12.4000
Více informací najdete na www.accaglobal.com/e-qualifications.
12.2000
Vystudovala Matematicko-fyzikální fakultu Univerzity Karlovy.
12.0000
Ondřej Křenek, Gynekologicko-porodnické oddělení, Kroměřížská nemocnice.
12.0000
Především z gynekologicko-porodnického oddělení.
12.0000
Responsibletravel.com sestavuje žebříček nejvyhledávanějších destinací tohoto sektoru turistiky.
12.0000
Zemědělství zaměstnává polovinu práceschopného obyvatelstva.
11.8571
Některé outplacementové programy nezahrnují individuální psychologické poradenství.
11.8333
Představitelé ministerstva zdravotnictví odmítají odborářské argumenty.
11.8333
Připravila například karikatury protitopolánkovských dopravních značek.
11.8000
Čtyřicetiletou Danihelkovou rozhodnutí ministra překvapilo.
11.7500
Podrobnosti nabízejí stránky www.tanecpraha.cz.
11.6667
Hvězda totiž opakovaně navštívila gynekologicko-porodnickou ambulanci.
11.6667
Většina maltských společností podstoupila radikální restrukturalizaci.
11.6250
Přes Gruzii prochází klíčové produktovody: Ázerbájdžán-Tbilisi-Ceyhan a Baku-Tbilisi-Erzerum.
11.6000
Existuje matematicko-fyzikální pojem radiolokační rovnice.
11.6000
Konkrétně školství, zdravotnictví, humanitární organizace.
11.5714
Transakci zpochybňovala také protikorupční organizace Transparency International.
11.5000
Další dramaturgicko-scenáristický počin vyšel.
11.5000
Přitažlivějším, pravděpodobně inteligentnějším (což mnoho neznamená).
266
Appendix to ces news 2009: Sentences with high average word length
Appendix to ces news 2009: Sentences with high
average word length
25 sentences with highest average word length
avg. word
length
sentence
18.0000
MyčkasfiltremjevefirměWelserProfi- lezapojenaprůměrněšestdnůvtýdnu ve dvousměnném provozu.
15.7500
Principu tryskání suchého ledu využívá např. strojAeroC100,cožjeflexibilnímobilní
zařízení,vhodnéproveškeréprůmyslovéprostory.
14.3333
Několik technicko-hospodářských pracovníků.
13.5714
Média www.mondotimes.com/1/world/mx, www.abyznewslinks.com/mexic.htm - přehled mexických médií.
13.5000
Tímto způsobemsedajíodstraňovatipoměrně velké otřepy na povrchu obrobků anebonástrojů(odtřepení,odhrotování, odbřitování,
odjehlování).
13.3750
Poslední „demokratická“ dvacetiletka je nejvýmluvnějším ukazatelem“demokratičnosti“ „demokratického“ světa.
12.5000
Slovensko-maďarské vztahy potřebují „restartovat“.
12.2500
Podle průzkumu serveru e-shopy-chovani-zakaznika.
12.2500
Zároveň schválila klimaticko-energetický balíček.
12.0000
"Restrukturalizace společnosti nadále pokračuje.
12.0000
Funguje to systémem pokus-netrefa-pokus-netrefa.
12.0000
Kontaktní centrum zaměstnanosti neposkytuje pracovně-právní poradenství.
12.0000
Pokud máte zájem o cvičení v Otrokovice: HUFOTRmezeraODPOVĚĎmezeraJMÉNOmezeraPŘIJMENÍmezera
ADRESAmezeraPSČ.
12.0000
Veškeré informace zákazníci najdou na www.t-mobile.cz/virtualniustredna.
12.0000
Více informací na www.czechtrade.cz/info/design.
11.8333
Mnohonárodnost kazachstánské společnosti předurčila politiku tolerance.
11.8000
Antidemokratické "alternativy" nejsou jednoznačně odmítány.
11.7778
Pokud máte zájem o cvičení v Bohumíně: HUFBOHmezeraODPOVĚĎmezeraJMÉNOmezeraPŘIJMENÍmezera
ADRESAmezeraPSČ.
11.7500
Restrukturalizace společnosti nadále pokračuje.
11.6364
Extraliga žen: Prostějov–Brno, Liberec–Přerov, Střešovice–Frýdek-Místek, Olomouc–Slavia Praha, Olymp Praha–Ostrava
(všichni 17).
11.6000
Média www.onlinenewspapers.com/serbia.htm - přehled novin.
11.6000
Nejúžasnějším dobrodružstvím je dobrodružství skutečnosti.
11.6000
Pro mnoho saúdskoarabských konzervativců nepředstavitelné.
11.6000
Společnost PricewaterhouseCoopers provedla vlastní výzkum.
11.6000
Stále bombarduje veřejnost protikomunistickou propagandou.
267
Appendix to ces news 2010: Sentences with high average word length
Appendix to ces news 2010: Sentences with high
average word length
25 sentences with highest average word length
avg. word length
sentence
17.3333
Ve skutečnosti šlo o irácko-britsko-francouzsko-holandsko-palestinsko-spojenoarabskoemirátskou produkci.
16.0000
Dále-zde máme další skupinku modelek-možná lepších-Minářová-Průšová-Hrbková-Kobzanová-Dvořáková.
15.5000
Přesto www.klepalsoftware.cz/liga.aspx Bohužel, (http:/ / adler.
14.6000
Město, Štěpánkovice-Šilheřovice, Bohuslavice-Ludgeřovice (všichni 15.30).
14.3333
Ženyjsouiprotoaktuálnímtématem číslo jedna.
14.0000
My jsme měli ve firmě nastavenýchpětkritérií,kterájsemmuselsplnit,abychdostalprémie.
13.6667
Margaret Thatcherová stejně jako Angela Merkelovámohoubýtpříklademvítěznýchvůdkyň.
13.6000
Největší, nejdražší, nejnavštěvovanější, nejlepší, nejekologičtější.
13.5000
AktuálněNejčtenějšíDiskutované Jacksonománie se vrací.
13.1250
JenžejakoujevůdkyníprezidentkaArgentinyCristine Fernándezová, která chce vykrást vlastní centrální banku?
13.0000
AktuálněNejčtenějšíDiskutované Škoda přepisuje prodejem historii.
13.0000
NejčtenějšíDiskutovanéAktuálně Škoda přepisuje prodejem historii.
12.8333
AktuálněNejčtenějšíDiskutované Facebook představil nové komunikační možnosti.
12.8333
Přehled ubytovacích kapacit hledejte na http://www.zulovsko.cz/ubytovani.htm.
12.8000
AktuálněNejčtenějšíDiskutované Chceme Vietnamce, inzerují firmy.
12.8000
Další informace naleznete na http://www.hochtief-development.cz.
12.6000
AktuálněNejčtenějšíDiskutované Přidáno dostane většina učitelů.
12.5714
USA náš vzor (gojjim naches) http://www.outsidermedia.cz/Veznice-v-Arizone-1.aspx Jistě.
12.2500
AktuálněNejčtenějšíDiskutované Concorde se vrací.
12.2500
Důchody, školství, zdravotnictví, infrastruktura.
12.0000
AktuálněNejčtenějšíDiskutované Daňová složenka zdarma končí.
12.0000
AktuálněNejčtenějšíDiskutované Fotbalová Plzeň zase kraluje.
12.0000
Bezplatně registrovat se můžete na www.oracle.com/goto/cz/oracleday2010.
12.0000
NejčtenějšíDiskutovanéAktuálně Daňová složenka zdarma končí.
12.0000
Pochopitelně slabého, pochopitelně místního nefiltrovaného kvasnicového.
268
Appendix to ces news 2011: Sentences with high average word length
Appendix to ces news 2011: Sentences with high
average word length
25 sentences with highest average word length
avg. word
length
sentence
14.7500
Více informací na www.dpp.cz/soutez-namalujte-svou-tramvaj.
14.6667
Více na www.shopper-marketing.retailinfo.cz.
14.3333
Více na www.retail-in-detail.retailinfo.cz.
14.0000
AktuálněNejčtenějšíDiskutované Portugalským prezidentem zůstává Silva.
13.5000
AktuálněNejčtenějšíDiskutované Nejvyšší soud ustoupil.
13.4375
Mezi důležité dálniční trasy řadí spojení Praha-Plzeň-Norimberk, Praha-Ústí nad Labem-Drážďany, Praha-Hradec
Králové-Trutnov-Legnica, Praha-Brno-Přerov-Hranice-Ostrava-Katovice, Brno-Mikulov-Vídeň a Brno-Bratislava.
13.2667
Důležité železniční trasy podle EU jsou Berlín-Ústí nad Labem-Praha-Česká Třebová-Brno-Břeclav-Vídeň, Břeclav-Bratislava,
Norimberk-Cheb-Plzeň, Mnichov-Domažlice-Praha a Brno-Přerov-Ostrava-Katovice.
13.2000
"Vládo-začni-uvažovat-selským-rozumem," frázoval v závěru projevu.
13.0000
AktuálněNejčtenějšíDiskutované Lukašenko nechal zatknout desítky demonstrantů.
13.0000
AktuálněNejčtenějšíDiskutované Velikáni, kteří pamatují historii.
12.8182
Pavlovice-Bořetice, Kyjov-Břeclav B (oba 10.15), Tvrdonice-Rohatec, Dražovice-Lanžhot, Kostice-Bučovice, Vacenovice-Mutěnice
(všichni 15.30).
12.7143
Tradičně nebude chybět pokračování divadelního sitkomu Jožkalipnikjebožíčlověkaneumílhát!
12.5714
Více informací na www.dpp.cz/soutez-namalujte-svou-tramvaj. Článek neobsahuje komentáře.
12.5556
Meziříčí, Hartvíkovice—Budišov-Nárameč, Bohdalov-Náměšť nad O., Přibyslavice-Kouty, Třešť-Bedřichov (všichni 16).
12.5000
Perspektivníjsou nebolestivé mikrojehličky nebo využitínanotechnologií ve výrobě aplikačníchsystémů.
12.3333
Neochota,nekompetentnost,ubohé technické znalosti personálu na prodejnách.
12.2500
AktuálněNejčtenějšíDiskutované Dráhy mění stroje.
12.2500
AktuálněNejčtenějšíDiskutované Máte dobrou práci?
12.2500
NejčtenějšíDiskutovanéAktuálně Máte dobrou práci?
12.2500
UPOZORNĚNÍ: Informace přinesla protivládní aktivistická "informačně-analytická agentura" Armtoday.
12.2000
NejnovějšíNejčtenějšíVýběr Krize (ve zdravotnictví) skončila?
12.1667
AktuálněNejčtenějšíDiskutované Hasiči vyhlásili nejvyšší stupeň poplachu.
12.1667
Více na www.shopper-marketing.retailinfo.cz. Článek neobsahuje komentáře.
12.0000
AktuálněNejčtenějšíDiskutované Japonsko pošle stovky miliard provozovateli Fukušimy.
12.0000
AktuálněNejčtenějšíDiskutované Klaus: Reformy jsou nezbytné.
269
Appendix to ces news 2012: Sentences with high average word length
Appendix to ces news 2012: Sentences with high
average word length
25 sentences with highest average word length
avg. word
length
sentence
21.2500
Více informací na: www.nadacepartnerstvi.cz/grantova-vyzva-nestle-pro-vodu-v-krajine.
14.2500
Jestli Parkanovou,tak potom Vondra,Drobil,Gross,Paroubek!
14.0000
Titulní stranaFotbalZahraničíŠpanělsko825 milionů ročně.
13.7500
Titulní stranaFotbalZahraničíŠpanělskoJá jsem nejlepší!
13.2500
Zbohatlík,lobista,poslanec či politická nomenklatura?
13.2000
Pomlouvání,napadání,zavírání nebo vyhazování oknem,ovšem základní.
12.8000
Titulní stranaFotbalZahraničíAngliePoslední šance koupit Téveze.
12.7500
RádceZdravíNejvětší nesmysly reformy zdravotnictví!
12.7500
Titulní stranaFotbalZahraničíAnglieHenry je zpátky!
12.6667
Titulní stranaFotbalZahraničíŠpanělskoGuardiola: Messiho už nikdo nepřekoná.
12.6667
Více informací na www.electroncz.cz, www.forenergo.cz, www.forautomation.cz.
12.5000
Osmapadesátiletý majitel zemědělsko-potravinářsko-chemického uskupení Agrofert vykročil do politiky.
12.5000
Osobních, byznysových, politických, mezinárodních.
12.4000
Bližší informace jsou na www.railconference.com/iric-2012/cz/.
12.4000
Nevzdělance potřebují hlavně novodobí komsomolci/kapitalisti,.
12.4000
Titulní stranaFotbalReprezentaceBílkova budoucnost je nejistá.
12.4000
Titulní stranaFotbalZahraničíAnglieLiverpoolu se vrací Suaréz.
12.2500
Jsou mezinárodní, multikulturní, multináboženští.
12.2500
Podrobnosti nabízí stránky www.divadelniflora.cz.
12.2500
Tak kdepak jste, Amerikowallstreetococacolobijci?
12.2500
Titulní stranaHokejReprezentaceYzerman je zpátky.
12.2500
Vašíček, hruška,malec,balej,koreis, zohorna,čermák, dlouhý,divíšk, největší čuráci Českého hokeje.
12.2000
"Ministerstvo spravedlnosti určitě nepostupovalo spravedlivě.
12.1000
Více informací naleznete na webu www.skola.petr-cech.cz a facebookovém profilu www.facebook.com/fotbalovaskolapetracecha.
12.0000
Jistě znáte postup učení, kdy je žák nejprve neuvědoměle-nekompetentní, uvědoměle-nekompetentní, uvědoměle-kompetentní,
neuvědoměle-kompetentní.
270
Appendix to ces newscrawl 2011: Sentences with high average word length
Appendix to ces newscrawl 2011: Sentences with
high average word length
25 sentences with highest average word length
avg. word
length
sentence
86.0000
a¯lpaƒa¡n-fermonovaƒa½-lapaa„a/index.htmlces
19.0000
Ve Francii,Belgii,Nizozemsku,Dánsku,Rakousku,Švýcarsku,Lucembursku a Polsku.
18.6667
Jinak ostatní nemastní,neslaní,zapšklí,zakyslí,náladoví.
16.7500
Začínalo to nějak takhle:"VuG+ZW7hIHBhbu0sIHbhvmVu/SBwYW5lLDxicj4".
16.0000
Dále-zde máme další skupinku modelek-možná lepších-Minářová-Průšová-Hrbková-Kobzanová-Dvořáková.
15.8000
Produktivitu práce ovlivňuje:organisace práce,technologie,vyspělost pracovníků.
15.5000
2010 22:57 Dnes se mi libila:podlaha,koberec, malba,tapety,postel,lustr,police,dekorace,celkovábarevnost,vnitřní uspořádání.
14.8000
Tolik autobusů nemá ani Student-Agency-včetně-vagónen-express-huikarii-ČD.
14.6667
Co třeba akcie,výhra,restituce,dědictví,atd.
14.6667
USA,Evropa,Rusko,Japonsko,Čína,snad i Indie.
14.4286
A mají různé druhy,oříškovou,vanilkovou,humanitární,nemocniční,islamisickou,jakou chcete či nechcete.
13.9091
Se spojovníkem tedy píšeme např. výrazy organizačně-správní, společensko-politický, literárně-hudební,
urbanisticko-architektonický, analogově-číslicový.
13.6364
Dotazy: www.roztleskavacky-kiki.estranky.cz nebo na [email protected] Email: [email protected]
Potřebujete pohlídat Vaše dítě?
13.6000
Pokud, nás reprezentují takový Rímanové,Nečasové,Bártové,Kalouskové.
13.5000
Jinak musím opakovat,šmrncovní paní,milá,inteligentní.
13.3750
Jejich špatná rozhodnutí skončila prohranými arbitrážemi,rozkradenými kampeličkami,zbankrotovanými podniky.
13.2857
Lipa,Globuska,Startka,Sparta,Petra,Clea,Bridge - máte pravdu,představivosti se meze nekladou.
13.2000
Hydrokinezioterapii nabízejí některá fyzioterapeutická pracoviště.
13.1667
Jezdili jsme v ten kraj vždy stejnou cestou: Počátky-Jindřichův Hradec-Týn nad
Vltavou-Vodňany-Bavorov-Volyně-čestice-Dobrš-Strašín-Sušice-Zbynice-Velhartice.
13.0000
Označit příspěvek jako nevhodný Himlhergotdonrvetrkrucajselement.
13.0000
Podle svých možností,třeba,nezištně,pomáhat raněným.
13.0000
Webový speciál www.ceskatelevize.cz/20filmovychsezon je průběžně aktualizován.
12.8000
!a lidi jako nečas,kalousek,bárta,dobeš,topol,íčko langer,klaus.
12.8000
Internetové stránky www.hasicibrandys.cz pravidelně aktualizuje.
12.8000
Majoránku,libeček,petrželku,kmín,pepř,papriku ale to ostatní ne.
271
Appendix to ces newscrawl 2012: Sentences with high average word length
Appendix to ces newscrawl 2012: Sentences with
high average word length
25 sentences with highest average word length
avg.
word
length
sentence
41.6667
Re: Nevim jestli je cestine ''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''
41.6667
Re: Nevim jestli je cestine
'''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''presny'''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''
27.0000
Re: O''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''Bamovi, zdá se, něco dochází.
26.0000
Já jsem chytrý,šikovný,vnímavý,ohleduplný,ušlechtilý,velkomožný,bystrý,krásný.
25.1429
I. SchmalzkopfRe: O''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''Bamovi, zdá se, něco dochází.
18.8333
Dnes se mi libila:podlaha,koberec, malba,tapety,postel,lustr,police,dekorace,celkovábarevnost,vnitřní uspořádání.
18.6667
Jinak ostatní nemastní,neslaní,zapšklí,zakyslí,náladoví.
17.2500
To bylo například samé:postél,přípravá,fájn,dělát,udělalá,dochutilá,.
16.7500
Jelítka jako zbytek soutěžících-závistivá,nepřející,afektovaná,zlá.
16.7500
Začínalo to nějak takhle:"VuG+ZW7hIHBhbu0sIHbhvmVu/SBwYW5lLDxicj4".
16.5714
Dělá Vám to v MODROVIZI radost Ratatatatatatatatatatatatatatatatatatatatatatataatatatataatatataatatataatatatatatata!
16.3333
Re: O''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''Bamovi, zdá se, něco dochází.
15.8333
Do dnesniho dne vlastnime 70kusu koz,15ovci,2jalovice,30slepic,Xkřepelek,Xperliček,Xholubu,atd.
15.8000
Dotazy: www.roztleskavacky-kiki.estranky.cz nebo na roztleskavacky-kiki@seznam.
15.7500
Komandovat,popohánět,sekýrovat,poučovat,ponížovat-to by jí šlo.
15.1429
P. BurešRe: O''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''Bamovi, zdá se, něco dochází.
14.6000
Na první pohled hospodský typ,nepříjemná,protivná,jednoduchá,prostoduchá.
14.5000
Jediná slušná,objektivní,charakterní,ovládající se člověk.
14.3333
Jde o zkratku termínů Česko-Lidskost-Odpovědnost-Všichni-Evropa-Křesťanská demokracie.
14.2500
Ke stolu šla neupravená,zpocená,rozcuchaná,upachtěná-děs.
14.2500
Nadutost,arogance,netaktnost,povyšování se nad ostatními.
14.2500
Restaurace,hotely,bary,obchody přijdou o zakazníky,tržby.
14.2000
Normální lidi podle emfelixe:estébáčtí práskači,pomocníci VB,kádrováci,politruci,absolventi Vokovické Sorbonny,alkoholici na
socce,závistivci.
14.0000
Další informace na www.spolekbrevnovskychzivnostniku.cz.
14.0000
Zdeněk vařil obyčejně,klasické menu pořadu Prostřeno:vývar,rolka,pudingovka,závitek.
272
Appendix to ces wikipedia 2007: Sentences with high average word length
Appendix to ces wikipedia 2007: Sentences with
high average word length
25 sentences with highest average word length
avg. word
length
sentence
18.1429
Domácí obyvatelstvo jméno používá v podobě
Taumatawhakatangihangakoauotamateturipukakapikimaungahoro-Nukupokaiwhenuakitanatahu.
13.3000
Městem prochází silnice II/210 v trase Krsy-Úterý-Teplá-Mnichov (okres Cheb)-Prameny-Sokolov-Rotava-Kraslice-HP
Kraslice/Klingenthal.
12.7500
Ekonomka-kybernetička, kandidátka ekonomických věd.
12.6667
Chemicky se jedná o 3-oxo-2-(2‘-cis-penetnyl)cyklopentan-1-octovou kyselinu.
12.4286
Moskovsko-Petrogradskaja (rusky Московско-Петроградская) je linka petrohradského metra.
12.4286
Něvsko-Vasileostrovskaja (rusky Невско-Василеостровская) je linka petrohradského metra.
12.4286
Československá národní demokracie byla prvorepubliková konzervativně-nacionální strana.
12.4000
Distribuční funkce exponenciálního rozdělení pravděpodobnosti.
12.0000
Domácí stránka projektu: http:/ / gaim-encryption.
12.0000
Hypergeometrické rozdělení pravděpodobnosti je příkladem diskrétního rozdělení pravděpodobnosti.
12.0000
Internacia Fervojista Esperanto-Federacio (IFEF) Mezinárodní železničářská esperantská federace.
12.0000
Multinomické rozdělení pravděpodobnosti představuje zobecnění binomického rozdělení.
12.0000
Nejrozšířenější náboženství je římsko-katolické.
12.0000
Tato reakce je zajišťována enzymem glyceraldehyd-3-fosfátdehydrogenázou.
12.0000
V Novosibirsku jsou čtyři železniční nádraží: Novosibirsk-Glavnyj, Novosibirsk-Zapadnyj, Novosibirsk-Južnyj a
Novosibirsk-Vostočnyj.
11.8571
PrvniBean session Uvědomte si, že beany běží na serveru, ne u uživatele.
11.8571
Zajímavou architektonickou památku představuje palác prezidenta Houphoëta-Boignyho.
11.8333
Strana sleduje středovou křesťansko-demokratickou politickou orientaci.
11.8333
Československá společnost (Sociologická analýza sociální stratifikace).
11.7778
Tato reakce nastává v uspořádání reaktantů suprafaciální-suprafaciální nebo antarafaciální-antarafaciální.
11.6667
Blacksmith-hammer-anvil-50x50.png Tento technologický článek je pahýl.
11.6667
Nejjednodušší kadencí je postup S-T-D (subdominanta-dominanta-tónika).
11.6667
Provozovatelem je Oberelbische Verkehrsgesellschaft Prirna-Sebnitz mbH (Hornolabská dopravní společnost).
11.6000
Je součástí radioizotopového termoelektrického generátoru.
11.6000
Jeho systematický název je bis(η5–cyklopentadienyl)železo.
273
Appendix to ces wikipedia 2012: Sentences with high average word length
Appendix to ces wikipedia 2012: Sentences with
high average word length
25 sentences with highest average word length
avg.
word
length
sentence
19.8571
Sky je největší http://www.parabola.cz/zpravicky/9747/nejvetsi-pay-tv-platformou-v-evrope-nadale-sky-digital/ evropská satelitní
platforma.
18.1429
Domácí obyvatelstvo jméno používá v podobě
Taumatawhakatangihangakoauotamateturipukakapikimaungahoro-Nukupokaiwhenuakitanatahu.
17.5000
Pořadí po prvním kole:Stoner,Pedrosa,Vermeulen,Rossi,Edwards,Melandri.
17.1667
Vystupuje na domácích i zahraničních pódiích/Rakousko,Španělsko,Švýcarsko,Německo,Anglie,Belgie,USA,ad.
16.5385
Metronews http://www.metronews.ca/toronto/world/article/421303--doctors-without-borders-loses-all-three-hospitals-in-haitian-quake
Kanceláře Citybank v Port-au-Prince byly zničeny a pohřešuje se několik zaměstnanců.
15.0000
“ http://www.novinky.cz/domaci/168487-my-vime-co-je-biomasa-utahuje-si-zubova-z-jacques.html 18. září 2009 bylo odvysíláno
dvousté pokračování pořadu.
14.3333
Další fotografie File:CharlesBridge-Prague.
14.1667
Během slavnostního večera obdržela i titul Miss Silueta
http://www.super.cz/co-se-kde-sustne/14134-miss-cr-vitezkou-se-stala-vnadna-katerina-sokolova.html a Miss Bohemia.
13.6250
DDT, plným názvem 1,1,1-trichlor-2,2-bis(4-chlorfenyl)ethan, je aromatická halogensloučenina (organochlorid).
13.6250
Odkazy Reference poslední 11. odkaz http://www.udi-praha.cz/Rocenky/sbornik05/tema4/apraha4.htm je nefunkční.
13.6000
Jsou to glukóza-6-fosfát, fruktóza-6-fosfát, glyceraldehyd-3-fosfát.
13.5000
Algoritmy České neuropsychofarmakologické společnosti.
13.5000
Později získala jméno Friedrich-Alexander-Universität.
13.4444
Související články * Kompresor (motor) Reference * Turbokompresor, http://www.autoabeceda.cz/co-je-to/turbokompresor.htm.
13.2500
Je členkou Orla a Junáka (její skautská přezdívka je Madam
http://www.ct24.cz/domaci/13012-ve-skautskych-krojich-prisli-do-snemovny-stary-pes-madam-i-braca/ ).
13.1667
Nejběžnějšími typy jsou „application/pgp-encrypted“ a „application/pkcd7-mime“.
13.1429
" http://www.amnesty.cz/zpravy/AI-haji-pravo-volby-pro-ohrozene-zeny/ Amnesty International zdůvodňuje svoje rozhodnutí
stigmatizací žen po znásilnění umocněnou následným těhotenstvím.
13.0000
Broskvová kůže z polyamidového filamentu :
http://www.hobby-g.cz/143-Spaci-pytle/3653-Ehmmans-spaci-pytel-Pro-Zone-4-Season-Sleeping-Bag.html • Velveton je imitace
sametu podobná jelenicové kůži.
13.0000
Chemicky se jedná o 3-oxo-2-(2‘-cis-penetnyl)cyklopentan-1-ethanovou kyselinu.
13.0000
Geniální tvůrce byl francouzsko-rusko-holandsko-italského původu.
12.8750
Němečtí vysídlenci byli přepravováni do dnešního Německa http://expulsion-nemcu-po-druhe-svetove-valce.
12.8750
Současně organizuje výstavy http://www.folklorweb.cz/clanky/20070423.php a tematické vzdělávací pořady.
12.8333
Vacciniaceae%20-%20Psammisia%20sclerophylla.htm obrázek a popis na meemelink.
12.7500
Ekonomka-kybernetička, kandidátka ekonomických věd.
12.6667
Byl dopisovatelem Amerikánsko-slovenských novin (americko-slovenské noviny).
274
Appendix to ces web 2002: Sentences with high average word length
Appendix to ces web 2002: Sentences with high
average word length
25 sentences with highest average word length
avg.
word
length
sentence
46.0000
Hrají: Holubová-Budař-Procházková-Chmela-Čtvrtníček-Maděričová-Hybner-Palatý-Prakesch-Kudla.
41.0000
Pokoje: komfortní,klimatizace,koupelna,WC,telefon,televize,balkon,diskotéka,butik.
40.0000
Vlastnosti: ctižádostivý,usilovný,vytrvalý,uzavřený,spolehlivý,praktický,šetrný.
40.0000
Vlastnosti: pravdomluvnost,veselost,vášnivostvýbušnost,netaktnost,lehkomyslnost.
39.0000
Sestava:Samec-Zuska(12.min. Teichmann)-Purkrábek,Mojžíš,Swider- Vacek,Klimt,Pačes-Lerch(46.min.Krtek),Maštalíř,Urban.
35.0000
Lucentini,Franco,1922-Lucký,Zdeněk,1925-Lucretius Carus,Titus,zemř.Kr.
33.5000
Přístroje: rychloměr,výškoměr,variometr,sklonoměr,kompas,palivoměr.
33.0000
Hrají: Málková-Chmela-Drabiščáková-Suchařípa-Klepl-Dobrý-Kotrbová.
29.0000
Krčálová,Jarmila,1928-Krček,Karel,1938-Krčil,Bohumil 'Bob'
28.7143
Rad.RumburkRužomberokRychnov n/Kn.RýmařovŘevniceŘíčky v Orl.
h.SaalbachSaalfeldenSalzburgSázavaSedlčanySedliceSemilySchwarzachSlanýSlapy ŽivohošťSmržovkaSněžnéSobotkaSokolovSoláňSöldenSoleniceSrníSt.
26.5714
SEVERNÍ DALMÁCIE: Praha-České Budějovice-Dolní Dvořiště-Wien-Graz-hraniční přechod
Spielfeld/Šentilj-Maribor-Zagreb-Karlovac-Slunj-Plitvice-Gračac-Maslenica-Zadar-Biograd-Vodice-Šibenik.
25.5000
Mahler,Oldřich Mahler,Zdeněk,1928-Mahler,Zdeněk,jr.
25.5000
PříjmeníJménoTyp kluzákuImatrikulaceSČAeroklubKoef.
25.0000
Miroslav-Tetčice-Velké Bíteš-Třebíč-Vranovská přehrada-Jevišovice-Miroslav.
25.0000
Pokoje: klimatizované,koupelna,WC,balkon,televize.
25.0000
Skříčka,Metoděj Skřivan,Aleš,1944-Skřivan,Aleš,jr.
24.6667
Halámek,Zdeněk,1943-Haĺamová,Maša,1908-Halas,František Halas,František st.
24.5000
Brno-Bratislava(SR)Pecz-Harkany(HUN)-Dolni Miholjac-Našice-Slavonski Brod (BiH)-Bosanski
Brod-Doboj-Zenice-Sarajevo-Mostar-Metkovič(HR)-Černá Hora.
24.5000
Kotek,Petr,1963-Kotek,Zdeněk,1924-Koten,Milan ml.
24.5000
Restaurace-míst:Centrální poloha:Parkoviště:Koup.
24.3333
Holzbecher,Záviš,1918-Holzknecht,Václav,1904- Homéros,činný 8.stol.př.Kr.
24.0000
MikulášLiptovský JánLíšniceLitoměřiceLitomyšlLitvínovLnářeLoferLoučná p.
23.6000
Předpoklady pro povolání: lékař,právník,umělec,spisovatel,programátor,učitel, obchodník,lékárník,zahradník,nakladatel.
23.5000
Prac.v obl.účetnictví,faktur.,rozpočet.,kalkul.
23.0000
Braniš,Martin,1952-Branišová,Eva Branner,H.Ch.
275
Appendix to ces web 2011: Sentences with high average word length
Appendix to ces web 2011: Sentences with high
average word length
25 sentences with highest average word length
avg. word
length
sentence
21.6667
Instituce,asociace,školení,konzultace,sociální odpovědnost firem.
19.8889
Jedenáctičlenná kapela plastikovskéhoundergroundu s velice"plastickým"zvukem díky bohatému nástrojovému
obsazení:kytara,basa,bicí,klávesy,klarinet,flétna,viola,xylofon,djembe.
19.0000
Tato stránka bude věnována-muzice,seriálům,celebritám,superstar,radám,škole.
18.8000
Je to známé klišé "neberte-je-vážně-oni-se-jen-chtějí-hádat-o-tom-kdo-je-nejlepší-anarchista".
18.6000
Vyrážíme směr Tábor ve složení:Mářa(FZR600),Méďa(GS500),Míma(GPZ500),Urby(SV650)Zero(NTV650).
18.5000
Kompletní zabezpečení objektů EZS,EPS,CCTV,návrhy,revize,servis,prohlídky.
18.2000
Byly to dvojice Jarmil-Čenda,Cecyl-Míra,Heřman-Pája, Chrudoš-Mára,Olin-Votok,Helmut-Chilli.
18.0000
Je to známé klišé "neberte-je-vážně-oni-se-chtějí-hádat-o-tom-kdo-je-nejlepší-anarchista".
17.7500
Vzor zprávy: TÝM:TÝM výsledek, 1x1:jméno:jméno výsledek,2x2:jméno,jméno-jméno,jménovýsledek,
3x3:jméno,jméno,jméno-jméno,jméno,jméno výsledek.
16.8889
Prodej sušených bylinek-prvosenka,pampeliška,dobromysl,sléz,mateřídouška,květ hluchavky,sušené borůvky,světlík,kontryhel,další
druhy bylinek dle dohody.
16.8571
Přijímáme tyto poukázky:vlastní naší domácí lékárny,Compliments,(Accor),VitalPass,FlexiPass,Unišek,Cadhoc,Tiket multi.
16.8000
Administrativa,přepisy textů,zpracování,archivace,kontrola podkladů pro účetnictví,.
16.8000
Značky oblečení jsou RipCurl,Funstorm,Nugget,Burton,Sam73,Timeout, Fishbone,Reojice.
16.6000
Jede to nějak jako Studénka-Suchdol-Hranice-Přerov-Nezamyslice-Kojetín-Vyškov-Brno.
16.4000
Vybírejte z mnoha produktů boty,trička,mikiny,bundy,šortky,tašky,kopačky,chrániče.
16.3333
MíruVaníčkovaVejdovskéhoVelkomoravskáVelký ÚjezdZeyerovaZámečnickásloupy veřejného osvětlení a tr.
16.2500
Poptáváme: výpočetní techniku, desky tištěných spojů,paměti(ramky), procesory,mobilní telefony,elektromotory,startéry,alternátory.
16.0000
MíruVaníčkovaVejdovskéhoVelkomoravskáVelký ÚjezdZeyerovaZámečnickákruhový objedzsloupy veřejného osvětlení a tr.
16.0000
Spn Praha r.1983,15kč,Němčina pro III.roč.SŠ-Zapletal,Jungwirth,Haupt,Vyd.SPn Praha,r.1982-10kč.
15.7500
Pro podrobnosti navštivte www.sonnettech.com/support/temporaid.
15.6000
Dálnice D8 je součástí IV. Evropského multimodálního dopravního koridoru
Berlín–Drážďany–Praha–Bratislava–Györ–Budapešť–Arad–Craiova–Sofie–Plovdiv–Istanbul.
15.6000
Dotazy můžete směrovat na aubrech(zavinac)labe(tecka)felk(tecka)cvut(tecka)cz.
15.5000
Podívejte se na nové fotky: www.karlin.mff.cuni.cz/~stanovsk/cesty/fotky/novosib/stolby.html.
15.5000
Požadujeme skvělé komunikativní jednání s klienty,asertivita,oddanost,loajalita,spolehlivost.
15.3333
Mám i trička,sukně,tepláky,čepice,hračky,boty.
276
Appendix to ces web 2012: Sentences with high average word length
Appendix to ces web 2012: Sentences with high
average word length
25 sentences with highest average word length
avg. word
length
sentence
21.6667
Instituce,asociace,školení,konzultace,sociální odpovědnost firem.
20.5000
Počasí,lidi,koupání,kempy,penziony,sklípky,víno,borovička,Jameson a vůbec všechno.
19.8889
Jedenáctičlenná kapela plastikovskéhoundergroundu s velice"plastickým"zvukem díky bohatému nástrojovému
obsazení:kytara,basa,bicí,klávesy,klarinet,flétna,viola,xylofon,djembe.
18.8000
Je to známé klišé "neberte-je-vážně-oni-se-jen-chtějí-hádat-o-tom-kdo-je-nejlepší-anarchista".
18.5000
Kompletní zabezpečení objektů EZS,EPS,CCTV,návrhy,revize,servis,prohlídky.
18.0000
Je to známé klišé "neberte-je-vážně-oni-se-chtějí-hádat-o-tom-kdo-je-nejlepší-anarchista".
17.7500
Vzor zprávy: TÝM:TÝM výsledek, 1x1:jméno:jméno výsledek,2x2:jméno,jméno-jméno,jménovýsledek,
3x3:jméno,jméno,jméno-jméno,jméno,jméno výsledek.
17.6667
Cena výcvikuČlenovéZávodyFoto-Video-galerieMám dotaz.
17.4286
Hraješ-li na housle,čelo,akordeon,flétnu,klarinet/či jiné dechy/,didgeridoo,basu,kontrabas/překvapením se nebráníme/,příp.
17.1250
Balíček obsahuje 3kalhoty,1komplet šaty-leginy,bunda bez rukavu,1šaty,2šatovky,1džínový
koplet,1sukně,4kratasky,2halenky,2capačky vel.17.
17.0000
Má digitální měřič-tepová frekvence,rychlost,čas,vzdálenost,kalorie.
16.9091
6.železniční stanice Popelín-Česká Olešná-Strmilov-Zahrádky-Domašín-Horní Pole-Světlá-Lhotka-Řásná-Velký pařezitý
rybník-Míchova skála-Javořice-Horní Dubenky-železniční stanice Jihlávka.
16.8571
Přijímáme tyto poukázky:vlastní naší domácí lékárny,Compliments,(Accor),VitalPass,FlexiPass,Unišek,Cadhoc,Tiket multi.
16.8333
FotogalerieTestyAutonovinkyVeterániPro motoristyTV tipyDoporučujemeOstatníMotosport nyní na MOTORMIX.
16.8000
Administrativa,přepisy textů,zpracování,archivace,kontrola podkladů pro účetnictví,.
16.7500
BIONmedzeraKÓDmedzeraMENOmedzeraPRIEZVISKOmedzeraPSČ na číslo 7503.
16.6667
Pro děti trampolína,kolotoč,prolézačky,pískoviště.
16.6000
Jede to nějak jako Studénka-Suchdol-Hranice-Přerov-Nezamyslice-Kojetín-Vyškov-Brno.
16.4000
Děkujeme všem pořadatelům,organizátorům,vystupujícím,sponzorům,zak ráááásný večer.
16.4000
Vybírejte z mnoha produktů boty,trička,mikiny,bundy,šortky,tašky,kopačky,chrániče.
16.2500
Poptáváme: výpočetní techniku, desky tištěných spojů,paměti(ramky), procesory,mobilní telefony,elektromotory,startéry,alternátory.
16.0000
Nejlépe emailem na správce: petrkovarvsbcz nebo daliborlukasvsbcz.
16.0000
Nový olej,filtry,termostat,baterie,zadní světla.
15.8571
਀䴀愀琀攀爀椀氀 漀搀攀猀氀洀 戀攀稀 瀀夀攁搀挀栀漀稀栀漀 稀愀瀀氀愀挀攀渀Ⰰ 愀戀礀挀栀 甀爀礀挀
栀氀椀氀 搀漀搀渀 戀愀氀Āku a platbu předpokládám během 10 dní.
15.7500
Pro podrobnosti navštivte www.sonnettech.com/support/temporaid.
277
Appendix to ces mixed 2012: Sentences with high average word length
Appendix to ces mixed 2012: Sentences with high
average word length
25 sentences with highest average word length
avg. word
length
sentence
46.0000
Hrají: Holubová-Budař-Procházková-Chmela-Čtvrtníček-Maděričová-Hybner-Palatý-Prakesch-Kudla.
41.0000
Pokoje: komfortní,klimatizace,koupelna,WC,telefon,televize,balkon,diskotéka,butik.
40.0000
Vlastnosti: ctižádostivý,usilovný,vytrvalý,uzavřený,spolehlivý,praktický,šetrný.
40.0000
Vlastnosti: pravdomluvnost,veselost,vášnivostvýbušnost,netaktnost,lehkomyslnost.
39.0000
Sestava:Samec-Zuska(12.min. Teichmann)-Purkrábek,Mojžíš,Swider- Vacek,Klimt,Pačes-Lerch(46.min.Krtek),Maštalíř,Urban.
35.0000
Lucentini,Franco,1922-Lucký,Zdeněk,1925-Lucretius Carus,Titus,zemř.Kr.
33.5000
Přístroje: rychloměr,výškoměr,variometr,sklonoměr,kompas,palivoměr.
33.0000
Hrají: Málková-Chmela-Drabiščáková-Suchařípa-Klepl-Dobrý-Kotrbová.
29.0000
Krčálová,Jarmila,1928-Krček,Karel,1938-Krčil,Bohumil 'Bob'
28.7143
Rad.RumburkRužomberokRychnov n/Kn.RýmařovŘevniceŘíčky v Orl.
h.SaalbachSaalfeldenSalzburgSázavaSedlčanySedliceSemilySchwarzachSlanýSlapy ŽivohošťSmržovkaSněžnéSobotkaSokolovSoláňSöldenSoleniceSrníSt.
27.0000
Re: O''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''Bamovi, zdá se, něco dochází.
26.0000
Já jsem chytrý,šikovný,vnímavý,ohleduplný,ušlechtilý,velkomožný,bystrý,krásný.
25.5000
Mahler,Oldřich Mahler,Zdeněk,1928-Mahler,Zdeněk,jr.
25.5000
PříjmeníJménoTyp kluzákuImatrikulaceSČAeroklubKoef.
25.1429
I. SchmalzkopfRe: O''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''Bamovi, zdá se, něco dochází.
25.0000
Miroslav-Tetčice-Velké Bíteš-Třebíč-Vranovská přehrada-Jevišovice-Miroslav.
25.0000
Pokoje: klimatizované,koupelna,WC,balkon,televize.
25.0000
Skříčka,Metoděj Skřivan,Aleš,1944-Skřivan,Aleš,jr.
24.6667
Halámek,Zdeněk,1943-Haĺamová,Maša,1908-Halas,František Halas,František st.
24.5000
Brno-Bratislava(SR)Pecz-Harkany(HUN)-Dolni Miholjac-Našice-Slavonski Brod (BiH)-Bosanski
Brod-Doboj-Zenice-Sarajevo-Mostar-Metkovič(HR)-Černá Hora.
24.5000
Kotek,Petr,1963-Kotek,Zdeněk,1924-Koten,Milan ml.
24.5000
Restaurace-míst:Centrální poloha:Parkoviště:Koup.
24.3333
Holzbecher,Záviš,1918-Holzknecht,Václav,1904- Homéros,činný 8.stol.př.Kr.
24.0000
MikulášLiptovský JánLíšniceLitoměřiceLitomyšlLitvínovLnářeLoferLoučná p.
23.6000
Předpoklady pro povolání: lékař,právník,umělec,spisovatel,programátor,učitel, obchodník,lékárník,zahradník,nakladatel.
278
Appendix to ces news 2005-2007: Problems with sentence segmentation - words ending in a stopword
Appendix to ces news 2005-2007: Problems with
sentence segmentation - words ending in a
stopword
Most frequent words ending in a stopword. They usually contain uppercase letters as result
form missing blanks.
Stopword Concatenated word Frequency of stopword Frequency of concatenated word
Na
TyTNa
27436
8
Je
SavaJe
16789
5
Je
KoLeJe
16789
3
Appendix to ces news 2008: Problems with
sentence segmentation - words ending in a
stopword
Appendix to ces news 2009: Problems with
sentence segmentation - words ending in a
stopword
Most frequent words ending in a stopword. They usually contain uppercase letters as result
form missing blanks.
Stopword Concatenated word Frequency of stopword Frequency of concatenated word
Na
05:00Na
50540
23
Je
05:00Je
33005
13
Jak
05:00Jak
15776
9
Když
05:00Když
17885
9
Pokud
05:00Pokud
20066
6
Po
05:00Po
17116
5
Ve
05:00Ve
16286
5
Podle
05:00Podle
44122
4
To
05:00To
31257
4
Podle
KD│Podle
44122
3
Podle
ZDEPodle
44122
3
279
Appendix to ces news 2010: Problems with sentence segmentation - words ending in a stopword
Appendix to ces news 2010: Problems with
sentence segmentation - words ending in a
stopword
Most frequent words ending in a stopword. They usually contain uppercase letters as result
form missing blanks.
Stopword Concatenated word Frequency of stopword Frequency of concatenated word
Na
05:00Na
53791
26
Je
05:00Je
33772
20
Když
05:00Když
19182
13
Po
05:00Po
17797
12
Jak
05:00Jak
17043
11
Ve
05:00Ve
16627
10
To
2010To
32902
7
Pokud
05:00Pokud
20417
6
Za
05:00Za
15923
5
Podle
ZDEPodle
42248
5
Jak
2010Jak
17043
4
Dnes
05:00Dnes
16107
3
To
05:00To
32902
3
Když
05:01Když
19182
3
Ve
11:55Ve
16627
3
Na
12:27Na
53791
3
Na
12:30Na
53791
3
Na
13:30Na
53791
3
Na
14:12Na
53791
3
Na
18:00Na
53791
3
280
Appendix to ces news 2011: Problems with sentence segmentation - words ending in a stopword
Appendix to ces news 2011: Problems with
sentence segmentation - words ending in a
stopword
Most frequent words ending in a stopword. They usually contain uppercase letters as result
form missing blanks.
Stopword Concatenated word Frequency of stopword Frequency of concatenated word
Na
05:00Na
48758
8
Když
05:00Když
16794
6
Je
05:00Je
30061
4
Do
05:00Do
12501
3
Jak
05:00Jak
16035
3
To
05:00To
29952
3
Za
05:00Za
14921
3
To
2011To
29952
3
Appendix to ces news 2012: Problems with
sentence segmentation - words ending in a
stopword
Most frequent words ending in a stopword. They usually contain uppercase letters as result
form missing blanks.
Stopword Concatenated word Frequency of stopword Frequency of concatenated word
Jak
módyJak
14428
9
Když
celebrityKdyž
17353
6
To
celebrityTo
27233
4
Jak
SchönJak
14428
3
Jak
celebrityJak
14428
3
Když
hvězdyKdyž
17353
3
281
Appendix to ces newscrawl 2011: Problems with sentence segmentation - words ending in a stopword
Appendix to ces newscrawl 2011: Problems with
sentence segmentation - words ending in a
stopword
Most frequent words ending in a stopword. They usually contain uppercase letters as result
form missing blanks.
Stopword Concatenated word Frequency of stopword Frequency of concatenated word
To
atd.To
74808
7
Na
AKTUÁLNĚNa
109403
5
Na
eGONa
109403
5
Pokud
‑Pokud
40541
5
Po
AKTUÁLNĚPo
32574
4
To
CedivodaTo
74808
4
Je
DenemarkJe
66209
4
Pokud
DenemarkPokud
40541
4
To
DenemarkTo
74808
4
Na
GLOSANa
109403
4
Když
GLOSYKdyž
35338
4
Je
OrlíkJe
66209
4
Je
atd.Je
66209
4
Na
atd.Na
109403
4
Jak
BoublíkováJak
39379
3
Ve
CedivodaVe
29206
3
Ve
DRIVe
29206
3
Ale
DenemarkAle
46971
3
Na
FIRMYNa
109403
3
Je
GLOSAJe
66209
3
282
Appendix to ces newscrawl 2012: Problems with sentence segmentation - words ending in a stopword
Appendix to ces newscrawl 2012: Problems with
sentence segmentation - words ending in a
stopword
Most frequent words ending in a stopword. They usually contain uppercase letters as result
form missing blanks.
Stopword Concatenated word Frequency of stopword Frequency of concatenated word
To
DenemarkTo
81375
18
Tak
DenemarkTak
29908
16
To
NovákTo
81375
13
Pokud
DenemarkPokud
44038
9
To
atd.To
81375
9
Ale
DenemarkAle
54782
8
Tak
SchmalzkopfTak
29908
8
To
KulhánkováTo
81375
7
Ale
atd.Ale
54782
7
Tak
CedivodaTak
29908
6
To
CedivodaTo
81375
6
Ve
DRIVe
36131
6
Na
DenemarkNa
116692
6
Je
FarmačkaJe
76101
6
To
FeřtkováTo
81375
6
To
HouškaTo
81375
6
Je
OrlíkJe
76101
6
Tak
KlušákTak
29908
5
Tak
KomárekTak
29908
5
Tak
KosTak
29908
5
283
Appendix to ces wikipedia 2007: Problems with sentence segmentation - words ending in a stopword
Appendix to ces wikipedia 2007: Problems with
sentence segmentation - words ending in a
stopword
Most frequent words ending in a stopword. They usually contain uppercase letters as result
form missing blanks.
Stopword Concatenated word Frequency of stopword Frequency of concatenated word
Po
OuLiPo
9637
3
Appendix to ces wikipedia 2012: Problems with
sentence segmentation - words ending in a
stopword
Most frequent words ending in a stopword. They usually contain uppercase letters as result
form missing blanks.
Stopword Concatenated word Frequency of stopword Frequency of concatenated word
Pro
FoxPro
8320
12
Na
105Na
33935
8
Je
AVNOJe
17568
7
Na
805Na
33935
4
Na
NAANa
33935
3
Od
SONICFLOOd
14112
3
284
Appendix to ces web 2002: Problems with sentence segmentation - words ending in a stopword
Appendix to ces web 2002: Problems with
sentence segmentation - words ending in a
stopword
Most frequent words ending in a stopword. They usually contain uppercase letters as result
form missing blanks.
Stopword Concatenated word Frequency of stopword Frequency of concatenated word
Pro
FoxPro
43268
80
Pro
FlashPro
43268
22
Pro
SuperPro
43268
17
Pro
Zaměření:Pro
43268
16
Ve
KaDeVe
33749
15
Po
Doprava:Po
52560
12
Pro
PagePro
43268
12
Pro
SentinelSuperPro
43268
12
Pro
602Pro
43268
11
Pro
ColorPro
43268
11
Pro
AmiPro
43268
9
Na
AARONa
98287
6
Po
CarPo
52560
6
Na
KNIHOVNa
98287
6
Pro
TicketPro
43268
6
Na
SLONa
98287
5
Pro
FactoryPro
43268
4
Po
ISyPo
52560
4
Na
J:"Na
98287
4
Na
Kč.Na
98287
4
285
Appendix to ces web 2011: Problems with sentence segmentation - words ending in a stopword
Appendix to ces web 2011: Problems with
sentence segmentation - words ending in a
stopword
Most frequent words ending in a stopword. They usually contain uppercase letters as result
form missing blanks.
Stopword Concatenated word Frequency of stopword Frequency of concatenated word
Po
FinPo
84652
54
Pro
FoxPro
75625
51
Pro
AuditPro
75625
43
Pro
ArtPro
75625
18
Na
CORSTENa
157540
18
Pro
NaviPro
75625
14
Pro
ProMoPro
75625
12
Pro
StudyPro
75625
12
Pro
PagePro
75625
11
Po
LiFePo
84652
10
Pro
602Pro
75625
8
Pro
ŠumavaPro
75625
8
Po
Po
84652
8
Pro
AmiPro
75625
7
Pro
MediaPro
75625
7
Pro
SoMoPro
75625
7
Pro
GigaPro
75625
6
Pro
DesignPro
75625
5
Pro
FilterPro
75625
5
Na
JEANa
157540
5
286
Appendix to ces web 2012: Problems with sentence segmentation - words ending in a stopword
Appendix to ces web 2012: Problems with
sentence segmentation - words ending in a
stopword
Most frequent words ending in a stopword. They usually contain uppercase letters as result
form missing blanks.
Stopword Concatenated word Frequency of stopword Frequency of concatenated word
Pro
FoxPro
82409
56
Pro
AuditPro
82409
52
Pro
ArtPro
82409
14
Pro
NaviPro
82409
14
Po
LiFePo
96393
12
Pro
PagePro
82409
10
Po
BamPo
96393
9
Pro
ThermoPro
82409
8
Pro
TicketPro
82409
8
Po
Po
96393
8
Pro
MediaPro
82409
7
Pro
NOVIPro
82409
7
Pro
OriginPro
82409
7
To
klikniTo
62214
7
Pro
602Pro
82409
6
Pro
AmiPro
82409
6
Pro
GigaPro
82409
6
Pro
StudyPro
82409
6
Pro
SuperPro
82409
6
Pro
AlpinePro
82409
5
287
Appendix to ces mixed 2012: Problems with sentence segmentation - words ending in a stopword
Appendix to ces mixed 2012: Problems with
sentence segmentation - words ending in a
stopword
Most frequent words ending in a stopword. They usually contain uppercase letters as result
form missing blanks.
Stopword Concatenated word Frequency of stopword Frequency of concatenated word
Pro
ProMoPro
255906
570
Pro
FoxPro
255906
164
Pro
ConPro
255906
103
Pro
AuditPro
255906
83
Na
05:00Na
753146
54
Po
FinPo
343393
54
Pro
MediaPro
255906
43
Pro
lidíPro
255906
42
Pro
FIFPro
255906
34
Je
05:00Je
463920
32
Když
05:00Když
224513
27
Pro
PagePro
255906
27
Pro
SuperPro
255906
26
Pro
TicketPro
255906
23
Pro
602Pro
255906
22
Pro
ArtPro
255906
22
Pro
FlashPro
255906
22
Jak
05:00Jak
191920
21
Pro
AmiPro
255906
18
Na
CORSTENa
753146
18
288

Podobné dokumenty

Moskevská u centra

Moskevská u centra živnost na náměstí a vybudoval tam pohostinství, dnes provozované pod názvem Moravanka. Na původním místě živnosti v čp. 6 pokračovala pohostinská činnost spojená se jménem Josefa Pihana, která se ...

Více

Markstrat

Markstrat Hodnotící stupnice (Semantic Scales) .................................................................................................................................. 11 Multidimenzionální hodnoce...

Více

Exran - Diecézní charita Brno CELSUZ

Exran - Diecézní charita Brno CELSUZ znaky – barva kůže, očí a vlasů, tělesný vzrůst, tvar hlavy apod. Mapa světa a lepky tří barev: bílé, černé, žluté. Kde se vyskytují jednotlivé rasy? Vyzveme studenty, aby pomocí barevných lepek vy...

Více

Sborník statí o kultuře 1998

Sborník statí o kultuře 1998 Úvodní slovo aneb Co se za pět let (1998-2003) v kultuře povedlo a co nikoliv Každá instituce (i každý jednotlivec), pokud se chce pochlubit svými úspěchy, tedy tím, co se mu podařilo, ať už je o ...

Více