Úvod do teorie informace, kódování a komprese

Transkript

Úvod do teorie informace, kódování a komprese
Úvod do teorie informace,
kódování a komprese
Informační a komunikační technologie ve
zdravotnictví
2009/2010
Teorie informace základní pojmy I.
Zpráva
jakákoliv posloupnost rozlišitelných znaků
Symboly
rozlišitelné prvky ve zprávě (znaky)
Abeceda
množina všech symbolů
Příklad:
Zpráva
a b c c a b d a b d d c b a c
délka zprávy = 15, abeceda A={a,b,c,d}
počet symbolů abecedy S=4
Biomedical Data Processing G r o u p
Teorie informace Základní pojmy II.
Signál
materiální nositel zprávy
Kódování
transformace (zobrazení) zprávy z původní
abecedy do abecedy jiné
Informace
mezi symboly zprávy a okolním světem
 mezi označením a významem
 mezi významem a jejich překladem
strukturní vztahy mezi symboly
Biomedical Data Processing G r o u p
Kódování
Kódování = reprezentace dat
Musí být jednoznačně dekódovatelný
1887 – Samuel Morse
první telegrafické spojení: tečky, čárky, lomítka
--/---/.-./..././---/...-/.---/.Optimální kódování
Časté znaky reprezentovány krátkým kódem
Čím méně častý je znak tím je reprezentován
delším kódem
Biomedical Data Processing G r o u p
Kódování textu
ASCII
7 bitové kódování, pouze anglické znaky
8 bitů, pro národní jazyky znaky > 128
Unix: ISO 8859-2
DOS/Windows: Latin-2, Kamenických, cp852, WinEE,
cp1250
proměnná délka – UTF-8 (UNICODE)
znaky < 127 jako ASCII
další znaky jako více bytů, oblasti
Biomedical Data Processing G r o u p
Teorie informace -
Přístupy k TI
Syntaktická
Zabývá se analýzou textů, resp. sdělení z hlediska
formálního uspořádání a spojení znaků, aniž
přihlíží k jejich významu, smyslu a užití.
Sémantická
Zabývá se analýzou textů, resp. sdělení z hlediska
vztahu mezi znakovou strukturou sdělení a jejich
významy.
Pragmatická
zabývající se sledováním účinku textu, resp.
sdělení na chování zdroje a příjemce
Biomedical Data Processing G r o u p
Teorie informace - Entropie
 Počet možných zpráv délky n nad abecedou s celkovým
počtem symbolů s je
N  sn
A = {0,1}, s=2, n=6 => N = 26= 64
A = {a,b,c,d}, s=4, n=6 => N = 54= 625
 Množství informace I ve zprávě
I  f (N )
 Hartleyova míra informace
I  K ln( N )  K  n  ln( s )
Biomedical Data Processing G r o u p
Teorie informace - Entropie
S četnost jednotlivých symbolů n1,n2,…n3
 ni ni 
I  Kn ln 
n
i 1  n
s
Za předpokladu dostatečné délky zprávy
můžeme relativní četnost považovat za
pravděpodobnosti
s
I   Kn  Pi ln Pi
i 1
Biomedical Data Processing G r o u p
Teorie informace - Entropie
Informační (Shannonova) entropie
s
I
H    K  Pi ln Pi
n
i 1
střední hodnota informace připadající na
jeden symbol zprávy
Biomedical Data Processing G r o u p
Teorie informace – konstanta K
Nejednodušší možná abeceda A={0,1}
Na jeden symbol položíme hodnotu informace
této abecedy 1
Předpoklad stejné pravděpodobnosti výskytu
obou symbolů
1
I  K ln 2  1, K 
ln 2
Tedy pro H:
s
s
1
Pi lnPi   Pi log2 Pi 
H 

ln 2 i1
i 1
Biomedical Data Processing G r o u p
Teorie informace Vlastnosti entropie
Konečná abeceda A={a1,a2,…,as}
Můžeme přiřadit určitou hodnotu
signálu xi:xi X, X = {x1,x2,…,xs}
Pravděpodobnost výskytu je P(ai)
resp. P(xi)
Pro informační entropii platí
s
H  P(xi ) log2 P(xi )
i1
Biomedical Data Processing G r o u p
Teorie informace Vlastnosti entropie
Entropie je rovná nule
tehdy a jen tehdy, jsou-li všechny
pravděpodobnosti kromě jedné rovny nule a
jedna pravděpodobnost rovna jedné
Entropie dosahuje maxima
 jsou-li všechny pravděpodobnosti stejné
1
P1  P 2  ..  P s 
s
H max ( X )  log 2 s
Biomedical Data Processing G r o u p
Teorie informace
Vlastnosti entropie
Sdružená entropie
Mějme dva signály xiX=(x1,…,xs), yiY=(y1,…,yr)
s
r
H ( X , Y )   P( xi , y j ) log2 P( xi , y j )
i 1 j 1
H ( X , Y )  H ( X )  H (Y )
Pro marginální entropii platí
s
r
r
H ( X )   P( xi , x j ) log 2  P( xi , x j )
i 1 j 1
j 1
Biomedical Data Processing G r o u p
Teorie informace Vlastnosti entropie
Podmíněná entropie
Sdruženou pravděpodobnost lze vyjádřit též jako
s
r
i1
j1
H(Y / X)  P(xi )P(yj / xi )  log2 P(yj / xi )
P(xi , yj )  P(xi )  P(yj / xi )
s
H ( X ,Y )  P(xi ) log2 P(xi )  H (Y / X )
i 1
Biomedical Data Processing G r o u p
Střední vzájemná informace
 Mějme dva signály xiX=(x1,…,xs), yiY=(y1,…,yr) – jsou určitým
způsobem závislé
 Neurčitost výběru hodnoty x za předpokladu znalosti hodnoty y
je dána jako H(X|Y)
 Změna neurčitosti ve výběru z X bez znalosti výběru z Y a s
znalosti výběru z Y
H(X )  H(X | Y)  T(X : Y)
Veličina T(X:Y) se nazývá střední vzájemnou informací
T ( X : Y )  H ( X )  H (Y )  H ( X , Y )
Biomedical Data Processing G r o u p
Střední vzájemná informace
T(X:Y)  0 – je nezáporná
T(X:Y) = T(Y:X) – symetrická fce svých arg.
T(X:Y) = 0 - jsou-li x a y statisticky nezávislé
T(X:Y) = min{H(X),H(Y)} – pak x a y jsou vázány
funkční závislosti y=f(x)
Biomedical Data Processing G r o u p
Komunikační kanál a kodóvání
Struktura komunikačního kanálu
Komunikační kanál lze dělit na
Spojitý komunikační kanál
Diskrétní komunikační kanál
Biomedical Data Processing G r o u p
Komunikační kanál a kodóvání
Mírou úspornosti kódování je poměrná entropie
h 
H
H
max
 Pro optimální kód je h = 1
Nadbytečnost symbolů – redundance r
Hmax  H
r  1 h 
Hmax
Biomedical Data Processing G r o u p
Komunikační kanál a kodóvání
Redundance zdroje
H0
H0
rz  1 
 1
Hmax
log2 s
Redundance kódováním
H1
rk  1 
H0
Celková redundance je dána vztahem
H1
rc  rz  rk  rz rk  1 
log 2 s
Biomedical Data Processing G r o u p
Komunikační kanál a kodóvání
Podle délky kódových slov lze kódy dělit na:
 Rovnoměrné kódy
 Kódová slova stejně dlouhá
 Není problém zjišťovat kde končí jedno a začíná druhé
 Nerovnoměrné kódy
 Délka kódových slov je různá
 Typickým příkladem je Morseova abeceda
Kódy kde žádné kódové slovo nebude začátkem
jiného slova
Není potřeba dělící znak
takové kódy jsou nazývány kódy s prefixovou
vlastností
Biomedical Data Processing G r o u p
Komunikační kanál a kodóvání
Tedy dále dělíme kódy na:
Kódy s prefixovou vlastností
Kódy bez prefixové vlastnosti
Kód má prefixovou vlastnost jestliže v
reprezentaci pomocí binárního grafu
nereprezentuje cesta od jednoho konečného
uzlu (kódového slova) ke kořenovému uzlu
jiné kódové slovo
Biomedical Data Processing G r o u p
Redundance a její vlastnosti
S rostoucí redundancí se zvyšuje počet
přenášených symbolů
Redundance má opodstatnění v případě
zarušení komunikačního kanálu
Opakování zprávy
Přidání speciálního znaku (paritní bit, CRC kód)
Biomedical Data Processing G r o u p
Hammingova vzdálenost
Důležitý pojem u vlastností kódů
Počet míst, ve kterých se dvě kódová slova liší
Pro tříprvkový kód
(000,001)=(000,010)=(000,100)=1
(000,011)=(000,110)=(000,101)2
(000,111)=3
Charakterizuje odolnost kódu proti rušení a
schopnost kódu identifikovat chybu
Biomedical Data Processing G r o u p
Detekce chyb
Parita – pouze detekce
Nejjednodušší způsob zabezpečení přenosu dat
Sečte se počet jedničkových bitů a doplní se
paritním bitem na sudý nebo lichý počet
Některé teoretické závěry vyžadují existenci nulového
slova (sudá parita)
Pro kontrolu při přenosu je lepší lichá parita (odhalí
přerušený přenos)
Příklad: sudá parita
Biomedical Data Processing G r o u p
Detekce chyb
Lineární kódy
Hammingův kód - pro opravu jedné chyby,
je speciálním případem lineárních dvojkových (n,k)
kódů
MD5 (Message-Digest algorithm 5)
 Rozšířená hašovací funkce - kontrola integrity souborů nebo
ukládání hesel
 Používá se pro kontrolu CD image (ISO), jako digest zprávy
pro elektronický podpis
Dříve se používaly kódy CRC (Cyclic Redundancy
Code) - Cyklický redundantní součet
 Vypočten před operací, u níž jsou předpokládány chyby
 Posíláno s daty
Biomedical Data Processing G r o u p
Komprese dat
Informace obsažená ve znaku je podstatně menší, než by se
očekávalo
A. Shanon 50.léta - entropie
Veškerá data obsahují nadbytečnou informaci
Cíl komprese:
Zmenšit data do tvaru, který bude menší, ale ponese
stejné informace
Kompresní poměr = délka komprimovaných dat /
délka původních dat
Příklad:
Chceme sestrojit binární prefixový kód pro desítkové
číslice (0..9) vhodný pro slova, kde se často vyskytují
číslice 3 a 4, ale zřídka se vyskytují číslice 5 a 6.
Biomedical Data Processing G r o u p
Ztrátová komprese
Využívá nedokonalosti lidských smyslů
Používá se pro obraz i zvuk.
Dochází např. k rozmazávání hran, vzniku
artefaktů
data de transformují tak, aby bylo možno
lehce oddělit důležité informace od
nedůležitých
nedůležité informace se pak potlačí mnohem
více než důležité
nakonec se výsledek zkomprimuje některým z
bezeztrátových kompresních algoritmů
Biomedical Data Processing G r o u p
Ztrátová komprese
Pro transformaci původních dat se obvykle používá
některá z transformací
 Příklady takových transformací jsou například DCT (discrit cosin
transform), FFT (Fast Fourier transform) nebo WT (wavelet
transform).
 Převod z časové oblasti do frekvenční nebo frekvenčně časové –
lidské smysly jsou na frekvence, ať už ve zvuku nebo v obraze,
velmi citlivé
Potlačení některých složek
 Rozhodující je kvalitní psychovizuální nebo psychoakustický model
 Ten určuje, jaká data mohou být potlačena nebo dokonce úplně
odstraněna
 Problém při kompresi zvuku je o to složitější, že lidský sluch je
velmi citlivý i na časové umístění zvuku
Biomedical Data Processing G r o u p
Ztrátová komprese
2D Fourierova tranformace
 Myšlenka. Obrazová funkce f(x, y) se rozloží na lineární
kombinaci harmonických (ortonormálních) funkcí.
 Definice přímé transformace: u, v jsou prostorové frekvence.
 Spojitá 2D Fourierova transformace
 
Fs ( u , v ) 

f ( x , y ) e  2 πj ( xu  yv ) dxdy
 
 Diskrétní 2D Fourierova transformace
1
Fd (u, v) 
Nx N y
N x 1 N y 1
  f ( x, y)e
 xu yv
2 πj 

 Nx N y





x 0 y 0
Biomedical Data Processing G r o u p
Bezeztrátová komprese
Bezeztrátové komprimační programy
většinou nepoužívá jen jeden algoritmus, ale hned
několik najednou.
U některých komprimačních programů jsou data napřed
transformována a až poté komprimována
Zmíněná transformace se používá za účelem
dosažení lepších kompresních poměrů
Transformace
Tyto algoritmy ve skutečnosti nic nekomprimují, pouze
modifikují data tak, aby se dala lépe zkomprimovat
Je také podmínkou, že ke každé transformaci musí
existovat transformace inverzní
Biomedical Data Processing G r o u p
Algoritmy komprese - obecně
Slovníkové algoritmy
Algoritmy v této skupině vytvářejí v průběhu
komprimace slovník na základě dat již zkomprimovaných
V něm se pak snaží najít data, která se teprve mají
komprimovat
Pokud jsou data nalezena ve slovníku, algoritmus zapíše
pozici dat ve slovníku místo samotných dat
Lempel-Ziv 77 (LZ77), Lempel-Ziv 78 (LZ78)
Lempel-Ziv-Welch 84 (LZW84)
LZMA - Lempel-Ziv-Markov-Chain Algorithm
Biomedical Data Processing G r o u p
Algoritmy komprese - obecně
Statistické algoritmy
Snaží se určitým způsobem předvídat jaké znaky budou
v souboru dat následovat
Statistické metody dělíme na metody se statickým
modelem a metody s adaptivním modelem
Metody se statickým modelem
 vytvoří před komprimací dat určitý model a
podle něho zkomprimují celý soubor dat
 metody s adaptivním modelem průběžně
model aktualizují
Huffmanovo kódování
Shannon-Fanovo kódování
Aritmetické kódování
Range coding (RC), ACB, Prediction by partial match
(PPM)
Biomedical Data Processing G r o u p
Statistické metody komprese
Run-length encoding
Zakóduje data tak, že před opakující se znaky vloží
počet opakováni
Příklad:
WWWWWWWWWWWWBWWWWWWWWWWWWBBB
WWWWWWWWWWWWWWWWWWWWWWWWBWW
WWWWWWWWWWWW
Výsledek:
12WB12W3B24WB14W
Biomedical Data Processing G r o u p
Statistické metody komprese
Hoffmanovy kódy
Konvertuje znaky vstupního souboru do bitových
řetězců různé délky.
Znaky, které se ve vstupním souboru vyskytují
nejčastěji, jsou konvertovány do bitových řetězců s
nejkratší délkou
Znaky, které se vyskytují velmi zřídka jsou
konvertovány do delších řetězců
Probíhá ve dvou fázích:
V první projde soubor a vytvoří statistiku četností
každého znaku.
Ve druhé fázi se využije této statistiky pro vytvoření
binárního stromu a k následné kompresi vstupních dat
Dekomprese pomocí rekonstruovaného binárního
stromu dekóduje řetězce proměnlivé délky.
Biomedical Data Processing G r o u p
Statistické metody komprese
Shannon-Fanovo kódování
Od Huffmanova kódování se liší pouze konstrukcí
binárního stromu
Množina znaků je rekursivně dělena vždy na dvě
podmnožiny, aby součet výskytů znaků v obou
podmnožinách byl přibližně stejný
Jedné podmnožině je pak v kódu přiřazena binární 1 a
druhé 0
Tento kód je tedy konstruován od kořene k listům a
narozdíl od Huffmanova kódování, jehož kód je tvořen
od listů ke kořenu, nemusí být optimální
Biomedical Data Processing G r o u p
Statistické metody komprese
Aritmetické kódování
Huffmanovo kódování dosahovalo optimálních výsledků,
pokud četnosti jednotlivých znaků byly mocninami čísla
2
V ostatních případech by bylo optimální na zakódování
jednoho znaku použít neceločíselný počet bitů
Situace se trochu zlepší použitím delšího kódového
slova - aritmetické kódování kóduje celou zprávu jako
jediné kódové slovo
Aritmetické kódování reprezentuje zprávu jako
podinterval intervalu <0,1)
Na začátku uvažujeme celý tento interval. Jak se zpráva
prodlužuje, zpřesňuje se i výsledný interval a jeho horní
a dolní mez se k sobě přibližují.
Čím je kódovaný znak pravděpodobnější, tím se interval
zúží méně a k zápisu delšího intervalu stačí méně bitů.
Biomedical Data Processing G r o u p
Slovníkové metody komprese
LZ-W (Lempel-Ziv-Welch)
LZW na několikrát se opakujících posloupnostech znaků
LZ77 by například řetězec: „leze po železe“
zakomprimoval jako: „leze po že[10,4]“
Na místo čísel uvedených v hranaté závorce se při
dekomprimaci (rozbalení) užijí 4 znaky z předcházejících
deseti
LZ78 využívá tzv. adaptivní slovníkovou metodu
Program si vytvoří pomocný soubor, tzv. slovník, který
využívá při komprimaci a dekomprimaci
Komprimační algoritmus tedy prochází jednotlivé znaky
a zjišťuje jestli jsou ve slovníku
Biomedical Data Processing G r o u p
Slovníkové metody komprese
LZW84 (Lempel-Ziv-Welch 84)
Vylepšení algoritmů LZ77 a LZ78
Byl využíván (a je částečně dodnes)
 v archivech ARC, starých verzích ZIP (PKZIP 0.x a 1.x)
 kompresoru „Z“
 u koprese GIF
 dokumentech PDF
Relativně jednoduchý a rychlý, ale nedosahuje zdaleka
tak dobré komprese jako náročnější algoritmy jako
LZMA
Biomedical Data Processing G r o u p
Slovníkové metody komprese
LZMA (Lempel-Ziv-Markov-Chain Algorithm)
kompresní algoritmus, vyvinutý programátorem Igorem
Pavlovem, pro jeho archivní program 7-Zip
Jedná se o vylepšení známého algorithmu Deflate
Skládá se z algoritmů
 LZ77
 Markov-Chain
 Range algorithm
Má vysoký kompresní poměr
Biomedical Data Processing G r o u p
Příklady komprese dat
RAR - napsal Eugene Roshal
 optimální poměr rychlosti k účinnosti komprese
 lze pracovat kromě nejrozšířenější platformy wintel i v
prostředích Unix, Linux, MacIntosh, IBM OS/2,…
 při 6 a více znakovém heslu trvá na současné technice
nalezení hesla několik desítek let
 možnost vytváření samorozbalujících archivů
ZIP
 nejznámější a data pomocí něj zabalené je schopen rozbalit
snad každý
 Používá Lempel-Ziv-Walshe Encoding
 nedosahuje nejlepších výsledků
Biomedical Data Processing G r o u p
Příklady komprese dat
ARJ (Archiver Robert Jung)
 Jeden z prvních archivátorů umožňujících dělit archiv na více
částí
 Dnes vytlačován RARem a ZIPem
7-zip
 Používá přednostně kompresní algoritmus LZMA
 Nabízí dale take PPMD, BZIP2, Deflate
 Vysoký kompresní poměr, lepší než ZIP, a to až o 70%
 Na druhé straně inkompresibilni soubory (GIF, PNG, AVI, MP3)
zásadně nelze kompresovat, ani programem 7-ZIP
Biomedical Data Processing G r o u p
Komprese obrazu
JPEG (Joint Photographic Experts Group)
standardní metoda ztrátové komprese
používané pro ukládání počítačových obrázku
Skutečným názvem typu souboru je JFIF, což
znamená JPEG File Interchange Format
Vhodný pro fotografické snímky nebo malby
realistických scenérií s hladkými přechody v
tónu a barvě
Novější ztrátové kompresní metody, zvláště
vlnková komprese, dávají ještě lepší výsledky.
Biomedical Data Processing G r o u p
JPEG komprese obrazu
Biomedical Data Processing G r o u p
JPEG komprese obrazu
Původní obraz

Komprimováno 20 : 1
Obrázky tohoto typu jsou pro JPEG kompresi vhodné. Vysoké
frekvence nejsou zastoupeny příliš významně. Nepřesnosti vzniklé
kompresí jsou maskovány členitostí obrazu.
Biomedical Data Processing G r o u p
JPEG komprese obrazu
Komprimováno 40 : 1
Původní obraz

V podobných případech bývá komprese JPEG nevhodná, a to zejména,
je-li vysoká. Vysoké frekvence jsou zde významné (neměly by se proto
šidit). Není zde ani členité pozadí, které by mohlo chyby vzniklé
kompresí zamaskovat .
Biomedical Data Processing G r o u p
Další algoritmy komprese obrazu
TIFF (Tag Image File Format)
 jeden z souborových formátů pro ukládání rastrové počítačové
grafiky
 Formát TIFF tvoří neoficiální standard pro ukládání snímků
určených pro tisk
 TIFF je složitější formát oproti jiným formátům pro ukládání
rastrové grafiky
GIF (Graphics Interchange Format)
 používá bezeztrátovou kompresi LZW84
 je tedy vhodný pro uložení tzv. perokresby (nápisy, plánky, loga)
 GIF umožňuje také jednoduché animace
 maximální počet současně použitých barev barevné palety je 256
(8 bitů) v jednom rámci
Biomedical Data Processing G r o u p
Další algoritmy komprese obrazu
PNG (Portable Network Graphics)
 grafický formát určený pro bezeztrátovou kompresi rastrové
grafiky
 vyvinut jako zdokonalení a náhrada formátu GIF
 nabízí více barev a lepší kompresi (algoritmus Deflate + filtry)
BMP
 .BMP nebo také .DIB (device-independent bitmap) je počítačový
formát pro ukládaní rastrové grafiky
 BMP jsou ukládány po jednotlivých pixelech,
 Soubory ve formátu BMP většinou nepoužívají žádnou kompresi
(přestože existují i varianty používající kompresi RLE)
Biomedical Data Processing G r o u p
Komprese zvuku
MP3 (MPEG-1 Layer 3)
formát ztrátové komprese zvukových souborů, založený
na kompresním algoritmu MPEG (Motion Picture Experts
Group)
Při zachování vysoké kvality umožňuje zmenšit velikost
hudebních souborů v CD kvalitě přibližně na desetinu
u mluveného slova však dává výrazně horší výsledky
Ze vstupního signálu se odeberou informace, jenž
člověk neslyší, nebo si je neuvědomuje
princip časového a frekvenčního maskování
Biomedical Data Processing G r o u p
Komprese zvuku MP3
Citlivost sluchu
40
dB
20
frekvence (kHz)
0
0


2
4
6
8
10
12
14
16
Nemá cenu přenášet, co ucho neslyší.
Přenášíme-li už, pak není třeba kódovat podrobněji, než
je rozlišovací schopnost ucha.
Biomedical Data Processing G r o u p
Komprese zvuku MP3
Frekvenční maskování
dB
60
40
20
frekvence (kHz)
0

2
4
6
8
10
12
14
16
Silně znějící tón způsobí podstatné snížení citlivosti ucha na
blízkých frekvencích. Eventuální blízké tóny není pak zapotřebí
vůbec přenášet nebo stačí jen hrubé kódování.
Biomedical Data Processing G r o u p
Komprese zvuku MP3
Temporální maskování
60 dB
40
čas (ms)
20
5

0
5
10
20
50
100
200
500
Po skončení silného tónu se navrací citlivost ucha pozvolna.
V této době není opět nutné některé jiné tóny přenášet.
Biomedical Data Processing G r o u p
Jiné algoritmy komprese zvuku
 AAC (Advanced Audio Coding)
 ztrátový zvukový kodek
 vyvinut jako logický následovník formátu MP3 na středních až vyšších
bitratech v rámci standardu MPEG4
 Enkodérů AAC je velké množství, od málo vyvedených jako FAAC (Fast
AAC) nebo Nero Digital až po prvotřídní jako Applův AAC enkodér
 Softwarová podpora není zrovna nejlepší, většina přehrávačů potřebuje
externí plugin
 WMA (Window Media Audio)
 Vyvinutý jako součást Windows Media
 Původně určen jako náhrada za MP3
 Známým problémem je příliš časné ořezávání vyšších frekvencí při nižších
bitrate
 Zato WMA neobsahuje ani při nižších bitrate tolik artefaktů jako
konkurence
Biomedical Data Processing G r o u p
Jiné algoritmy komprese zvuku
 Ogg (termín z počítačové hry Netrek)
 definován v RFC 3533 a jeho MIME typ application/ogg v RFC 3534
 výchozí materiál větší iniciativy, která si klade za cíl vyvinout komponenty
pro kódování a dekódování multimediálního obsahu
 komponenty budou svobodně dostupné a svobodně reimplementovatelné
v softwaru
 Po stránce kvality je zvukový kodek na přibližně na stejné úrovni jako
konkurenční formát WMA
Biomedical Data Processing G r o u p
Kodek
Spojení kodéru a dekodéru
Resp. komprese a dekomprese
Zařízení nebo počítačový program, který
dokáže transformovat datový proud nebo
signál
Někdy zaměňován s formátem video souborů
nebo s tzv. kontainerem
Příklady: DivX, XviD, 3ivX
Na podobných principech pracuje také obvykle
hardwarový endec (encode a decode =
zakódovat a dekódovat)
Biomedical Data Processing G r o u p
Kodek
DivX
Obrazový kodek kompatibilní se standardem MPEG-4
Typický celovečerní film zabírá na DVD asi 7 gigabyte
- DivX cca 700 megabyte
není svobodný software ani open source, ale existuje
open source verze nazvaná OpenDivX – silně okleštěná
Problém - nelegální kopie filmů
XviD
MPEG-4 kompatibilní kodek s otevřeným kódem
původně založený na OpenDivX
XviD obsahuje vlastnosti z MPEG-4 Advanced Simple
Profile
Mezi odbornými zastánci obou kodeků dlouhodobě
panují spory o to, který z nich je kvalitnější, obecně se
má za to, že jsou v podstatě srovnatelné
Biomedical Data Processing G r o u p
Literatura
 http://cs.wikipedia.org/wiki/
 http://www.video.az4u.info/redakce/index.php
 Václav Hlaváč, Jan Kybic: LINEÁRNÍ INTEGRÁLNÍ
TRANSFORMACE, Czech Technical University, Faculty of
Electrical Engineering, Center for Machine Perception, Prague,
Czech Republic
 Melichar, B.: Textové informační systémy. Praha, Vydavatelství
ČVUT 1997
 Adámek, J.: Kódování a teorie informace. Praha, Vydavatelství
ČVUT 1994
Biomedical Data Processing G r o u p

Podobné dokumenty

Bezdrátový přenos dat pro detekci a analýzu mikrospánků

Bezdrátový přenos dat pro detekci a analýzu mikrospánků Protože řidič musí být v zásadě pohybově neomezen, musí být tento přenos bezdrátový. Bude sice působit na velmi malou vzdálenost (max. cca 2 až 3 m), jeho vysílací část však musí být velmi lehká a ...

Více

MPEG-4 - Multimediální technologie (UMT)

MPEG-4 - Multimediální technologie (UMT) větší velikost > DCT= diskrétní kosínová transformace (JPEG)komprimovaní po blocích 8x8 pixelů, 6 bloků= makroblok)

Více

Cestopisy od Fictionp www.journey.cz, [email protected], 28057477

Cestopisy od Fictionp www.journey.cz, pn265@email.cz, 28057477 stopka ze všech čtyř stran, každý musí zastavit a platí zde pravidlo, kdo přijel první, první odjíždí. To by u nás bylo bouraček ještě více. U nájezdu na dálnici nebo i jinde na křižovatce máte pře...

Více

Audiovizuální technika a zpracování signálů

Audiovizuální technika a zpracování signálů Metody analýzy experimentálních dat, 1D, 2D, 3D ANOVA, algoritmy učení s učitelem a bez učitele, regresní analýzy, validace a redukce dat (nový AED)

Více

Obrázky na WWW stránkách - Inovace bakalářského studijního

Obrázky na WWW stránkách - Inovace bakalářského studijního – jméno: red – hexadecimální kód: #RRGGBB; #FF0000 – procentový zápis: rgb(100%,0%,0%)

Více

Diapositiva 1

Diapositiva 1 400 kbit/s YouTube 240p videos (komprese H.264) 750 kbit/s YouTube 360p videos (komprese H.264) 1 Mbit/s YouTube 480p videos (komprese H.264) 1.15 Mbit/s max – VCD quality (komprese MPEG1) 2.5 Mbit...

Více

Komprese zvuku - Ing. Jiří Franc

Komprese zvuku - Ing. Jiří Franc • Jednotka bel (B), častěji její 1/10 tedy decibel (dB) • Počátek stupnice 0 dB = práh slyšení pro tón frekvence 1 kHz

Více

vy_32_inovace_01_rar_p1 - Střední odborná škola stavební Karlovy

vy_32_inovace_01_rar_p1 - Střední odborná škola stavební Karlovy WINRAR Pro šifrování používá RAR poměrně silnou blokovou šifru, takže i když se po internetu povaluje spousta programů pro zjištění hesla, při 6 a více znakovém heslu trvá na současné technice nal...

Více

Přenos dat

Přenos dat Zpráva o velmi pravděpodobném jevu nese v sobě tedy velmi málo informace a naopak zpráva o málo pravděpodobném jevu obsahuje velké množství informace. Informační entropie – je průměrný objem inform...

Více