Képkorrekciós eljárások
Mielőtt egy képfeldolgozásra kerül, rendszerint több átalakításon megy keresztül: felvétel, digitalizálás, átvitel, másolás, stb. Mindegyik eljárás hibával jár, ezek rontják a kép minőségét, torzításokat okoznak. Ezeken kívül hamis információk, zajok keveredhetnek a képhez. Megváltozik a kép információtartalma. Ha ezek kis területen jelentkeznek, akkor ezek lokális vagy pontszerű hibáknak, ha az egész képre kiterjednek, akkor globális hibának nevezzük. A korrekciós eljárások általában a hibák hatásának megszüntetésére, az ideális kép visszaállítására irányulnak. Vannak lokális illetve globális eljárások.
A lokális eljárások az egyes képpontok meghatározott
környezetének elemzése alapján javítanak, a
globálisak az egész képet értékelik. Mivel a képminőség
egzakt mértéke nem ismeretes, egy-egy eljárás
hatékonysága és javítóképessége szubjektív
megítélés kérdése. Ezért, valamint a képjavítás
átfogó elméletének hiányában, az alkalmazandó
módszert és eljárást egyéb szempontok,
rendszerint a könnyű programozhatóság, a rövid
futási idő, stb. alapján választják ki.
Digitalizálás és visszaállítás
Egy
természetes kép analóg, térben (x, y, z) és időben
(t) folytonos, különböző színárnyalatokat
tartalmazhat ()
és függ a megfigyelési iránytól ()
is, matematikailag valamilyen e(x, y, z, t,
,)
folytonos függvénnyel lehet leírni.
Feldolgozás
céljára a képet fel kell venni valamilyen leképező
eszközzel. A felvett kép kétdimenziós, és mivel
a felvétel egy meghatározott időpillanatban,
frekvenciasávban, és irányból történt,
valamilyen f(x, y) folytonos függvénnyel lehet leírni.
Digitális
kép létrehozása
Számítógépes feldolgozás céljából a képjelet digitalizálni kell. Ez azt jelenti, hogy a képet pontokra bontjuk és az egyes képpontok világosságértékét kvantáljuk. A digitális kép – bár a vizuális információt megőrzi – képiességét elveszti. Ahhoz, hogy ismét látható legyen, analóg képjellé kell visszaállítani.
A két folyamatnak felváltva ismételhetőnek kell
lennie, ezért csak olyan eljárásokat szabad használni,
amelyek ezt lehetővé teszik.
Mintavételezés
A
digitalizálás első lépése az analóg kép
felbontása képpontokra. Ez úgy történik, hogy a
képsík meghatározott pontjaiban mintákat veszünk
a képjelből. Ezek a minták elvileg a folytonos kép
valamilyen mérhető tulajdonságát reprezentálják,
legtöbbször a kép világosságát vagy színét
az adott pontban. Más szóval a mintavételezés
tulajdonképpen egy mérés, s mint minden mérés,
valamilyen bizonytalansággal, mérési hibával jár.
Nagyon fontos, hogy a mérési hibák mérhetőek
legyenek, így értékelni lehessen a mintavételezés
jóságát.
Legyen
a folytonos, végtelen kiterjedésű, ideális képnek
a mérendő sajátságát leíró függvény f(x,
y). Színes képek esetén 3 egymástól független
függvényre van szükség. Legyen a mintavételezési
pontok x-irányú távolsága x,
az y-irányú y.
Egészítsük ki továbbá a véges, (K-1)x
· (L-1)y
méretű képet üres képpontokkal a teljes x-y síkban,
és a kép középpontja legyen az origóban. Ekkor
az ideális mintavételt a
mintavételi
függvénnyel lehet leírni, amely a Dirac-delta
kiterjesztése az összes kijelölt mintavételezési
pontra. Az eredményül kapott digitalizált képet
a
összefüggés
írja le, ami nem más, mint az eredeti képfüggvényértékek
halmaza a k = m · x,
l = n · y
pontokban. Ezzel a képet felbontottuk K,L képpontra.
Kvantálás
A
digitalizálási folyamat második lépésében az
A/D átalakító összehasonlítja az egyes képpontokhoz
tartozó függvényértéket a lehetséges kimeneti
szintjeivel. A folyamatot kvantálásnak nevezzük.
Eredményként annak a kimenő szintnek a kódját
kapjuk, amelyikhez a vizsgált függvényérték a
legközelebb esik. Így minden ponthoz egy, a világosságtól
függő kódszám fog tartozni, amelyet világosságkódnak
nevezünk és q-val jelölünk. Ezzel létrehoztuk a
digitális képet. Színes képek esetében a digitális
színkód 3 függvényérték egyidejű kvantálásával
áll elő. A világosságkód nem-negatív egész szám
és értéke a gyakorlatban 0 <= q <= 255
intervallumba esik. A lehetséges világosságkódok
halmazára a {Q}, az értékkészletére I255 jelölést
használjuk.
Egy
digitális kép létrehozásának fázisai
Az
eredeti és a digitalizált kép
Visszaállítás
(rekonstrukció)
A
visszaállítás vagy rekonstrukció (reconstruction)
során a digitális képből interpolációval állítjuk
elő az analóg képet. Mivel a kvantáláskor a
mintavételezéssel nyert képfüggvényértékeket
a legközelebbi kvantumszinthez igazítottuk, az
eredeti képet többé nem lehet rekonstruálni.
Jelöljük
f'(x,y)-al azt a folytonos képfüggvényt, amely az
f(x,y)-tól annyiban tér el, hogy a mintavételezési
pontokban a kvantált függvényértékek
szerepelnek. A képfelület emiatt természetesen a
közbülső pontokban is általában el fog térni
az eredetitől. Erről annyit állíthatunk, hogy
az
adott digitalizálási technika esetén. A mintavételezés
eredményéül kapott függvény alapján q(k,l) függvényt
úgy foghatjuk fel, mintha az f'(x,y) függvényből
állt volna elő mintavételezéssel:
Frekvenciaspektrumát
pedig a
összefüggés
adja, ahol F' az f' Fourier-transzformáltja.
A
visszaállított f-1 képfüggvényt a
q(k,l)-nek, az r(x,y) interpolációs függvénnyel
képzett konvolúciója eredményezi:
Képjavítások
Képjavításnak
az olyan eljárásokat nevezzük, amelyekben a
hibajavítás során nem vizsgálják a képnek az
eredetihez való viszonyát. Az eljárás hatékonyságát
különféle objektív és szubjektív becslések
alapján értékelik.
A
hibák torzításokra és zajhatásokra vezethetők
vissza. A torzítás általában csökkenti a
kontrasztot, kisebb lesz a különbség a legsötétebb
és a legvilágosabb képpontok világossága között,
és elmosódást okoz. Kiszélesednek az alakzatok közötti
átmeneti tartományok, életlen lesz a kép.
A
képjavítás célja, hogy a képet az emberi szemlélő
vagy a további gépi feldolgozás számára kedvezőbbé
alakítsa. Ennek megfelelően a kontraszt fokozására,
a kép élesítésére és a zajok kiszűrésére irányul,
az egyes képpontok világosságkódjának megváltoztatásával,
ezáltal megváltozik a világosságkódok eloszlása.
Világosságkód-transzformációk
A
transzformációk célja a kontraszt növelése a
világosságkódok eloszlásának megváltoztatásával.
A
hisztogram
A
képjavítás során különösen fontos szerepet játszik
a hisztogram, ami megadja a világosságkódok
eloszlását az adott képben. A hisztogramtáblázat
annyi elemű, amennyi a világosságkódok értékkészlete
és
'(qi)
= Nqi
ahol
Nqi a qi
világosságkódú képpontok száma a digitális képben.
A hisztogramot oszlopdiagrammal ábrázoljuk. A vízszintes
tengelyen a lehetséges világosságkódokat mérjük
fel, a [qi,qi+1)
intervallumhoz tartozó ordináta pedig a qi
világosságkódú képpontok relatív gyakoriságával
arányos:
(qi)
= c (Nqi / N)
ahol
N a képet alkotó képpontok száma. A továbbiakban
mindig feltesszük, hogy a hisztogram normalizált
(c=1), amiből következik, hogy ekkor
.
Ha
a világosságkódot valószínűségi változóként
kezeljük, akkor annak P valószínűsége, hogy értéke
a q és q+q
közé esik, valamint a sűrűségfüggvény között
fennáll az
összefüggés,
ami éppen a relatív gyakorisági hányadossal közelíthető,
vagyis
.
A
hisztogram diagrammok megtekintéséhez kattintson ide
Skálázások
A
további eljárások tárgyalásához szükség van
a következő jelölések bevezetésére:
{Qb}
- a világosságkódok eredeti (bemenő) értékkészlete
{Qk} - az eredményül kapott (kimenő)
értékkészlet
qbm, qkm - a megfelelő halmaz
legkisebb elemei
qbM, qkM - a megfelelő halmaz
legnagyobb elemei
qb€{Qb} - egy képpont
eredeti világosságkódja
qk€{Qk} - egy képpont
transzformált világosságkódja
Skálázásnak
nevezzük a T:{qba, qbf}
{Qk} leképzést megvalósító globális transzformációkat,
ahol qba >= qbm , ill. qbf
<= qbM a bemenő világosságkód-intervallum
alsó illetve felső határa.
Legtöbbször szakaszonkénti lineáris transzformációt
végzünk a következő összefüggés alapján:
ahol
int a legközelebbi egész-szám függvény. Ha
teljesen bemenő intervallumot akarjuk transzformálni,
akkor qba = qbm , ill. qbf
= qbM, különben sávzsugorításról
beszélünk. Az utóbbit akkor érdemes alkalmazni,
ha az értékes képpontok világosságkódja a [qba
, qbf ] tartományba esik. Akkor is
célszerű, ha a szélsőséges világosságkódú képpontok
száma alacsony, és megtartásuk feleslegesen szegényítené
a többség kontrasztját.
Szakaszonkénti
lineáris transzformációk
Az
eljárást kontrasztkiemelésnek
nevezzük, ha {Qb}
{Qk}, ugyanis ilyenkor ténylegesen megnő
a különbség a legsötétebb és a legvilágosabb
képpontok világosságkódja között, az eredménykép
hisztogramjában pedig lyukak keletkeznek.
Kontrasztikemelés
Tetszés
szerinti t transzformációt valósíthatunk meg
a
képlettel.
Itt qtM, ill. qtm a bemenő kódokra
alkalmazott t transzformáció során nyert
legkisebb, ill. legnagyobb értékek. Monoton növekvő
t függvény esetén természetesen qtM=t(qbM)
és qtm=t(qbm).
Az
eddig tárgyalt monoton növekvő transzformációs
függvények helyett monoton csökkenő vagy nem
monoton függvények is használatosak. Inverz
megjelenítést érhetünk el a
invertáló
transzformációval, ha pl. a sötétebb képrészek
hordozzák a hasznos információt.
A skálázásokat átszínezésnek is nevezzük,
mivel a színes megjelenítés esetén megváltoztatják
a képpontok színét.
Képvágások
Vágásnak
a képpontok küszöbök szerinti osztályozását
nevezzük. A küszöb az osztályozás szempontjából
figyelembe vett - mindig mérhető és ezért számszerűsíthető
- tulajdonság határértéke. Legyen {0
<1<...<n } a megadott n+1 küszöb halmaza,
ezekkel a képpontokat n osztályba sorolhatjuk. Jelöljük
a vizsgált képjellemzőt -val.
Egy képpont akkor tartozik az i-edik osztályba, ha
teljesül a i-1
<=
< i
feltétel.
A legegyszerűbb vágási eljárásban a képpontokat
világosságkódjuk szerint osztályozzuk. Ilyenkor
mindig érvényes a 0
= qm, és a n
= qM+1 alapértelmezés. Ha n osztályt
definiálunk, az eljárást n-szintre vágásnak
nevezzük. Ehhez nyilvánvalóan legalább n-1 küszöböt
kell megadni. Az alábbi ábra 4-szintrevágást
mutat be, természetesen az egy osztályba tartozó
világosságkódok nem kell, hogy összefüggő
intervallumot alkossanak.
4-szintrevágás
Igen
gyakori eset a két-szintrevágás, amikor a képpontokat
értékes és háttér képpontoknak minősítjük s
a továbbiakban csak az értékes képpontokat
dolgozzuk fel.
2-szintrevágás
További
speciális eset a sávkivágás, amihez két küszöbre
(1,
2)
és két osztályszintre (q1,q0) van szükség. Az
eljárás a 1
<= q(k,l) < 2
világosságkódú képpontokat q1 színűre
színezi át. A többi pont vagy háttérszínű (q0) lesz vagy nem változik.
Sávkivágás
Zajos
képekben rendszerint mind a háttérben, mind az értékes
pontok között vannak azonos világosságkódúak.
Ilyenkor az egyszerű vágás nem vezet eredményre.
Ha a két-szintrevágás előtt simítószűrőt
alkalmazunk, az eredmény sokkal megfelelőbb lesz.
Vágás
átlag szerint
Az
elvégzett transzformáció:
Az
alábbi ábrán a világosságkódok átlaga is
azonos. Itt a különböző gradiensű képpontok szétválogatásával
lehet megfelelő eredményt elérni.
Vágás
gradiens eloszlás szerint
Hisztogram
transzformációk
Az
eddigiektől némileg eltérnek azok az ugyancsak
globális módszerek, amelyekben úgy transzformáljuk
a világosságkódokat, hogy a kép hisztogramja előre
meghatározott alakú legyen. Ere a következő
esetekben lehet szükség:
- Össze
akarunk hasonlítani két képet, amelyek különböző
megvilágítási viszonyok mellett, készültek, s
így a valóságban azonos fényességű pontokhoz a
két képben különböző világosságkódok
tartoznak. Ilyenkor a két hisztogramot azonos alakúra
kell hozni.
- A
kép olyan tulajdonságait akarjuk elemezni, amelyek
a világosságkódok eloszlásától függnek. Ekkor
célszerű a hisztogramot valamilyen normalizált
alakra hozni.
- Utólag
meg akarjuk valósítani az eloszlásfüggő (tapered)
kvantálást, a kvantálási hiba csökkentése érdekében
rendszerint adott számú kvantumszint megtartásával.
E célból sűríteni kell a kvantumszinteket
azokban a világosságkód-tartományokban, ahová a
képpontok nagyobb része tartozik, míg a többi
tartományban a szinttávolságok nőnek. Az eljárást
közvetlen hisztogramspecifikációnak is nevezzük,
mivel hatására az eredménykép hisztogramja előre
meghatározott függvény közelítése lesz.
Jelölje
a bemeneti hisztogram ordinátáit (q),
a kimenőét (r).
A relatív gyakoriságból következik, hogy ezek arányosak
a q-adik, illetve az r-edik kvantumszinthez tartozó
képpontok számával és
ahol
J-vel és
I-vel
a bemenő és a kimenő világosságkódok maximális
értékét jelöltük. A továbbiakban csak monoton
transzformációkkal foglalkozunk, ezért a
halmozott részhisztogramoknak minden lépésben meg
kell egyezniük:
Tekintsük
a legegyszerűbb esetet, amikor azt akarjuk elérni,
hogy a kimenő kép hisztogramja a vízszintes
tengellyel párhuzamos egyenes (közelítése) ,
azaz
legyen.
Ebben az esetben a fenti képlet jobb oldala n / I
-re egyszerűsödik. A hisztogramtranszformációt
úgy végezzük, hogy n=1-től indulva rendre kiszámítjuk
azokat az mn értékeket, amelyekre:
Az
egyenlőtlenség alapján adódó n értékek kijelölik
a kimenő hisztogramban a kvantumszinteket, az mn
index alapján pedig meghatározhatók az adott
kvantumszinthez tartozó bemenő világosságkódok.
Mivel a kiinduló feltevés teljesülése esetén a
kimenő hisztogramban az egyes világosságkód-intervallumokba
közel egyenlő számú képpont esik , ezt az eljárást
hisztogramkiegyelítésnek nevezzük.
Hisztogram
kiegyenlítés hatása
Teljes
kiegyenlítés csak akkor volna lehetséges, ha a
bemenő képen az azonos világosságkódú képpontok
halmazát felbontanánk és a kimenő képben különböző
értékű halmazokba sorolnánk őket. Ez az önkényes
felbontás értelmetlen lenne és hamis eredményhez
vezetne.
A probléma általános megoldásához vegyük
figyelembe hogy a hisztogram a sűrűségfüggvény,
míg a halmozott részhisztogram az eloszlásfüggvény
közelítéseként értelmezhető. Ez alapján a részhisztogram
összefüggés feltételt az alábbiak szerint írhatjuk
át:
ahol
s()
a bemenő, t()
pedig a kimenő sűrűségfüggvény.
Hisztogramkiegyenlítés esetén
amit
az eloszlásfüggvényre felírt összefüggésbe beírva
az alábbi eredményre jutunk:
Ha a
bemenő eloszlásfüggvény helyére behelyettesítjük
a diszkrét közelítésnek megfelelő halmozott
bemenő részhisztogramot, minden qb
bemenő világosságkódhoz explicit módon meghatározhatjuk
az r kimenő világosságkód közelítő értékét:
.
Élkiemelés
(élesítés)
A
torzítások (képhibák) második csoportja a határátmenetek
kiszélesedésében, az élek elmosódásában
jelentkezik. Pszichofizikai kísérletekkel bebizonyították,
hogy szubjektíven előnyösebb érzetet kelt a túlhangsúlyozott
élekkel rendelkező kép, mint a valósághű ábrázolás.
Ezen túlmenően az élkiemelést a szegmentálásnál
(mi esetünkben elemzések) tárgyalt élkitűzés
előkészítő fázisaként is gyakran alkalmazzák.
Az
eljárások célja az egyes képrészletek közötti
átmeneti tartomány szűkítése, a határátmenetek
meredekebbé tétele, az elmosódások korrigálása,
így ezek általában lokális jellegűek.
Élkiemelést lehet megvalósítani a statisztikus
differencia-operátorral. Az eljárás során egy képpont
korrigált világosságkódját úgy számítjuk ki,
hogy elosztjuk a környezetében lévő képpontok
világosságkódjának eloszlása alapján meghatározott
szórással. Az eredményképben a hirtelen változások
helyén kis, a homogén tartományokban nagy világosságkód-értékek
jelennek meg. Hátrányos, hogy az eljárás a
zajokat is kiemeli.
A módszereket
rendszerint konvolúciós szűrővel realizálják.
Az eljárás azt jelenti, hogy minden képpont világosságkódját
helyettesítjük a szűrő által kijelölt környezetében
lévő képpontok világosságkódjának valamilyen
súlyozott átlagával. A leggyakrabban alkalmazott
élkiemelő függvény az
kifejezés,
ahol a 2
digitális Laplace-operátor. Így a függvényt az
alábbi ábrán megadott Tf1 jelű konvolúciós
szűrő realizálja.
Tf1
=
Tf2 =
Tf3 =
Felüláteresztő
(élkiemelő) szűrők
Az élkiemelő szűrők hatásainak megtekintése
Zajelnyomás
(simítás)
A képhibák
harmadik csoportját a zajok alkotják. A
képet érő zavaró hatások egy része abban nyilvánul
meg, hogy a képpontok eredeti világosságkódja -
általában véletlenszerűen - megváltozik. A
zavaró hatások eredményét (a képre rakódott
“zajt”) az érdemi feldolgozás előtt el kell távolítani
a képről, vagy legalábbis csökkenteni kell. Az
erre irányuló eljárásokat nevezzük zajszűrésnek,
zajelnyomásnak, vagy simításnak.
A
zaj általában véletlenszerűen előforduló, izolált
pontokban jelentkezik, amelyeknek a világosságkódja
lényegesen eltér a környezetükétől. Ezen
megfigyelésen alapulnak a zajok elnyomására szolgáló
lokális módszerek. A legegyszerűbb esetben minden
képpont világosságkódját összehasonlítjuk
valamilyen környezetében lévő képpontok világosságkódjának
átlagértékével (qá). A korrekció képlete:
ahol
a kép jellegétől függő, kísérleti úton
meghatározandó küszöbérték. A qá
3x3 méretű környezet esetén például az alábbi
szűrőkkel számítható ki.
Ta1
= 1 / 12
Ta2 = 1 / 8
Ta3
= 1 / 9
Aluláteresztő
(simító) szűrők
Ezek
elemei mindig pozitívak, és összegük mindig 1. Többnyire
négyzetesek és ritkán nagyobbak 5x5 méretűnél
(ezek már nagyon elmosnák a képet).
A
lineáris szűrés a zajhatásokat csak szétosztja,
“szétkeni” egy nagyobb területre. Ha egyetlen
pixelt terhel egy erőteljes zajbeütés (fehér
pont egy sötét képen), akkor a szűrés után ez,
bár határozottan gyengítve, de egy nxn pixel
nagyságú területen elosztva jelentkezik. Létezik
olyan szűrési eljárás, ami az ilyen pontszerű
zajbeütésektől szinte tökéletesen meg tudja
szabadítani a képet.
Ilyenek
a rank szűrők, elvük a következő. Vegyük
minden pixel egy meghatározott környezetét. A
pixel valamint a környezet k darab intenzitás értékét
rendezzük nagyság szerint növekvő sorba. E sorból
vegyük az n-edik elemet; ez lesz a pixel új világosságértéke.
Ha n=1, akkor mindig a minimális értéket választottuk,
ha n=k, akkor mindig a k-adikat. Rank szűrő tehát
nagyon sokféle van, hiszen a vizsgált pixelkörnyezet
mérete, alakja sokféleképpen választható (néhány
szokásos esetet felrajzoltam a következő ábrán),
továbbá az n érték 1 és k közötti megválasztása
is erősen befolyásolja az eredményt.
Különös
fontosságú a rank szűrők azon változata, amelynél
n=k/2, vagyis a sorba rendezett világosságértékek
közül éppen a középsőt választjuk. Ilyenkor
beszélünk medián szűrésről. A mediánszűrés
során a figyelembe vett mintát a szűrőbe eső képpontok
világosságkódja alkotja. A szűrést úgy valósítja
meg, hogy minden képpont világosságkódját
kicseréli a ráillesztett szűrő által meghatározott
minta mediánjával. Nyilvánvaló, hogy ez a szűrés
a kiugró zajcsúcsokat teljesen eltünteti és nem
csak elkeni, mint a lineáris szűrés. A medián szűrés
nem lineáris, mert a kép konstans szorzásával
ugyan felcserélhető, de két kép összeadásával
nem.
Az
átlag- és a mediánszűrő hatása
A zajelnyomó szűrők hatásainak megtekintése
Képjavítások
a frekvencia tartományban
Az
előző pontokban ismertetett képjavítási eljárások
a képpontok eredeti világosságkódjával végzett
műveleteken alapultak. A képtartománybeli eljárások
előnye, hogy könnyen programozhatók, hatékonyak
és viszonylag kicsi a gépidő igényük. A számítástechnika
fejlődésével a számítógépek teljesítménye
ma már lehetővé teszi, hogy a frekvenciatartományban
működő algoritmusokat is megvalósítsunk
elfogadható válaszidők mellett. A
frekvenciatartományban végzett (globális) javítások
a konvolúció elméleten alapulnak , amikor is a képet
kétváltozós függvényként kezeljük. Képlettel:
g(x,y)
= f(x,y)
h(x,y)
ahol
f(x,y) az eredeti, g(x,y) a javított képet, h(x,y)
a javítást végző, eltolásvariáns szűrőfüggvényt
jelenti. Ismeretes, hogy ez utóbbival egyenértékű
eredményhez jutunk, ha az integranduszok
Fourier-transzformáltjának szorzatát képezzük,
majd erre inverz Fourier-transformációt hajtunk végre.
A képjavítás
ezek szerint most úgy történi, hogy először előállítjuk
a kép F(u,v) Fourier-transzformáltját, majd
megszorozzuk egy alkalmasan választott H(u,v) szűrőfüggvénnyel:
G(u,v)
= F(u,v) * H(u,v)
Ha
most G(u,v)-re inverz Fourier-transzformációt
hajtunk végre, megkapjuk a javított g(x,y) képet.
Zajszűrés
A
frekvenciatartományban történő képjavítás
Fourier transzformáción alapul. A bázisfüggvényben
szereplő tagok periodikus függvények és síkhullámot
írnak le a képsíkban. Az egyes bázisfüggvények
abban térnek el egymástól, hogy mindegyiknek más
a frekvenciája és ebből adódóan a hullámhossza.
A folytonos függvényekre érvényes matematikai
eljárásokat - amint az a képfeldolgozásban
gyakran tesszük - átvisszük a digitális képekre,
értelemszerűen az összefüggések diszkrét
megfelelőjét alkalmazva. A gyakorlatban diszkrét
Fourier transzformációt alkalmazunk a képekre
ott, ahol a frekvencia értékek csak egész értéket
vehetnek fel. Jelölje a megengedett frekvencia párokat
( u, v ), ahol u,v = 0,±1,±2,...
Digitális
kép esetén a diszkrét Fourier transzformáció
során minden (u, v) frekvencia párhoz egy F(u, v)
komplex számot határozunk meg, amit Fourier együtthatónak
nevezünk. Az elnevezés onnan származik, hogy a kép
visszaállítása során az így meghatározott számok
lesznek a megfelelő (u, v) frekvenciájú bázisfüggvény
együtthatói. Ennek megfelelően ha az F(u,v) értékeket
valamilyen módon megváltoztatjuk, akkor nem az
eredeti, hanem a céljainknak megfelelően megváltoztatott
képet kapjuk vissza. Ha bizonyos együtthatókat például
egyszerűen 0 értékűre változtatunk, akkor a kép
visszaállításakor ennek az együtthatónak
megfelelő bázisfüggvény nem fog szerepelni. Ebből
már látható hogy a frekvenciatartományban történő
képjavítás akkor a leghatékonyabb, ha jól
meghatározható frekvenciájú periodikus zajt kell
a képből kiszűrni, hiszen akkor egyszerűen az
adott frekvenciájú együtthatókat kell 0-ra változtatni.
Természetesen
általános célú zajszűrést is végezhetünk a
frekvenciatartományban, hiszen a zaj a világosságkódokban
jelentkező véletlenszerű és hirtelen változást
jelent. A képen lévő hirtelen változások leírásában
a magasabb frekvenciájú, azaz rövidebb hullámhosszú
bázisfüggvények kapnak szerepet, ennek megfelelően,
ha ezeket “kiszűrjük", azaz nem vesszük
figyelembe a kép visszaállításakor, akkor a zaj
hatása csökken. A zajelnyomás mértéke attól függ,
hogy hány magasabb frekvenciájú bázisfüggvényt
hagytunk el. Miután az élek is hirtelen átmenetet
jelentenek a képen, ezért sajnos a magas frekvenciájú
bázisfüggvények elhagyásával az él átmenetek
sem lesznek tökéletesen visszaállíthatók, ezért
a visszaállított kép homályosabb lesz mint az
eredeti.
A
zajszűrő függvényeket aluláteresztő szűrőknek
és az eljárást aluláteresztő szűrésnek (lowpass
filtering) is nevezik tekintettel arra, hogy a
magasfrekvenciás összetevőket kiszűrik, míg az
alacsonyabb frekvenciájú komponenseket változatlanul
hagyják.
A
legegyszerűbb, ideális aluláteresztő szűrő átviteli
függvénye a következő:
ahol
az r = ( u2 + v2 )1/2
euklideszi távolságfüggvény megadja az adott
frekvenciapár origótól való távolságát, és ro
egy konstans. (Az r és ro jelentése későbbi
szűrőfüggvényekben is változatlan). A képletből
látható, hogy az ideális szűrő változatlanul
átengedi az ro sugarú kör belsejébe
eső alacsonyfrekvenciás összetevőket, hiszen
ezek változatlanok maradnak, míg a körön kívüli
magasabb frekvenciájúakat teljesen kiszűri (0-val
szorozzuk a Fourier együtthatókat). Azokat a
frekvenciapárokat, ahol a H(u,v) függvénynek
szakadása van, vágási frekvenciának nevezzük. A
fentiekben megadott szűrőfüggvény az (u,v) síkra
helyezett, a w tengelyre nézve szimmetrikus, egységnyi
magasságú, ro sugarú
hengerrel ábrázolható, amelynek az alaplapja középpontjával
az origóra illeszkedik. A függvény felületét a
henger fedőköre és az (u,v)
síknak a függvény értelmezési tartományába eső
része alkotja a henger alaplapjának kivételével.
Az
ideális szűrő hátránya, hogy a magasfrekvenciás
összetevőket teljes mértékben kiszűri, ezzel az
éleket is elsimítja, így nagymértékben homályosítja
a képet. További hátrány, hogy az elhagyott és
megtartott frekvenciák közötti éles vágás
miatt zavaró hatás, az úgynevezett gyűrődés
jelenik meg a visszaállított képen, ami azt
jelenti, hogy a képen periodikusan jelentkező
foltok tűnnek fel. Ennek elkerülésére olyan szűrőfüggvényeket
szoktak alkalmazni, amelyek fokozatosan módosítják
a Fourier együtthatókat.
Az
alábbi képlettel megadható Butterworth szűrő
például kismértékben
a magasfrekvenciás összetev őket
is átengedi, így kevésbé homályosodik el a kép,
és a sima átmenet miatt a gyűrődés sem lép
fel:
H(
u,v ) = 1 / [ 1 + ( r / ro )2n
]
Ez
a függvény a w tengelyre körszimmetrikus, sima átmenetet
megvalósító (szakadás nélküli), kondér alakú
felületet határoz meg, amelynek maximuma az origóban
van és a maximum értéke egyhez közelít, míg az
origótól távolodva egyre kisebb értékeket vesz
fel és 0-hoz közelít. A kitevőben szereplő n értékének
változtatásával befolyásolhatjuk a felület
lefutását. A képletből az is kiolvasható, hogy
ebben az esetben az ro vágási
frekvencia azokat a frekvencia párokat adja meg,
ahol a szűrőfüggvény értéke O.5-re csökken,
tehát ennél a küszöbnél nagyobb frekvenciához
tartozó bázisfüggvényeket 5O%-nál kisebb mértékben
fogja figyelembe venni az inverz transzformáció
során.
A
Butterworth szűrő függvénye által meghatározott
felület drótvázas modellje
Az
alábbi képlettel definiált exponenciális szűrő
egy a w tengelyre körszimmetrikus harang alakú felületet
ír le.
H(
u,v ) = exp [ - ( r / ro )n ]
A
meredekebb lecsengése miatt a Butterworth szűrőnél
kissé jobban homályosít, de korántsem annyira,
mint az ideális szűrő, gyűrődés pedig itt sem
lép fel.
Az
exponenciális szűrő drótvázas modellje
A
trapéz szűrő
átmenetet képez az ideális és a sima szűrők között,
ennek H(u,v) függvénye:
A
szűrő onnan kapta a nevét, hogy a megadott függvény
a w tengelyre körszimmetrikus csonka kúpot ír le,
aminek minden, a w tengelyen áthaladó síkkal való
metszete egy egyenlőszárú trapéz. A csonka kúp
fedőlapjának sugara ro,
az alaplapjának sugara r1. Az ro sugarú
körön belül változatlanok maradnak a Fourier együtthatók,
az r1 sugarú körön
kívül 0-val, míg a két sugár által meghatározott
körgyűrűn belül 1 és 0 közötti fokozatosan csökkenő
értékkel szorozzuk meg a Fourier együtthatókat.
Élkiemelés
Az
élek nagyobb változást jelentenek a világosságkódokban,
vagyis szintln a kép Fourier-transzformáltjának
nagyobb frekvenciájú komponenseit adják. Ezért
felüláteresztő szűrők (highpass filter)
alkalmazásával tudjuk az élesítést elvégezni,
amelyek kiszűrik a kisfrekvenciás komponenseket és
változatlanul hagyják a többit. A zajelnyomásnál
megismert aluláteresztő szűrők felüláteresztő
megfelelőit az alábbiakban adjuk meg:
Ideális
szűrő:
Butterworth-szűrő:
Exponenciális
szűrő:
Trapéz
szűrő:
Az
ideális szűrő természetesen levág egy adott
frekvencia alatt minden összetevőt, azaz teljesen
kiszűri a kép kisfrekvenciás összetevőit, különben
mindegyikük mellékhatásai megegyeznek a megfelelő
aluláteresztő szűrőéivel.
|