Marcin Wilczewski Politechnika Gdańska, 2008/091 · Modele barw. Charakterystyki obrazu....
-
Upload
nguyenkhanh -
Category
Documents
-
view
213 -
download
0
Transcript of Marcin Wilczewski Politechnika Gdańska, 2008/091 · Modele barw. Charakterystyki obrazu....
1
Algorytmy graficzne
Marcin Wilczewski Politechnika Gdańska, 2008/09
2
Zagadnienia, wykład, laboratorium
Wykład:Światło i barwa. Modele barw.Charakterystyki obrazu. Reprezentacja i opis.Obrazy binarne i ich przetwarzanie. Obrazy barwne i ich przetwarzanie.Metody przetwarzania obrazu w dziedzinie przestrzennej i częstotliwościowej.Algorytmy kompresji danych obrazowych.
Wykład kończy się pisemnym zaliczeniem (ostatnie zajęcia w semestrze, 20 punktów).
Literatura:Rafael C. Gonzalez, Richard E. Woods, „Digital Image Processing”R. Tadeusiewicz, P. Korohoda, „Komputerowa analiza i przetwarzanie obrazów”
Oceny[26,30] – 3; [31-35] – 3+; [36,40] – 4; [41,45] – 4+; [46-50] - 5
Laboratorium:Problemy do rozwiązania omawiane na wykładzie. Czas realizacji od 1 do 4 tygodni. Maksymalnie: 30 punktów. Możliwość zdobycia punktów na wykładzie.
3
Obszar zainteresowań wykładu
Dziedziny związane z tworzeniem i przetwarzaniem obrazów cyfrowych:grafika komputerowa – generowanie obrazów, tworzenie obrazów sztucznych, przetwarzanie obrazów naturalnych. Celem jest stworzenie obrazu,cyfrowe przetwarzanie obrazów – celem jest wydobywanie lub podkreślanie istotnych informacji zawartych w obrazie, computer vision (widzenie komputerowe)
in/out obraz opis
obraz przetwarzanie obrazów (image processing)
computer vision (widzenie komputerowe)
sztuczna inteligencjaopis grafika komputerowa
4
Układ wzrokowy człowieka
Siatkówka. Wyściela dno oka. Uważa się, że stanowi najbardziej wysuniętą na zewnątrz część mózgu.
Plamka żółta stanowi centralny obszar siatkówki i wraz dołkiem centralnym (fovea) jest obszarem najostrzejszego widzenia. Jednym z zadań zwężającej sięźrenicy jest skupienie strumienia światła na plamce żółtej. Dlaczego nadmiar światła w oku jest niepożądany?
Komórkami fotoreceptorowymi oka są pręciki i czopki. Ich położenie oraz proporcje zależne są od konkretnego regionu siatkówki. Czopki dominują w regionach centralnych (plamka żółta i dołek centralny) tworząc obszar widzenia o największej rozdzielczości. Wraz z oddalaniem się od plamki żółtej maleje ilośćczopków, przy jednoczesnym wzroście liczby pręcików. Plamka ślepa jest obszarem braku fotoreceptorów.
Związkiem absorbującym światło w pręcikach jest rodopsyna o maksimum absorpcji dla fal długości 500nm. Dla czopków istnieją trzy różne związki absorbujące (jodopsyny) o maksimach absorpcji 450nm, 530nm oraz 570nm, przy czym pojedynczy czopek zawiera jeden rodzaj opsyny.
Dwa systemy widzenia: pręcikowy (nocny, skotopowy) oraz czopkowy (dzienny, fotopowy). Przełączanie systemów regulowane jest przez natężenie światła docierającego do oka.
Proporcje pomiędzy pręcikami i czopkami zależą od trybu życia organizmu (u człowieka stosunek pręcików do czopków wynosi ok.. 120:6).
W oku zachodzi silna redukcja (i przekształcanie) informacji nie tylko przez rozpraszanie i absorpcję światła padającego na komórki pigmentowe, ale równieżprzez uśrednianie sygnałów pochodzących z poszczególnych receptorów (pola receptorowe).
Absorpcja fotonów i wywołane tym reakcje można uważać za pierwszy etap procesu przetwarzania informacji niesionej przez promieniowanie elektromagnetycznie przez organizm.
Rys. (a) schemat ludzkiego oka, (b) schemat budowy pręcika i czopka.
a
b
5
Cechy detekcji ludzkiego oka
Efekt pasm Macha (efekty graniczne, złudzenie kontrastu brzegowego) tłumaczy się zjawiskiem hamowania obocznego sąsiednich fotoreceptorów lub pól receptorowych. Prowadzi to do odczucia rozjaśnienia części jasnej i przyciemnienia części ciemnej wzdłuż granicy pól. Hamowanie oboczne interpretuje się jako proces wzmacniania poziomu sygnału do szumu (zwiększania kontrastu).
Rozdzielczość przestrzenna jest związana z gęstością upakowania fotoreceptorów w siatkówce. W określonych warunkach dwa punkty zewnętrzne emitujące światło są percepowane jako jeden punkt świetlny.
Rozdzielczość przestrzenna związana jest z natężeniem sygnału. Spadek natężenie sygnału pociąga za sobą poszerzenie otworu źrenicy, zwiększenie rozpraszania światła w gałce ocznej i zmniejszenie kontrastu (pobudzenie pól receptorowych o mniejszej rozdzielczości w peryferyjnych obszarach siatkówki).
Adaptacja do poziomu oświetlenia wiąże się z koniecznościąprzejścia z systemu czopkowego na pręcikowy lub odwrotnie Efektami adaptacji tego typu są m. in. oślepienie wskutek działania silnego bodźca świetlnego (globalne podwyższenie progu pobudzenia fotoreceptorów), utrzymujące się oślepienie po ustaniu działania bodźca, niższa wrażliwość na ciągłe zmiany jasności (natężenia) niżna zmiany skokowe (nieliniowa wrażliwość na zmiany jasności).
Prawo Webera – progowa wielkość dostrzegalnej różnicy jasności, ΔI, jest proporcjonalna do wartości bodźca początkowego, I, tzn. ΔI/I≈0.02=const. Prawo to nie stosuje się dla skrajnie dużych i małych wartości bodźca.
Kontrast równoczesny luminancji
Rozdzielczość czasowa (efekt stroboskopowy).Rys. (a) Efekt pasm Macha (kontrast graniczny); (b) kontrast powierzchniowy. Ten drugi polega na złudzeniu zwiększenia jasności obiektu w miarę zwiększania kontrastu z tłem.
a
b
6
Złudzenia wieloznaczne (sylwetki alternatywne)
a b
Rys. Sylwetki alternatywne: twarz i puchar. (a) – interpretacja obrazu jest zależna od definicji tła i obiektu. Wieloznaczna interpretacja rysunku (b) nie jest tak oczywista jak rysunku (a) (tzn. widać raczej puchar niż twarze).
7
Kontrast równoczesny – przykład 1
[http://web.mit.edu/persci/]
8
Kontrast równoczesny – przykład 1
[http://web.mit.edu/persci/]
9
Kontrast równoczesny – przykład 2
Rys. Pierścienie Koffka.
a b
c
10
Światło i barwa
Elementem koniecznym zjawiska widzenia jest triada optyczna (źródło światła, obiekt, obserwator). Barwa nie jest immanentną cechą obiektów materialnych, ale wypadkową cech obiektu (materiał, geometria), cech padającego światła (skład fizyczny) oraz zjawisk psychologicznych.Czym jest światło?Czym jest barwa?
Długość fali światła [nm]
Wrażenie barwy przy postrzeganiu w warunkach widzenia
fotopowego skotopowego
380-440 fioletowa
440-470 Indygo
470-480 błękitna
480-490 niebieska
490-510 niebieskozielona
510-530 niebieskawozielona
530-560 zielona
560-580 żółtozielona
580-590 żółta
590-600 żółtopomarańczowa
600-610 pomarańczowa
610-620 pomarańczowoczerwona
620-780 czerwona
nie występuje wrażenie barwy
11
Czym jest barwa?
Światło odbite od poszczególnych pól powyższej sekwencji i rejestrowane przez ludzkie oko jakościowo identyczne. Różni się jakością.
Do opisu wrażenia wywołanego działaniem każdego bodźca świetlnego używa się wielkości ilościowych (jasność) oraz jakościowych (chromatyczność):jakość (chromatyczność) - odcień oraz nasycenieilość (jasność) - luminancja
Barwa (wrażenie barwne) jest wrażeniem wzrokowym powstającym na skutek oddziaływania (w określonych warunkach) fali świetlnej z materią (receptorami). Rodzaj wrażenia barwnego zależy od: cech fizycznych fali świetlnej (właściwości promieniowania), zjawisk fizjologicznych zachodzących pod wpływem światła oraz zjawisk natury psychologicznej.Barwa jest atrybutem każdego wrażenia świetlnego postrzeganego w warunkach widzenia fotopowego i określa jakość tego wrażenia (światła).
12
Cechy barwy
Określenia fizyczne (fizykalne)dominująca długość falizakres spektralny światłanatężenie
W zastosowaniach technicznych opis tego typu jest nieefektywny.
Określenia percepcyjneodcień barwy (np. czerwony, niebieski, zielony, żółty)nasycenie (np. zielony, seledynowy, oliwkowy, etc.) lub czystość pobudzeniajasność
13
Trójpobudzeniowa teoria percepcji barw
Zgodnie z teorią trójpobudzeniową wrażenia barwne powstają na skutek działania fali świetlnej na trzy rodzaje receptorów siatkówki oka: czopków S (B-blue, niebieskie), M (G-green, zielone) oraz L (R-ed, czerwone). Każdy z rodzajów czopków posiada szczytową czułość dla różnych zakresów długości fali i jest zdolny pobrać światło tylko z jednego zakresu widma.
Wrażenie barwne (barwa uświadamiana) jest funkcją stosunku trzech sygnałów: β:γ:δSuma β+γ+δ wpływa na odczucie jasności (luminancji) bodźca świetlnego. Równocenne pobudzenie trzech receptorów β:γ:δ=1:1:1 prowadzi do wrażenia bieli lub szarości (w zależności od sumy sygnałów).Na gruncie teorii trójpobudzeniowej można wyjaśnić zjawisko metameryzmu: β=const., γ=const., δ=const.Wniosek: oko nie analizuje fizycznego składu spektralnego światła, ale uśrednia (całkuje) docierający sygnał. Całe promieniowane elektromagnetyczne zostaje zredukowane do trzech czynników (silna redukcja informacji). Skoro tak, to w metodach uzyskiwania barwnych obrazów rzeczywistości nie trzeba odtwarzać ich właściwości spektralnych.
Przyjmując, że padające na receptory światło opisane jest przez funkcjęrozkładu spektralnego E(λ), na wyjściu czopków pojawiają się sygnały:
14
Metameryzm
Światła o czterech podanych wyżej rozkładach widmowych wywołują to samo wrażenie barwne (podane obok).
Bodźce świetlne różniące się rozkładem spektralnym mogą wywoływać to samo wrażenie barwne (wrażenie barwy). Bodźce takie nazywane są metamerami, a zjawisko - metameryzmem.
Na podstawie właściwości spektralnych (skład widmowy, skład fizyczny) bodźca świetlnego możnaokreślić wrażenie barwne jakie bodziec ten wywoła.Zależność w przeciwną stronę nie jest prawdziwa, tzn. barwa nie implikuje składu widmowego bodźca świetlnego.Czerwone światło żarówki (widmo ciągłe) i czerwone światło lasera (światło monochromatyczne)– skład fizyczny świateł różny, a wrażenie barwne może być identyczne. Prosty eksperyment: ta sama fotografia kolorowa oglądana w świetle obu źródeł wygląda inaczej! Jak?Zależność widmo-barwa jest zależnością typu wiele do jednego.Jak wyjaśnić zjawisko metameryzmu na gruncie trójpobudzeniowej teorii widzeniaW zastosowaniach technicznych nie odtwarza się składu widmowego światła, ale jedynie składowe β, γ, δ.
15
Prawa Grassmanna (1853)
Trzy prawa addytywnego mieszania bodźców barwowych (Grassmann – 1853)Każdy bodziec barwowy (wrażenie dowolnej barwy) może być odtworzony jednoznacznie przez addytywne zmieszanie trzech odpowiednio dobranych bodźców podstawowych (liniowo niezależnych). Należy podkreślić, że taka synteza addytywna nie odtwarza własności fizycznych bodźca, ale jedynie efekt, jaki on wywołuje w układzie widzenia (oku).Jasność bodźca wynikowego jest równa sumie jasności bodźców składowych.Różne bodźce świetlne (różniące się rozkładem spektralnym) wywołujące to samo wrażenie barwy zmieszane w jednakowych stosunkach z innych bodźcem świetlnym dają jednakowe nowe bodźce barwowe, tzn. wywołują jednakowe wrażenia barwne.
Wniosek:Wrażenie barwne można odtworzyć bez konieczności rekonstrukcji składu widmowego bodźca.
16
Addytywna synteza barw
Cechy modelu
Określone wrażenie barwne uzyskiwane jest poprzez zmieszanie świateł (barw) podstawowych.
Z reguły stosuje się mieszanie świateł: czerwonego (R), zielonego (G) i niebieskiego (B). Teoretycznie można użyćinnych świateł (o innych barwach) ale wówczas gama (gamut) barw odtwarzanych jest mniejsza. Jednocześnie podobne efekty można uzyskać przez mieszanie więcej niżtrzech świateł.
Równocenne połączenie barw podstawowych daje czystąbiel. Zerowe składowe każdej z barw podstawowych dajączerń – brak barwy.
Wrażenie światła białego można też uzyskać przez zmieszanie tylko dwóch świateł. Barwy tych świateł sąwówczas nazywane barwami dopełniającymi.
Zwykle przyjmuje się, że intensywności barw podstawowych R, G oraz B leżą w zakresie [0,1], a tym samym dostępne barwy opisywane są w sześcianie jednostkowym.
Stosuje się do opisu „źródeł” światła – monitory CRT, odbiorniki TV
Synteza addytywna zachodzić może przy niejednoczesnym mieszaniu barw (pod pewnymi warunkami. Jakimi?)
17
Subtraktywna synteza barw - 1
Cechy modeluBarwami podstawowymi modelu są barwy dopełniające barw podstawowych R, G, B:cyjan (niebiesko-zielona), purpura oraz barwa żółtaModel subtraktywny – barwy powstająpoprzez selektywne usunięcie wybranego zakresu widma światła białego (filtracja, absorpcja)Warunkiem koniecznym syntezy jest obecność światła białego oraz substancji o selektywnej absorpcji promieniowania świetlnegoZastosowanie w poligrafiiŁatwość konwersji do barw modelu RGB
18
Subtraktywna synteza barw - 2
Filtrowanie światła białego przez barwy podstawowe modelu CMY
19
Barwa – potrzeba obiektywnego opisu
Istnieje potrzeba określania barwy w sposób
ścisły
obiektywny
precyzyjny
nadający się do przetwarzania komputerowego
bez konieczności korzystania z wzorników.
W praktyce powstało wiele sposób obiektywnego i numerycznego opisu barw
modele kolorymetryczne: CIE RGB, CIE XYZ, CIE UVW, CIE LUV
modele komputerowe i telewizyjne: RGB, HSV, YCbCR, YUV, YIQ.
20
Jak opisywać barwy?
Istnieją dwie podstawowe metody określania barw:wzorniki i atlasy barw publikowane w postaci tradycyjnej (wzorniki PANTONE, Villalobos, Euroscala, atlasy barw Munsella oraz Ostwalda, etc.). Zawierają próbki numerowane i usystematyzowane według określonych kryteriów. Istnieją rozwiązania elektronicznego pomiaru koloru PANTONE (kolorymetry elektroniczne). Reprodukcja barw z katalogów PANTONE w druku w oparciu o triadę CMYK nie zawsze jest możliwa. Sugeruje się stosowanie innych katalogów, np. Euroscala.Zalety: wygodne i naturalne w użyciu. Wady: nietrwałość wzorców, konieczność uwzględnienia takich parametrów jak rodzaj podłoża.metody kolorymetryczne oparte na trójchromatycznym mechanizmie widzenia człowieka: dowolny bodziec świetlny opisuje się udziałami trzech bodźców podstawowych.
patrz: www.pantone.pl
21
System barw Munsella - 1
Okrąg barw Newtona
[http://www.colorsystem.com]
Koncepcja Newtona okręgu barw pozwala interpretować odcień barwy (hue) jako wielkośćprzyjmującą wartości z przedziału 0-360 stopni i odłożoną na obwodzie koła. Nie istnieje więc pojęcie wartości minimalnych i maksymalnych odcienia.
22
System uporządkowania barw Munsella (1905) - 2
Przestrzeń trzech parametrów HVC systemu uporządkowania barw Munsella
System barw Munsella jest jednym z najstarszych i dotychczas powszechnie stosowanym sposobem opisu barw.
Parametry modelu: odcień, chroma (nasycenie), wartość (jasność).
Na osi wartości (oś z) położone są barwy achromatyczne (czerń, szarości, biel)
Wartość (value) leży w przedziale [0,10], nasycenie w przedziale [0,28] w zależności od konkretnej barwy
W 1942 ASO rekomendowała model Munsella jako standard oznaczania barwy powierzchni (np. gleby). Stosowany do zastosowań naukowych i przemysłowych, ale nie poligraficznych.
23
System uporządkowania barw Munsella (1905) - 3
Krąg barw Munsella
System Munsella:5 barw głównych: Red, Yellow, Green, Blue, Purple5 barw rozszerzonych (pośrednich):YR(pomarańczowy), GY (jasnozielony), BG (cyjan), PB (fiolet), RP (róż)Kręgi barw podzielone są na 10 segmentów, których środki odpowiadają barwom głównymNazewnictwo barw zgodnie z konwencją: H V/C. Przykład: 5RP2/12, 5RP5/26Porównanie próbki barwy lub światła z wzorcem jest procedurą subiektywnąZnacznie ograniczona przestrzeń barw
24
System uporządkowania barw Munsella (1905) - 4
Barwa 5PB w atlasie barw Munsella Reprezentacja przestrzenna modelu barw Munsella
http://www.daicolor.co.jp
25
Eksperyment kolorymetrii trójchromatycznej (idea)
Eksperyment zrównania (dopasowania, matching) barw. Zrównywanie bodźców odbywa się w odpowiednich warunkach, które mają zapewnić wyeliminowanie czynników psychologicznych i innych, takich jak struktura podłoża.
Posługiwanie się wzornikami jest wygodne w praktyce, ale nieprecyzyjne (np. określenie barwy zależy od rodzaju podłoża). Kolorymetria dziedzina nauki, która ma na celu liczbowy opis wrażeń barwnych (obiektywny opis chromatyczności bodźców barwowych). Metody kolorymetryczne opierają się na prawach Grassmanna.
Mieszanie bodźców podstawowych nie odtwarza fizycznie bodźca zadanego, ale jedynie kolorymetrycznie, tzn. odtwarza wrażenie barwne, ale nie skład widmowy światła.
26
Równanie barwy
Posługując się schematem eksperymentu kolorymetrycznego uzyskuje się tzw. równanie barwy prezentujące fakt zrównania bodźca świetlnego o zadanym rozkładzie spektralnym przez mieszaninę trzech niezależnych bodźców podstawowych
Z drugiego prawa Grassmanna wynika, że zachodzi równanie (pod warunkiem, że nastąpiło zrównanie jakości i ilości światła)
Równanie barwy ma postać równania wektorowego. Barwa jest punktem (elementem) rzeczywistej trójwymiarowej przestrzeni wektorowej, której bazą są bodźce podstawowe.Równanie barwy można uprościć do postaci:
Współczynniki a,b i c nazywane są składowymi trójchromatycznymi, natomiast unormowane a’, b’i c’ z przedziału [0,1] – współrzędnymi trójchromatycznymi w układzie bodźców podstawowych.
Do określenia chromatyczności bodźca (barwy) wystarczy znajomość trzech składowych lub dwóch współrzędnych trójchromatycznych.Metoda matematycznego, numerycznego, obiektywnego opisu barwy.
27
Model CIE-RGB 1931
Przykład przedstawiony wcześniej jest czysto teoretyczny i nie specyfikuje barw podstawowych. Najbardziej znanym przykładem przestrzeni (systemu, modelu) barw jest model CIE RGB opracowany przez CommisionInternationale de L’Eclairage (Międzynarodową Komisję Oświetleniową) w roku 1931.
Cechy modelu CIE RGB 1931
Barwy powstają jako mieszanina barw podstawowych: λR=700nm, λG=546,1nm oraz λB=435,8nm (dwie ostatnie długości fal to linie widma rtęci).
Proporcje dopasowania podawane są w tzw. jednostkach trójchromatycznych, tzn. tak by wrażenie bieli ekwienergetycznej uzyskać przy jednakowej ilości bodźców podstawowych. Użycie jednostek trójchromatycznych wymaga jedynie odpowiedniego przeskalowania. Dzięki temu punkt bieli ekwienergetycznej leży pośrodku trójkąta barw.
Dzięki stosowaniu jednostek trójchromatycznych punkt bieli ekwienergetycznej leży pośrodku trójkąta barw.
W oparciu o kolorymetr wykorzystujący jako podstawowe barwy świateł monochromatycznych o długości fal podanych wyżej wyznaczono równanie barwy dla wszystkich barw świateł monochromatycznych w widmie światła białego oraz obserwatora normalnego. Wynikiem tego są funkcje dopasowania barw (colormatching function).
28
Funkcje dopasowania barw modelu CIE RGB 1931
Funkcje dopasowania barw modelu CIE-RGB. Składowa r przyjmuje ujemne wartości w zakresie światła o długości fal pomiędzy długościami fal bodźców B oraz G, natomiast składowa g wartość ujemnąprzyjmuje dla świateł o długości fali poniżej długości fali bodźca B.
Funkcje dopasowania określają proporcje w jakich należy dokonać addytywnej syntezy barw podstawowych modelu aby odtworzyć barwę światła o zadanej długości fali
Postać krzywych wyznaczonych na podstawie danych eksperymentalnych (Wright, 1928,1929 oraz Guild, 1931) wskazuje, że nie każdą barwę można dopasować kombinacjąbarw podstawowych. Przykładem są barwy światełmonochromatycznych o długościach fal poniżej 546,1nm.
Oznaczając barwy podstawowe jako R, G, B, każdą barwęwidzialną reprezentować można jako wektor w przestrzeni wektorowej, której bazą są wektory R, G oraz B – jest to przestrzeń CIE RGB.
Posługując się kolorymetrem CIE RGB wyznaczyć można współrzędne trójchromatyczne dla światła o dowolnym rozkładzie spektralnym. Problem: jest to niepraktyczne! Istniejątablice.
Funkcje dopasowania przedstawione na rysunku odpowiadajądopasowaniu barw za pomocą konkretnych użytych w modelu barw podstawowych. Użycie innych barw podstawowych prowadzi do innym krzywych dopasowania.
Równania określające współrzędne w przestrzeni CIE-RGB dla koloru określonego rozkładem widmowym P(λ):
∫∫∫
),()(=
),()(=),()(=
λbλPλdb
λgλPλdgλrλPλdr
29
Pole barw modelu CIE-RGB
Wykres chromatyczności (pole możliwych barw) w modelu CIE-RGB. Wykres powstał przez zrzutowanie płaszczyzny (trójkąta) o równaniu r+g+b=1 na płaszczyznę RG. Zwróćuwagę na fakt, że składowa r przyjmuje wartości ujemne.
df Pole wszystkich możliwych barw zawiera równieżtzw. linię purpur (podstawa podkowy pola barw)
Purpura nie jest składową światła białego, jednak jest możliwa do odtworzenia przez zmieszanie świateł o długości fali 380nm oraz 700nm.
Lokus widma jest krzywą łączącą punkty odpowiadające barwom świateł monochromatycznych 380nm-780nm (barwy o największym nasyceniu). Krańce lokusu połączone są tzw. odcinkiem purpur.
Punkt E odpowiada bieli ekwienergetycznej, (1/3,1/3, 1/3).
Wadą modelu CIE RGB jest koniecznośćposługiwania się ujemnymi wartościami składowych i współrzędnych trójchromatycznych.
30
Model CIE-XYZ
Model barw opracowany w 1931 roku przez Międzynarodową Komisję Oświetleniową (CIE) dla rozwiązania problemu ujemnych współrzędnych i składowych trójchromatycznych.
Układ XYZ powstaje przez transpozycję układu RGB.
Bodźcami podstawowymi stają się bodźce oznaczane jako XYZ leżące poza obszarem barw fizycznie realizowalnych. Bodźce XYZ są więc fikcyjnymi, abstrakcyjnymi bodźcami barwowymi. Tym samym nie jest możliwa konstrukcja kolorymetru wykorzystującego bodźce XYZ.
Bodźce XYZ prowadzą do funkcji dopasowania o wartościach dodatnich (patrz rysunek obok).
Transformacja składowych trójchromatycznych pomiędzy CIE RGB oraz CIE XYZ opisana jest równaniem
Funkcje dopasowania (funkcje współczynników rozkładu) barw modelu CIE XYZ 1931
i można je odnaleźć w odpowiednich tablicach.
Składowe trójchromatyczne dowolnego bodźca świetlnego o zadanym rozkładzie widmowym S(λ) określające położenie dowolnej barwy w przestrzeni barw CIE XYZ określone są równaniami:
31
Przestrzeń barw modelu CIEXYZ
Przestrzeń barw modelu CIE XYZ 1931 jest bryłą o kształcie zbliżonym do stożka i o wierzchołku w początku układu współrzędnych.
Bryła składa się z punktów stanowiących współrzędne trójchromatyczne bodźców barwowych możliwych fizycznie do odtworzenia. Ponieważ w modelu CIE XYZ składowe trójchromatyczne przyjmują wartości dodatnie, to bryła barw znajduje się w pierwszym oktancie układu.
Posługiwanie się bryłą barw jest niewygodne, dlatego stosuje się wykres chromatyczności (pole barw).
Wykres chromatyczności uzyskuje się przez zrzutowanie płaszczyzny x+y+z=1 (równanie dla współrzędnych a nie składowychtrójchromatycznych) na płaszczyznę XY.
Współrzędne x oraz y jednoznacznie określają położenie punktu barwy na polu chromatyczności w układzie XYZ. Znajomość współrzędnych trójchromatycznych identyfikuje bodziec barwny i pozwala nazwaćwrażenie barwne jakie bodziec ten wywoła.
Przestrzeń barw modelu CIE XYZ 1931 (A) oraz wykres chromatyczności (B)
A
B
32
Model CIE-XYZ - cechy
Wykres chromatyczności modelu CIE-XYZ
Na brzegu obszaru w kształcie podkowy zlokalizowane są barwy nasycone (barwy spektralne, odcień barwy). Wnętrze obszaru wypełniają barwy nienasycone
Odcinek łączący barwę z lokusu z punktem bieli odpowiada barwom nienasyconym odcienia barwy z lokusu. Odcień danej barwy można określić przez przedłużenie odcinka przechodzącego przez punkt bieli i punkt danej barwy aż do punktu na lokusie
Nasycenie barwy określa stosunek długości odcinka łączącego punkt bieli z punktem barwy do odcinka łączącego punkt bieli z punktem lokusu i przechodzącego przez punkt barwy (barwy na lokusie są maksymalnie nasycone, czyste)
Odcinek łączący dwie dowolne barwy zawiera wszystkie barwy jakie można uzyskać przez odpowiednie zmieszanie barw na brzegach odcinka
Wykres chromatyczności nie zawiera informacji o jasności (luminancji). Pełną paletę barw tworzy nieskończenie wiele płaszczyzn przecinających bryłę barw. Wniosek: wykres nie zawiera pełnej palety barw.
Podstawę „podkowy” stanowią barwy niespektralne (linia purpury)
Reprezentacja gamutów – palety barw możliwych do reprezentacji na odpowiednim nośniku
33
Gamuty
Gamuty urządzeń i nośników
34
Gamuty
Porównanie gamy barw reprodukowalnych w systemach PANTONE, CMYK oraz standardowego monitora CRT.
Żaden z systemów nie daje możliwości odwzorowania pełnego zestawu barw występujących w rzeczywistości (naturze)
35
Elipsy Stilesa w modelu CIE-XYZ
Obok podanych zalet model CIE XYZ posiada też wady. Podstawową wadą jest fakt percepcyjnej niejednorodności: jednakowym odległościom na wykresie chromatyczności nie odpowiadają jednakowym różnicom w barwach postrzeganych przez normalnego obserwatora. Innymi słowy: odległość pomiędzy barwami nie niesie informacji o stopniu podobieństwa pomiędzy barwami.
Punkty odpowiadające bodźcom barwowym nierozróżnialnym przez człowieka tworzą elipsy o różnych wielkościach (barwy o współrzędnych wewnątrz elips są nierozróżnialne).
Problem ten ujawnia się w przypadkach, gdy konieczne jest określenie różnicy pomiędzy barwą uzyskanąw drodze reprodukcji a oryginałem. Zwykła odległość euklidesowa nie jest wówczas efektywną miarązniekształcenia barwy.
Elipsy Stilesa w układzie XYZ (elipsy są powiększone ok. 10x)
36
Model RGBModel RGB stanowi najpopularniejszą reprezentację barw.
Model oparty o trójchromatyczną teorię postrzegania barw, zgodnie z którą wrażenie barwy powstaje wskutek pobudzenia trzech rodzajów czopków o maksimach absorpcji spektralnej dla światła czerwonego, zielonego i niebieskiego.
Bryła barw modelu RGB jest sześcianem w wierzchołkach którego znajdują się barwy podstawowe: czerwona, zielona, niebieska, barwy do nich dopełniające: żółty, niebieskozielony (cyjan), purpura (magenta) oraz czerń (0,0,0) i biel (1,1,1).
Model addytywny – barwy uzyskuje się w drodze mieszania barw podstawowych R, G, B w różnych proporcjach. Brak barw odpowiada czerni.
Zalety: wszystkie barwy pośrednie można reprezentować liniową kombinacją barw podstawowych (wygoda i szybkość obliczeń), odpowiada sposobom generowania barw w urządzeniach typu monitor i telewizor…
Model RGB posiada wady, które powodują, że w wielu zastosowaniach konieczna jest transformacja obrazu RGB do innej przestrzeni barw posiadającej lepsze własności. Podstawowe wady modelu RGB to:
percepcyjna niejednorodność, tzn. słabe korelacje pomiędzy postrzeganą różnicą dwóch barw a ich euklidesową odległością w sześcianie RGB,
nieintuicyjność posługiwania się składowymi R, G i B w określaniu barwy – problem z wizualizacjąbarwy na podstawie znajomości składowch RGB,
korelacje pomiędzy poszczególnymi składowymi. Istnieją szacunki, że dla obrazów naturalnych korelacje pomiędzy składowymi R i B, R i G oraz G i B wynoszą odpowiednio: 0.78, 0.98 oraz 0.94. Obraz zapisany w formacie RGB jest podatny na kompresję.
wrażliwość wartości składowych na zmiany poziomu oświetlenia (iluminacji) sceny,
jednoczesne operacje wykonywane na wszystkich składowych mogą prowadzić do przekłamania kolorów (np. rozjaśnianie obrazu RGB wymaga ingerencji we wszystkie składowe obrazu).
Rys. (a) – sześcian barw modelu RGB; (b) – nieintuicyjność modelu RGB. Lewa kolumna odpowiada barwom (R,G,B)=(10,200,10..150), prawa kolumna barwom (R,G,B)=(100,200,10..150); (c) – dwa przykładowe kolory, dla których odległość euklidesowa w przestrzeni RGB jest identyczna (d=90) z odległością pomiędzy kolorami w dowolnym wierszu na rysunku (b).
b
a
c
37
Model rgb (unormowany RGB)Wartości składowych RGB są proporcjonalne do ilości światła padającego na obrazowany obiekt (fragment sceny). Wszystkie
lokalne zaburzenia w ilości światła padającego na obiekt spowodowane, dla przykładu zacienieniem, powodują wyraźne zmiany wszystkich składowych obrazu. Jest to niepożądane zjawisko, które może prowadzić do błędów segmentacji prowadzonej na obrazie RGB (lub błędów innego rodzaju).
Prostą operacją uniezależniającą składowe barwy od ilości światła jest proces normalizacji składowych postaci:
w której rezultacie powstają barwy unormowane r, g oraz b spełniające warunek: r+g+b=1 (znajomość dwóch składowych pozwala wyznaczyć trzecią).
Problem osobliwości: R+G+B=0.
Składowe rgb w przeciwieństwie do RGB posiadają pożądaną cechę: ich wartości nie zmieniają się pod wpływem zmiany oświetlenia obiektu (sceny) bez zmiany składu spektralnego światła.
Czy znajomość składowych r, g oraz b wystarcza do jednoznacznego odtworzenia wartości składowych R, G oraz B?
38
Model rgb (unormowany RGB) - ilustracja
Rys. (a) - obraz oryginalny; (b), (c), (d) odpowiednio składowe R, G, B obrazu (a); (e), (f), (g) odpowiednio składowe unormowane r, g, b obrazu (a); (h) oraz (i) wartości pikseli w wierszu 100 dla składowej odpowiednio G oraz g obrazu oryginalnego. Widać stabilnośćskładowych rgb na zmiany poziomu oświetlenia, któremu nie towarzyszy zmiana składu spektralnego światła.
50 100 150 200 250 300 350
50
100
150
200
250
300
0 100 200 300 4000
50
100
150
200
250
300
0 100 200 300 4000
50
100
150
200
250
300
0 100 200 300 4000
50
100
150
200
250
300
0 100 200 300 4000
50
100
150
200
250
300
0 100 200 300 4000
50
100
150
200
250
300
0 100 200 300 4000
50
100
150
200
250
300
100 200 300 400
50
100
150
200
250
100 200 300 400
0.4
0.5
0.6
0.7
a
b c d
e f g
h i
39
Model HSV (1)Model HSV (hue, saturation, value) jest modelem, który nawiązuje do naturalnego sposobu interpretacji i opisu barw za
pomocą trzech atrybutów: odcienia (hue), nasycenia (saturation) oraz jasności (intensity, brightness, value). Dwa pierwsze atrybuty związane są z cechą jakościową światła (chromatyczność), trzeci parametr, jasność, jest związany z ilością światła.
Model HSV pozwala rozłożyć wrażenie barwne na trzy składowe, przy czym tylko dwie dotyczą chromatyczności.
Barwy w modelu HSV reprezentowane są jako punkty leżące na oraz w wewnątrz ostrosłupa foremnego o podstawie sześciokąta. Ostrosłup HSV można uzyskać przez transformację sześcianu RGB.
Oś V (value, intensity) przyjmuje wartości z przedziału [0,1] i stanowi ośostrosłupa. Punkty osi V reprezentują barwy achromatyczne (poziomy szarości od czerni do bieli)
Nasycenie S (saturation) przyjmuje wartości z przedziału [0,1] i jest mierzona jako odległość punkty barwy od osi V. Barwy o maksymalnym nasyceniu odpowiadają barwom świateł monochromatycznych.
Odcień H (hue) przyjmuje wartości z przedziału [0,360] i mierzony jest jako kąt obrotu wokół osi V (przeciwnie do kierunku ruchu wskazówek zegara). Jak zmienia się odcień w przypadku S=0?
Analiza ostrosłupa HSV wskazuje, że maksymalne nasycenie barwy jakie można uzyskać zależy od wartości jasności (ilości światła). Podobny efekt jest wbudowany np. w system barw Munsela. Przecięcie sześcianu płaszczyzną prostopadłą do osi V dla ustalonej wartości V daje możliwe barwy dla danego poziomu jasności. Dla płaszczyzny V=0 jedynym wrażeniem jest czerń.
Rys. Przestrzeń barw modelu HSV.
40
Model HSV (2)Równania opisujące konwersję pomiędzy modelami RGB oraz HSV w sposób przybliżony odpowiadają psychofizycznemu
wrażeniu (odcień, nasycenie, jasność) wywołanemu przez kombinację barw RGB.
Przy założeniu, że R,G,B=[0,1] konwersja modelu RGB do modelu HSV opisana jest równaniami:
Zaproponowano wiele wersji powyższych równań o znacznie mniejszej złożoności obliczeniowej. Przykładem jest równanie na składową H, które nie zawiera funkcji trygonometrycznych:
Implementując powyższe równania należy zwrócić uwagę na osobliwości! (np. dla barw achromatycznych) oraz na fakt, że zmienna θ jest wartością kątową wyrażoną w stopniach (nie radianach).
41
Model HSV (3) - ilustracja
Rys. (a) – sześcian RGB; obrazy (b), (c) i (d) to obrazy odpowiednio H, S oraz V obrazu oryginalnego wyrażonego w modelu HSV.Obraz (e) jest obrazem składowej H obrazu oryginalnego (a) silnie skompresowanego algorytmem JPEG.
a b
c d
50 100 150 200 250
50
100
150
200
250
0 50 100 150 200 250 3000
50
100
150
200
250
0 50 100 150 200 250 3000
50
100
150
200
250
0 50 100 150 200 250 3000
50
100
150
200
250
0 50 100 150 200 250 3000
50
100
150
200
250
e
42
Obraz w składowych RGB…
Rys. Obraz RGB. Na następnym slajdzie przedstawiona jest wersja HSV obrazu.
ba
c d
43
…Model HSV (4) - ilustracja
Rys. (a) – obraz oryginalny oraz odpowiednio jego składowe H, S, V w modelu HSV.Obraz (e) stanowi pokolorowanąwersję obrazu składowej H (obrazu (b)).
Obrazy (b) oraz (e) wskazują na wyraźne rozseparowanie obszarów o różnym odcieniu co podkreśla istnienie obiektów na jednolitym tle.
ba
dc e
44
Model HSV (5) – przykład segmentacji
ba
dc
Rys. Przykład segmentacji przez kwantyzacjęskładowej H obrazu w modelu HSV.
(a) – obraz oryginalny; (b)-(d) obrazy powstałe po kwantyzacji odcienia do odpowiednio 6, 4 oraz 3 poziomów.
45
Model HSV (6)Zalety modelu HSV:
Naturalność i zgodność ze sposobem opisu barw przez człowieka.
Separacja wielkości opisujących wrażenia chromatyczne od achromatycznych (HS oraz V). Dla przykładu, wykonanie operacji rozjaśnienia obrazu RGB wymaga modyfikacji wszystkich trzech składowych. Ta sama operacja w obrazie po konwersji do przestrzeni HSV wymaga modyfikacji tylko składowej V. Podobnie w przypadku modyfikacji nasycenia i odcienia.
Możliwość opisu barwy poprzez tylko dwie składowe: H oraz S. Ta cecha pozwala wykorzystywać model HSV w zastosowaniach do rozpoznawania obiektów na podstawie koloru (barwy) niezależnie od zmian jasności (podobnie jak model rgb).
Pozwala zdefiniować efektywne miary w przestrzeni obrazu. Przykładem miar może być liczba unikalnych kolorów mierzonych jako liczba odcieni, nasycenie pikseli (pixel saturation) jako stosunek liczby pikseli o maksymalnym nasyceniu do liczby pikseli nienasyconych oraz często stosowana miara odległości na histogramach HSV.
Wady modelu HSV:Istnienie osobliwości w równaniach konwersji RGB do HSV: osobliwość H dla wszystkich barw achromatycznych oraz
osobliwość S dla czerni (R=G=B=0),Percepcyjna niejednorodność pomimo zorientowania modelu na intuicyjność.
Przykłady wykorzystania modelu HSV w przemyśle i technice:
identyfikacja obiektów kodowanych barwą,
sortowanie i klasyfikacja owoców i warzyw…
rozpoznawanie znaków drogowych.
46
Modele barw YUV oraz YIQJednakowe traktowanie składowych R, G i B prowadzi do nieefektywnego opisu barwy. Z jednej strony ludzkie oko jest
najbardziej wrażliwe na zieleń, mniej na czerwień oraz barwę niebieską. Z drugiej strony, bardziej czułe na zmiany luminancji niż chrominancji. Obie te cechy zostają wykorzystane w konstrukcji modeli YUV oraz YIQ.
Modele YUV (Europa) oraz YIQ (USA, Kanada, Japonia) niezależnie opisują składowe luminancji oraz chrominancji barwy: reprezentacja barwy w formacie: chrominancja–luminancja.
Modele YUV oraz YIQ wykorzystuje się do kodowania barw w transmisji sygnału TV (analogowy kompozyt) w systemach kodowania PAL, SECAM oraz NTSC.
Składowa Y obu modeli jest identyczna i odpowiada luminancji (luma). Składowa Y stanowi czarno-białą treść obrazu kolorowego. Pozostałe składowe, UV oraz IQ są tzw. sygnałami różnicowymi (patrz równania) i niosą informacje o barwie (chrominancja).
Równania konwersji pomiędzy modelem RGB oraz YUV i YIQ są potaci:
Składowe modelu YUV w systemie PAL Składowe modelu YIQ
Modele YUV i YIQ wykorzystują własności ludzkiego widzenia (np. wagi składowych R, G, B w równaniu na luminancję Y odpowiadają wrażliwości oka na barwy podstawowe)
Składowe U, V oraz I, Q mogą przyjmować wartości ujemne.
47
Modele barw YUV oraz YIQ
0 50 100 150 200 250
0
50
100
150
200
250
300
350
0 50 100 150 200 250
0
50
100
150
200
250
300
350
0 50 100 150 200 250
0
50
100
150
200
250
300
350
Rys. Przykładowy obraz oraz jego składowe Y, I oraz Q.
48
Model YCbCrModel YCbCr stanowi przesuniętą (offset) oraz przeskalowaną wersję systemu YUV.
Barwa reprezentowana jest przez składową luminancyjną (Y) oraz dwie składowe chrominancji Cb oraz Cr.
Model Ohta I1I2I3. Model w którym stopień korelacji pomiędzy składowymi jest bliski wartości osiąganej przez transformację Karhunena-Loeve’go.
Model PhotoYCC opracowany przez firmę Kodak w 1992 jako format archiwizacji obrazów na płytach Photo CD.
Model CMY(K).
Modele CIELUV oraz CIELAB.
Rys. Formaty modelu YCbCR. Format 4:4:4, 4:2:2 oraz 4:2:0.
YCbCr dopuszcza kilka formatów kodowania barwy różniących się częstością próbkowania składowych. Stosowanie różnych formatów jest oparte o własność ludzkiego oka polegającą na mniejsze wrażliwości na zmiany barwy niż zmiany luminancji. Format 4:4:4 odpowiada jednakowej częstości próbkowania składowych Y oraz Cb i Cr. Dla formatu 4:2:2 składowe Cb oraz Cr są w poziomie próbkowane z częstością dwukrotnie mniejszą niż składowa Y. W przypadku formatu 4:2:0 częstośćpróbkowania jest zmniejszana dwukrotnie zarówno w pionie, jak i w poziomie.