Marcin Wilczewski Politechnika Gdańska, 2008/091 · Modele barw. Charakterystyki obrazu....

1

Algorytmy graficzne

Marcin Wilczewski Politechnika Gdańska, 2008/09

2

Zagadnienia, wykład, laboratorium

Wykład:Światło i barwa. Modele barw.Charakterystyki obrazu. Reprezentacja i opis.Obrazy binarne i ich przetwarzanie. Obrazy barwne i ich przetwarzanie.Metody przetwarzania obrazu w dziedzinie przestrzennej i częstotliwościowej.Algorytmy kompresji danych obrazowych.

Wykład kończy się pisemnym zaliczeniem (ostatnie zajęcia w semestrze, 20 punktów).

Literatura:Rafael C. Gonzalez, Richard E. Woods, „Digital Image Processing”R. Tadeusiewicz, P. Korohoda, „Komputerowa analiza i przetwarzanie obrazów”

Oceny[26,30] – 3; [31-35] – 3+; [36,40] – 4; [41,45] – 4+; [46-50] - 5

Laboratorium:Problemy do rozwiązania omawiane na wykładzie. Czas realizacji od 1 do 4 tygodni. Maksymalnie: 30 punktów. Możliwość zdobycia punktów na wykładzie.

3

Obszar zainteresowań wykładu

Dziedziny związane z tworzeniem i przetwarzaniem obrazów cyfrowych:grafika komputerowa – generowanie obrazów, tworzenie obrazów sztucznych, przetwarzanie obrazów naturalnych. Celem jest stworzenie obrazu,cyfrowe przetwarzanie obrazów – celem jest wydobywanie lub podkreślanie istotnych informacji zawartych w obrazie, computer vision (widzenie komputerowe)

in/out obraz opis

obraz przetwarzanie obrazów (image processing)

computer vision (widzenie komputerowe)

sztuczna inteligencjaopis grafika komputerowa

4

Układ wzrokowy człowieka

Siatkówka. Wyściela dno oka. Uważa się, że stanowi najbardziej wysuniętą na zewnątrz część mózgu.

Plamka żółta stanowi centralny obszar siatkówki i wraz dołkiem centralnym (fovea) jest obszarem najostrzejszego widzenia. Jednym z zadań zwężającej sięźrenicy jest skupienie strumienia światła na plamce żółtej. Dlaczego nadmiar światła w oku jest niepożądany?

Komórkami fotoreceptorowymi oka są pręciki i czopki. Ich położenie oraz proporcje zależne są od konkretnego regionu siatkówki. Czopki dominują w regionach centralnych (plamka żółta i dołek centralny) tworząc obszar widzenia o największej rozdzielczości. Wraz z oddalaniem się od plamki żółtej maleje ilośćczopków, przy jednoczesnym wzroście liczby pręcików. Plamka ślepa jest obszarem braku fotoreceptorów.

Związkiem absorbującym światło w pręcikach jest rodopsyna o maksimum absorpcji dla fal długości 500nm. Dla czopków istnieją trzy różne związki absorbujące (jodopsyny) o maksimach absorpcji 450nm, 530nm oraz 570nm, przy czym pojedynczy czopek zawiera jeden rodzaj opsyny.

Dwa systemy widzenia: pręcikowy (nocny, skotopowy) oraz czopkowy (dzienny, fotopowy). Przełączanie systemów regulowane jest przez natężenie światła docierającego do oka.

Proporcje pomiędzy pręcikami i czopkami zależą od trybu życia organizmu (u człowieka stosunek pręcików do czopków wynosi ok.. 120:6).

W oku zachodzi silna redukcja (i przekształcanie) informacji nie tylko przez rozpraszanie i absorpcję światła padającego na komórki pigmentowe, ale równieżprzez uśrednianie sygnałów pochodzących z poszczególnych receptorów (pola receptorowe).

Absorpcja fotonów i wywołane tym reakcje można uważać za pierwszy etap procesu przetwarzania informacji niesionej przez promieniowanie elektromagnetycznie przez organizm.

Rys. (a) schemat ludzkiego oka, (b) schemat budowy pręcika i czopka.

a

b

5

Cechy detekcji ludzkiego oka

Efekt pasm Macha (efekty graniczne, złudzenie kontrastu brzegowego) tłumaczy się zjawiskiem hamowania obocznego sąsiednich fotoreceptorów lub pól receptorowych. Prowadzi to do odczucia rozjaśnienia części jasnej i przyciemnienia części ciemnej wzdłuż granicy pól. Hamowanie oboczne interpretuje się jako proces wzmacniania poziomu sygnału do szumu (zwiększania kontrastu).

Rozdzielczość przestrzenna jest związana z gęstością upakowania fotoreceptorów w siatkówce. W określonych warunkach dwa punkty zewnętrzne emitujące światło są percepowane jako jeden punkt świetlny.

Rozdzielczość przestrzenna związana jest z natężeniem sygnału. Spadek natężenie sygnału pociąga za sobą poszerzenie otworu źrenicy, zwiększenie rozpraszania światła w gałce ocznej i zmniejszenie kontrastu (pobudzenie pól receptorowych o mniejszej rozdzielczości w peryferyjnych obszarach siatkówki).

Adaptacja do poziomu oświetlenia wiąże się z koniecznościąprzejścia z systemu czopkowego na pręcikowy lub odwrotnie Efektami adaptacji tego typu są m. in. oślepienie wskutek działania silnego bodźca świetlnego (globalne podwyższenie progu pobudzenia fotoreceptorów), utrzymujące się oślepienie po ustaniu działania bodźca, niższa wrażliwość na ciągłe zmiany jasności (natężenia) niżna zmiany skokowe (nieliniowa wrażliwość na zmiany jasności).

Prawo Webera – progowa wielkość dostrzegalnej różnicy jasności, ΔI, jest proporcjonalna do wartości bodźca początkowego, I, tzn. ΔI/I≈0.02=const. Prawo to nie stosuje się dla skrajnie dużych i małych wartości bodźca.

Kontrast równoczesny luminancji

Rozdzielczość czasowa (efekt stroboskopowy).Rys. (a) Efekt pasm Macha (kontrast graniczny); (b) kontrast powierzchniowy. Ten drugi polega na złudzeniu zwiększenia jasności obiektu w miarę zwiększania kontrastu z tłem.

a

b

6

Złudzenia wieloznaczne (sylwetki alternatywne)

a b

Rys. Sylwetki alternatywne: twarz i puchar. (a) – interpretacja obrazu jest zależna od definicji tła i obiektu. Wieloznaczna interpretacja rysunku (b) nie jest tak oczywista jak rysunku (a) (tzn. widać raczej puchar niż twarze).

7

Kontrast równoczesny – przykład 1

[http://web.mit.edu/persci/]

8


[http://web.mit.edu/persci/]

9


Rys. Pierścienie Koffka.

a b

c

10

Światło i barwa

Elementem koniecznym zjawiska widzenia jest triada optyczna (źródło światła, obiekt, obserwator). Barwa nie jest immanentną cechą obiektów materialnych, ale wypadkową cech obiektu (materiał, geometria), cech padającego światła (skład fizyczny) oraz zjawisk psychologicznych.Czym jest światło?Czym jest barwa?

Długość fali światła [nm]

Wrażenie barwy przy postrzeganiu w warunkach widzenia

fotopowego skotopowego

380-440 fioletowa

440-470 Indygo

470-480 błękitna

480-490 niebieska

490-510 niebieskozielona

510-530 niebieskawozielona

530-560 zielona

560-580 żółtozielona

580-590 żółta

590-600 żółtopomarańczowa

600-610 pomarańczowa

610-620 pomarańczowoczerwona

620-780 czerwona

nie występuje wrażenie barwy

11

Czym jest barwa?

Światło odbite od poszczególnych pól powyższej sekwencji i rejestrowane przez ludzkie oko jakościowo identyczne. Różni się jakością.

Do opisu wrażenia wywołanego działaniem każdego bodźca świetlnego używa się wielkości ilościowych (jasność) oraz jakościowych (chromatyczność):jakość (chromatyczność) - odcień oraz nasycenieilość (jasność) - luminancja

Barwa (wrażenie barwne) jest wrażeniem wzrokowym powstającym na skutek oddziaływania (w określonych warunkach) fali świetlnej z materią (receptorami). Rodzaj wrażenia barwnego zależy od: cech fizycznych fali świetlnej (właściwości promieniowania), zjawisk fizjologicznych zachodzących pod wpływem światła oraz zjawisk natury psychologicznej.Barwa jest atrybutem każdego wrażenia świetlnego postrzeganego w warunkach widzenia fotopowego i określa jakość tego wrażenia (światła).

12

Cechy barwy

Określenia fizyczne (fizykalne)dominująca długość falizakres spektralny światłanatężenie

W zastosowaniach technicznych opis tego typu jest nieefektywny.

Określenia percepcyjneodcień barwy (np. czerwony, niebieski, zielony, żółty)nasycenie (np. zielony, seledynowy, oliwkowy, etc.) lub czystość pobudzeniajasność

13

Trójpobudzeniowa teoria percepcji barw

Zgodnie z teorią trójpobudzeniową wrażenia barwne powstają na skutek działania fali świetlnej na trzy rodzaje receptorów siatkówki oka: czopków S (B-blue, niebieskie), M (G-green, zielone) oraz L (R-ed, czerwone). Każdy z rodzajów czopków posiada szczytową czułość dla różnych zakresów długości fali i jest zdolny pobrać światło tylko z jednego zakresu widma.

Wrażenie barwne (barwa uświadamiana) jest funkcją stosunku trzech sygnałów: β:γ:δSuma β+γ+δ wpływa na odczucie jasności (luminancji) bodźca świetlnego. Równocenne pobudzenie trzech receptorów β:γ:δ=1:1:1 prowadzi do wrażenia bieli lub szarości (w zależności od sumy sygnałów).Na gruncie teorii trójpobudzeniowej można wyjaśnić zjawisko metameryzmu: β=const., γ=const., δ=const.Wniosek: oko nie analizuje fizycznego składu spektralnego światła, ale uśrednia (całkuje) docierający sygnał. Całe promieniowane elektromagnetyczne zostaje zredukowane do trzech czynników (silna redukcja informacji). Skoro tak, to w metodach uzyskiwania barwnych obrazów rzeczywistości nie trzeba odtwarzać ich właściwości spektralnych.

Przyjmując, że padające na receptory światło opisane jest przez funkcjęrozkładu spektralnego E(λ), na wyjściu czopków pojawiają się sygnały:

14

Metameryzm

Światła o czterech podanych wyżej rozkładach widmowych wywołują to samo wrażenie barwne (podane obok).

Bodźce świetlne różniące się rozkładem spektralnym mogą wywoływać to samo wrażenie barwne (wrażenie barwy). Bodźce takie nazywane są metamerami, a zjawisko - metameryzmem.

Na podstawie właściwości spektralnych (skład widmowy, skład fizyczny) bodźca świetlnego możnaokreślić wrażenie barwne jakie bodziec ten wywoła.Zależność w przeciwną stronę nie jest prawdziwa, tzn. barwa nie implikuje składu widmowego bodźca świetlnego.Czerwone światło żarówki (widmo ciągłe) i czerwone światło lasera (światło monochromatyczne)– skład fizyczny świateł różny, a wrażenie barwne może być identyczne. Prosty eksperyment: ta sama fotografia kolorowa oglądana w świetle obu źródeł wygląda inaczej! Jak?Zależność widmo-barwa jest zależnością typu wiele do jednego.Jak wyjaśnić zjawisko metameryzmu na gruncie trójpobudzeniowej teorii widzeniaW zastosowaniach technicznych nie odtwarza się składu widmowego światła, ale jedynie składowe β, γ, δ.

15

Prawa Grassmanna (1853)

Trzy prawa addytywnego mieszania bodźców barwowych (Grassmann – 1853)Każdy bodziec barwowy (wrażenie dowolnej barwy) może być odtworzony jednoznacznie przez addytywne zmieszanie trzech odpowiednio dobranych bodźców podstawowych (liniowo niezależnych). Należy podkreślić, że taka synteza addytywna nie odtwarza własności fizycznych bodźca, ale jedynie efekt, jaki on wywołuje w układzie widzenia (oku).Jasność bodźca wynikowego jest równa sumie jasności bodźców składowych.Różne bodźce świetlne (różniące się rozkładem spektralnym) wywołujące to samo wrażenie barwy zmieszane w jednakowych stosunkach z innych bodźcem świetlnym dają jednakowe nowe bodźce barwowe, tzn. wywołują jednakowe wrażenia barwne.

Wniosek:Wrażenie barwne można odtworzyć bez konieczności rekonstrukcji składu widmowego bodźca.

16

Addytywna synteza barw

Cechy modelu

Określone wrażenie barwne uzyskiwane jest poprzez zmieszanie świateł (barw) podstawowych.

Z reguły stosuje się mieszanie świateł: czerwonego (R), zielonego (G) i niebieskiego (B). Teoretycznie można użyćinnych świateł (o innych barwach) ale wówczas gama (gamut) barw odtwarzanych jest mniejsza. Jednocześnie podobne efekty można uzyskać przez mieszanie więcej niżtrzech świateł.

Równocenne połączenie barw podstawowych daje czystąbiel. Zerowe składowe każdej z barw podstawowych dajączerń – brak barwy.

Wrażenie światła białego można też uzyskać przez zmieszanie tylko dwóch świateł. Barwy tych świateł sąwówczas nazywane barwami dopełniającymi.

Zwykle przyjmuje się, że intensywności barw podstawowych R, G oraz B leżą w zakresie [0,1], a tym samym dostępne barwy opisywane są w sześcianie jednostkowym.

Stosuje się do opisu „źródeł” światła – monitory CRT, odbiorniki TV

Synteza addytywna zachodzić może przy niejednoczesnym mieszaniu barw (pod pewnymi warunkami. Jakimi?)

17

Subtraktywna synteza barw - 1

Cechy modeluBarwami podstawowymi modelu są barwy dopełniające barw podstawowych R, G, B:cyjan (niebiesko-zielona), purpura oraz barwa żółtaModel subtraktywny – barwy powstająpoprzez selektywne usunięcie wybranego zakresu widma światła białego (filtracja, absorpcja)Warunkiem koniecznym syntezy jest obecność światła białego oraz substancji o selektywnej absorpcji promieniowania świetlnegoZastosowanie w poligrafiiŁatwość konwersji do barw modelu RGB

18

Subtraktywna synteza barw - 2

Filtrowanie światła białego przez barwy podstawowe modelu CMY

19

Barwa – potrzeba obiektywnego opisu

Istnieje potrzeba określania barwy w sposób

ścisły

obiektywny

precyzyjny

nadający się do przetwarzania komputerowego

bez konieczności korzystania z wzorników.

W praktyce powstało wiele sposób obiektywnego i numerycznego opisu barw

modele kolorymetryczne: CIE RGB, CIE XYZ, CIE UVW, CIE LUV

modele komputerowe i telewizyjne: RGB, HSV, YCbCR, YUV, YIQ.

20

Jak opisywać barwy?

Istnieją dwie podstawowe metody określania barw:wzorniki i atlasy barw publikowane w postaci tradycyjnej (wzorniki PANTONE, Villalobos, Euroscala, atlasy barw Munsella oraz Ostwalda, etc.). Zawierają próbki numerowane i usystematyzowane według określonych kryteriów. Istnieją rozwiązania elektronicznego pomiaru koloru PANTONE (kolorymetry elektroniczne). Reprodukcja barw z katalogów PANTONE w druku w oparciu o triadę CMYK nie zawsze jest możliwa. Sugeruje się stosowanie innych katalogów, np. Euroscala.Zalety: wygodne i naturalne w użyciu. Wady: nietrwałość wzorców, konieczność uwzględnienia takich parametrów jak rodzaj podłoża.metody kolorymetryczne oparte na trójchromatycznym mechanizmie widzenia człowieka: dowolny bodziec świetlny opisuje się udziałami trzech bodźców podstawowych.

patrz: www.pantone.pl

21

System barw Munsella - 1

Okrąg barw Newtona

[http://www.colorsystem.com]

Koncepcja Newtona okręgu barw pozwala interpretować odcień barwy (hue) jako wielkośćprzyjmującą wartości z przedziału 0-360 stopni i odłożoną na obwodzie koła. Nie istnieje więc pojęcie wartości minimalnych i maksymalnych odcienia.

22

System uporządkowania barw Munsella (1905) - 2

Przestrzeń trzech parametrów HVC systemu uporządkowania barw Munsella

System barw Munsella jest jednym z najstarszych i dotychczas powszechnie stosowanym sposobem opisu barw.

Parametry modelu: odcień, chroma (nasycenie), wartość (jasność).

Na osi wartości (oś z) położone są barwy achromatyczne (czerń, szarości, biel)

Wartość (value) leży w przedziale [0,10], nasycenie w przedziale [0,28] w zależności od konkretnej barwy

W 1942 ASO rekomendowała model Munsella jako standard oznaczania barwy powierzchni (np. gleby). Stosowany do zastosowań naukowych i przemysłowych, ale nie poligraficznych.

23


Krąg barw Munsella

System Munsella:5 barw głównych: Red, Yellow, Green, Blue, Purple5 barw rozszerzonych (pośrednich):YR(pomarańczowy), GY (jasnozielony), BG (cyjan), PB (fiolet), RP (róż)Kręgi barw podzielone są na 10 segmentów, których środki odpowiadają barwom głównymNazewnictwo barw zgodnie z konwencją: H V/C. Przykład: 5RP2/12, 5RP5/26Porównanie próbki barwy lub światła z wzorcem jest procedurą subiektywnąZnacznie ograniczona przestrzeń barw

24


Barwa 5PB w atlasie barw Munsella Reprezentacja przestrzenna modelu barw Munsella

http://www.daicolor.co.jp

25

Eksperyment kolorymetrii trójchromatycznej (idea)

Eksperyment zrównania (dopasowania, matching) barw. Zrównywanie bodźców odbywa się w odpowiednich warunkach, które mają zapewnić wyeliminowanie czynników psychologicznych i innych, takich jak struktura podłoża.

Posługiwanie się wzornikami jest wygodne w praktyce, ale nieprecyzyjne (np. określenie barwy zależy od rodzaju podłoża). Kolorymetria dziedzina nauki, która ma na celu liczbowy opis wrażeń barwnych (obiektywny opis chromatyczności bodźców barwowych). Metody kolorymetryczne opierają się na prawach Grassmanna.

Mieszanie bodźców podstawowych nie odtwarza fizycznie bodźca zadanego, ale jedynie kolorymetrycznie, tzn. odtwarza wrażenie barwne, ale nie skład widmowy światła.

26

Równanie barwy

Posługując się schematem eksperymentu kolorymetrycznego uzyskuje się tzw. równanie barwy prezentujące fakt zrównania bodźca świetlnego o zadanym rozkładzie spektralnym przez mieszaninę trzech niezależnych bodźców podstawowych

Z drugiego prawa Grassmanna wynika, że zachodzi równanie (pod warunkiem, że nastąpiło zrównanie jakości i ilości światła)

Równanie barwy ma postać równania wektorowego. Barwa jest punktem (elementem) rzeczywistej trójwymiarowej przestrzeni wektorowej, której bazą są bodźce podstawowe.Równanie barwy można uprościć do postaci:

Współczynniki a,b i c nazywane są składowymi trójchromatycznymi, natomiast unormowane a’, b’i c’ z przedziału [0,1] – współrzędnymi trójchromatycznymi w układzie bodźców podstawowych.

Do określenia chromatyczności bodźca (barwy) wystarczy znajomość trzech składowych lub dwóch współrzędnych trójchromatycznych.Metoda matematycznego, numerycznego, obiektywnego opisu barwy.

27

Model CIE-RGB 1931

Przykład przedstawiony wcześniej jest czysto teoretyczny i nie specyfikuje barw podstawowych. Najbardziej znanym przykładem przestrzeni (systemu, modelu) barw jest model CIE RGB opracowany przez CommisionInternationale de L’Eclairage (Międzynarodową Komisję Oświetleniową) w roku 1931.

Cechy modelu CIE RGB 1931

Barwy powstają jako mieszanina barw podstawowych: λR=700nm, λG=546,1nm oraz λB=435,8nm (dwie ostatnie długości fal to linie widma rtęci).

Proporcje dopasowania podawane są w tzw. jednostkach trójchromatycznych, tzn. tak by wrażenie bieli ekwienergetycznej uzyskać przy jednakowej ilości bodźców podstawowych. Użycie jednostek trójchromatycznych wymaga jedynie odpowiedniego przeskalowania. Dzięki temu punkt bieli ekwienergetycznej leży pośrodku trójkąta barw.

Dzięki stosowaniu jednostek trójchromatycznych punkt bieli ekwienergetycznej leży pośrodku trójkąta barw.

W oparciu o kolorymetr wykorzystujący jako podstawowe barwy świateł monochromatycznych o długości fal podanych wyżej wyznaczono równanie barwy dla wszystkich barw świateł monochromatycznych w widmie światła białego oraz obserwatora normalnego. Wynikiem tego są funkcje dopasowania barw (colormatching function).

28

Funkcje dopasowania barw modelu CIE RGB 1931

Funkcje dopasowania barw modelu CIE-RGB. Składowa r przyjmuje ujemne wartości w zakresie światła o długości fal pomiędzy długościami fal bodźców B oraz G, natomiast składowa g wartość ujemnąprzyjmuje dla świateł o długości fali poniżej długości fali bodźca B.

Funkcje dopasowania określają proporcje w jakich należy dokonać addytywnej syntezy barw podstawowych modelu aby odtworzyć barwę światła o zadanej długości fali

Postać krzywych wyznaczonych na podstawie danych eksperymentalnych (Wright, 1928,1929 oraz Guild, 1931) wskazuje, że nie każdą barwę można dopasować kombinacjąbarw podstawowych. Przykładem są barwy światełmonochromatycznych o długościach fal poniżej 546,1nm.

Oznaczając barwy podstawowe jako R, G, B, każdą barwęwidzialną reprezentować można jako wektor w przestrzeni wektorowej, której bazą są wektory R, G oraz B – jest to przestrzeń CIE RGB.

Posługując się kolorymetrem CIE RGB wyznaczyć można współrzędne trójchromatyczne dla światła o dowolnym rozkładzie spektralnym. Problem: jest to niepraktyczne! Istniejątablice.

Funkcje dopasowania przedstawione na rysunku odpowiadajądopasowaniu barw za pomocą konkretnych użytych w modelu barw podstawowych. Użycie innych barw podstawowych prowadzi do innym krzywych dopasowania.

Równania określające współrzędne w przestrzeni CIE-RGB dla koloru określonego rozkładem widmowym P(λ):

∫∫∫

),()(=

),()(=),()(=

λbλPλdb

λgλPλdgλrλPλdr

29

Pole barw modelu CIE-RGB

Wykres chromatyczności (pole możliwych barw) w modelu CIE-RGB. Wykres powstał przez zrzutowanie płaszczyzny (trójkąta) o równaniu r+g+b=1 na płaszczyznę RG. Zwróćuwagę na fakt, że składowa r przyjmuje wartości ujemne.

df Pole wszystkich możliwych barw zawiera równieżtzw. linię purpur (podstawa podkowy pola barw)

Purpura nie jest składową światła białego, jednak jest możliwa do odtworzenia przez zmieszanie świateł o długości fali 380nm oraz 700nm.

Lokus widma jest krzywą łączącą punkty odpowiadające barwom świateł monochromatycznych 380nm-780nm (barwy o największym nasyceniu). Krańce lokusu połączone są tzw. odcinkiem purpur.

Punkt E odpowiada bieli ekwienergetycznej, (1/3,1/3, 1/3).

Wadą modelu CIE RGB jest koniecznośćposługiwania się ujemnymi wartościami składowych i współrzędnych trójchromatycznych.

30

Model CIE-XYZ

Model barw opracowany w 1931 roku przez Międzynarodową Komisję Oświetleniową (CIE) dla rozwiązania problemu ujemnych współrzędnych i składowych trójchromatycznych.

Układ XYZ powstaje przez transpozycję układu RGB.

Bodźcami podstawowymi stają się bodźce oznaczane jako XYZ leżące poza obszarem barw fizycznie realizowalnych. Bodźce XYZ są więc fikcyjnymi, abstrakcyjnymi bodźcami barwowymi. Tym samym nie jest możliwa konstrukcja kolorymetru wykorzystującego bodźce XYZ.

Bodźce XYZ prowadzą do funkcji dopasowania o wartościach dodatnich (patrz rysunek obok).

Transformacja składowych trójchromatycznych pomiędzy CIE RGB oraz CIE XYZ opisana jest równaniem

Funkcje dopasowania (funkcje współczynników rozkładu) barw modelu CIE XYZ 1931

i można je odnaleźć w odpowiednich tablicach.

Składowe trójchromatyczne dowolnego bodźca świetlnego o zadanym rozkładzie widmowym S(λ) określające położenie dowolnej barwy w przestrzeni barw CIE XYZ określone są równaniami:

31

Przestrzeń barw modelu CIEXYZ

Przestrzeń barw modelu CIE XYZ 1931 jest bryłą o kształcie zbliżonym do stożka i o wierzchołku w początku układu współrzędnych.

Bryła składa się z punktów stanowiących współrzędne trójchromatyczne bodźców barwowych możliwych fizycznie do odtworzenia. Ponieważ w modelu CIE XYZ składowe trójchromatyczne przyjmują wartości dodatnie, to bryła barw znajduje się w pierwszym oktancie układu.

Posługiwanie się bryłą barw jest niewygodne, dlatego stosuje się wykres chromatyczności (pole barw).

Wykres chromatyczności uzyskuje się przez zrzutowanie płaszczyzny x+y+z=1 (równanie dla współrzędnych a nie składowychtrójchromatycznych) na płaszczyznę XY.

Współrzędne x oraz y jednoznacznie określają położenie punktu barwy na polu chromatyczności w układzie XYZ. Znajomość współrzędnych trójchromatycznych identyfikuje bodziec barwny i pozwala nazwaćwrażenie barwne jakie bodziec ten wywoła.

Przestrzeń barw modelu CIE XYZ 1931 (A) oraz wykres chromatyczności (B)

A

B

32

Model CIE-XYZ - cechy

Wykres chromatyczności modelu CIE-XYZ

Na brzegu obszaru w kształcie podkowy zlokalizowane są barwy nasycone (barwy spektralne, odcień barwy). Wnętrze obszaru wypełniają barwy nienasycone

Odcinek łączący barwę z lokusu z punktem bieli odpowiada barwom nienasyconym odcienia barwy z lokusu. Odcień danej barwy można określić przez przedłużenie odcinka przechodzącego przez punkt bieli i punkt danej barwy aż do punktu na lokusie

Nasycenie barwy określa stosunek długości odcinka łączącego punkt bieli z punktem barwy do odcinka łączącego punkt bieli z punktem lokusu i przechodzącego przez punkt barwy (barwy na lokusie są maksymalnie nasycone, czyste)

Odcinek łączący dwie dowolne barwy zawiera wszystkie barwy jakie można uzyskać przez odpowiednie zmieszanie barw na brzegach odcinka

Wykres chromatyczności nie zawiera informacji o jasności (luminancji). Pełną paletę barw tworzy nieskończenie wiele płaszczyzn przecinających bryłę barw. Wniosek: wykres nie zawiera pełnej palety barw.

Podstawę „podkowy” stanowią barwy niespektralne (linia purpury)

Reprezentacja gamutów – palety barw możliwych do reprezentacji na odpowiednim nośniku

33

Gamuty

Gamuty urządzeń i nośników

34

Gamuty

Porównanie gamy barw reprodukowalnych w systemach PANTONE, CMYK oraz standardowego monitora CRT.

Żaden z systemów nie daje możliwości odwzorowania pełnego zestawu barw występujących w rzeczywistości (naturze)

35

Elipsy Stilesa w modelu CIE-XYZ

Obok podanych zalet model CIE XYZ posiada też wady. Podstawową wadą jest fakt percepcyjnej niejednorodności: jednakowym odległościom na wykresie chromatyczności nie odpowiadają jednakowym różnicom w barwach postrzeganych przez normalnego obserwatora. Innymi słowy: odległość pomiędzy barwami nie niesie informacji o stopniu podobieństwa pomiędzy barwami.

Punkty odpowiadające bodźcom barwowym nierozróżnialnym przez człowieka tworzą elipsy o różnych wielkościach (barwy o współrzędnych wewnątrz elips są nierozróżnialne).

Problem ten ujawnia się w przypadkach, gdy konieczne jest określenie różnicy pomiędzy barwą uzyskanąw drodze reprodukcji a oryginałem. Zwykła odległość euklidesowa nie jest wówczas efektywną miarązniekształcenia barwy.

Elipsy Stilesa w układzie XYZ (elipsy są powiększone ok. 10x)

36

Model RGBModel RGB stanowi najpopularniejszą reprezentację barw.

Model oparty o trójchromatyczną teorię postrzegania barw, zgodnie z którą wrażenie barwy powstaje wskutek pobudzenia trzech rodzajów czopków o maksimach absorpcji spektralnej dla światła czerwonego, zielonego i niebieskiego.

Bryła barw modelu RGB jest sześcianem w wierzchołkach którego znajdują się barwy podstawowe: czerwona, zielona, niebieska, barwy do nich dopełniające: żółty, niebieskozielony (cyjan), purpura (magenta) oraz czerń (0,0,0) i biel (1,1,1).

Model addytywny – barwy uzyskuje się w drodze mieszania barw podstawowych R, G, B w różnych proporcjach. Brak barw odpowiada czerni.

Zalety: wszystkie barwy pośrednie można reprezentować liniową kombinacją barw podstawowych (wygoda i szybkość obliczeń), odpowiada sposobom generowania barw w urządzeniach typu monitor i telewizor…

Model RGB posiada wady, które powodują, że w wielu zastosowaniach konieczna jest transformacja obrazu RGB do innej przestrzeni barw posiadającej lepsze własności. Podstawowe wady modelu RGB to:

percepcyjna niejednorodność, tzn. słabe korelacje pomiędzy postrzeganą różnicą dwóch barw a ich euklidesową odległością w sześcianie RGB,

nieintuicyjność posługiwania się składowymi R, G i B w określaniu barwy – problem z wizualizacjąbarwy na podstawie znajomości składowch RGB,

korelacje pomiędzy poszczególnymi składowymi. Istnieją szacunki, że dla obrazów naturalnych korelacje pomiędzy składowymi R i B, R i G oraz G i B wynoszą odpowiednio: 0.78, 0.98 oraz 0.94. Obraz zapisany w formacie RGB jest podatny na kompresję.

wrażliwość wartości składowych na zmiany poziomu oświetlenia (iluminacji) sceny,

jednoczesne operacje wykonywane na wszystkich składowych mogą prowadzić do przekłamania kolorów (np. rozjaśnianie obrazu RGB wymaga ingerencji we wszystkie składowe obrazu).

Rys. (a) – sześcian barw modelu RGB; (b) – nieintuicyjność modelu RGB. Lewa kolumna odpowiada barwom (R,G,B)=(10,200,10..150), prawa kolumna barwom (R,G,B)=(100,200,10..150); (c) – dwa przykładowe kolory, dla których odległość euklidesowa w przestrzeni RGB jest identyczna (d=90) z odległością pomiędzy kolorami w dowolnym wierszu na rysunku (b).

b

a

c

37

Model rgb (unormowany RGB)Wartości składowych RGB są proporcjonalne do ilości światła padającego na obrazowany obiekt (fragment sceny). Wszystkie

lokalne zaburzenia w ilości światła padającego na obiekt spowodowane, dla przykładu zacienieniem, powodują wyraźne zmiany wszystkich składowych obrazu. Jest to niepożądane zjawisko, które może prowadzić do błędów segmentacji prowadzonej na obrazie RGB (lub błędów innego rodzaju).

Prostą operacją uniezależniającą składowe barwy od ilości światła jest proces normalizacji składowych postaci:

w której rezultacie powstają barwy unormowane r, g oraz b spełniające warunek: r+g+b=1 (znajomość dwóch składowych pozwala wyznaczyć trzecią).

Problem osobliwości: R+G+B=0.

Składowe rgb w przeciwieństwie do RGB posiadają pożądaną cechę: ich wartości nie zmieniają się pod wpływem zmiany oświetlenia obiektu (sceny) bez zmiany składu spektralnego światła.

Czy znajomość składowych r, g oraz b wystarcza do jednoznacznego odtworzenia wartości składowych R, G oraz B?

38

Model rgb (unormowany RGB) - ilustracja

Rys. (a) - obraz oryginalny; (b), (c), (d) odpowiednio składowe R, G, B obrazu (a); (e), (f), (g) odpowiednio składowe unormowane r, g, b obrazu (a); (h) oraz (i) wartości pikseli w wierszu 100 dla składowej odpowiednio G oraz g obrazu oryginalnego. Widać stabilnośćskładowych rgb na zmiany poziomu oświetlenia, któremu nie towarzyszy zmiana składu spektralnego światła.

50 100 150 200 250 300 350

50

100

150

200

250

300

0 100 200 300 4000

50

100

150

200

250

300

0 100 200 300 4000

50

100

150

200

250

300

0 100 200 300 4000

50

100

150

200

250

300

0 100 200 300 4000

50

100

150

200

250

300

0 100 200 300 4000

50

100

150

200

250

300

0 100 200 300 4000

50

100

150

200

250

300

100 200 300 400

50

100

150

200

250

100 200 300 400

0.4

0.5

0.6

0.7

a

b c d

e f g

h i

39

Model HSV (1)Model HSV (hue, saturation, value) jest modelem, który nawiązuje do naturalnego sposobu interpretacji i opisu barw za

pomocą trzech atrybutów: odcienia (hue), nasycenia (saturation) oraz jasności (intensity, brightness, value). Dwa pierwsze atrybuty związane są z cechą jakościową światła (chromatyczność), trzeci parametr, jasność, jest związany z ilością światła.

Model HSV pozwala rozłożyć wrażenie barwne na trzy składowe, przy czym tylko dwie dotyczą chromatyczności.

Barwy w modelu HSV reprezentowane są jako punkty leżące na oraz w wewnątrz ostrosłupa foremnego o podstawie sześciokąta. Ostrosłup HSV można uzyskać przez transformację sześcianu RGB.

Oś V (value, intensity) przyjmuje wartości z przedziału [0,1] i stanowi ośostrosłupa. Punkty osi V reprezentują barwy achromatyczne (poziomy szarości od czerni do bieli)

Nasycenie S (saturation) przyjmuje wartości z przedziału [0,1] i jest mierzona jako odległość punkty barwy od osi V. Barwy o maksymalnym nasyceniu odpowiadają barwom świateł monochromatycznych.

Odcień H (hue) przyjmuje wartości z przedziału [0,360] i mierzony jest jako kąt obrotu wokół osi V (przeciwnie do kierunku ruchu wskazówek zegara). Jak zmienia się odcień w przypadku S=0?

Analiza ostrosłupa HSV wskazuje, że maksymalne nasycenie barwy jakie można uzyskać zależy od wartości jasności (ilości światła). Podobny efekt jest wbudowany np. w system barw Munsela. Przecięcie sześcianu płaszczyzną prostopadłą do osi V dla ustalonej wartości V daje możliwe barwy dla danego poziomu jasności. Dla płaszczyzny V=0 jedynym wrażeniem jest czerń.

Rys. Przestrzeń barw modelu HSV.

40

Model HSV (2)Równania opisujące konwersję pomiędzy modelami RGB oraz HSV w sposób przybliżony odpowiadają psychofizycznemu

wrażeniu (odcień, nasycenie, jasność) wywołanemu przez kombinację barw RGB.

Przy założeniu, że R,G,B=[0,1] konwersja modelu RGB do modelu HSV opisana jest równaniami:

Zaproponowano wiele wersji powyższych równań o znacznie mniejszej złożoności obliczeniowej. Przykładem jest równanie na składową H, które nie zawiera funkcji trygonometrycznych:

Implementując powyższe równania należy zwrócić uwagę na osobliwości! (np. dla barw achromatycznych) oraz na fakt, że zmienna θ jest wartością kątową wyrażoną w stopniach (nie radianach).

41

Model HSV (3) - ilustracja

Rys. (a) – sześcian RGB; obrazy (b), (c) i (d) to obrazy odpowiednio H, S oraz V obrazu oryginalnego wyrażonego w modelu HSV.Obraz (e) jest obrazem składowej H obrazu oryginalnego (a) silnie skompresowanego algorytmem JPEG.

a b

c d

50 100 150 200 250

50

100

150

200

250

0 50 100 150 200 250 3000

50

100

150

200

250

0 50 100 150 200 250 3000

50

100

150

200

250

0 50 100 150 200 250 3000

50

100

150

200

250

0 50 100 150 200 250 3000

50

100

150

200

250

e

42

Obraz w składowych RGB…

Rys. Obraz RGB. Na następnym slajdzie przedstawiona jest wersja HSV obrazu.

ba

c d

43

…Model HSV (4) - ilustracja

Rys. (a) – obraz oryginalny oraz odpowiednio jego składowe H, S, V w modelu HSV.Obraz (e) stanowi pokolorowanąwersję obrazu składowej H (obrazu (b)).

Obrazy (b) oraz (e) wskazują na wyraźne rozseparowanie obszarów o różnym odcieniu co podkreśla istnienie obiektów na jednolitym tle.

ba

dc e

44

Model HSV (5) – przykład segmentacji

ba

dc

Rys. Przykład segmentacji przez kwantyzacjęskładowej H obrazu w modelu HSV.

(a) – obraz oryginalny; (b)-(d) obrazy powstałe po kwantyzacji odcienia do odpowiednio 6, 4 oraz 3 poziomów.

45

Model HSV (6)Zalety modelu HSV:

Naturalność i zgodność ze sposobem opisu barw przez człowieka.

Separacja wielkości opisujących wrażenia chromatyczne od achromatycznych (HS oraz V). Dla przykładu, wykonanie operacji rozjaśnienia obrazu RGB wymaga modyfikacji wszystkich trzech składowych. Ta sama operacja w obrazie po konwersji do przestrzeni HSV wymaga modyfikacji tylko składowej V. Podobnie w przypadku modyfikacji nasycenia i odcienia.

Możliwość opisu barwy poprzez tylko dwie składowe: H oraz S. Ta cecha pozwala wykorzystywać model HSV w zastosowaniach do rozpoznawania obiektów na podstawie koloru (barwy) niezależnie od zmian jasności (podobnie jak model rgb).

Pozwala zdefiniować efektywne miary w przestrzeni obrazu. Przykładem miar może być liczba unikalnych kolorów mierzonych jako liczba odcieni, nasycenie pikseli (pixel saturation) jako stosunek liczby pikseli o maksymalnym nasyceniu do liczby pikseli nienasyconych oraz często stosowana miara odległości na histogramach HSV.

Wady modelu HSV:Istnienie osobliwości w równaniach konwersji RGB do HSV: osobliwość H dla wszystkich barw achromatycznych oraz

osobliwość S dla czerni (R=G=B=0),Percepcyjna niejednorodność pomimo zorientowania modelu na intuicyjność.

Przykłady wykorzystania modelu HSV w przemyśle i technice:

identyfikacja obiektów kodowanych barwą,

sortowanie i klasyfikacja owoców i warzyw…

rozpoznawanie znaków drogowych.

46

Modele barw YUV oraz YIQJednakowe traktowanie składowych R, G i B prowadzi do nieefektywnego opisu barwy. Z jednej strony ludzkie oko jest

najbardziej wrażliwe na zieleń, mniej na czerwień oraz barwę niebieską. Z drugiej strony, bardziej czułe na zmiany luminancji niż chrominancji. Obie te cechy zostają wykorzystane w konstrukcji modeli YUV oraz YIQ.

Modele YUV (Europa) oraz YIQ (USA, Kanada, Japonia) niezależnie opisują składowe luminancji oraz chrominancji barwy: reprezentacja barwy w formacie: chrominancja–luminancja.

Modele YUV oraz YIQ wykorzystuje się do kodowania barw w transmisji sygnału TV (analogowy kompozyt) w systemach kodowania PAL, SECAM oraz NTSC.

Składowa Y obu modeli jest identyczna i odpowiada luminancji (luma). Składowa Y stanowi czarno-białą treść obrazu kolorowego. Pozostałe składowe, UV oraz IQ są tzw. sygnałami różnicowymi (patrz równania) i niosą informacje o barwie (chrominancja).

Równania konwersji pomiędzy modelem RGB oraz YUV i YIQ są potaci:

Składowe modelu YUV w systemie PAL Składowe modelu YIQ

Modele YUV i YIQ wykorzystują własności ludzkiego widzenia (np. wagi składowych R, G, B w równaniu na luminancję Y odpowiadają wrażliwości oka na barwy podstawowe)

Składowe U, V oraz I, Q mogą przyjmować wartości ujemne.

47

Modele barw YUV oraz YIQ

0 50 100 150 200 250

0

50

100

150

200

250

300

350

0 50 100 150 200 250

0

50

100

150

200

250

300

350

0 50 100 150 200 250

0

50

100

150

200

250

300

350

Rys. Przykładowy obraz oraz jego składowe Y, I oraz Q.

48

Model YCbCrModel YCbCr stanowi przesuniętą (offset) oraz przeskalowaną wersję systemu YUV.

Barwa reprezentowana jest przez składową luminancyjną (Y) oraz dwie składowe chrominancji Cb oraz Cr.

Model Ohta I1I2I3. Model w którym stopień korelacji pomiędzy składowymi jest bliski wartości osiąganej przez transformację Karhunena-Loeve’go.

Model PhotoYCC opracowany przez firmę Kodak w 1992 jako format archiwizacji obrazów na płytach Photo CD.

Model CMY(K).

Modele CIELUV oraz CIELAB.

Rys. Formaty modelu YCbCR. Format 4:4:4, 4:2:2 oraz 4:2:0.

YCbCr dopuszcza kilka formatów kodowania barwy różniących się częstością próbkowania składowych. Stosowanie różnych formatów jest oparte o własność ludzkiego oka polegającą na mniejsze wrażliwości na zmiany barwy niż zmiany luminancji. Format 4:4:4 odpowiada jednakowej częstości próbkowania składowych Y oraz Cb i Cr. Dla formatu 4:2:2 składowe Cb oraz Cr są w poziomie próbkowane z częstością dwukrotnie mniejszą niż składowa Y. W przypadku formatu 4:2:0 częstośćpróbkowania jest zmniejszana dwukrotnie zarówno w pionie, jak i w poziomie.

Marcin Wilczewski Politechnika Gdańska, 2008/091 · Modele barw. Charakterystyki obrazu....

Documents

Transcript of Marcin Wilczewski Politechnika Gdańska, 2008/091 · Modele barw. Charakterystyki obrazu....