Spor Karşılaşmalarında Skor Ekranının Okunması

36
T.C. GEBZE TEKNİK ÜNİVERSİTESİ Bilgisayar Mühendisliği Bölümü SPOR KARŞILAŞMALARINDA SKOR EKRANININ OKUNMASI Büşra ERKAN Danışman

Transcript of Spor Karşılaşmalarında Skor Ekranının Okunması

T.C.GEBZE TEKNİK ÜNİVERSİTESİ

Bilgisayar Mühendisliği Bölümü

SPOR KARŞILAŞMALARINDA

SKOR EKRANININ OKUNMASI

Büşra ERKAN

DanışmanDoç. Dr. Yusuf Sinan AKGÜL

ii

T.C.GEBZE TEKNİK ÜNİVERSİTESİ

Bilgisayar Mühendisliği Bölümü

ii

SPOR KARŞILAŞMALARINDA

SKOR EKRANININ OKUNMASI

Büşra ERKAN

DanışmanDoç. Dr. Yusuf Sinan AKGÜL

i

Bu çalışma ..../..../200.. tarihinde aşağıdaki jüri tarafından Bilgisayar Mühendisliği Bölümünde Lisans Bitirme Projesi olarak kabul edilmiştir.

Bitirme Projesi Jürisi

Danışman Adı Doç. Dr. Yusuf Sinan AKGÜL

Üniversite Gebze Teknik Üniversitesi

Fakülte Mühendislik Fakültesi

Jüri Adı Doç. Dr. Fatih Erdoğan SEVİLGEN

Üniversite Gebze Teknik Üniversitesi

Fakülte Mühendislik Fakültesi

Jüri Adı Yrd. Doç. Dr. Yakup GENÇ

Üniversite Gebze Teknik Üniversitesi

Fakülte Mühendislik Fakültesi

v

ÖNSÖZ

Bitirme çalışmam sırasında engin bilgisiyle bana her zaman yol gösteren Sayın Doç. Dr. Yusuf Sinan AKGÜL hocama ve bu çalışmayı destekleyen Gebze Teknik Üniversitesi’ne içten teşekkürlerimi sunarım.

Ayrıca eğitimim süresince bana her konuda destek veren aileme ve bana hayatlarıyla örnek olan tüm hocalarıma saygı ve sevgilerimi sunarım.

Aralık, 2015 Büşra ERKAN

v

İÇİNDEKİLER

ÖNSÖZ.................................................................................................VI

İÇİNDEKİLER..................................................................................VII

KISALTMA LİSTESİ..........................................................................IX

ÖZET......................................................................................................X

1. GİRİŞ..................................................................................................1

1.1. PROJE TANIMI..............................................................................2

1.2. PROJENİN NEDEN VE AMAÇLARI..........................................3

1.3. LİTERATÜR ARAŞTIRMASI......................................................3

1.4. PROJE GEREKSİNİMLERİ........................................................31.4.1. Fonksiyonel Gereksinimler.....................................................................4

1.4.2. Fonksiyonel Olmayan Gereksinimler....................................................4

1.4.2. Sistemin Temel Özellikleri......................................................................4

1.5. BAŞARI KRİTERLERİ.................................................................4

2. YÖNTEM............................................................................................5

2.1. SINIFLANDIRICININ EĞİTİLMESİ..........................................7

2.2. RAKAMLARIN BULUNMASI.....................................................8

2.3. RAKAMLARIN TANINMASI....................................................10

2.4. SKOR METNİNİN OLUŞTURULMASI...................................10

3. PROJE PLANLAMASI...................................................................10

3.1. SİSTEM MİMARİSİ....................................................................10

3.2. UML DİYAGRAMLARI..............................................................113.2.1. Kullanım Durum Diyagramı.................................................................11

3.2.2. Etkinlik Diyagramı................................................................................12

v

4. DENEYLER......................................................................................12

4.1. RAKAMLARIN BULUNMASI...................................................13

4.2. RAKAMLARIN TANINMASI....................................................144.2.1. Başarılı Sonuç Örnekleri.......................................................................14

4.2.2. Başarısız Sonuç Örnekleri....................................................................15

5. SONUÇ..............................................................................................16

KAYNAKLAR......................................................................................17

EKLER..................................................................................................19

v

KISALTMA LİSTESİ

HOG : Yönlü Gradientlerin Histogramı (Histogram of Oriented Gradients)SVM : Destek Vektör Makineleri (Support Vector Machines)GTÜ : Gebze Teknik Üniversitesi

i

ÖZET

Bu rapor G.T.Ü. Bilgisayar Mühendiliği Bölümü 4. sınıfında hazırlanan Lisans

Bitirme Projesi olarak geliştirilen Spor Karşılaşmalarında Skor Ekranının

Okunmasını içeren sistemin tanımı, içeriği, başlatılma nedenleri, amaçları ve

sonuçlarını içermektedir.

Gerçek dünya görüntüleri üzerinde metin bulma ve tanıma problemi son zamanlarda

üzerinde çokça çalışılmış bir bilgisayarlı görme problemidir. Bu çalışmalara örnek

olarak Google Sokak Görünümü uygulaması benzeri uygulamalar verilebilir.

Sistem, amatör basketbol karşılaşmalarında skor ekranının görüntüsünün izleyiciye

gösterilmek üzere gerçek zamanlı olarak metin haline getirilmesini

gerçeklemektedir. Günümüzde, amatör basketbol karşılaşmalarında, skor ekranı

izleyiciye kameralardan alınan görüntünün ekrana yerleştirilmesi ile sunulmaktadır.

Bu işlem sırasında yüksek maliyetli saha kameraları kullanıldığından maliyeti

oldukça fazla olmaktadır. Bu problemi çözmek adına projede web cam kullanılmış

ve sistemin maliyeti düşürülmüştür.

x

SUMMARY

In this report, the definition of systems, that developed as a graduation project,

content, reasons for launch, goals and results are mentioned.

Text detection and recognition in real-world images is a problem which has been

receiving significant attention . Computer vision applications like Google Street

View is an instance of this problem.

The system has been developed to display scoreboard image using web cam in

amateur basketball match. In amateur basketball matches, the scoreboard is shown

by placing the image that taken from the camera on screen. As costly field cameras

are used, the cost becomes too. This web cam used in the project to solve the

problem and reduced the cost of the system.

x

1. GİRİŞ

Gerçek dünya görüntüleri üzerinde metin bulma ve tanıma problemi son zamanlarda

üzerinde çokça çalışılmış bir bilgisayarlı görme problemidir. Bu çalışmalara örnek

olarak Google Sokak Görünümü uygulaması, görme engelli kişiler için yardımcı

uygulamalar ve benzeri uygulamalar verilebilir. Bu proje daha önce yapılmamış olsa

da bu konuyla yakından ilişkili başka araştırmalar ve projeler yapılmıştır. Bu

araştırmalar doğrultusunda yazılmış olan makaleler ve kitaplar projede referans

olarak alınmıştır.

Spor karşılaşmalarında skor ekranının okunması projesi doğada metin algılama

probleminin özelleşmiş bir formu gerçekleştirilmiş, spor karşılaşmalarında düşük

maliyetli kamera kullanılarak skor ekranının okunması ve metin olarak tekrar

oluştulması sağlanmıştır. Bu proje sayesinde skor ekranının görüntülenmesini

sağlayan yüksek maliyetli kamera yerine web kamera kullanılabilecek ve maliyet

düşürülecektir.

1

1.1. PROJE TANIMI

Sistem, amatör basketbol karşılaşmalarında skor ekranının görüntüsünün izleyiciye

gösterilmek üzere gerçek zamanlı olarak metin haline getirilmesini

gerçeklemektedir. Proje kapsamında eğitim verilerinin oluşturulması ve testlerin

yapılması adına Gebze Teknik Üniversitesi Prof. Dr. Ahmet Ayhan Spor Salonunda

bulunan skor ekranı kullanılmıştır.

Amatör basketbol karşılaşmalarında, skor ekranı izleyiciye kameralardan alınan

görüntünün ekranın üst köşesine yerleştirilmesi ile gösterilmektedir. Bu işlem

sırasında saha kameraları kullanıldığından maliyeti yüksek olmaktadır. Bu problemi

çözmek adına projede web cam kullanılmış ve maliyet düşürülmüştür.

Şekil 1.1.1 Sistemin Çalışma Şeması

2

1.2. PROJENİN NEDEN VE AMAÇLARI

Amatör basketbol karşılaşmalarında, skor ekranı izleyiciye kameralardan alınan

görüntünün ekrana yerleştirilmesi ile sunulmaktadır. Bu işlem sırasında yüksek

maliyetli saha kameraları kullanıldığından maliyeti oldukça fazla olmaktadır.

Projenin amaçları şu şekildedir;

Maliyet problemini çözmek adına projede web cam kullanılıp maliyetin

düşürülmesi

Doğada metin algılama probleminin özelleşmiş bir formunun gerçek

zamanlı olarak gerçeklenmesi amaçlanmıştır.

1.3. LİTERATÜR ARAŞTIRMASI

Yapılan literatür araştırması sonucunda, gerçek dünya görüntüleri üzerinde metin

bulma ve algılama problemini çözmek amacıyla bir çok çalışma yapıldığı

gözlemlenmiştir. Yapılan araştırmalar sonucunda projede HOG tabanlı SVM ve

kayan pencere yöntemi kullanılmasına karar verilmiştir.

1.4. PROJE GEREKSİNİMLERİ

Proje gereksinimlerini fonksiyonel gereksinimler ve fonksiyonel olmayan

gereksinimler diye iki başlık altında ifade etmek daha doğru olacaktır.

Bu kısımda fonksiyonel gereksinimler sistemin iç yapısına ait detaylara yer

verirken, fonksiyonel olmayan gereksinimler, performans, kullanım kolaylığı gibi

kullanılabilirlik ile alakalı gereksinimlere yer vermektedir.

3

1.4.1. Fonksiyonel Gereksinimler

Fonksiyonel gereksinimler şu şekildedir;

Kameradan görüntünün alınması

Skor ekranındaki rakamların yerinin bulunması

Rakam olduğu tespit edilen alanlardaki rakamların tanınması

Yeni bir skor ekranı görüntüsünün oluşturulması

Proje içerisinde 3 temel fonksiyon bulunmaktadır. Bu fonksiyonlar şu şekildedir;

Skor ekranındaki rakamların yerlerinin bulunması

Rakam olduğu belirlenen alanlarda bulunan rakamların tanınması

Bulunan yer ve rakam bilgileri ile skor metninin oluşturulması

1.4.2. Fonksiyonel Olmayan Gereksinimler

Sistemin güvenilirliği konusunda, kullandığımız açık kaynak kodlu bir

kütüphane olan OpenCV referans olarak gösterilmektedir.

Geliştirilebilir olmalıdır.

OpenCV

1.4.2. Sistemin Temel Özellikleri

Sistem gerçek zamanlı olarak çalışmaktadır.

Sistem 32/64 bit bilgisayarlarda çalışabilmektedir.

1.5. BAŞARI KRİTERLERİ

Proje bitiminin hangi ölçülerde başarılı olduğunun değerlendirilebilmesi için

oldukça önemli olan başarı ölçütümüz bu başlık altında belirtilecektir. Bunlar;

Maksimum %3 hata ile rakamların tanınması

Normal çekim şartları altında 100x100 pikselden büyük görüntüler için

çalışma

Alınan ilk görüntü için 5 saniye, sonraki görüntüler için 0.1 saniye görüntü

işleme süresi

4

2. YÖNTEM

Bu kısımda, projede kullanılan yöntemlerin nasıl geliştirildiği ve kullanılan araçların

ne için ve nasıl kullanıldığı ile ilgili detaylı açıklamalar yer almaktadır.

Şekil 2.1 Sistemin Çalışma Şeması

Sistemde kullanılan, görüntülerin alındığı kamera, bir web kamera üzerine yerleştirilmiş 12x zoom telefoto lens kullanılarak elde edilmiştir.

5

Şekil 2.2 Sistemde Kullanılan 12x Zoom Lens

Şekil 2.3 Lens Yerleştirilmiş Web Kamera

6

Şekil 2.4 Lens Yerleştirilmiş Web Kamera

2.1. SINIFLANDIRICININ EĞİTİLMESİ

Yönlü gradientlerin histogramı (Histogram of Oriented Gradients) bilgisayarlı

görme ve görüntü işleme alanlarında obje tanımak için sıkça kullanılan bir özellik

vektörü oluşturma yöntemidir. Bu yöntemde, görüntü hücrelere bölünür, bölünen

hücrelerin yoğunluk gradientleri çıkarılır, bunların histogramı oluşturulur.

Oluşturulan histogramlardan özellik vektörü elde edilir. Bu projede, sınıflandırıcının

eğitilmesi için HOG yöntemi kullanılmaktadır.

Support Vector Machine(SVM), denetimli bir öğrenme modelidir. Bu yöntemde

verilen veri seti bir doğru, düzlem vb. kullanılarak pozitif ve negatif değerler olarak

ikiye ayırılır. Gelen test verisinin pozitif ya da negatif olduğuna karar verilir.

Projede 64x32 piksel boyuntundaki görüntülerin HOG vektörleri hesaplanır ve

SVM’e verilerek eğitim yapılır.

Her rakam için ayrı bir SVM eğitilir. Buna ek olarak rakamların bulunması için bir

rakam sınıflandırıcısı eğitilir. Bu sınıflandırıcı skor ekranı görüntüsü üzerinde kayan

pencereler algoritmasını kullanarak gezer ve rakam olan alt görüntülerin

bulunmasını sağlar.

SVM eğitiminde kullanılan örnek görüntüler aşağıdaki gibidir;

7

Şekil 2.1.1 0 Rakamı İçin Kullanılan Örnek Pozitif Görüntü

Şekil 2.1.2 5 Rakamı İçin Kullanılan Örnek Pozitif Görüntü

2.2. RAKAMLARIN BULUNMASI

Kameradan alınan görüntü üzerinde kullanıcının skor ekranının 4 köşesini

işaretlenmesi istenir. İşaretlenen noktalar kullanılarak skor ekranının bir görüntüsü

oluşturulur. Bu görüntü üzerinde her rakamın sınıflandırcısı çalıştırılır. Her rakam

sınıflandırıcısından marjine belirli bir eşik değerinin üstünde uzak olan noktaların

SVM skorlarının mutlak değeri belirli bir kat sayı ile çarpılarak bir yoğunluk değeri

elde edilir. Elde edilen bu değer, tüm pikselleri başta sıfır olan skor ekranı

görüntüsüyle aynı boyutta bir görüntü üzerinde denk gelen noktaya, yoğunluk değeri

olarak yazılır. Oluşturulan bu skor görüntüsü üzerinde, en büyük olmayanı bastırma

yöntemleri kullanılarak rakamların konumları tespit edilir.

Şekil 2.2.1 Kesilen Skor Ekranının Görüntüsü

8

Şekil 2.2.2 SVM Skorlarından Oluşturulmuş Görüntü

Fakat bu yöntem kullanıldığında, skor görüntüsünü 10, skor görüntüsünü 1 kez

gezmek gerekmektedir. Bunlar da programın çalışma süresini uzatmaktadır. Bu

sebeple bu yöntemin değiştirilip iyileştirilmesine gidilmiştir.

Programın çalışmasını hızlandırmak adına öncelikle skor ekranının görüntüsü

üzerinde 10 kez gezme işlemine bir alternatif aranmıştır. Problemin çözümü için bir

rakam sınıflandırıcısı oluşturulmuştur. Bu sınıflandırıcının pozitif veri setini, tüm

rakamların pozitif görüntüleri, negatif veri setini ise, tüm rakamların ortak negatif

görüntüleri oluşturmaktadır. Bu yöntemde, görüntü üzerinde öncelikle, rakam

sınıflandırıcısı çalıştırılır ve rakamlar bulunur.

İkinci problemimiz olan skor değerlerinin bulunduğu görüntü üzerinde gezme işlemi

için ise, skorlar bir görüntü üzerinde değil bir vektörde tutulması yolu izlenmiştir.

Rakam sınıflandırıcısının verdiği skor değerlerinden, belirlenen eşik değerinin

üzerinde olanların koordinat bilgileri bir vektörde tutulur. Aynı zamanda, bu eşik

değerinin üzerindeki skorlar ayrı bir vektörde tutulur. Skor vektörünün n. indeksinde

bulunan skor değeri, koordinat vektöründeki n. indeksteki noktaya ait olmaktadır.

Bu vektörler üzerinde 15x15 piksel boyutunda bir alanda en büyük olmayanı

bastırma yöntemleri kullanılarak en yüksek skora sahip noktalar belirlenir. Bu

noktalar rakamların başlangıç noktalarını ifade etmektedir. Yapılan değişiklikler

sonucunda programın çalışma süresinde azalma görülmüştür.

9

2.3. RAKAMLARIN TANINMASI

Bu kısımda, rakamların bulunması işlemi tamamlandıktan sonra, bulunan alanlarda

oluşturulan görüntülerin HOG vektörleri çıkarılır. Çıkarılan vektör her bir rakamın

sınıflandırıcısına gönderilir, alınan skorlar karşılaştırılır ve en iyi skora sahip olan

rakamın o alanda bulunduğuna karar verilir.

2.4. SKOR METNİNİN OLUŞTURULMASI

Rakamların bulunması ve rakamın tanınması işlemleri tamamlandıktan sonra bu

aşamaya geçilir. Bu aşamada tanınan rakam, oluşturulan metinde olması gereken

konuma yerleştirilir.

3. PROJE PLANLAMASI

Bu bölümde projenin planlaması ve projedeki işleyiş hakkında bilgi veren

diyagramlar belirtilmiştir.

3.1. SİSTEM MİMARİSİ

Bitirme projesi kapsamında geliştirilen bu sistem, skor ekranının önceden

kaydedilmiş videoları üzerinde ve kameradan görüntü alınarak geliştirilmiştir.

Kamera ve video görüntüleri üzerinde testleri yapılmıştır. Her iki durumda da alınan

görüntü aşağıdaki adımlar takip edilerek işlenir.

1. Kullanıcıdan alınan koordinatlara göre skor ekranının görüntüsü kesilir.

2. Görüntü üzerinde rakamlar bulunur.

1

3. Bulunan alanlardaki rakamlar tanınır.

4. Sentetik skor ekranı görüntüsü oluşturulur.

3.2. UML DİYAGRAMLARI

3.2.1. Kullanım Durum Diyagramı

Şekil 3.2.1.1 Kullanım Durum Diyagramı

1

3.2.2. Etkinlik Diyagramı

Şekil 3.2.1.2 Etkinlik Diyagramı

4. DENEYLER

Bu kısımda projenin başlangıcından şuan gelinen noktaya kadar uygulanan

yöntemlerin sonuçları birbirleriyle karşılaştırılarak gösterilecektir. Deneyler i7-

2670QM CPU ve 4 GB Ram donanımına sahip dizüstü bilgisayarda

gerçekleştirilmiştir.

1

4.1. RAKAMLARIN BULUNMASI

Bu aşamada, ilk olarak her rakam için ayrı ayrı eğitilmiş olan svm skorları

kullanılarak rakamlar bulunmaya çalışıldı. Bu yöntemde görüntü 10 kez gezilerek

her rakam için belirli bir eşik değerinin üzerindeki değerler skor görüntüsüne

kaydedilmiştir. Bu aşamada elde edilen skor görüntüsünün bir örneği aşağıdaki

gibidir.

Şekil 4.1.1 SVM Skorlarından Oluşturulmuş Örnek Görüntü

Bu yöntemin uzun zaman almasından dolayı öncelikle, bir rakam sınıflandırıcısı

eğitildi. Bu sınıflandırıcı sayesinde, bir görüntüde rakam olup olmadığı bilgisine,

görüntü üzerinde bir kez gezilerek ulaşıldı.

İkinci olarak, skor değerlerinin bir matriste tutulması, en büyük olmayanı baskılama

yöntemi uygulanırken zaman maliyetini artırdığı için bu yöntemden vazgeçildi.

Bunun yerine rakam bulunan noktalar ve skor değerleri birer vektörde tutularak en

büyük olmayanı baskılama algoritması uygulandı. Bu işlemin testleri 200 adet

görüntü ile yapılmış %99 başarı elde edilmiştir.

1

Şekil 4.1.2 Algoritmanın Son Hali İle SVM Skorlarından Oluşturulmuş Örnek Görüntü

4.2. RAKAMLARIN TANINMASI

Bu kısımda, bir önceki aşamada belirlenen noktalardan başlayan 64x32 piksel

boyutundaki küçük resimler, skor ekranı görüntüsünen kesilmiştir. Kesilen

görüntülerde, SVM kullanılarak rakamların tanınması işlemi gerçekleştirilmiştir.

İşlemin testi 2000 adet görüntü üzerinde yapılmış, %2 hata ile çalıştığı tespit

edilmiştir. Tanınan rakamlar konum bilgisi de dikkate alınarak oluşturulan

görüntüye yerleştirilerek çalışma tamamlanmıştır. Bu işlem ilk alınan görüntü için 5

saniye, diğer her görüntü için 0.1 saniye sürmektedir.

4.2.1. Başarılı Sonuç Örnekleri

Şekil 4.2.1.1 Kameradan Alınan Kesilmiş Skor Ekranı Görüntüsü

1

Şekil 4.2.1.2 Çalışma Sonucunda Oluşturulan Görüntü

4.2.2. Başarısız Sonuç Örnekleri

Şekil 4.2.2.1 ‘ de yer alan görüntüde 3 rakamı sistem tarafından 8 rakamı olarak algılanmış ve yanlış sonuç üretilmiştir.

Şekil 4.2.2.1 Kameradan Alınan Kesilmiş Skor Ekranı Görüntüsü

1

Şekil 4.2.2.2 Çalışma Sonucunda Oluşturulan Görüntü

5. SONUÇ

Proje kapsamında kullanılan görüntüler, Gebze Teknik Üniversitesi Prof. Dr. Ahmet

Ayhan Spor Salonundaki skor ekranının görüntüleri alınarak sağlanmıştır. İlk olarak

HOG tabanlı SVM kullanılarak eğitim yapılması hedeflenmiştir. Bu eğitimler

sırasında her rakam için ortalama 300 adet pozitif görüntü, 2100 adet negatif

görüntü kullanılmıştır. Eğitim tamamlandıktan sonra skor ekranı görüntüsünde

rakamları bulma işlemine geçilmiştir. Bu aşamada 3’er piksel aralıklarla kayan

pencereler yöntemi kullanılmış, belirli bir eşik değeri üstünde skora sahip noktalar

belirlenmiştir. Belirlenen bu noktalar en büyük olmayanı bastırma yöntemi

kullanılarak rakam bulunan noktalar kaydedilmişitir. Bir sonraki aşamada, bu

noktalardan başlayan 64x32 piksel boyutundaki küçük resimler, skor ekranı

görüntüsünen kesilmiştir. Kesilen görüntülerde, SVM kullanılarak rakamların

tanınması işlemi gerçekleştirilmiştir. Tanınan rakamlar konum bilgisi de dikkate

alınarak oluşturulan görüntüye yerleştirilerek çalışma tamamlanmıştır. Çalışmanın

testleri Gebze Teknik Üniversitesi Prof. Dr. Ahmet Ayhan Spor Salonunda

gerçekleştirilmiştir.

1

KAYNAKLAR

[1] Wang, Kai, Boris Babenko, and Serge Belongie. "End-to-end scene text   Computer Vision (ICCV), 2011 IEEE International Conference on. IEEE, 2011.[2] Chen, Xiangrong, and Alan L. Yuille. "Detecting and reading text in natural scenes." Computer Vision and Pattern Recognition, 2004. CVPR 2004. Proceedings of the 2004 IEEE Computer Society Conference on. Vol. 2. IEEE, 2004.[3] Li, Huiping, David Doermann, and Omid Kia. "Automatic text detection and tracking in digital video." Image Processing, IEEE Transactions on 9.1 (2000): 147-156.[4] Ezaki, Nobuo, Marius Bulacu, and Lambert Schomaker. "Text detection from natural scene images: towards a system for visually impaired persons." Pattern Recognition, 2004. ICPR 2004. Proceedings of the 17th International Conference on. Vol. 2. IEEE, 2004. [5] Mishra, Anand, Karteek Alahari, and C. V. Jawahar. "Top-down and bottom-up cues for scene text recognition." Computer Vision and Pattern Recognition (CVPR), 2012 IEEE Conference on. IEEE, 2012.[6] Han, Feng, et al. "A two-stage approach to people and vehicle detection with hog-based svm." Performance Metrics for Intelligent Systems 2006 Workshop. 2006.[7] Lienhart, Rainer W., and Frank Stuber. "Automatic text recognition in digital videos." Electronic Imaging: Science & Technology. International Society for Optics and Photonics, 1996.[8] Chen, Datong, Jean-Marc Odobez, and Herve Bourlard. "Text detection and recognition in images and video frames." Pattern recognition 37.3 (2004): 595-608.[9] Neumann, Lukáš, and Jiří Matas. "Real-time scene text localization and recognition." Computer Vision and Pattern Recognition (CVPR), 2012 IEEE Conference on. IEEE, 2012.[10] Neumann, Lukas, and Jiri Matas. "A method for text localization and recognition in real-world images." Computer Vision–ACCV 2010. Springer Berlin Heidelberg, 2011. 770-783.[11] Neumann, Lukáš, and Jiří Matas. "Real-time scene text localization and recognition." Computer Vision and Pattern Recognition (CVPR), 2012 IEEE Conference on. IEEE, 2012.[12] A. Shahab, F. Shafait, and A. Dengel. ICDAR 2011 robust reading competition challenge 2: Reading text in scene images. In ICDAR 2011, pages 1491–1496, 2011.[13] Tomasi, Carlo. "Histograms of Oriented Gradients."[14] Newell, Andrew J., and Lewis D. Griffin. "Multiscale histogram of oriented gradient descriptors for robust character recognition." Document Analysis and Recognition (ICDAR), 2011 International Conference on. IEEE, 2011.[15] Kim, Kwang In, Keechul Jung, and Jin Hyung Kim. "Texture-based approach for text detection in images using support vector machines and continuously

1

adaptive mean shift algorithm." Pattern Analysis and Machine Intelligence, IEEE Transactions on 25.12 (2003): 1631-1639.[16] Wang, Lipo. Support Vector Machines: theory and applications. Vol. 177. Springer Science & Business Media, 2005.

1

EKLER

A. Lisans Bitirme Projesi Konusu Bildirme Formu

1

T.C.GEBZE TEKNİK ÜNİVERSİTESİ

MÜHENDİSLİK FAKÜLTESİBİLGİSAYAR MÜHENDİSLİĞİ

LİSANS BİTİRME PROJESİ KONUSU BİLDİRME FORMU

ÖĞRENCİ ADI SOYADI : Büşra ERKAN

ÖĞRENCİ NO : 111044063 İMZA:

PROJE KONU BAŞLIĞI: Spor karşılaşmalarında skor ekranının okunması

PROJENİN AMACI :

Spor karşılaşmalarında skor ekranını okumak için yüksek maliyetli kamera yerine web cam kullanılarak ekrana verilecek görüntünün elde edilmesi. Bu doğrultuda skor ekranındaki rakamları bulup tanımaya çalışacağım.

FAYDALANILACAK KAYNAKLAR :

1) OpenCV Tutorial, http://docs.opencv.org/doc/tutorials/tutorials.html2) Wang, Kai, and Serge Belongie. Word spotting in the wild. Springer Berlin Heidelberg, 2010.3) Wang, Kai, Boris Babenko, and Serge Belongie. "End-to-end scene text recognition." Computer Vision (ICCV), 2011 IEEE International Conference on. IEEE, 2011.

PROJE DANIŞMANI: Doç. Dr. Yusuf Sinan AKGÜL İMZA:

BÖLÜM BAŞKANI: Prof. Dr. İbrahim SOĞUKPINAR İMZA:

Bu form bilgisayar ortamında 2 nüsha olarak düzenlenecek, bir nüsha bölüm başkanlığına ve bir nüsha proje danışmanına verilecektir.

2

Ek A. Lisans Bitirme Projesi Konusu Bildirme Formu

2