NORMALİZASYON2).pdf · zorunludur, çünkü SQL gibi bir ilişkisel sorgu dili 1NF'de olmayan bir...
Transcript of NORMALİZASYON2).pdf · zorunludur, çünkü SQL gibi bir ilişkisel sorgu dili 1NF'de olmayan bir...
NORMALİZASYON
• Tasarlanan ilişkisel şema yeterli olmayabilir.
• Bu nedenle, yeterli olmayan bir ilişkisel şema,niteliklerini daha küçük ilişkisel şemalara bölerekayrıştırılır.
• Normalizasyon, belirli bir veri kümesi için en basityapıyı bulmakla ilgilidir.
• Güncelleme anomalilerini (ekleme, silme, değiştirme)ve veri tutarsızlıklarını önlemek için normalleştirmeyapılır.
Bir veritabanı
tasarımını neden
normalleştirelim?
Yerden tasarruf
Farklı ilişki türlerini ele almak
– Birden çoğa
– Çoktan bire
– Diğer veri ilişkileri türleri.
Verilerin özniteliği yedekleme
Mevcut veritabanlarına bağlantıları kolaylaştırır.
Veri fazlalıklarını azaltma
Veritabanı kararlılığını ve esnekliğini artırır.
Veri belirsizliğini azaltır.
İlk Normal FormYinelenen Grupları Ortadan Kaldır
Normalleştirilmemiş form:
Parcel Id Köşe Noktaları1011 2382,3482, 2384,3821, 2348,3842,
2399,3492, 2395,38901025 5482,3891, 5418,3812, 5420,3889
Normalleştirilmiş form:(Tüm satırlar aynı uzunlukta ve her veri değeri atomiktir)
Parcel Id Corner Points1011 2382,3482, 1011 2384,38211011 2348,38421011 2399,34921011 2395,38901025 5482,38911025 5418,38121025 5420,3889
İkinci Normal FormAnahtarın Bir Kısmında Veri Bağımlılığını Ortadan Kaldırmak
Normalleştirilmemiş form:
PID Municipal Land Registration Office Area1011 Ankara Yaprak cad, Mamak 2001012 Ankara Yaprak cad, Mamak 3401025 Konya Kozlu cad. Meram 1261026 Konya Kozlu cad. Meram 670
Normalleştirilmiş formlar:PID Municipal Area1011 Ankara 2001012 Ankara 3401025 Konya 1261026 Konya 670
Municipal Land Registration Office Ankara Yaprak cad, Mamak Konya Kozlu cad. Meram
İkinci ve üçüncü normal formlar,anahtar olmayan ve anahtarözellikler arasındaki ilişkilerleilgilenir.
Anahtar olmayan özellikler
Kompozit anahtar özellik
Üçüncü Normal Form Anahtarda Bağımlı Olmayan Verileri Elde Etme
Normalleştirilmemiş form:
PID Municipal OwnerSIN OwnerName Area1011 Ankara 234-876-723 A.Deniz 2001012 Ankara 234-876-723 A.Deniz 3401025 Konya 477-654-194 H.Uzun 1261026 Konya 477-654-194 H.Uzun 670
Normalleştirilmiş form:
PID Municipal OwnerSIN Area1011 Ankara 234-876-723 2001012 Ankara 234-876-723 3401025 Konya 477-654-194 1261026 Konya 477-654-194 670
OwnerSIN OwnerName234-876-723 A.Deniz477-654-194 H.Uzun
Anahtar olmayan özellik başka bir anahtar olmayan özellik hakkında bir gerçek olduğunda üçüncü normal form ihlal edilir.
Üç normal form arasında, 1NF zorunludur, çünkü SQL gibi bir ilişkisel sorgu dili 1NF'de olmayan bir ilişkiyi idare edemez.
Anormalliklerin güncellenmesi nedeniyle veri tabanındaki tutarsızlıkları önlemek için 2NF ve 3NF önerilmektedir.
DBMS ve CBS Arasındaki Farklar
• Bir DBMS, büyük hacimli verileri yönetmek için genel amaçlıbir sistemdir.• Geleneksel olarak, DBMS'ler iş uygulamaları için tasarlanmışve kullanılmıştır.• CBS, büyük hacimli mekansal verileri yönetmek ve analizetmek için kullanılan bir sistemdir.
• CBS bir DBMS bileşeni içerir
CBS ve DBMS
DBMS veya CBS'nin daha önce depolanmış olan talepverilerini geri alabilme yeteneği.
Coğrafi arama, CBS veri alımının sırrıdır.
Birçok veri organizasyonu coğrafi arama yapamaz.
CBS sistemleri, yerleşik DBMS'lere sahiptir veya ticaribir DBMS'ye bağlanır.
Örnekler: Dbase, ORACLE, Excel, Paradox
Veri yapısı
• Bir veri yapısı, bilginin sembolik bir temsiledönüştürülmesine izin veren bir dizi kural iletanımlanabilir. Veri yapısı, veri parçalarının sırasını vebunların birbirleriyle nasıl ilişkili olduğunu belirler.
• Bir veri yapısının seçimi, temsilin (raster veya vektör),üzerinde gerçekleştirilen işlemlerin hızının ve sonuçolarak kullanışlılığının depolanma gereksiniminietkiler.
Veri Yapıları nelerdir
- Bir bilgisayardaki verileri düzenlemek için biçimlerdir.- Veri dosyasını yorumlamak için şablon olarak kullanılırlar.129392877383892002934839203- Veri dosyası oluşturmak için şablon olarak kullanılırlar.
77383 89200 1293928
Hat uzunluğu X1 Y1 X2 Y2
Yapılar arasında ortak özellikler:- Bir tam sayı 32 bit ile gösterilir (yaklaşık -2 milyar ila +2 milyar arasındatam sayı)- Bir nokta, iki (X) koordinat ve biri (y) koordinatı için olmak üzere iki pozitiftamsayı ile temsil edilir.-Bir çizgi, bir puan listesiyle temsil edilir.
Yapı 1
X1Y1X2Y2......X23Y23 –1 X24Y24X25Y25..........X40Y40 –1EOF
Yapı 2
23X1Y1X2Y2.............X23Y2317X24Y24X25Y25...........X40Y40EOFNP
Yapı 3
23X1Y1X2Y2.............X23Y23-1 17X24Y24X25Y25...........X40Y40-1EOF
Birinci hat İkinci hat
Üç yapılarını karşılaştırma:
Hız: Çizelgenin başlangıcındaki NP okunacak koordinat sayısını belirlediği içinYapı 2 ve 3'ten bir satır okumak daha hızlıdır.
Yapı 1'den bir satır okumak. Yapı 2'den bir satır okumak
LOOP read NPread X do NP times
if X is -1 then exit loop read Xread Y read YEnd Loop end do
Sağlamlık:
Veri yapısı, veri bozulmasına dayanabiliyorsa sağlam olabileceği söylenebilir.
Yapı 3 iyidir.
Depolama:
Yapı 1 ve 2 aynı boyuttadır. Yapı 3, gereksiz verilerden dolayı daha büyüktür.
-Bir veri yapısını seçerken dikkat edilmesi gereken pek çok yön var.-Bazı yapılar diğerlerinden daha belirli amaçlar için daha uygun olabilir.-Bir yapı seçerken bir uzlaşma yapılmalıdır.
Mekansal Veri Yapılarında PopülerUnsurlar
• Koordinatlar, uzunluk ve alan gibi mekansal nitelikler.
• Mekansal olmayan özellikler
• Otoyol adı gibi özellik (varlık) için benzersiz bir tanımlamakodu (veya özellik tuşu)
• Bir sınıflandırma kodu (veya özellik kodu (varlığın bir otoyolsınıfına ait olduğunu belirtmek için).
• Diğer mekansal varlıklar ile topolojik ilişkiler.
• Veri kaynağı: Bu özellik için veri kaynağını gösterir. (uydugörüntüleri, yer araştırması, vb. veriler) DOĞRULUK İÇİN Önemli.
Bir Varlığın Kimliği ve Sınıflandırılması
Kimlik ve Sınıflandırma, çoğu veritabanında depolanan bir varlığın iki önemli özelliğidir.
Bir varlığın kimliği, varlığı diğerlerinden ayırır. (benzersiz bir kimlik kodu veya özellik tuşu)
Her otoyolun ayrı bir adı vardır. Ama hepsi otoyollar ve bir karayolu sınıfı oluştururlar.
Bir sınıf, bazı ortak özelliklere sahip bir varlık grubudur.Ulaşım (Demiryolları, Yollar, Nehirler, vb.)
HY1 HY2
HY3HY5
Sınıflandırma Kodu (Özellik Kodu)
-Bir sınıf, sınıftaki varlıkların paylaştığı ortak özniteliklerin listesiyle tanımlanır.SurfaceType = PavedDivided=yesLanes=4
- Bir sınıflandırma kodu, ortak özniteliklerin listesiyle ilişkili kısa bir addır.HYPAD104
- Bir grup varlığın aynı anda ele alınması için bir sınıflandırma kodukullanılabilir. (HY) bir otoyol grubunu temsil eder.
Teoride, veritabanı zaten öznitelikleri içeriyorsa, bir sınıflandırma koduna gerekyoktur.
Özellik Kodu (Sınıflandırma Kodu)
-Özelliğin niteliğini açıklayan bir özellik sınıfı için bir sınıflandırma kodudur.-Uzamsal varlığın ait olduğu özellik sınıfını tanımlamak için kullanılır.
HY, otoyol özelliklerinin sınıfını tanımlar.-Özellik kodu alfa sayısal veya sadece sayısal olabilir. Yani. A3B3, HY, 2834 vb-Özellik kodu sınıflara ve alt sınıflara ayrılabilir.
HYPA, döşeli otoyolların bir alt sınıfını tanımlar ve HYPAD104, dört şeritli, döşeli,bölünmüş bir otoyol sınıfını tanımlar.
Kodlar, uzunlukları ve anlamları birlikte özellik kodlama standardını oluşturur.Özellik kodlama standartları, kuruluşa ve kullanılan GIS sistemine büyük ölçüdebağımlıdır.
Kanada Geomatik Bilimler Konseyi (CCOG), hiyerarşik düzende düzenlenen 10karakterli bir featute kodu önermiştir. Ulusal Topografik Veri Tabanı, sayısal birkod kullanır.
CCOG Özellik Kodlama Sistemi
• Özellik kodlamasının hiyerarşik sırası, genelleme / uzmanlaşma kavramına dayanmaktadır.
• Genelleştirme (süper sınıf): anaokulu, ilkokul, ortaokul, okul olarak genelleştirilebilir.
• Uzmanlık (alt sınıf): Anaokulu özel bir okul türüdür.
CCOG Özellik Kodlama Sistemi
BUILDINGB
COMMERCIAL EDUCATION GOVERNMENTE
UNIVERSITY SCHOOL LIBRARY26000
KINDERGARDEN PRIMARY SECONDARY220 310 360
Bir ilkokulda bir özellik kodu varBE26000310
Seviye 1Sınıf
Seviye 2kategori
3. seviye5 basamaklı sayı
Seviye 43 basamaklı sayı
Hiyerarşik Kodlama Sisteminin Avantaj veDezavantajları:
• Kod farklı genelleme seviyelerinde kullanılabilir
• CBS, tam DBMS yeteneklerine sahip değilse, veri alımı içinkullanışlıdırlar.
• Tüm kullanıcılar aynı şekilde özellikleri sınıflandırmakdezavantaj değildir.
CCOG Özellik Kodlama Sistemi
• NTDB Standartları ve Spesifikasyonları, 1: 50000 ve 1: 250000 haritaları için özellik kodlarının bir listesini sağlar.
• Sayısal bir kod kullanılır.• Kod, iki bölümün birleşimidir: bir varlık kodu ve özniteliklerin listesi için bir
kod.Örneğin:Varlık Kodu KombinasyonuBina 105 (varlık kodu) 105
-Okul 56 (özellik kodu) 161Anaokulu 1 162İlkokul 2 163 Ortaokul 3 164
• Bu kod, bir sınıf hiyerarşisi anlamına gelmez.• Kodlama seviyesinin önemi kolayca tespit edilemeyebilir.• Sayılar kendilerine herhangi bir anlam katmayabilir.
NTDB Özellik Kodlama Sistemi
Vektör formatında doğrusal özellikler içinbasit bir veri yapısı
• ÖZELLİK KODU, ÖZELLİK ANAHTARI, NOKTALARIN SAYISI, X1,Y1,X2,Y2,X3,Y3,....Xn,Yn, UZUNLUĞU, diğer özellikler.
Örneğin:
“HWY”,“E5”,5,45,67,60,50,60,45,72,51,75,55,45,56,1978,”Patika”
Özelliklerin Sembolizasyonu
• Önceki veri yapıları veri sorgulama ve analiz için uygundur, sunum içinuygun değildir.
• Kartografik bilgi ve mekânsal bilgi karıştırılmamalıdır.• Kartografik bilgiler, verilerin görüntülenmesi ile ilgilidir ve bu, bir
uygulamadan diğerine değişebilir.• Mekansal verilerin kartografik özelliklerinin bağımsız bir semboloji dosyası
aracılığıyla kontrol edilmesi arzu edilir.• Sembolik noktalar ve grafik çizgiler farklı şekillerde saklanır. Grafik
çizgilerini oluşturan noktalar veritabanında saklanır, ancak sembolleringrafiklerini oluşturan noktalar bir nokta sembol dosyasında ayrı ayrıdepolanır.
• Bazı sistemler standart bir sembol seti sağlarken, diğerleri sembololuşturma ve bunları CBS (semboloji dosyası) içinde saklayabilmekabiliyetini sağlar.
Niteliklerin Özellikleri
• boyut
• dağıtım
• Desen
• bitişiklik
• Komşuluk
• şekil
• ölçek
• oryantasyon.
Coğrafi özelliklerin temel özellikleri
CBS Analizi
• CBS analizlerinin ve tanımlarının çoğu, coğrafiözelliklerin özelliklerinin araştırılması vearalarındaki ilişkilerin belirlenmesidir.
Nokta Sembollerinin Kullanılması
• Daire
• Havalimanı
• Çapraz +
• Nokta
• Kare
A
BDijital dosyaveritabanı
Nokta Sembol Dosyası Gösterim
Oryantasyon 0 derece ve büyütme ile A-Havalimanında 1Yönelim 0 derece ve büyütme 4 ile B-Havalimanında
Nokta dosyasındaki sembollerin düzenlenme nedenleri:
-Sembollerin grafikleri için ortak bir kayıt, aynı türdensembollerin birbiriyle özdeş görünmesini garanti eder.
-Sembollerin şeklini değiştirmek daha kolaydır.
-Veri tabanının boyutunu azaltmaya yardımcı olur.
Çizgi Sembollerinin Kullanılması
MunicipalBdry Kısa çizgi + boşlukNationBdry Kısa çizgi + boşluk + Nokta + BoşlukProvinBdry Nokta + Boşluk
Nokta sembolüDosya
GösterimBir belediye sınırı
Çizgi dosyasındaki sembollerin düzenlenme nedenleri:
-Çizgi çizgi bölümleri için depolama çok yüksek.
-Kesintisiz bir çizgi, parçalanmış parçalara göre analiz için dahauygundur.
-Sondaki çizgi modelini değiştirmek daha kolaydır.