Data quality
-
Upload
adi-ben-nun -
Category
Data & Analytics
-
view
292 -
download
0
Transcript of Data quality
איכות נתונים
המידה שבה מידע מייצג נאמנה היבטים של מרחב מסוים
עדי בן נון
2016אוקטובר
איכות המידע המרחבי
זה או כמה .. אין על זה דיונים סוערים ברשת.. אז נכון
... ואיך זה שעדיין..חשוב
והדוגמאות כמובן .. אז נשתדל לעשות זאת בקצרה
...כחול לבן
:נבחין בן שתי רמות מבחינת איכות נתונים
המתייחסים לרמת הישות המרחבית –רכיבי מיקרו
.הבודדת
אוסף הנתונים המתייחסים לרמת -רכיבי מקרו
.בכללותו
2עדי בן נון| איכות נתונים
:רכיבי רמת המיקרו
ישות
דיוק מיקום
דיוק מאפיינים
עקיבות לוגית
רזולוציה
http://www.govmap.gov.il www.openstreetmap.org
3עדי בן נון| איכות נתונים
דיוק מרחביPositional (spatial) accuracy
ההבדל בן מיקום הישות המתוארת במידע למיקומה
.האמתי
שהוא precision:יש להעיר שישנו עוד סוג של דיוק
. המדידהשל החזרתיותמידת
http://www.govmap.gov.il
4עדי בן נון| איכות נתונים
דיוק המאפייניםAttribute accuracy
?האם הישות הגיאוגרפית מאופיינת נכון
?האם יש קידוד חסר
?האם ישנו עירוב של מאפיינים
http://www.govmap.gov.il
http://www.govmap.gov.il
5עדי בן נון| איכות נתונים
המאפייניםדיוק
http://www.govmap.gov.il
http://www.govmap.gov.il
https://www.google.co.il/maps
https://www.google.co.il/maps
6עדי בן נון| איכות נתונים
עקביות לוגיתLogical consistency
ישנה עקביות לוגית ביחסים בן הישויות במרחב
חלקה מסוים ולא \להיות משויך כולו לגוש" אמור"כך למשל מבנה
.חלקה\לחצות גבול גוש
..להיות לא בתוך בניין" אמור"שביל
http://www.govmap.gov.il
7עדי בן נון| איכות נתונים
רזולוציה של הנתונים
מדידה ' ביחהראסטריאורך דופן של התא -ראסטר
.הישות הגיאוגרפית הקטנה ביותר הממופה-ווקטור
http://www.govmap.gov.il
8עדי בן נון| איכות נתונים
:המקרורכיבי רמת
מידע
שלמות
www.openstreetmap.orgיוחסיןזמן
9עדי בן נון| איכות נתונים
שלמותCompleteness
.כמות המידע הזמינה בתא שטח הנבדק
.עד כמה שיטת המיון אכן מייצגת את הנתונים
כמות ופיזור בשטח של מדידות או מקורות –אימות נתונים
.מידע אחרים בלתי תלויים ששימשו לבנית במידע
http://www.govmap.gov.il
10עדי בן נון| איכות נתונים
זמן עדכניות
http://www.govmap.gov.il www.openstreetmap.org
11עדי בן נון| איכות נתונים
יוחסיןLineage
מקורות המידע ותהליכים שהביאו ליצירתו: ההיסטוריה של המידע
.כל מקור מידע והליך עיבוד נתונים שלו מביא שגיאות נוספות למוצר הסופי
.יש לתעד הליך זה כיצד ומי ייצר אותו
http://www.govmap.gov.il
12עדי בן נון| איכות נתונים
מקורות שגיאה
שגיאות במידע מרחבי הינן תופעה שאי
.לחלוטיןלבטלה אפשר
ישנו איזון עדין בן עלות יצירה ותחזוקת
.המידע לרמת השגיאות שבו
http://www.govmap.gov.il www.openstreetmap.org
13עדי בן נון| איכות נתונים
דטהמטה
מידע על המידע
במטאדטהאיכות המידע מתוארת
.ושיתוףלמטאדטהמוגדרים סטנדרטים
http://www.govmap.gov.il
14עדי בן נון| איכות נתונים
? מה לא סביר במפה.. שאלון חזרה
http://www.govmap.gov.il
15עדי בן נון| איכות נתונים
..הבחנותקצת
וידע information-מידע , data-נתונים : מושגים קרוביםלסיום נאמר משהו על שלושה knowledge .
?כלומר
...תמונהאו שם מקום , מס תושבים בשכונהכגון , נתונים הם עובדות
.בשכונהלמשל ממוצע גיל התושבים . משמעותהוא ארגון של הנתונים באופן המעניק להם מידע
למשל הקשר בן רמת . שוניםהוא ארגון של המידע באופן המאפשר לקשור בין פריטי מידע ידע ..הילדים הממוצע למשפחה בשכונה' החיים למס
, הגבולות ביניהםאת לא תמיד אפשר להגדיר . שלושת המושגים מציינים רמות שונות של הפשטה..רק בהיבטים של איכות בתחום המכיל נתונים ומידעעסקנו אבל לצורכנו כרגע נציין שאנו
16עדי בן נון| איכות נתונים