Data quality

16
איכות נתונים המידה שבה מידע מייצג נאמנה היבטים של מרחב מסוים עדי בן נון אוקטובר2016

Transcript of Data quality

Page 1: Data quality

איכות נתונים

המידה שבה מידע מייצג נאמנה היבטים של מרחב מסוים

עדי בן נון

2016אוקטובר

Page 2: Data quality

איכות המידע המרחבי

זה או כמה .. אין על זה דיונים סוערים ברשת.. אז נכון

... ואיך זה שעדיין..חשוב

והדוגמאות כמובן .. אז נשתדל לעשות זאת בקצרה

...כחול לבן

:נבחין בן שתי רמות מבחינת איכות נתונים

המתייחסים לרמת הישות המרחבית –רכיבי מיקרו

.הבודדת

אוסף הנתונים המתייחסים לרמת -רכיבי מקרו

.בכללותו

2עדי בן נון| איכות נתונים

Page 3: Data quality

:רכיבי רמת המיקרו

ישות

דיוק מיקום

דיוק מאפיינים

עקיבות לוגית

רזולוציה

http://www.govmap.gov.il www.openstreetmap.org

3עדי בן נון| איכות נתונים

Page 4: Data quality

דיוק מרחביPositional (spatial) accuracy

ההבדל בן מיקום הישות המתוארת במידע למיקומה

.האמתי

שהוא precision:יש להעיר שישנו עוד סוג של דיוק

. המדידהשל החזרתיותמידת

http://www.govmap.gov.il

4עדי בן נון| איכות נתונים

Page 5: Data quality

דיוק המאפייניםAttribute accuracy

?האם הישות הגיאוגרפית מאופיינת נכון

?האם יש קידוד חסר

?האם ישנו עירוב של מאפיינים

http://www.govmap.gov.il

http://www.govmap.gov.il

5עדי בן נון| איכות נתונים

Page 6: Data quality

המאפייניםדיוק

http://www.govmap.gov.il

http://www.govmap.gov.il

https://www.google.co.il/maps

https://www.google.co.il/maps

6עדי בן נון| איכות נתונים

Page 7: Data quality

עקביות לוגיתLogical consistency

ישנה עקביות לוגית ביחסים בן הישויות במרחב

חלקה מסוים ולא \להיות משויך כולו לגוש" אמור"כך למשל מבנה

.חלקה\לחצות גבול גוש

..להיות לא בתוך בניין" אמור"שביל

http://www.govmap.gov.il

7עדי בן נון| איכות נתונים

Page 8: Data quality

רזולוציה של הנתונים

מדידה ' ביחהראסטריאורך דופן של התא -ראסטר

.הישות הגיאוגרפית הקטנה ביותר הממופה-ווקטור

http://www.govmap.gov.il

8עדי בן נון| איכות נתונים

Page 9: Data quality

:המקרורכיבי רמת

מידע

שלמות

www.openstreetmap.orgיוחסיןזמן

9עדי בן נון| איכות נתונים

Page 10: Data quality

שלמותCompleteness

.כמות המידע הזמינה בתא שטח הנבדק

.עד כמה שיטת המיון אכן מייצגת את הנתונים

כמות ופיזור בשטח של מדידות או מקורות –אימות נתונים

.מידע אחרים בלתי תלויים ששימשו לבנית במידע

http://www.govmap.gov.il

10עדי בן נון| איכות נתונים

Page 11: Data quality

זמן עדכניות

http://www.govmap.gov.il www.openstreetmap.org

11עדי בן נון| איכות נתונים

Page 12: Data quality

יוחסיןLineage

מקורות המידע ותהליכים שהביאו ליצירתו: ההיסטוריה של המידע

.כל מקור מידע והליך עיבוד נתונים שלו מביא שגיאות נוספות למוצר הסופי

.יש לתעד הליך זה כיצד ומי ייצר אותו

http://www.govmap.gov.il

12עדי בן נון| איכות נתונים

Page 13: Data quality

מקורות שגיאה

שגיאות במידע מרחבי הינן תופעה שאי

.לחלוטיןלבטלה אפשר

ישנו איזון עדין בן עלות יצירה ותחזוקת

.המידע לרמת השגיאות שבו

http://www.govmap.gov.il www.openstreetmap.org

13עדי בן נון| איכות נתונים

Page 14: Data quality

דטהמטה

מידע על המידע

במטאדטהאיכות המידע מתוארת

.ושיתוףלמטאדטהמוגדרים סטנדרטים

http://www.govmap.gov.il

14עדי בן נון| איכות נתונים

Page 15: Data quality

? מה לא סביר במפה.. שאלון חזרה

http://www.govmap.gov.il

15עדי בן נון| איכות נתונים

Page 16: Data quality

..הבחנותקצת

וידע information-מידע , data-נתונים : מושגים קרוביםלסיום נאמר משהו על שלושה knowledge .

?כלומר

...תמונהאו שם מקום , מס תושבים בשכונהכגון , נתונים הם עובדות

.בשכונהלמשל ממוצע גיל התושבים . משמעותהוא ארגון של הנתונים באופן המעניק להם מידע

למשל הקשר בן רמת . שוניםהוא ארגון של המידע באופן המאפשר לקשור בין פריטי מידע ידע ..הילדים הממוצע למשפחה בשכונה' החיים למס

, הגבולות ביניהםאת לא תמיד אפשר להגדיר . שלושת המושגים מציינים רמות שונות של הפשטה..רק בהיבטים של איכות בתחום המכיל נתונים ומידעעסקנו אבל לצורכנו כרגע נציין שאנו

16עדי בן נון| איכות נתונים