Vervanging en kwaliteitseisen
-
Upload
leon-van-oosterom -
Category
Business
-
view
913 -
download
0
description
Transcript of Vervanging en kwaliteitseisen
1
Kun je dan iedereen laten scannen?
2
Regeling 15 december 2009 Archiefregeling Artikel 16. Kwaliteitssysteem De zorgdrager
zorgt ervoor dat het beheer van zijn archiefbescheiden voldoet aan toetsbare eisen van een door hem toe te passen kwaliteitssysteem
Artikel 20. Toegankelijke staat De zorgdrager zorgt ervoor dat het archiveringssysteem de toegankelijke staat van archiefbescheiden waarborgt, zodanig dat elk van de archiefbescheiden binnen een redelijke termijn a.kan worden gevonden
1°.aan de hand van de daaraan gekoppelde metagegevens; of 2°.door middel van een andere ontsluitingsmethode; en
b.leesbaar of waarneembaar te maken is.
3
Artikel 26. Algemene eisen aan opslagformaten voor digitale archiefbescheiden
1. Digitale archiefbescheiden worden, uiterlijk op het tijdstip van overbrenging, opgeslagen in een valideerbaar en volledig gedocumenteerd bestandsformaat dat voldoet aan een open standaard, tenzij dit redelijkerwijs niet van de zorgdrager kan worden verlangd. Alsdan vindt met de beheerder van de voor overbrenging aangewezen archiefbewaarplaats overleg plaats over een alternatief bestandsformaat.
2. Voor zover op het tijdstip van overbrenging gebruik wordt gemaakt van encryptietechniek, wordt aan de beheerder van de archiefbewaarplaats de bijbehorende decryptiesleutel verstrekt.
3. Gebruikmaking van compressietechniek is slechts toegestaan, voor zover daarbij niet zodanig verlies van informatie optreedt, dat niet langer aan de bij deze regeling gestelde eisen ten aanzien van de toegankelijke en geordende staat van digitale archiefbescheiden kan worden voldaan.
4
Niet langer wordt voorgeschreven welke resolutie gescan moet worden.
Niet langer wordt compressie per definitie verboden.
5
7
Hoeveel bit?
a) Bilevel
b) Greyscale
c) Indexed color
d) Full color
Hoeveel DPI?
a) 100 DPI
b) 200 DPI
c) 300 DPI
d) Meer?
Welke samenstelling
a) Single page
b) Multipage
c) Bookmarks
d) OCR
Welke format
a) tiff
b) jpg
c) PDF
d) PDF/A-1b
e) ODF ????Indexering
a) Document
b) Zone OCR
c) Tagged Metadata
8
9
1. Document analyse
2. Stel output structuur en vorm vast
3. Bepaal scannersoort
4. Kies juiste aansturing scanner
5. Bepaal en richt het imaging proces in
6. Validatie
7. Logprocedures
10
1. Imaging post processing1. Logdata scanoutput2. Image enhancement3. QC image kwaliteit4. Herkennen barcodes/patchcodes5. Structureren output6. Vastleggen Metatags
1. Data extractie door OCR2. Data Entry
7. Full tekst OCR8. Volledigheidscontrole9. Definitieve Output
Gebruik van OCR techniek om archiefstructuren vast te leggen Bijvoorbeeld door barcodes, zone
herkenning of combinatie van factoren.
OCR (Optical Character Recognition) ICR (handprint recognition) OMR (checkmark recognition) Barcode herkenning Document conversie met accurate layout PDF conversion naar PDF/A of PDF 1.7 Vaste en semi-gestructureerde
formulieren en documentvastlegging Document classificatie
12
13
Vaste structuren:Vragenlijsten, enquetes, multiple choice testen, vaak handgeschreven Identieke layout
Semi-gestructureerd:Facturen, prijslijsten, paspoorten, vrachtbrieven, inkoop orders Gelijke data maar andere layouts
Ongestructureerd:Contracten, brieven, artikelenOngestrucureerde inhoud en verschillende layouts
14
15
Document Analyse (DA) maakt het verschilDA met behoud van de
Layout (FineReader) “Eigen factuur DA Logic” (FlexiLayout)
16
Combinerendocumenten met
voorbladen
AanleverenDIV
Geautomatiseerdscannen
Output:CSV bestandImagefiles
Importscript
DM Applicatie
Werkprocesapplicatie
export DBgegevens
Printenmachine-herkenbarevoor-tussenbladen
Invullenmetagegevens
Kwaliteits-controles
Processing CorsaExtractor
Validerenmetagegevens
Veel voorkomende misverstanden Kwaliteitszorg kost te veel Wij hebben VRS dus dat hoeft niet De scanoperator is verantwoordelijk
17
De kwaliteit wordt door de scanoperator bewaakt
………….. toch?18
19
20
Quality Index :3 = nauwelijks leesbaar3.6 = marginaal5 = goed8 = uitstekend
Stel een A4 document met als kleinste letter de letter “e” met een hoogte van 2 millimeter.
Doelstelling is een goede kwaliteit binaire scan te maken (Q1=5). Gewenste resolutie wordt dan:
3x5 / 0,039 x 2mm= 15 / 0,078 = 192dpi (200 dpi)
De Quality Index gebruiken bij binair scannen:• dpi = 3QI / (.039h)• QI = dpi x .039h)/3• h = 3QI / (.039dpi)
21
Stel een A4 document met als kleinste letter de letter “e” met een hoogte van 2 millimeter.
Doelstelling is een goede kwaliteit scan met 256 grijswaarden te maken. Gewenste resolutie wordt dan:
2x5 / 0,039 x 2mm= 10 / 0,078 = 128dpi (150 dpi)Quality Index :3 = nauwelijks leesbaar3.6 = marginaal5 = goed8 = uitstekend
De Quality Index gebruiken bij grijs of kleur scannen:• dpi = 2QI / (.039h)• QI = dpi x .039h)/2• h = 2QI / (.039dpi)
22
1. Zwart wit scannen documenten; 300DPI
2. Kleur scannen documenten; 200DPI
3. Scannen t.b.v. OCR; 300DPI
4. Zwart wit scannen tekeningen; 200DPI
5. Scannen voor internet; 100DPI
6. Historische documenten; grijs of kleur
7. Zwakke documenten; grijs of kleur
De meeste Dm systemen hebben een geïntegreerde scanmodule. Je keurt dan in één keer de batch goed. Leveranciers wordt wakker! Klant, neem geen genoegen met nee!
23
zorgt voor: Betrouwbaarheid Continuïteit Vertrouwelijkheid Integriteit Authenticiteit
24
25
Zorgt voor onafhankelijke toetsing Laat zien: wie wat wanneer Biedt differentiatie in het keuren
Onafhankelijke toetsing; Dus niet de scanoperator Kwaliteitszorg als benoemde functie
26
We willen ook achteraf kunnen zien wie de toetsing heeft gedaan, op welke bestanden en wanneer dat is uitgevoerd.
27
Zware fouten Compromitteert de informatie
Lichte fouten Cosmetisch maar niet kritiek
28
het formaat van de bestanden is fout er is incoherentie tussen beelden en namen van de
bestanden één of meerdere pagina's ontbreken in een dossier de afmetingen van het beeld zijn niet conform de
specificaties de resolutie is niet conform de specificaties het beeld staat meer dan 2° scheef ten opzichte van zijn
as er is een geometrische vervorming van het beeld het beeld werd verminkt tijdens het scannen sommige tekstzones zijn niet leesbaar
29
de ligging van het beeld is niet correct (bijvoorbeeld geroteerd)
er zit een halo rond het beeld het ruisniveau is overdreven er zijn overblijvende sporen van de scanning- en
behandelingsprocedure (strepen, banen, ruis...) het beeld is horizontaal niet gecentreerd en niet
gealigneerd aan het bovenste deel aan de kantlijn het contrast en de helderheid zijn onaangepast onvoldoende helderheid er zijn interferentiezones
30
Voer een relevante steekproef uit. Start met 20% van alle images Bij goed gevolg, bouw af tot 5%
31
Kies voor 3 tot 5 promille voor zware fouten
Kies voor 5 % lichte fouten
32
Na een eerste afkeur, verhoog de steekproef met 5 %
Wanneer dan nog een te hoog percentage fouten wordt gevonden; Onderzoek wat de oorzaak is. Herverwerk de betreffende batch
33
Iso 2859
34
Een zorgvuldige validatie van de output op PDF/A 1b is aan te bevelen.
Verschillende leveranciers leveren daartoe tools: Adobe Apagao Callas Software AG PDF Tools AG Intarsys Seal Systems AG Solid Documents
35
36