Metadata met betrekking tot Audiovisuele Media
-
Upload
vrt-medialab -
Category
Technology
-
view
2.019 -
download
1
description
Transcript of Metadata met betrekking tot Audiovisuele Media
medialab
Metadata met betrekking tot Audiovisuele MediaMetadata met betrekking tot Audiovisuele Media
2medialab
Overzicht
Definities Metadata (Meta)datamodel Metadatastandaard
Types en verschijningsvormen van metadata
Probleemstelling en oplossingsstrategie
Uitdagingen
Conclusies
3medialab
Metadata – « data over data »
Production Platform
Data General
Data General
Data General
Data General
Data General
Data General
WWWWWWWWWWWW
Communication(Information)
Metadata
Infrastructure - Networks and Storage
Production and distribution
4medialab
Meta – data ?
Metadata was pictografisch tot aan de uitvinding van het schrift en wordt nuterug pictografisch omwille van de tekortkomingen ervan.
5medialab
Definities - Metadata
Metadata is “data over data” of documentatie over (digitale) objecten in het algemeen.Het doel van metadata is om op een eenduidige manier deze objecten erover tecommuniceren.
Figuur 1 – MARC 21 record van « Planning for Automation – how-to-do it manual for librarians »
6medialab
Definities – Datamodel en ontologie
*
1
*
1
is associated with
*
0..1
is associated with
*
1
*
1
*
1
*
0..1 performed by*
1Referrer
*
1Includes
*
1
*
1
*
1
*
1
EDITORIAL_MASTER
INTELLECTUAL_PROPERTY NOMENCLATUREPRODUCTION
PROGRAMME_GROUP
EMA_CAST
PERFORMANCE
PGR_CAST
ROLE_TYPE
CHR_PLAY
PARTY
PAR_ASSOCIATION
ISO639
DISTRIBUTION
EMA_CONTRIBUTION
PGR_CONTRIBUTION
- PGR_ID*[1] : Unsigned lon
- EMA_ID*[1] : Unsigned lon
- PRF_ID*[1] : Unsigned lon
- ID*[1] : Unsigned long integer
- EMA_ID[1]
- TYPE[1] : Short text
- DISTRIBUTION_CHANNEL[1] : Integer
- DISTRIBUTION_SERVICE[1]
- PLANNED_START_DATE[1]
- PLANNED_START_TIME[1]
- PLANNED_DURATION[1]
- ACTUAL_START_DATE[1]
- ACTUAL_START_TIME[1]
- ACTUAL_DURATION[1]
- QUALIFICATION_FLAG[1]
- QUALIFICATION_CODE[1]
- SUBTITLE_FLAG[1]
- SUBTITLE_TYPE[1]
- LIVE_FLAG[1]
- INTERACTIVE_FLAG[1]
- INTENDED_ASPECT_RATIO[1]
- IMAGE_FORMAT[1]
- SOUND_FORMAT[1]
- CODE*[1] : Short text (2)
- DESCRIPTION[1] : Text
- PART*[1] : Unsigned long
- COLLECTION*[1] : Unsigne
- ID*[1] : Unsigned long integer
- NAME[0..1] : Short text
- FIRSTNAME[0..1] : Short text
- SURNAME[0..1] : Short text
- DESCRIPTION[0..1] : Text
- ID*[1] : Unsigned long integer
- NAME[1] : Short text
- DESCRIPTION[0..1] : Text
- ID*[1] : Unsigned long integer
- CODE[1] : P/META 9.1.31
- NAME[1] : Short text
- DESCRIPTION[0..1] : Text - PGR_ID*[1] : Unsigned lon
- PRF_ID*[1] : Unsigned lon
- ID*[1] : Unsigned long integer
- ROLE_TYPE[1] : Unsigned long
- CHAR_ID[0..1] : Unsigned long i
- PARTY_ID[0..1] : Unsigned long
- EMA_ID*[1] : Unsigned lon
- ID*[1] : Unsigned long integer
- COPYRIGHT_HOLDER[0..1] : Short text
- LICENSE_TYPE[0..1] : Unsigned long integer
- LICENCE_DESC[0..1] : Text
- TERRITORY[0..1] : Short text
- DISTR_CHANNEL_TYPE[0..1] : Unsigned integer
- DISTRIBUTION_CHANNEL[0..1] : Short text
- CONTRACT[0..1] : Short text
- START_DATE[0..1] : Date
- START_TIME[0..1] : Time
- END_DATE[0..1] : Date
- END_TIME[0..1] : Time
- CONDITIONAL_IND[1] : Boolean
- CONDITION_DESC[0..1] : Text
- RESTRICTION_IND[1] : Boolean
- RESTRICTION_TYPE[0..1] : Unsigned long integer
- RES_START_DATE[0..1] : Date
- RES_START_TIME[0..1] : Time
- RES_END_DATE[0..1] : Date
- RES_END_TIME[0..1] : Time
- RES_DESC[0..1] : Text
- ID*[1] : Unsigned long integer
- NATURE_ID[1] : Unsigned long integer
- NATURE[0..1] : Short text
- CATEGORY_ID[0..1] : Unsigned long integer
- CATEGORY_NAME[0..1] : Short text
- EDITORIAL_GENRE_ID[0..1] : Unsigned long integer
- EDITORIAL_GENRE_NAME[0..1] : Short text
- FORMAT_ID[0..1] : Unsigned long integer
- FORMAT_NAME[0..1] : Short text
- INTENTION_ID[0..1] : Unsigned long integer
- INTENTION_NAME[0..1] : Short text
- QLF_IND[1] : Boolean
- QLF_TYPE[0..1] : Unsigned long integer
- QLF_ADRESS[0..1] : Text
- BRAND[0..1] : Short text
- ID*[1] : Unsigned long integer
- MATERIAL_NUMBER[0..1] : Unsigned integer
- MATERIAL_DESC[0..1] : Short text
- PRODUCTION_ORDER[0..1] : Short text
- V-ISAN[0..1] : Short text
- PRD_HIERARCHY[0..1] : Short text
- PRN_SERIES[1] : Unsigned long integer
- LIVE_IND[1] : Boolean
- LIVE_LOCATION[0..1] : Short text
- PROVENANCE[0..1] : Short text
- SUPPLIER[0..1] : Short text
- PRN_DEPARTMENT[0..1] : Short text
- PRN_MANAGER[0..1] : Short text
- PRODUCER[0..1] : Short text
- DIRECTOR[0..1] : Short text
- ASSISTANT[0..1] : Short text
- CHIEF_PRODUCTION[0..1] : Short text
- PRESENTATION[0..1] : Short text
- FEATURING[0..1] : Text
- SONORISATION[0..1] : Short text
- ASSEMBLED_BY[0..1] : Short text
- ASS_WORKCENTER[0..1] : Short text
- ASS_DATE[0..1] : Date
- PROCUREMENT_TYPE[0..1] : Unsigned long integer
- MATERIAL_TYPE[0..1] : Short text
- PRODUCT_DIVISION[0..1] : Unsigned long integer
- ID*[1] : Unsigned long integer
- CMS_ID[1]
- PGR_ID[1] : Unsigned long integer
- TYPE[1] : Short text
- NUMBER[1] : Unsigned long integer
- PART_NUMBER[0..1] : Short text (3)
- VERSION[0..1] : Unsigned integer
- NAME[0..1] : Short text
- DESCRIPTION[0..1] : Text
- ANNOTATION[0..1] : Text
- INFO[0..1] : Text
- DURATION_SCRIPT[0..1] : Time
- DURATION_REVIEW[1]
- NOMENCLATURE[0..1] : Unsigned long integer
- PRODUCTION[0..1] : Unsigned long integer
- COPYRIGHT[0..1] : Unsigned long integer
- STATUS[1] : Short text
- MATERIAL_STATUS[1] : Short text
- RIGHT_STATUS[0..1] : Short text
- ID*[1] : Unsigned long integer
- PARENT_ID[1] : Unsigned long integer
- NAME[1] : Short text
- SERIES_NUMBER[0..1] : Unsigned integer
- LABEL[0..1] : Short text
- TITLE[0..1] : Short text
- ORIGINAL_TITLE[0..1] : Short text
- DESCRIPTION[0..1] : Text
- LANGUAGE_CODE[0..1] : Short text (2)
- ORI_LANGUAGE_CODE[0..1] : Short text (2)
- VOLUME[0..1] : Number
- PRODUCTION[1] : Unsigned long integer
- NOMENCLATURE[1] : Unsigned long integer
- COPYRIGHT[1] : Unsigned long integer
=> Eender welke ontologie kan perfect voorgesteld worden door een datamodel.
De ontologie (van het Grieks ὀν = zijnde, dingen en λόγος = woord, leer) is deleer van de dingen. De klassieke ontologie definieert fundamentele categorieën enonderlinge relaties. Een ontologie representeert een bepaald kennisdomein.
Wanneer we informatie in een database opslaan, gebruiken we een genormaliseerddatamodel.
• Een datamodel definieert logische entiteiten en hun relaties.• Een datamodel is genormaliseerd wanneer alle onafhankelijk variabelen zijnopgesplitst.
7medialab
Doelstelling van een metadata standaard
Een metadata standaard moet een zekere compatibiliteit garanderen tussen informatieverwerkendesystemen. Het definieert minstens een vocabularium, een syntax en/of een datamodel en het is eennodige(!) voorwaarde voor eenduidige communicatie tussen systemen, processen en mensen.
In het algemeen worden een standaard gedefinieerd met het oog op interoperabiliteit tussendeelsystemen.
Voorbeeld - het Telex (Teletypewriter Exchange) protocol definieert 5-bit codering (26 letters en 6speciale tekens) en 45,5 bits per seconde
Een volledige(!) garantie op compatibiliteit houdt in dat, naast een vocabularium, een syntax eneen ontologie, ook de codering en de verpakking wordt genormeerd.
Bijvoorbeeld:• Dublin Core definieert uitsluitend 15 begrippen (titel, onderwerp, format,…)• Resource Description Framework (RDF) specifieert uitsluitend de syntax van een beschrijving
8medialab
Metadata – « data over data »
9medialab
10medialab
Overzicht
Definities Verschillende aspecten van metadata Ontologie Metadatastandaard
Types en verschijningsvormen van metadata
Probleemstelling en oplossingsstrategie
Uitdagingen
Conclusies
11medialab
Enterprise Resources Planning - Logistieke metadata (APICS)
Supply
(Production)
Material Master
New Products
(Creativity)
Bill of Material
Sales
(Distribution)
Product Catalog
Sales and Operations Planning• Logistieke metadata is informatie met betrekkingtot de ontwikkeling, productie en distributie van hetproduct.
• Logistieke informatie vormt de basis van een ERPsysteem en wordt meestel gecommuniceerd als inhoudvan een document.
• APICS (www.apics.org) is een industrieassociatiedie het logistiek vocabularium standaardiseert.
12medialab
Product Engineering - Beschrijvende metadata (CAD/CAM)
• Beschrijvende metadata is informatie met betrekking tot de inhoudvan het product en ze is meestal het resultaat van eenproductontwikkelingsproces. Indien mogelijk wordt dit procesgeformaliseerd en gebruikt men hiervoor een CAD systeem.
• In het algemeen is beschrijvende informatie beschikbaar onder devorm van tekst of grafische modellen.
• Per industrie en per type product zijn er vaak verschillendemethodes met bijhorende documentatiestandaarden:
• Nieuws maakt gebruik van NewsML (www.iptc.org/newsml)• Movie Script Markup Language (MSML) is in ontwikkeling
13medialab
Het archief – Annoteren, indexeren, opzoeken…
ArchiveSystem
• Het archiefsysteem verzamelt alle beschikbare metadata met betrekking tot ruwmateriaal of afgewerkte producten. P/META (www.ebu.ch) is origineel ontwikkeldvoor deze specifieke toepassing.
• De documentalist rubriceert en categoriseert de beschikbare items. Hij gebruikthiervoor meestal termen uit een gecontroleerde lijst en hij kan de de facto standaardLibrary of Congress Subject Headings (http://authorities.loc.gov) gebruiken.
• Wanneer feature extraction algoritmes worden gebruikt om diverse visuele, auraleof conceptuele entiteiten te herkennen, maken we bij voorkeur gebruik van ISO/IECMpeg7 (http://en.wikipedia.org/wiki/mpeg7).
P/META
Feature ExtractionSystem
Mpeg7
14medialab
15medialab
Sales and Distribution – Electronische Programmagids (TVAnytime)
P/META
• De elektronische programmagids (EPG) is een onderdeel van het proces ‘Salesand Distribution’ en het is een combinatie van logistieke en inhoudelijke gegevensafkomstig uit het ERP systeem en het productontwikkelingsproces.
• De EPG informatie wordt meestal gecentraliseerd in een distribution schedulingsysteem, en dit publiceert op haar beurt het zendschema naar diverse platformen. Wekunnen bijvoorbeeld P/META (www.ebu.ch) recupereren om deze interface teimplementeren.
• Hoewel TV-Anytime (www.tv-anytime.org, genormeerd door ETSI) beschikbaar isom uitzendschema’s te representeren, worden in de praktijk nog steeds voor elkdoelplatform proprietaire interfaces ontwikkeld.
DistributionScheduling
System
TV-Anytime
16medialab
Voorbeeld - Newswires
1922 – Eerste commerciele telex machines 1979: IPTC 7901 (Tekstberichten) « Designed for computerised handling » 1990: IIM (Binary file format - IPTC headers in pictures) 1997: NITF (Uitsluitend tekst, ontwikkeld in SGML en nadien geporteerd naar XML)
1998 - XML 1.0 recommendation by W3C 1998: NewsML, ontwikkeld door Reuters, XML representatie van text, foto’s en video 2000: NewsML 1.0 accepted by IPTC 2008: NewsML-G2 joint effort of IPTC and EBU, includes support for timecodes and taxonomies
NewsItem
Descriptive• Language• Genre• Context• Mention • Relates to• Of interest to
Administrative• Publisher• Creator• Source • Contributor• History
Rights• Ownership• Usage terms
Content Item (actual binary data or pointer to file)Content Item (actual binary data or pointer to file)
• Streaming Technical metadataTechnical metadata
Type• Mediatype
NewsLines• HeadLine• SlugLine• ByLine• Keywords
Content Item (actual binary data or pointer to file)Content Item (actual binary data or pointer to file)
• Size Duration Width• Height Resolution Color• Streaming Technical metadataTechnical metadata
17medialab
Evolutie van de Informatietechnologie
EDP EDP –– Electronic Data Processing Electronic Data Processing• Digital Information•• Client/Server-based architectures• Databases and Data-pumps• Remote Procedure Calls use plain text
Info•Xyzlk•Ouidf•oidf
Conventional MethodsConventional Methods• Analog Media and File Cabinets• “Wires”• Thesaurus
Integrated ProcessesIntegrated Processes• Digital Media - “Metadata”• File-based production – Information Overflow• Service-Oriented Architectures• Webservices use hypertext (XML)• Point-to-point Interfaces
IntegrationIntegrationSemantic ComputingSemantic Computing• “Semantic web” • Information-centric infrastructures• Knowledge Management• Semantic reasoning
19701970 19901990 20102010Pre-Digitization
Analogue SystemsGeneration 1
Stand-Alone SystemsGeneration 2The Internet
Generation XAmbient Intelligence
Single SourceData
18medialab
19medialab
Overzicht
Definities Verschillende aspecten van metadata Ontologie Metadatastandaard
Types en verschijningsvormen van metadata
Probleemstelling en oplossingsstrategie
Uitdagingen
Conclusies
20medialab
Typevoorbeeld
Archive Database SystemMedia Asset Management System
archiefnummer : ALG 20010813 1fragmentnummer : 1
reeks : 1000 ZONNEN EN GARNALEN
bandnummer : E03024404formaat : DBCM
fragmenttitel : 1000 ZONNEN & GARNALEN
beeld : KL/PALPLUSfragmentduur : 18 20
tekst : 0'00" TOERISTISCH REPORTAGEMAGAZINE OVERZICHT
ONDERWERPEN GENERIEK TOERISTISCH REPORTAGEMAGAZINE, OVERZICHT ONDERWERPEN
0'50" VANDAAG : KUNSTENAAR LUC HOFKENS ONTWIERP EEN OASE
OP ZIJN DAKTERRAS IN BORGERHOUT DIE DOET DENKEN AAN DE
GRAND CANYON INTERVIEW MET LUC EN ZIJN VROUW MARILOU BUITENBEELD DAK MET OMGEVING BUITENKANT
ARBEIDERSWONING, PANO OVER ROTSWANDEN, KRATEN MET WATER,
BEPANTING, FOTOALBUM MET VERLOOP WERKENtrefwoorden : BELGIE; BORGERHOUT; ARTIEST; OASE; KUNST; GRAND
CANYON (NATUURGEBIED); DAK; TERRAS; INTERVIEW; EURO
SPACE CENTER; RUIMTEVAART; PC; BOOTTOCHT; RIJKDOM; PASSAGIER; GASTRONOMIE; RESTAURANT; PERSONEEL
rechthebbende : VRT
21medialab
Typevoorbeeld
22medialab
Consensus en functionaliteit
Systeemintegratie is vaak een compromis. We moeten het evenwicht zoeken tussen eenalgemene aanvaarde oplossing (door toepassing van een standaard) en een specifiekepuntoplossing waarvan men de zekerheid heeft dat ze goed werkt.
• Interfaces op basis van een metadatastandaard is gemakkelijk herbruikbaar en het geheelblijft relatief makkelijk beheersbaar. Ze veroorzaken meestal relatief veel overhead.
• Specifieke oplossingen kunnen gemakkelijker geoptimaliseerd worden in functie vanefficiëntie en performantie.
=> Strategie – Standaard waar mogelijk, puntoplossing waar nodig
23medialab
Overzicht van beschikbare standaarden
Stand-AloneStand-AloneSystemsSystems
HardwiredHardwired
Long-Term StrategyLong-Term StrategyPartial SolutionsPartial Solutions
Specific SolutionsSpecific Solutions
Functionaliteit
Con
sens
usHighHigh
LowLow
LowLow HighHigh
SemanticReasoning
CustomDevelopment
GenericGenericStandardsStandards
AmbientAmbientIntelligenceIntelligence
De FactoDe FactoStandardsStandards
24medialab
Overzicht
Definities Verschillende aspecten van metadata Ontologie Metadatastandaard
Types en verschijningsvormen van metadata
Probleemstelling en oplossingsstrategie
Uitdagingen
Conclusies
25medialab
Gartner
26medialab
CAD/CAM for Drama Production
?
27medialab
The Semantic Gap
Allegory of Fortune, Dosso Dossi
Prosperity in life is transitory anddependant on luck
Semantic awareness is more then database management. Itis unique to rich media and it requires interpretation,
translation, historic background, etc.
28medialab
Conclusies
Een volledige oplossing voor het probleem van systeemintegratiespecifieert minstens een encodering, een vocabularium, een syntax,een datamodel en een verpakking.
De formele standaarden die tot nu zijn ontwikkeld binnen deaudiovisuele industrie zijn meestal te algemeen of te moeilijk.
In de praktijk behelpt men zich vandaag bijna altijd metpuntoplossingen of industriestandaarden.
Omdat de natuurlijke taal tekort schiet als accurate beschrijving, gaanwe terug naar meerdimensionale grafische modellen.
De grootste uitdaging voor het semantisch web is de semantischeinterpretatie van grafische objecten
29medialab
30medialab
ISAN Registration Authorities
Agence Française ISAN Aribsan (Spain and Latin America) ISAN Australasia (Australia and New Zealand) ISAN Berne (Switserland and neighbouring countries) ISAN NL (Netherlands) ISAN RA Deuthschland Microsoft Studios (USA) Secure Path (USA) ISAN IFTA (IFTA members) ISAN UK ISAN Sverige ISAN PL (Poland) Abrisan (Brazil) ISAN Iran
31medialab
http://medialab.vrt.be [email protected]