La PROBLEMÁTICA DE LOS REPOSITORIOS INSTITUCIONALES EN el PERÚ
La urgente necesidad de construir repositorios institucionales
-
Upload
wilson-manuel-pinto-naranjo -
Category
Technology
-
view
6.307 -
download
1
description
Transcript of La urgente necesidad de construir repositorios institucionales
35 Años del desarrollo de las Ciencias de la Información en Colombia
La URGENTE necesidad de construir Repositorios Institucionales
Laureano Felipe Gómez DueñasFacultad de Sistemas de Información y Documentación
Universidad de La [email protected]
Congreso Internacional de Redes y Sistemas de Información Especializadas en Ciencia y Tecnología
Bogotá, Colombia – 29-31 de Agoto de 2007
35 Años del desarrollo de las Ciencias de la Información en Colombia
“Los analfabetos del siglo XXI no serán los que no sepan leer ni escribir, sino aquellos que no puedan aprender, desaprender y reaprender”
A. Tolfler: “Reinventando el futuro”
Diagnostico Actual
Infoxicación*
• El Informe “La expansión del Universo Digital: Un pronóstico del crecimiento mundial de la información al año 2010”, revela la cantidad anual de información creada y copiada a escala global.
• En 2006 el universo digital ha alcanzado la dimensión de 161.000 millones de Gigabytes
(161 Exabytes),
¿161 Exabytes?• Equivale ~
– 3 millones de veces la cantidad total de libros escritos en la historia de la humanidad
– 12 pilas de libros de 93 millones de millas de altura
2010988 EB
2006161 EB
6 AñosCrecimiento Anual 57%
Mientras que casi el 70% del universo digital será generado por individuos para el 2010, las organizaciones serán
responsables de la seguridad, privacidad, confiabilidad y acceso de por lo menos el 85% de esa información.
1.8454.3286.7472.723 UNIVERSIDAD MILITAR NUEVA GRANADA4616
2.6024215.7724.291 POLITECNICO GRANCOLOMBIANO4599
8153.8096.2464.164 UNIVERSIDAD DE CALDAS4525
3.4335.0874.588545 FUNDACION UNIVERSITARIA CATOLICA DEL NORTE4500
2.3685.1755.4634.176 UNIVERSIDAD NACIONAL DE COLOMBIA MANIZALES4497
2.1373.8865.1254.446 UNIVERSIDAD PONTIFICIA BOLIVARIANA4167
3.0932.2764.4634.869 ESCUELA DE INGENIERIA DE ANTIOQUIA3833
3062.4685.2323.248 UNIVERSIDAD DE LA SALLE COLOMBIA3832
2.6892.5475.2793.222 UNIVERSIDAD INDUSTRIAL DE SANTANDER3809
2.3371.6245.2123.902 UNIVERSIDAD SERGIO ARBOLEDA3782
1043.3554.8873.715 UNIVERSIDAD DEL ROSARIO3606
3.5033.3754.3723.484 ESCUELA DE ADMINISTRACION DE NEGOCIOS3602
12.6945123.223 UNIVERSIDAD DEL NORTE BARRANQUILLA3527
4371.7775443.299 UNIVERSIDAD DE LA SABANA3520
1.7051.571493.181 PONTIFICIA UNIVERSIDAD JAVERIANA CALI3323
9513.0324.3073.686 UNIVERSIDAD AUTONOMA DE BUCARAMANGA3250
1.7452.7744.1133.525 UNIVERSIDAD EXTERNADO DE COLOMBIA3174
1.3952.1584.3783.072 ESCUELA DE ADMINISTRACION FINANZAS Y TECNOLOGIA MEDELLIN 3076
9331.4254.2241.922 UNIVERSIDAD TECNOLOGICA DE PEREIRA2563
1.0881.5833.7432.552 UNIVERSIDAD NACIONAL DE COLOMBIA MEDELLIN2522
2.0342.5583.3052.006 UNIVERSIDAD DISTRITAL FRANCISCO JOSE DE CALDAS2420
1.6722.4042.0441.371 UNIVERSIDAD DEL CAUCA1645
5401.6312.1081.469 PONTIFICIA UNIVERSIDAD JAVERIANA1492
3539271.9961.175 UNIVERSIDAD DEL VALLE1281
466667181.033 UNIVERSIDAD DE ANTIOQUIA1136
3358501.7431.007 UNIVERSIDAD NACIONAL DE COLOMBIA1111
3506591.4141.088 UNIVERSIDAD DE LOS ANDES971
SCHOLARFICHEROS
RICOS VISIBILID
AD TAMAÑO UNIVERSIDADRANKING MUNDIAL
MADE INCOLOMBIA
¿En Colombia?Las instituciones están generando un número
creciente, complejo y heterogéneo de contenidos digitales. pero …
• Producción Intelectual Perdida
• Todavía entregando trabajos impresos
• Poca normalización del contenido• No existen
Políticas Nacionales e Institucionales para el manejo de Contenidos.
Incremento en Costos del Contenido
• Contenido Físico– Libros
– Revistas– Otros
• Contenido Digital– Bases de Datos
– Multimedia– Tesis
La dificultad de acceso a documentos e información pertinente es un fenómeno creciente y grave para la calidad académica del país.
“La información sólo existe en la medida que es accesible”
Brecha Digital
•Heterogenización de las Máquinas
Recursos aislados, sin posibilidad de interconexión y navegación entre unos y otros.
Bases de Datos
e-prints
Repositorios
Portales
WikisWebs
TOC
Catálogos
Soluciones a la Medida!!
¿Visibilidad?
• Desconocimiento Técnicas SEO - SEM• Poco Interés en la Visibilidad• Escaso trabajo inter – intra disciplinar
– Profesionales en Información– Ingenieros– Diseñadores– Administradores– Etc..
• Poco apoyo de las Maquinas?– Por Desconocimiento?– Por Desconfianza?
Web VisibleWeb Visible
Web ProfundaWeb Profunda
35 Años del desarrollo de las Ciencias de la Información en Colombia
¿Cuál es el Ideal?
VisiónAcceso Universal al conocimiento registrado en formato digital, sin limites de tiempo ni espacio.
Web Semántica
35 Años del desarrollo de las Ciencias de la Información en Colombia
¿Cuál es la Solución?
Trabajo Cooperativo
Pero….. Independiente..
35 Años del desarrollo de las Ciencias de la Información en Colombia
¿Pero Cómo?
Facilísimo!!!!!!
Aplicando Normas y EstándaresESTÁNDARES
PROTOCOLOS
METADATOS
PERFILES DE APLICACIÓN
Eva Mª Méndez RodríguezRDF/XML y la tendencia de los metadatos orientados al contenido
35 Años del desarrollo de las Ciencias de la Información en Colombia
¿Y en este caso concreto?
Implantando nuestro
“Repositorio Digital”
¿Qué es un Repositorio Digital?
“Un conjunto de servicios que una o varias Instituciones ofrecen a los miembros de su comunidad para la gestión y la difusión de los materiales digitales creados por la Institución y su comunidad de miembros. Esencialmente supone un compromiso de organización para el control de esos contenidos (políticas), incluyendo su preservación en el tiempo así como su organización y acceso o distribución con el fin de maximizar la visibilidad e impacto en línea”
Institutional Repositories: Essential Infrastructure for Scholarship in the Digital Age. Clifford A. Lynch, 2003
¿Qué Hace un Repositorio?
Organización que procura la selección, evaluación, registro y sistematización de recursos de información en formato digital, asegurando su persistencia en el tiempo y el acceso local o a distancia por parte de una comunidad de usuarios locales o remotos.
¿Qué es una Biblioteca Digital?
+SERVICIOS DIGITALES!!!
Repositorio
Repositorios y Bibliotecas digitales
Recursos Humanos
RecursosTecnológicos
RecursosPropios
Repositorio -Biblioteca Digital Capital Intelectual
Repositorios y Bibliotecas Digitales
BIBLIOTECA DIGITAL
REPOSITORIOS
PORTALES DE USUARIOS
¿Qué NO es un Repositorio?– WWW (Intranet, Internet)– Motores de búsqueda (Google, altavista,
yahoo)– Materiales digitalizados en CD, DVD, HD,
etc. – OPAC’s– Enciclopedias en línea
– Colección de Enlaces
• Contenido– General (eprints)– Especializado
(Temático)• Cobertura
– Institucional– Nacional – Mundial
• Función– Académica– Corporativa– General
Clasificación de los Repositorios• Tipo de usuario (Audiencia)
– Interno– Externo
• Distribución e Interconexión– Centralizado– Distribuido– Híbrido.
Contenidos / Documentos Digitales (Eprints) de los Repositorios
• Tesis / Libros• Investigaciones• Revistas / Casos• Animaciones• Mapas / Fotos• Videos / Audio• Mundos Virtuales• Páginas / Sitios• Presentaciones• Programas / Juegos• Simulaciones /
Características Repositorio
El contenido es depositado por:
• El creador (AutoArchivo - Preferible)• El propietario• Una tercera parte en su nombre
– Bibliotecas
Características Repositorio Debe ser Interoperable…
O p e n A r c h iv e s In it ia t iv e P r o to c o l f o r M e ta d a ta H a r v e s t in g ( O A I -P M H ) .http://www.openarchives.org
Search and Retrieval Protocol (SRU/SRW) Z39.50 Sindicación de contenidos con RSS
OAI SRU RSSCosechar
Buscar
Sindicar
Mi Repositorio
Características Repositorio
Provee mecanismos de Preservación Digital:
• Formatos
• Versioning
• Firmas Digitales (Checksum/CRC)
Características Repositorio
• Posee mecanismos para validar y controlar el acceso a:– Objetos– Metadatos– Documentos
• Aunque privilegia Acceso Abierto al Contenido
Características Repositorio Manejar URL’s persistentes para cada
documento
Objeto Digital
Características Repositorio
• Trabaja con Objetos Digitales, que “Encapsulan atómicamente”, los documentos del usuario, los metadatos agrupados, y los identificadores digitales.
METADATOS
DOCUMENTO
ID. ÚNICA
PROCEDIMIENTOS
Beneficios de los Repositorios
Acceso
Visibilidad
Mayor número de citas
Mayor impacto
Mayor uso...
Mayor acceso.....Mayor visibilidad
¿Repositorios en Latinoamérica?
100,00%806384100,00%154Totales
34,98%2820846,49%10Venezuela
0,01%1001,30%2Uruguay
0,47%37924,55%7Perú
27,55%2221327,79%12México
0,00%00,65%1Cuba
0,00%01,95%3Costa Rica
0,62%49655,84%9Colombia
1,39%111763,90%6Chile
34,40%27739961,04%94Brasil
0,59%47366,49%10Argentina
%Registros%RepositoriosPaís
¿Repositorios en Latinoamérica?
35 Años del desarrollo de las Ciencias de la Información en Colombia
Pasos para la construcción de unREPOSITORIO
¿Cómo Lograrlo? Con poco Presupuesto.
¿Metodología?• NO existe una metodología definitiva de
implantación de repositorios.– ¿Qué beneficios le puede aportar desarrollar un
repositorio Institucional? – ¿Mi organización está preparada para abordar este
tipo de proyecto?– ¿Cómo debo comenzar este proyecto?– ¿Qué costos va a representar para mi centro? – ¿Qué requerimientos legales debo cumplir en
relación a los derechos de autor y el copyright?
Construcción de Repositorios
¿Qué se requiere?• Crear colecciones (contenidos digitales)
– Agregar, indexar archivos– Útil: XML, HTML, PDF, …
• Proveer servicios– Búsqueda, recuperación, navegación, visualización,
anotación, colaboración, …– Útil: Phronesis, BVIC, Hermes, greenstone, …
• Compartir colecciones y servicios– Acceso distribuido, servicios federados,…– Útil: Dublin Core, METS, Z39.50, OAI, OAI-PMH,…
Paso 0 – Repositorio como Organización
CoordinadorRepositorio
Unidad de SoporteTecnológico
Unidad de Selección demateriales
Unidad de Procesostécnicos documentales
Dirección General
Dirección Repositorio
Unidad de divulgación,mercadeo y servicios
Subunidad deAnálisis de Inf .
Subunidad deDigitalización
Comité Repo
Obtención Objetos Digitales
Otras Bibliotecas Digitales Donación
CompraDigitalización Canje
Generación Propia Internet
Redes de Cooperación Temática- Consorcios
Desarrollo de ColeccionesSelecciónAdquisición ComercialTécnicas de Transformación
Selección Objetos Digitales
Control BibliográficoCatalogaciónClasificaciónAlmacenamiento
Normas y Procedimientos
Conservación y Preservación
Políticas de trabajoBackupsSeguridadAlmacenamientoTransformación
Gestión y Administración
Colecciones Objetos digitalesServiciosHardwareSoftware
Paso I - Análisis de las Necesidades
• Determine un grupo de usuarios (una comunidad especifica)– Universidad– Organización– Facultad
– Clase (Asignatura)
PASO I - Análisis de las Necesidades
• Realice un diagnostico de las necesidades de información de los Usuarios (Estudio de Usuarios)– Determine las áreas temáticas de su interés
– Determine el tipo de información que consultan
– Determine las fuentes que utilizan
– Determine su nivel de utilización (Tenga en cuenta su copyright)
– Qué hacen con el material después de consultarlo?
Paso II – Diagnostico de los Documentos Existentes
• En esta actividad involucra realizar un diagnostico y evaluación de las diversas colecciones existentes en comunidad seleccionada para identificar: tipologías documentales, formatos, tamaños, espacios, almacenamiento y otros factores que se ajusten a la utilización de normas y estándares internacionales.
• Durante esta actividad se tendrá en cuenta la experiencia en el manejo de algunos de los programas que se están utilizando en el mundo y en la propia comunidad. Recogiendo sus experiencias en estas herramientas, combinándolas con las experiencias propias.
Paso II – Diagnostico de los Documentos Existentes
• Realice un diagnostico de los contenidos que producen los usuarios– Qué Software-Hardware utilizan– Qué Tipos de documentos producen
• Físicos
• Digitales
– Qué Formatos Trabajan – Qué áreas temáticas involucran– Qué hacen con los materiales producidos– Cómo manejan derechos de autor
– Cuál es el nivel de importancia para reutilizar esos documentos
Paso II – Diagnostico de los Documentos Existentes
• Analizar Colecciones Físicas 1. Determinar el alcance o el grado de la
digitalización (entera o el subconjunto?)
2. Determinar el estado del material respecto a:• Custodia• Procesamiento• almacenamiento
3. Determinar el estado de las ayudas del acceso (grados de la terminación, de la preparación, y del formato)
Paso II – Diagnostico de los Documentos Existentes
4. Determinar el mejor formato, e.g. conversión con texto completo (OCR), imágenes escaneadas
5. Determinar de las condiciones y las preparaciones físicas para la exploración
6. Determinar las restricciones y el copyright
Paso II – Diagnostico de los Documentos Existentes
– Analizar Colecciones Digitales• Tipos de Archivos• Formatos• Finalidad• Estructura
• Software Aplicativo• Licenciamiento Software• Tamaños (Bytes)
• Etc…
Paso III – Normalice y Clasifique
• Categorización Clasificación Taxonómica Documental
• Tipologías Documentales• Control de Términos• Control de Autoridades• Modelo de Metadatos
– Elementos– Calificadores
• Listas de Opciones– Idiomas
Un repositorio está creado para reflejar la estructura interna de las organizaciones, es decir, está organizado de manera jerárquica.
Definición Comunidad:• Unidades-subsistemas productores de documentos, que hacen
parte de un sistema institucional, las cuales trabajan en un área específica ó cuyos procesos se pueden tomar como sistemas independientes generadores de conocimiento.
Definición de Colecciones• Tipos documentales específicos que trabajan las
comunidades, ya sean especificados por formato ó por proceso en el que están involucrados. Las colecciones son los elementos lógicos encargados de contener los documentos en el repositorio, una colección puede pertenecer a una o más comunidades.
Paso III – Normalice y Clasifique
Definición de Objetos (Ítems)• Unidades lógicas que encapsulan documentos de información,
documentos referenciales de la información (Metadatos) e Identificadores digitales (URN). Esto con el objetivo de conservar y transmitir dicha información en el dominio del espacio y del tiempo.
Definición de Documentos (Formato de Archivo - BitStream)• En realidad es un archivo, pero con determinados atributos ya
que contiene datos textuales o gráficos creados por el usuario con su computadora mediante un programa. El archivo recibe un nombre y un formato para guardarlo en un directorio, subdirectorio o carpeta previamente asignado en la unidad de almacenamiento. Es posible volver a abrirlo cuando se necesite acceder a su contenido, ya sea para imprimirlo, modificarlo o eliminarlo. Es mucho más frecuente decirle solamente archivo.
Paso III – Normalice y Clasifique
Paso III – Normalice y Clasifique
• Seleccione de las colecciones – Análisis de los documentos
• Formato
• Área Temática• Instrumento de aplicación (Taller, parcial, conversa torio)• Repetibilidad – Continuidad• Audiencia
Metadatos
Utilizar el esquema de metadatos Q u a li f ie d D u b lin C o r e recomendado por el D C M I L ib r a r ie s W o r k in g G r o u p - D C L ib r a r ie s A p p lic a t io n P r o f i le (DC-LAP).
Aunque no restringe la posibilidad de usar otros modelos de metadatos: LOM FGCD MARC21 MODS
Paso IV – Determine Recursos de Hardware
Almacena, preserva y controla los documentos
Almacenar, almacenar, almacenar….
Servidor Almacena
miento
Atiende todas las peticiones de los usuarios (Servicios)
Procesar, procesar.. procesar
ServidorObservacionesServicios y AplicaciónEquipo
Se debería contar con un laboratorio especializado en manejo de contenidos, se estima que pueden trabajar adecuadamente inicialmente con cuatro estaciones de trabajo.
Estos equipos serian utilizados por personal temporal y fijo contratado, para realizar las siguientes funciones sobre los documentos que se incluirán en los repositorios:
Ubicación y consolidación de documentos
Evaluación de pertinencia, formato y diseño.
Digitalización y OCR (opcional) Catalogación (directamente en los
repositorios, utilizando metadatos predefinidos)
Depuración
Estaciones de
Trabajo
ObservacionesServicios y AplicaciónEquipo
Paso IV – Determine Recursos de Hardware
Se puede trabajar con el escáner ya existente del servicio de Conmutación, siempre y cuando no interfiera con el desarrollo normal de operaciones del servicio.
Se requieren cuando haya a lugar procesos de digitalización de textos.
Escáner (Cama plana y Rodillo)
ObservacionesServicios y Aplicación
Equipo
Paso IV – Determine Recursos de Hardware
Paso IV – Determine Recursos de Hardware (Telecomunicaciones)
Paso V – Determine Recursos de Software
Software LibreVS
Software Propietario
http://www.dspace.org/ • Software de código abierto• Desarrollado por las Biblitoecas del MIT y
Hewlett – Packard Labs • Es un sistema de repositorio digital• Permite:
– Capturar y describir documentos digitales– Buscar y Recuperar documentos Digitales– Distribuir documentos digitales – Preservar documentos digitales
• Almacenar diferentes tipos de contenido
Paso VI - Diseñe e Implemente Políticas• Políticas
– Adquisición– Acceso– Publicación– Manejo y transformación de Contenidos– Preservación– Almacenamiento– Interoperabilidad – Metabúsqueda– Creación y Estructuración de Contenidos– Etc…
• Marketing• Licenciamiento Contenidos
Paso VII – Contenido Retrospectivo
Digitalización La captura y transformación de documentos físicos a documentos en forma digital (imagen) con el propósito de archivarlos con inteligencia que permita:
– Facilidad de Acceso a la Información
– Optimización de Espacio de Almacenamiento
– Reimpresión Bajo Demanda
– Integración de Aplicaciones
– Seguridad de Acceso a la Información
– Integración de Diversos Formatos
– Control Y Administración de Los Documentos
– Asegurar la vida útil del Documento
35 Años del desarrollo de las Ciencias de la Información en Colombia
Sólo Falta
Registrarse y Compartir …
35 Años del desarrollo de las Ciencias de la Información en Colombia
…Y compartir mediante los Integradores de contenido
MetaBuscadores
35 Años del desarrollo de las Ciencias de la Información en Colombia
¿Qué falta?
Voluntad!!!
Desafíos• Aceptación Organizacional
–Valorando y confiando en un repositorio institucional
– Múltiples Disciplinas que integran diferentes culturas
– Derechos de autor y políticas• Cultura y Costumbre Bibliotecas
– Políticas para el manejo y control de la información
– Operaciones y servicios sobre los documentos
Desafíos
• Enseñar y Compartir– Dspace esta diseñado para
interoperar– Dspace es Escalable– Investigación en
Repositorios, Bibliotecas Digitales y Difusión de los resultados
• Sustentabilidad– Preservación Documental– Apoyo Económico
35 Años del desarrollo de las Ciencias de la Información en Colombia
¿Y el Futuro?
Snow Crash (Neal Stephenson)
Second Life
Bibliotecas y Second Life• Second Life Library 2.0 / Info
Island Library/Info IslandALS
• Second Life Teens Library ‘Eye4You Alliance’
• Second Life Medical Library 2.0
• Consumer Health Information Library
• Library Gallery• Michigan Library Costoriumm• ALF Autism Museum and
Library• ALA Washington office
Biblioteca Virtual Cervantes
EL FUTURO….
ES AHORA!!!!!
¿Preguntas?Gracias - Thanks
Merci - DankeObrigado - Arigato
Grazie - Tack
Laureano Felipe Gómez Dueñas
Universidad de La Salle