Post on 07-Oct-2020
1
Maximiliano Díaz Molinaro
Ejercicio del artículo 3.41. Funcionamiento de directorios y motores de búsqueda
Enunciado del ejercicio
El alumno debe elegir dos palabras o dos frases clave relacionadas con cualquier tema del curso, por ejemplo: (1)
"edición de páginas web", (2) usabilidad; y con estas dos palabras clave (las que elija el usuario, no necesariamente
las dos anteriores) hacer una comparación entre:
Google (http://wwww.google.es) y Yahoo Search (http://es.search.yahoo.com).
Para esta comparación, examinará los diez primeros resultados proporcionados por cada uno de los motores y a
partir de la relevancia de los mismos (siempre a juicio del alumno) hará un informe comparativo de la eficacia de
estos dos motores. El informe del alumno deberá indicar: (1) qué palabras (o frases) clave ha utilizado, y (2) una
opinión razonada de cuál ha sido el mejor motor no solamente teniendo en cuenta la relevancia de los resultados,
sino las demás opciones del motor: en particular la búsqueda avanzada y la presentación de los resultados.
....................................
Alternativa al ejercicio anterior: Para dar un poco más de diversidad a los resultados, se pueden comparar otras
parejas distintas de motores, a elección del alumno. Por ejemplo, las siguientes parejas pueden ser objeto de
análisis para este ejercicio (siguiendo las indicaciones generales):
Bing vs. Google
Yahoo vs. Bing
Palabras clave (PC a partir de ahora) utilizadas en la búsqueda:
PC1 Archivos
PC2 Web social
Con esta búsqueda pretendemos obtener información sobre la implantación y el uso de las
herramientas que proporciona la web social en los archivos. Elegimos la palabra archivos de
forma premeditada. Con ella queremos referirnos a la institución, pero puede resultar
interesante ver cómo los dos motores de búsqueda utilizados (MDB) –Google y Bing- tratan la
ambigüedad del término (archivo como institución, y archivo como documento). Por otro lado,
los resultados obtenidos en lo referente a web social quedan agrupados, en ocasiones, bajo
conceptos como web 2.0 o social media.
Una búsqueda simple con Bing nos da 6.210.000 resultados.
2
URL de las 10 primeras posiciones y breve análisis:
1ª http://es.wikipedia.org/wiki/Web_2.0
Descripción del concepto web 2.0 en Wikipedia. No hay relación entre la búsqueda y el
resultado más allá de la idea de red social. A parte de la presencia de la palabra web en la raíz
de la URL, la ocurrencia de la PC1 en el código HTML es de 1 ocasión, mientras que para las
PC2 la palabra web se encuentra en 276 ocasiones y en etiquetas <h2> y <h3>; y la palabra
social ha sido localizada en 12 ocasiones.
2ª http://www.slideshare.net/davidgadir/archivos-y-redes-sociales-la-web-social-como-
vehculo-para-la-difusin-de-los-archivos-1-parte-12149774
Primera parte de la presentación realizada por un documentalista en el V Curso de
especialización archivística: ¿hacia la e-Administración, recursos digitales y archivos 2.0?, en
Priego de Córdoba, entre el 22 y el 24 de marzo de 2012. Esta presentación está alojada en
Slideshare. Independientemente de la calidad de los contenidos, este resultado coincide
plenamente con la búsqueda planteada. De hecho, la misma URL da una buena pauta de qué
trata este enlace. En cuanto a código HTML de la página, la PC1 se da en 232 ocasiones, y la
PC2 48 veces. Las dos PC se encuentran en el <title> de la sección <head>, y en la etiqueta
<h1>.
3
3ª http://webysocialmedia.es/tag/web/
Página web de una empresa, con sede en Zaragoza, que desarrolla su actividad en el sector de
las tecnologías de la información y comunicaciones. Ofrecen servicios y soluciones informáticas
a pymes y despachos profesionales. Este resultado no nos es útil. La palabra archivo
corresponde a un menú cronológico de los archivos almacenados en el sitio web; el menú está
situado a la izquierda de la página. En cualquier caso, Bing lo rescata, entre otros motivos, por
los contenidos de la etiqueta <title> dentro del <head>:
<title>Web Archivos - Web Y Social Media | Web y Social Media</title>
4ª http://wdb.ugr.es/~dgomez/documentalista/archivos-y-redes-sociales-la-web-social-
como-vehiculo-para-la-difusion-de-los-archivos/
Página web de David Gómez Domínguez, autor de la presentación que queda registrada en el
2º resultado (Slideshare) de esta búsqueda. De hecho, nos remite a la misma presentación
realizada en el V Curso de especialización archivística(...). Si nos fijamos en la URL, contiene
parte de la misma raíz. Del código HTML, decir que la PC1 se halla en 58 ocasiones, y la PC2 en
13 ocasiones. Las dos PC tienen presencia en etiqueta <h1>, y también destacaríamos el <title>
de la sección <head>:
<title> Archivos y redes sociales: la web social como vehículo para la difusión de los archivos | David Gómez
Domínguez</title>
5ª http://prezi.com/qajq22md0vv_/archivos-web-2-0-social-media/
Presentación titulada Archivos, web 2. 0 & Social Media, elaborada en 2012 por una
profesional en ciencia de la información y la documentación que trabaja para el SENA,
organismo que depende del Gobierno de Colombia. Revisando las diapositivas, vemos que se
centra en la web 2.0 y las posibilidades que proporciona en la gestión del conocimiento, así
como compartir archivos. La cuestión de archivos (como institución) y web social queda algo
alejada de la búsqueda planteada. Destacamos el <title>:
<title>Archivos, web 2. 0 & Social Media by CAMILO PINZON on Prezi</title>
6ª http://wwwhatsnew.com/category/web-social/
Sección de web social del sitio web wwwhatsnew.com, web que se dedica a comentar
aplicaciones gratuitas en la web, y noticias sobre Internet, con la evolución de los eventos que
están transformando la web, así como noticias relacionadas con marketing en las redes
sociales. Como hemos mencionado al principio, este resultado corresponde a la sección Web
social, donde se recogen noticias sobre este tema, queda, por lo tanto, algo alejado de nuestra
4
búsqueda. Elementos destacables del código son, una vez más, el <title>: <title>Web Social</title>,
y la presencia de la PC2 en etiquetas <h1>, <h2> y <h3>.
7ª http://webysocialmedia.es/tag/google/
Volvemos al mismo sitio web de la 3ª posición. Es una página de la empresa que corresponde a
la sección Contrátanos (oferta de servicios, consultas, etc.). Lo único destacable del resultado,
a parte de la URL, es la presencia del concepto web en el código HTML: en 386 ocasiones en el
3er resultado, y 315 en el 7º.
8ª http://www.mcu.es/archivos/MC/AHN/index.html
Página de inicio del Archivo Histórico Nacional del sitio web del Ministerio de Educación,
Cultura y Deporte de España. Una vez más el resultado referido a la búsqueda es tangencial.
Destaca la presencia de la PC1, en 75 ocasiones y en diversas etiquetas <h1>, <h2> y <h4>. Por
último mostramos un fragmento de diversas secciones del <head> que pueden explicar el por
qué de este resultado:
<title>Portada del Archivo Histórico Nacional</title>
<meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1" />
<meta name="DC.title" content="Portada del Archivo Histórico Nacional" />
<meta name="title" content="Portada del Archivo Histórico Nacional" />
<meta name="DC.editor" content="SG de los Archivos Estatales" />
<meta name="editor" content="SG de los Archivos Estatales" />
<meta name="DC.description" content="" />
<meta name="description" content="" />
<meta name="DC.keywords" content="ARCHIVOS ESTATALES, ARCHIVOS HISTÓRICOS, PORTALES DEL
MINISTERIO DE CULTURA" />
<meta name="keywords" content="ARCHIVOS ESTATALES, ARCHIVOS HISTÓRICOS, PORTALES DEL
MINISTERIO DE CULTURA" />
9ª http://www.carlosnuel.com/archivos
Este sitio web se dedica a informar y comerciar con gadgets, negocios y tecnología de
consumo. Obviamente no tiene mucho que ver con la búsqueda planteada. El resultado
corresponde al penúltimo elemento de la barra de menú: Archivos. La PC1 tiene se encuentra
en 9 ocasiones y tiene presencia en <title> y etiquetas <h1> y <h4>. Por su parte la PC2 se
muestra en una etiqueta <h4>.
10ª http://www.socialbiblio.com/tag/archivos/
Página web correspondiente al sitio SocialBiblio, comunidad de práctica (cooperación en el
aprendizaje) en línea sobre biblioteconomía, documentación y gestión de la información. El
5
resultado corresponde a una sección donde quedan agrupados todos los posts que contienen
la etiqueta Archivos. En cuanto al código HTML, la PC1 se halla en 30 ocasiones, en <title> y
otras secciones del <head>, así como en etiquetas <h3> y <h4>. Para la PC2 tenemos 1
ocurrencia dentro de un menú muy amplio.
El balance de la búsqueda con Bing es bastante pobre y con ello queda demostrado que la
ambigüedad de la lengua es un problema a resolver en la web. El peso de la palabra archivo,
entendido como documento, tiene mucha más relevancia que la definición correspondiente a
institución. Ahora bien, si tenemos presente los resultados que se encuentran en la 2ª y 4ª
posición, se puede ser algo optimista.
Veamos ahora qué sucede con Google. La búsqueda archivos AND web social da la cifra de
10.600.000 resultados (tiempo de espera: 0,27 segundos).
En cuanto a las 10 primeras URL:
1ª http://www.biblogtecarios.es/davidgomez/hacia-la-visibilizacion-social-de-los-
archivos-la-web-2-0-su-servicio
Entrada en el blog de Biblogtecarios realizada por David Gómez donde proporciona un
resumen de su intervención en el V Curso de Especialización en Archivística: ¿Hacia dónde
evolucionan los archivos? e-administración, recursos digitales y archivos 2.0. Intervención que
lleva por título Archivos y redes sociales: la web social como vehículo para la difusión de los
archivos. Este resultado coincide plenamente con las necesidades de información planteadas.
En cuanto al código HTML, vemos que la URL recoge parte de las palabras clave utilizadas y la
frase final coincide con la búsqueda deseada. La PC1 se encuentra en 54 ocasiones, la palabra
web se repite 44 veces, la palabra web 2.0 en 9 ocasiones, y la palabra social media 4 veces. La
6
PC2, en su conjunto, aparece 8 veces. Destaca el <head> por la gran cantidad de ocurrencias
que tienen los diversos términos en secciones como <title>, <keywords>, <description> y
<abstract>, así como la etiqueta <h1>
2ª http://blogs.grupojoly.com/redes-y-cacharros/2012/11/01/la-web-social-se-reune-de-
nuevo-en-sevilla-en-el-ebe/
Este resultado corresponde a la entrada de un blog para promocionar las jornadas Evento Blog
- EBE, destinadas a profesionales de la web y en especial a la web social, que tuvo lugar en
noviembre del año pasado en Sevilla. A parte de la PC2, que queda recogida en la URL, la PC1
no se encuentra en ninguna parte. Este resultado, puede interesar en cuanto al uso de la web
social en general, pero no tiene relación directa con el mundo de los archivos.
3ª http://wdb.ugr.es/~dgomez/documentalista/archivos-y-redes-sociales-la-web-social-
como-vehiculo-para-la-difusion-de-los-archivos/
Este resultado es el mismo que se encuentra en la 4ª posición de resultados obtenidos con
Bing y tiene relación directa con el 1er resultado de Google antes analizado. Corresponde a la
página web del documentalista David Gómez Domínguez y tiene relación directa con la
búsqueda planteada (para datos cuantitativos, consultar el 4º resultado de Bing)
4ª http://www.slideshare.net/davidgadir/archivos-y-redes-sociales-la-web-social-como-
vehculo-para-la-difusin-de-los-archivos-3-parte
Esta URL corresponde a la tercera parte de la presentación realizada por el documentalista
David Gómez para el V Curso de Especialización en Archivística: ¿Hacia dónde evolucionan los
archivos? e-administración, recursos digitales y archivos 2.0. Se encuentra alojada en
Slideshare. El 2º resultado de Bing recoge la primera parte de la presentación (también en
Slideshare), pero no la segunda y tercera parte en que se dividió la misma. Por otro lado tiene
relación directa con el primer resultado de Google. A parte de las PC utilizadas en la URL,
tenemos que la PC1 aparece en 240 ocasiones, la palabra web tiene 158 ocurrencias, y la PC2
47.
5ª http://www.slideshare.net/davidgadir/archivos-y-redes-sociales-la-web-social-como-
vehculo-para-la-difusin-de-los-archivos-2-parte
Esta es la segunda parte de la presentación antes mencionada. URL a parte, la PC1 aparece en
233 ocasiones, el término web en 171 ocasiones, y la PC2 aparece 53 veces. Tanto en este
resultado como el anterior destaca la etiqueta <title> de la sección <head>:
<title>(2ª PARTE) Archivos y redes sociales: la web social como vehículo p...</title>
7
6ª http://www.slideshare.net/Rafalmao/la-web-20-web-social-aplicada-a-los-archivos-
una-nueva-manera-de-gestionar-informacin
Presentación elaborada por un documentalista venezolano que lleva por título La Web 2.0 ó
Web Social Aplicada a los Archivos. Una Nueva Manera de Gestionar Información. Esta
presentación también está alojada en Slideshare y es un buen resultado, independientemente
del contenido, para la búsqueda planteada. La PC1 aparece 149 veces, mientras que el
término web 2.0 aparece en 21 ocasiones y la PC2 en 15. Las dos PC aparecen en etiquetas
<h1> y <h2>. Destaca, una vez más, el <title>: <title>La Web 2.0 ó Web Social Aplicada a los Archivos. Una
Nueva Manera d...</title>.
7ª http://es.wikipedia.org/wiki/Web_social
Descripción del concepto web social en Wikipedia. Por lo que se refiere al código HTML, la PC1
se da en una ocasión. El término web en 74 ocasiones y la PC2 aparece 11 veces, además de
<title> y etiqueta <h1>. Este resultado es útil para la comprensión del concepto, pero no
aporta nada a la búsqueda planteada.
8ª http://www.elprofesionaldelainformacion.com/libros/etiquetar-web-social.html
Página web del portal El profesional de la información donde se promociona el libro publicado
por Raquel Gómez-Díaz sobre el uso de las etiquetas en la web social. La PC1 no aparece en
todo el código, la palabra web en 29 ocasiones, y la PC2 surge 13 veces. La PC2 la encontramos
en las secciones <title> y <keywords> de la sección <head>.
9ª http://diarium.usal.es/biblioblog/category/web-social/
Página hospedada en el gestor de blogs de la Universidad de Salamanca (Diarium). Este blog es
Biblioblog, y la página en cuestión corresponde a la sección del Archivo de entradas, y en
concreto, lo referente a Web social. La PC1 aparece 4 veces, el término web en 52 ocasiones, y
la PC2 tiene 25 ocurrencias y aparece en <title> y en etiqueta <h2>.
10ª https://www.facebook.com/pages/Curso-Aplicaciones-libres-archivos-abiertos-y-web-
social/166591743599
Página de Facebook correspondiente a un Curso [de] Aplicaciones libres, archivos abiertos y
web social. Accedimos a la página pero no contiene mucha más información; no parece, por el
título, que sea de utilidad para nuestra búsqueda. La URL contiene las dos PC; PC1 en 35
ocasiones, PC2 en 12 ocasiones, y aparecen de forma masiva en la sección <head>, 7 y 4 veces
respectivamente.
8
La búsqueda simple con Google ha dado 5 resultados positivos, ahora bien, 4 de ellos
corresponden a una conferencia dada por un documentalista en unas jornadas realizadas en
Priego de Córdoba en marzo de 2012, por lo tanto, no hay mucha diversidad de información.
Hay que decir que este documentalista ha sabido rentabilizar su conferencia porque está muy
bien posicionada. Por otro lado, curiosamente Bing nos proporciona acceso directo a la 1ª
parte de las diapositivas de esta conferencia, y Google da como resultado la 2ª y 3ª parte de la
presentación. He analizado el código HTML y no encuentro el por qué de estos resultados,
debe existir algún criterio de los MDB no coincidente entre las tres URL. En cualquier caso,
Google arroja mejores resultados que Bing en búsqueda simple, y más cantidad, puesto que
hay más de 4 millones de diferencia.
A modo de conclusión, presentamos dos tablas comparativas donde quedan agrupados los
resultados obtenidos en las búsquedas simples. Hay que decir que los resultados de estas
tablas son orientativos porque no contemplan, por ejemplo, el orden de aparición de las PC.
Demuestran, eso sí, la validez de los resultados que da cada MDB, en especial, los datos más
elevados referentes a la frecuencia absoluta de las palabras clave, que coinciden con los
resultados más útiles.
Bing PC1 en URL* PC2 en URL Frecuencia
absoluta PC1
Frecuencia absoluta
PC2**
PC1 en <head>
PC2 en <head>
1er resultado No No (excepto
web) 1
276 (web) i 12 (social)
- -
2º Sí Sí 232 48 Sí Sí
3º No Sí (por
separado) 2
386 (web) i 367 (social)
Sí Sí (por
separado)
4º Sí Sí 58 13 Sí Sí
5º Sí Sí (por
separado) 14
10 (web) i 19 (social)
Sí Sí (por
separado)
6º No Sí 1 44 (web) No Sí
7º No Sí (por
separado) 2
315 (web) i 357 (social)
Sí Sí (por
separado)
8º Sí No 75 16 (web) Sí -
9º Sí No 9 1 Sí -
10º Sí No 30 1 Sí -
*Presencia de la palabra clave en la URL
** Si solo aparece el número, corresponde al término de búsqueda completo -web social-. En caso contrario, entre
paréntesis se indica uno de los dos términos empleados en la PC2 -web / social-.
9
Google PC1 en URL PC2 en URL Frecuencia
absoluta PC1 Frecuencia
absoluta PC2 PC1 en <head>
PC2 en <head>
1er resultado Sí Sí (por
separado) 54 8 Sí Sí
2º No Sí 0 12 No Sí
3º Sí Sí 58 13 Sí Sí
4º Sí Sí 240 47 Sí Sí
5º Sí Sí 233 53 Sí Sí
6º Sí Sí 149 15 Sí Sí
7º No Sí 1 11 No Sí
8º No Sí 0 13 No Sí
9º No Sí 4 25 No Sí
10º Sí Sí 35 12 Sí Sí
Es con la búsqueda avanzada que se resuelve mucho mejor las necesidades de información, o
bien acotando más los términos de búsqueda (substituyendo la palabra archivos por
archivística, por ejemplo).
En cuanto a otras opciones de búsqueda en Bing, hay que clicar en el cajón de búsqueda y se
nos permite acceder a Búsqueda avanzada y Administrar el historial de búsqueda. Si añadimos
el término archivística en el cajón de Búsqueda avanzada nos da otros resultados mucho más
próximos a lo que buscamos:
10
Exceptuando dos enlaces, el resto es más coincidente con la búsqueda deseada. Existen,
además, las opciones para acotar la búsqueda en Sitios/Dominios concretos, que permiten
limitar la búsqueda a sitios específicos, o a dominios raíz (.edu, .gov, .net, …), o bien a dominios
específicos de país (.es, .it, .de, …). Por otro lado se puede acotar por regiones geográficas y
por idioma.
Para más detalle de la Búsqueda avanzada tenemos explicaciones acerca del uso de símbolos y
de los operadores booleanos:
O bien cómo limitar y/o afinar las búsquedas en Bing a partir de palabras clave que se
incorporan a los términos de búsqueda utilizados:
11
12
En cuanto a la búsqueda avanzada en Google, vemos que tiene incorporados mecanismos de
uso fácil como se puede observar en esta captura de pantalla:
Si bien la mayoría de prestaciones iniciales coinciden con Bing, esta página de inicio de Google
para realizar 'búsqueda avanzada' es más fácil de usar para la persona que no está
especializada con este tipo de búsquedas. Simplemente, con rellenar los cajones de búsqueda
y elegir las opciones de los desplegables, se puede obtener muy buenos resultados. Por otro
lado dispone, como Bing, de palabras clave avanzadas como link: y site:, que nos permiten
analizar enlaces de entrada o bien la presencia de palabras clave.
Comparando los dos MDB vemos que Bing tiene muy buenas prestaciones para la búsqueda
avanzada. Google tendrá que seguir innovando si no quiere verse superado en poco tiempo.
Por último trataremos el tema de la presentación de resultados. En Google los resultados son
presentados con diversas opciones relevantes: imágenes, noticias, mapas, resultados en
Youtube, Shopping,... todo ello relacionado con la búsqueda planteada. Por otro lado tiene
resultados más específicos/científicos en la sección Google Académico. La página de resultados
también ofrece opciones rápidas para depurar la búsqueda. Debajo del cajón de búsqueda de
la página de resultados, a la derecha, existe la pestaña Herramientas de búsqueda. Aquí
podemos limitar los resultados por idiomas o por localización geográfica, acotar fechas, y la
herramienta Verbatim, que exprime al máximo el lenguaje utilizado en las búsquedas.
En cuanto al MDB Bing, nos permite filtrar los resultados por idiomas y por región, opciones
que se encuentran junto a la cifra de resultados obtenida. A parte, en la parte superior nos da
resultados diferenciados por: web, imágenes, vídeos, compras, noticias, y más. Por otro lado,
presenta una serie de opciones vinculadas con la búsqueda planteada, es la opción Búsquedas
relacionadas, que puede ser de gran ayuda para encontrar sinónimos u otras opciones que no
13
se nos hayan ocurrido. Por último, en la página de resultados, en el ángulo superior derecho
tenemos la herramienta Preferencias, representado por una rueda dentada. Aquí podemos
perfilar un poco más los resultados obtenidos al predeterminar algunas de las opciones de
búsqueda. Existe, además, el Historial de búsqueda.
Para terminar, los dos buscadores disponen de la herramienta En caché (Google) o Cached
page (Bing) que son útiles para ver la localización de las palabras clave en la página web
consultada. Para acceder a esta herramienta es tan sencillo como situarse junto a las URL de la
página de resultados y clicar en la flecha que se encuentra a la derecha de cada URL.
Accedemos a capturas de pantalla recientes en las cuales queda marcado en colores distintos
las palabras clave utilizadas en la búsqueda.