Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la...

28

Transcript of Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la...

Page 1: Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la familia de protocolos TCP/IP, garantizando que las.
Page 2: Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la familia de protocolos TCP/IP, garantizando que las.

BÚSQUEDA Y SELECCIÓN 1.2

Page 3: Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la familia de protocolos TCP/IP, garantizando que las.

Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la familia de protocolos TCP/IP, garantizando que las redes físicas heterogéneas que la componen funcionen como una red lógica única, de alcance mundial.

Page 4: Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la familia de protocolos TCP/IP, garantizando que las.

1.2 BUSQUEDA Y SELECCIÓN Y ORGANIZACIÓN DE LA INFORMACION

INTERNET

Se ha convertido

INTERNET

Se ha convertido

HERRAMIENTA DE BUSQUEDA DE INFORMACION

ATRAVES DE BUSCADORES ( Sistemas Informáticos que indexan archivos de la WEB) (google, msn, yahoo)

BUSCAR LA INFORMACION POR AREA Y LUGAR DEL MUNDO

Las búsquedas se hacen con palabras clave o con árboles jerárquicos por temas.

un listado de direcciones Web en los que se mencionan temas relacionados.

en

que

facilitan

Para ello

resultando

Page 5: Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la familia de protocolos TCP/IP, garantizando que las.

Historia CronológicaDesarrollo de se genero la 1972 1983 1990

Arpanet primera red de Demostración de la Desarrollo del Desarrollo de

1960 computadorascomunicaciones financiada

protocolo TCP/IP WWW

1965

por DARPA naciendo Arpanet

1961 1969 1975 1989

Leonard Kleinrock Se genera el enlace funciono como redTim Bernes creo

publico el primer documento entre UCLA y la Univ. unió centros universitarios lenguaje HTML

de la teoria de commutacion de Stanford y militares

de paquetes

Page 6: Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la familia de protocolos TCP/IP, garantizando que las.

El envío de correo electrónico La transmisión de archivos Las conversaciones en línea La mensajería instantánea y presencia La transmisión de contenido y comunicación

multimedia -telefonía , televisión Los boletines electrónicos , el acceso

remoto a otras máquinas Los juegos en línea.

Servicios de Internet

Page 7: Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la familia de protocolos TCP/IP, garantizando que las.

Conjunto de redes de computadoras En organización no tiene un lugar central.

La gran parte de la infraestructura es pública, de los gobiernos mundiales, organismos y universidades.

Otra gran parte de Internet es privada, y la gestionan empresas de servicios de Internet (que dan acceso) o simplemente publican contenidos.

INTERNET ES :

Page 8: Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la familia de protocolos TCP/IP, garantizando que las.

Tecnología de Internet

Acceso a internet

Telefonía

ADSL, Cable Módems, o el RDSI

Red Eléctrica y

Satélite

Redes Inalámbricas

Page 9: Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la familia de protocolos TCP/IP, garantizando que las.

Son categorías que identifican de manera

general la clase de empresa u organización que está conectada y a los países. Tip

osEdu Institución educativa

Mil Militar

Gov Institución pública.

Org Otros organismos y entidades sin ánimo del lucro

Net Empresas de redes y telecomunicaciones

Com Comercial

Dominio

Page 10: Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la familia de protocolos TCP/IP, garantizando que las.

Los dominios asignados a los países se identifican mediante un código de dos letras que aparecen al final de la dirección. Ejem : Argentina: ar México: mx Colombia: co

La Corporación de Internet para los Nombres y los Números Asignados (ICANN) es la autoridad que coordina la asignación de identificadores únicos en Internet, incluyendo nombres de dominio, direcciones de Protocolos de Internet, números del puerto del protocolo y de parámetros.

Page 11: Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la familia de protocolos TCP/IP, garantizando que las.

Como funciona Internet

1. El usuario se conecta a la red a través de un modem2.El proveedor del servicio

Se da cuenta de la conexiónPor el protocolo TCP/IP y asigna un IP a tu computadoraY desde ese momento entras a la red

3.Cuando queremos acceder a una pagina proporcionamos un dominio que es traducido al servidor DNS

4.Cuando sabemos en qué Servidor Web seencuentra la página que queremos visitar se procede a su descarga y visualización en elnavegador del PC

El fundamento de Internet es el TCP/IP, un protocolo de transmisión que asigna a cadamáquina que se conecta un número específico, llamado "número IP“ que evita que la información se cruce

Page 12: Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la familia de protocolos TCP/IP, garantizando que las.

Terminal de 19”

Conexión telefónica o cable

Requerimientos

Modem que modula y demodula la señal

FTP

Page 13: Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la familia de protocolos TCP/IP, garantizando que las.

PARA QUE SIRVE INTERNET?

Uno de los usos más obvios es el del correo electrónico: enviar y recibir mensajes a cualquier otra persona conectada sin necesidad de cartas, teléfonos, faxes o contestadores, con la ventaja de recibir información editable o archivos especiales (de tratamiento de texto, hojas de cálculo, etc.) con los que trabajar.

Page 14: Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la familia de protocolos TCP/IP, garantizando que las.

Otra de las utilidades más comunes es el entretenimiento: los usuarios encuentran en los grupos de noticias , en las listas de correo , una forma de comunicarse con otras personas con las que comparten intereses y aficiones.

Para los usuarios de computadoras personales, Internet está repleta de archivos y programas de distribución pública, que pueden usar de forma gratuita (o del tipo "pagasi-te-gusta"), incluyendo utilidades, aplicaciones y juegos.

Internet también se presenta como un vasto almacén de información. Hay miles de bases de datos y recopilaciones de información sobre todos los temas imaginables: médicos,

históricos, periodísticos y económicos.

Page 15: Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la familia de protocolos TCP/IP, garantizando que las.

HTML Estas siglas significan Hiper Text Markup Language (Lenguaje de

Marcas de Hipertextos). Permite saltar de una página a otra en un mismo documento o

hacia otro que podría estar localizado al extremo opuesto del planeta.

A estos textos, que no son continuos ni lineales y que se pueden leer como saltando las páginas hacia cualquier lado se les llama hipertexto o hipermedia (expresión que comprende todos los contenidos posibles, es decir, textos, audio, imágenes, iconos y

vídeos). Los browser o navegadores permiten visualizar la forma amena y atractiva, toda la información en la pantalla del monitor.

El hipertexto es lo que permite que al hacer clic en una palabra o gráfico pasemos de la página en la que estamos a otra página distinta.

Page 16: Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la familia de protocolos TCP/IP, garantizando que las.

Facilita y hace atractiva la utilización de la red añadiendo interactividad a través de la introducción del hipertexto, los gráficos y los formularios.

Se define como hipertexto (sistema de enlaces que permite saltar de unos lugares a otros) como multimedia, que hace referencia al tipo de contenidos que puede manejar (texto, gráficos, vídeo, sonido y otros) e Internet la base sobre las que se transmite la información.

El aspecto exterior de la WWW son las conocidas "páginas Web."

.

WorldWideWeb

Page 17: Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la familia de protocolos TCP/IP, garantizando que las.

Las páginas de la WWW están situadas en servidores de todo el mundo (sitios Web), y se accede a ellas mediante un programa denominado "navegador" (browser).

Este programa emplea un protocolo llamado HTTP, que funciona sobre TCP/IP, y que se encarga de gestionar el aspecto de las páginas y los enlaces.

Cada página Web tiene una dirección única en Internet, en forma de URL que indica el tipo de documento (página Web o documento en formato HTML), y el de las páginas hipertexto de la WWW comienza siempre por http.

Page 18: Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la familia de protocolos TCP/IP, garantizando que las.

FORMATO

se trata una página Web en formato HTML

http://www.ibm.com identificador

de la empresa nombre de la empresa Si fuera .es seria de España

Page 19: Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la familia de protocolos TCP/IP, garantizando que las.

Naveg

ad

or

es

La información en la WEB está disponible a través de pág WEB

Escritas en HTML

Navegador transformaEl lenguaje en págs WEB visibles

El más usado Internet Explorer

El primer navegador fue Mosaic 1993,

que paso a ser Netscape .

Finalmente se generó Internet

Explorer de Windows 1996

2005 se creo Firefox de Mozzilla

En 2008 apareció Chrome

navegador de la mano de

Google.

Page 20: Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la familia de protocolos TCP/IP, garantizando que las.

INTRODUCCIÓN A LOS BUSCADORES

Historia Definición

Clasificación Componentes

Funcionamiento

Page 21: Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la familia de protocolos TCP/IP, garantizando que las.

1990Desarrollo de ArchieAlan Emtage de la Universidad

de Montreal

se utilizaba para buscar archivosalojados en servidores FTP públicos.

1991 sistema Gopherestudiante de la Universidad de Minnesota

con el objetivo de indexar archivos simples de texto.

1993 Worl Wide Web Warender un robot debúsqueda creado en Perl que pretendía medir el tamaño de lared. Ese robot se amplió pudiendo leer direcciones URL creándose así WandexMuy inestable

Aliweb (Archie Like Indexing on the Web), 1993 Martijn Koster

Fue en Abril de 1994 cuandoDavid Filo y Jerry Yang crearonYahoo!

Historia Buscadores

Page 22: Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la familia de protocolos TCP/IP, garantizando que las.

1994 se creo Webcrawler La gran diferencia y paso diferencial quepodríamos llamar la versión 1 de los buscadores era que indexaba las páginas de forma completa y que buscaba información en ellas, al contrario de sus antecesores, que sólo buscaban en ladirección web, título o metatags. Esto hizo que la relevancia de los resultados fuera mucho mayor

InfoSeek 1994 Este sistema lo que hace realmente es unificar los resultados de varios motores de búsqueda

1995 Excite Universidad de Stanford

1995 Altavista tenía ancho de banda casi ilimitado, permitíaconsultas en lenguaje natural (las que utilizamos habitualmente para hacer búsquedas), consultas avanzadas mediante operadores lógicos (AND - OR)

añadir o eliminar direcciones web en 24 horas, comprobar los enlaces entrantes a un sitio web e incluso permitía hacer búsquedas en los nombres de imágenes y algunos ficheros multimedia

Historia Buscadores

Page 23: Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la familia de protocolos TCP/IP, garantizando que las.

1996 Sergey Brin y Larry Page empezaron a desarrollar Google en la Universidad deStanford

una interfaz muy clara y sencilla.El 15 noviembre de 2003, Google implementó uno de losprimeros grandes cambios en su motor de búsquedaañadiendo mejoras en la búsqueda semántica. Los motoresde búsqueda tenían unas necesidades básicas: clustering ysemántica

En 1998 apareció MSN Search, de la mano de Microsoft Creado por Rich Skrenta y Bob Truel

Nutch es un motor de búsqueda en código abierto y creado enJava.

Aunque su desarrollo es costoso, ha conseguido el apoyo deYahoo!.

Historia Buscadores

Page 24: Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la familia de protocolos TCP/IP, garantizando que las.

En noviembre de 2004, MSN Search y de la mano de Christopher Payne y Oshoma Momoh pusieron en marcha unaprimera fase pública del motor de Microsoft, que se hizo pública el 20 de enero de 2005

Historia Buscadores

Definición: Un buscador es un sistema informático que permite al usuario encontrar archivos almacenados en servidores.

Page 25: Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la familia de protocolos TCP/IP, garantizando que las.

Los índices o directorios En los índices, hay personas detrás de ellos que clasifican

inteligentemente las páginas web y los recursos de la red en categorías predeterminadas, a modo de gran árbol .El primer motor de búsqueda que apareció fue Yahoo.

Los motores de búsqueda Son bases de datos que almacenan, una versión reducida de todas las

páginas web y recursos que encuentran en la red y que, aunque almacenan más información, son ligeramente menos precisos. El rastreo de la web lo hace un programa, llamado araña ó motor .Este programa va visitando las páginas y, a la vez, creando una base de datos en la que relaciona la dirección de la página con las 100 primeras palabras que aparecen en ella. Google.

Metabuscadores Los metabuscadores son páginas web en las que nos ofrece una búsqueda

sin que haya una base de datos propia. Hacen las búsquedas simultáneamente en varios motores seleccionados respetando el formato original de los buscadores e incorporan funciones adicionales.

Clasificación de Buscadores

Page 26: Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la familia de protocolos TCP/IP, garantizando que las.

Componentes

Los buscadores automáticos emplean programas de ordenador llamados robots o arañas, que saltan de una página a otra de la Web recogiendo páginas y almacenandotoda la información en una gigantesca base de datos. Esta base de datos contiene, entre otros datos, el título de la página, una descripción, palabras clave y los enlaces.

Los robots que recorren la red escrutándola (también llamados spider, robot ocrawler)

La base de datos que es construida por los robots

El motor de búsqueda que facilita la consulta a la base (también conocido con indicador)

La interfaz de búsqueda en la cual hacen la solicitud los usuarios

Page 27: Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la familia de protocolos TCP/IP, garantizando que las.

El funcionamiento de los buscadores puede resumirse en tres pasos:

1. Recolectan información de todas las páginas que hay en Internet explorando de manera automática cada una de ellas y crean un archivo de las páginas exploradas.

2. Indexan el archivo, es decir, crean un índice a partir de las palabras clave y criterios predeterminados. Ante la solicitud de información de un usuario, revisan este índice para arrojar los resultados.

3. Producen resultados ante determinada búsqueda relacionando las palabras claves y la calidad de la página con las palabras que ha ingresado el usuario para realizar su búsqueda.

Funcionamiento

Page 28: Internet es un conjunto descentralizado de redes de comunicación interconectadas, que utilizan la familia de protocolos TCP/IP, garantizando que las.