Internet invisible

 

Interness 26-1-2003

Autor: Juan Pablo Sánchez


Hay dos formas de localizar información en Internet la primera es utilizando la URL o dirección donde se encuentra la información que buscamos, es la forma más rápida y directa. Si queremos conocer los cursos que imparte IBM España tecleamos en la ventana del navegador www.ibm.es y resuelto. Pero no siempre conocemos la URL donde se encuentra la información que buscamos ¿Qué dirección Internet tiene la Real Academia de la Lengua Española?¿Tiene WEB? , para estos casos, que son la mayoría, podemos introducir algunas palabras claves en un buscador como Google (www.google.com), como "Real" "Academia" "Lengua" "Española" y este nos devuelve las URL dónde se puede encontrar la información que buscamos por ejemplo www.rae.es y algunas más, que vemos que no es lo que buscamos.

Los buscadores lo que hacen es ir recorriendo la red e indexando todas las palabras que encuentran ( "real" en www.rae.es, www.realmadrid.es , etc.) cuando las interrogamos consultan el índice y nos muestra los registros indexados. Sin embargo, únicamente pueden indexar los términos que aparecen en páginas estáticas HTML.

Hay mucha información cargada en las WEBs en forma de archivos Word, Acrobat, Power Point, etc. y algunos buscadores como Google ("El gafotas" ) que poseen rutinas de lecturas de estos formatos e indexan esta información.

Cómo Internet no deja de ser una red de redes hay muchas bases de datos conectadas a Internet, las bases de datos no pueden ser indexadas por los buscadores y por ello para ellos no existe, resulta invisible para las "arañas" que rastrean la red. Los periodistas prefieren hablar de "Internet Invisible" en lugar de Bases de Datos, pues vende más.

La cantidad de información almacenada en Bases de Datos conectadas a Internet es de unas 500 veces la que hay visible en Internet, lo cual hace unas 500 mil millones de páginas o lo que es lo mismo 7.500 Tera Bytes.

Podemos distinguir cuatro tipos de bases de datos:

 

Algunas WEBs en las que se encuentran relaciones de bases de datos públicas o que son capaces de consultar a varias de ellas de forma simultánea:

Si es interesante consultar las Bases de Datos accesibles desde Internet es más interesante que se puedad hacceder de forma automática por parte de programas de ordenador y electrodomésticos.

Cuando nos conectamos a un sistema de Mensajería Electrónica, como Messenger, el programa cliente que está en nuestro PC accede a una base de datos central para leer las direcciones IP de los amigos que tenemos dados de alta en nuestra lista y de paso actualiza nuestro regitro de BAse de Datos con el fin de notificar de nuestra IP a los que nos tienen en sus listas.

Pero también podemos hacer que cuando introducimos un CD de música en nuestro PC de forma automática se acceda a una Base de Datos para informarnos de todos los detalles sobre el CD. Esta base de datos puede ser CDDB (http://www.gracenote.com/ ) que dispone de más de 1,5 millones de entradas o FreeDB (http://www.freedb.org/ ). Ambas usan formatos compatibles, siendo la segunda un proyecto de software libre. LAs bases de datos permiten ser consultadas por WEB y ser mantenidas por los usuarios.

Algunos reproductores como PDHercules Digital Recordable Jukebox II pueden consultar a CDDB si tienen accesoa Internet, también algunos programas reproductores incluyen clientes de CDDB/FreeDB como Choice Caster oVuPlayer (http://www.vuplayer.com/), pero sino puede hacerse con clientes gratuitos como CDAID de http://www.marvintec.com o zCDcat http://on.to/zzzbla/ (Esta WEB está un poco destartalada, pero el programa no está nada mal). Estos programas lo que hacen es localizar el UPC (Universal Product Code) una especie de ISBN de los CD, pero como este código puede no ser único calcula un valor a partir del númerod e pistas o tracks y de su duración.

Los DVD también están en esta base de datos.

Rápidamente la imaginación nos lleva a muchas más aplicaciones: por ejemplo conocer las propiedades alimenticias, posibles menús, etc. de un alimento a partir de su códiog de barras;


Volver al índice de temas de Interness