Internet invisible
Interness 26-1-2003
Autor: Juan Pablo Sánchez
Hay dos formas de localizar información en Internet la primera es utilizando
la URL o dirección donde se encuentra la información que buscamos,
es la forma más rápida y directa. Si queremos conocer los cursos
que imparte IBM España tecleamos en la ventana del navegador www.ibm.es
y resuelto. Pero no siempre conocemos la URL donde se encuentra la información
que buscamos ¿Qué dirección Internet tiene la Real Academia
de la Lengua Española?¿Tiene WEB? , para estos casos, que son
la mayoría, podemos introducir algunas palabras claves en un buscador
como Google (www.google.com), como "Real" "Academia" "Lengua"
"Española" y este nos devuelve las URL dónde se puede
encontrar la información que buscamos por ejemplo www.rae.es y algunas
más, que vemos que no es lo que buscamos.
Los buscadores lo que hacen es ir recorriendo la red e indexando todas las palabras
que encuentran ( "real" en www.rae.es, www.realmadrid.es , etc.) cuando
las interrogamos consultan el índice y nos muestra los registros indexados.
Sin embargo, únicamente pueden indexar los términos que aparecen
en páginas estáticas HTML.
Hay mucha información cargada en las WEBs en forma de archivos Word,
Acrobat, Power Point, etc. y algunos buscadores como Google ("El gafotas"
) que poseen rutinas de lecturas de estos formatos e indexan esta información.
Cómo Internet no deja de ser una red de redes hay muchas bases de datos
conectadas a Internet, las bases de datos no pueden ser indexadas por los buscadores
y por ello para ellos no existe, resulta invisible para las "arañas"
que rastrean la red. Los periodistas prefieren hablar de "Internet Invisible"
en lugar de Bases de Datos, pues vende más.
La cantidad de información almacenada en Bases de Datos conectadas a
Internet es de unas 500 veces la que hay visible en Internet, lo cual hace unas
500 mil millones de páginas o lo que es lo mismo 7.500 Tera Bytes.
Podemos distinguir cuatro tipos de bases de datos:
Algunas WEBs en las que se encuentran relaciones de bases de datos públicas
o que son capaces de consultar a varias de ellas de forma simultánea:
Si es interesante consultar las Bases de Datos accesibles desde Internet es
más interesante que se puedad hacceder de forma automática por
parte de programas de ordenador y electrodomésticos.
Cuando nos conectamos a un sistema de Mensajería Electrónica,
como Messenger, el programa cliente que está en nuestro PC accede a una
base de datos central para leer las direcciones IP de los amigos que tenemos
dados de alta en nuestra lista y de paso actualiza nuestro regitro de BAse de
Datos con el fin de notificar de nuestra IP a los que nos tienen en sus listas.
Pero también podemos hacer que cuando introducimos un CD de música
en nuestro PC de forma automática se acceda a una Base de Datos para
informarnos de todos los detalles sobre el CD. Esta base de datos puede ser
CDDB (http://www.gracenote.com/
) que dispone de más de 1,5 millones de entradas o FreeDB (http://www.freedb.org/
). Ambas usan formatos compatibles, siendo la segunda un proyecto de software
libre. LAs bases de datos permiten ser consultadas por WEB y ser mantenidas
por los usuarios.
Algunos reproductores como PDHercules Digital Recordable Jukebox II pueden consultar
a CDDB si tienen accesoa Internet, también algunos programas reproductores
incluyen clientes de CDDB/FreeDB como Choice Caster oVuPlayer (http://www.vuplayer.com/),
pero sino puede hacerse con clientes gratuitos como CDAID de http://www.marvintec.com
o zCDcat http://on.to/zzzbla/ (Esta WEB está un poco destartalada, pero
el programa no está nada mal). Estos programas lo que hacen es localizar
el UPC (Universal Product Code) una especie de ISBN de los CD, pero como este
código puede no ser único calcula un valor a partir del númerod
e pistas o tracks y de su duración.
Los DVD también están en esta base de datos.
Rápidamente la imaginación nos lleva a muchas más aplicaciones:
por ejemplo conocer las propiedades alimenticias, posibles menús, etc.
de un alimento a partir de su códiog de barras;