jueves, 19 de noviembre de 2015

¿Qué es la Web Superficial y la Web Profunda?


Web Superficial o Web Profunda  son conceptos sobre internet que hacen referencia básicamente a la accesibilidad a los contenidos web según la posibilidad de acceso a los mismos por parte de los motores de búsqueda.




Pasando en limpio ...

WEB SUPERFICIAL
WEB PROFUNDA
Información disponible en Internet que es recuperada interrogando a los buscadores convencionales.
Información disponible en Internet que no se recupera interrogando a los buscadores convencionales
Es de libre acceso. No se requiere la realización de un proceso de registro para acceder a la información.
Estas bases de datos requieren un usuario y contraseña para acceder  a ellas o bien son páginas dinámicas.
Formada por páginas Web estáticas, es decir, páginas o archivos con una URL fija y accesibles desde otro enlace.
Páginas que no tienen una URL fija y que se construyen en el mismo instante (temporales) desapareciendo una vez cerrada la consulta.
Los documentos aparecen referenciados o ligados a otros.
 Los documentos no tienen un link ligado a otro.

Sherman y Price identifican cuatro tipos de contenidos invisibles en la Web
  • La Web opaca está compuesta por archivos que, si bien podrían estar incluidos en los índices de los buscadores, no lo están por algún motivo.
  • La Web privada consiste en las páginas Web que podrían estar indizadas en los buscadores pero son excluidas deliberadamente.
  • La Web propietaria incluye aquellas páginas en las que es necesario registrarse para tener acceso al contenido, ya sea de forma gratuita o arancelada.
  • La Web realmente invisible se compone de páginas que no pueden ser indizadas por limitaciones técnicas de los buscadores, programas ejecutables y archivos comprimidos, páginas generadas dinámicamente, es decir, que se generan a partir de datos que introduce el usuario, información almacenada en bases de datos relacionales, que no puede ser extraída a menos que se realice una petición específica.
Algunos de los recursos de búsqueda en la Web Profunda

  • The WWW Virtual Library se considera el catálogo más antiguo en la web y fue iniciado por Tim Berners-Lee, el creador de la web.
  • Infoplease es una Web de consulta con más de 57.000 artículos de la prestigiosa enciclopedia Columbia. Facilita la consulta de información con opciones de búsqueda por términos o por áreas de conocimiento. Es posible acceder a un buen número de enciclopedias, atlas, y biografías. Y también tiene algunas ramificaciones interesantes como Factmonster.com para los niños y Biosearch, un motor de búsqueda sólo para biografías, o información de todo lo acontecido históricamente en un determinado día.
  •  DeepWebTech ofrece cinco motores de búsqueda para temas específicos. Los motores de búsqueda abarcan la ciencia, medicina y negocios. El uso de estos motores de búsqueda específicos del tema, puede consultar las bases de datos subyacentes en la Web profunda.
  • TechXtra centra su información, en ingeniería, matemáticas e informática. Es posible navegar a través de una extensa lista de revistas gratuitas especializadas de ingeniería, documentos técnicos, descargas y podcasts. 

Según Lluis Codina: “Internet invisible es un nombre claramente inadecuado para referirse al sector de sitios y de páginas web que no pueden indizar los motores de búsqueda de uso público. Debería denominarse, en realidad, la web "no indizable", lo cual es un término mucho más adecuado”.
Él explica que hay opr lo menos tres motivos por los cuales hay contendios no indizables.
1- Los formatos de los documentos.
2- Las páginas ques se generan en forma dinámica; típicamente, a través de la consutla a una base de datos.
3- Conjunto de sitios o páginas Web, de forma expresa, se excluyen de la actividad indicadora de los motores de búsqueda.

Fuentes consultadas:

No hay comentarios:

Publicar un comentario