martes, 1 de marzo de 2016

Web Superficial y Web Profunda Académica


Los internautas tienen acceso sólo a una parte de lo que realmente existe online y son los motores de búsqueda tradicionales los encargados de localizar dicha información, a esto se le denomina web o internet superficial o visible.Aquello que no puede ser indexado por los buscadores es la web o internet profunda o invisible.

Las principales características de la web superficial son:
-Es de libre acceso.
-Su información no está contenida en la base de datos.
-No se requiere la realización de un proceso de registro para acceder a la información.
-Mayoritariamente está conformada por páginas web estáticas, es decir páginas o archivos con la URL fija y accesible desde otro enlace.

Las características de la web profunda son:
-La información no se recupera interrogando a los buscadores convencionales.
-La información es almacenada y accesible mediante base de datos.
-Los resultados se generan mediante una contestación a una pregunta directa a través de páginas dinámicas (ASP, PHP, etc).

 Lo que se muestra fuera del agua será la web superficial y lo que está dentro del agua , la web profunda.

Clasificación de la web profunda:

Sherman y Price en su artículo Invisible Web: Uncovering Sources Search Engines Can’t See, nos hablan de la web invisble y la dividen en cuatro tipos de invisibilidades: La Web opaca (The Opaque Web),  la Web privada (The Private Web),  la Web propietaria (The Proprietary) y la Web realmente invisible (The Truly Invisible Web).

1.- Web Opaca: Consiste en archivos que pueden, pero no están incluidos en los índices de los buscadores.
      Algunos motivos pueden ser:
-Extensión de la indización.
-Frecuencia de la indización.
-Número máximo de resultados visibles.
-URL desconectadas.

2.-Web Privada: Consiste en las páginas web técnicamente indizables, pero que son excluidas por algunos de estos motivos:
-Son páginas protegidas por contraseñas.
-El uso de archivos "robots.txt" para deshabilitar el motor de búsqueda.
-El uso del archivo "noindex" para evitar que el motor de búsqueda lea el contenido de la página.

3.-Web Propietaria: Son páginas accesibles a las personas que están de acuerdo con determinados términos o condiciones para ver su contenido o cuerpo de la página. Están disponibles de forma gratuita a través de un registro de solicitud o mediante un pago.

4.- Web Realmente Invisible: Son páginas verdaderamente invisibles porque los motores de búsqueda no pueden indizar el contenido de las páginas por razones técnicas. Pueden ser: Archivos con formatos PDF, flash ejecutables, archivos comprimidos. Asi mismo las páginas generadas dinámicamente.

Más sobre el tema:





                                   



















No hay comentarios:

Publicar un comentario