domingo, 22 de marzo de 2015

COMO FUNCIONA UN BUSCADOR POR DENTRO PAGE RANK



bolaEstructura de datos en Internet.

Ya vimos en la unidad 1 que cualquiera puede introducir información en Internet. Simplemente tiene que disponer de un servidor donde alojarla. Cada nueva página que se crea en Internet tiene una dirección única. Por ejemplo, http://www.aulaclic.es/internet/t_4_7.htm. Cuando alguien decide crear un sitio web elige el nombre que le parece apropiado, y también da el nombre que quiere a las carpetas y páginas que va creando. De forma que los millones de páginas que existen en Internet no tienen porqué tener una estructura común ni una relación prefijada entre ellas.


Estructura de un buscador.

Acabamos de ver que la estructura de la información en Internet no facilita su organización. ¿Qué han hecho los buscadores? La respuesta es crearse su propia copia de Internet.

¿Cómo lo hacen? Lo hacen unos robots, por supuesto no son robots de metal, en realidad son unos programas que van visitando las páginas de Internet y copiándolas en los discos de los buscadores.


Las cifras de Google.

Para poder realizar todas estas funciones los ingenieros de Google han creado programas que contienen millones de fórmulas y para poder trabajar con tantos datos utilizan miles de ordenadores trabajando en paralelo, se habla de más de 60.000 ordenadores, además son ordenadores personales comunes. El trabajo en paralelo permite que una búsqueda no se ejecute en un sólo ordenador, sino en varios ordenadores a la vez, de modo que cada ordenador hace una parte del trabajo. En el primer semestre del 2005 Google informó que tenía indexadas más 11.000 millones de páginas, y en 2008 informó que había llegado al billón (un millón de millones).

Más información sobre Google.

Como grande en su sector que es, hay mucha información de actualidad y de interés sobre Google.

No hay comentarios:

Publicar un comentario