|
Cómo funciona
el buscador web de Google:
la compañía aporta un poco más de información

El buscador web
de Google es la joya de la corona de la compañía.
Es lo que le proporciona el mayor porcentaje de sus multimillonarios
ingresos y, sobre todo, su credibilidad como marca. Por ello,
en muy raras ocasiones se hacen comentarios sobre su funcionamiento
y, de hecho, solamente unos pocos de los 17.000 empleados de Google
están autorizados a hablar públicamente sobre qué
parámetros se siguen a la hora de valorar la relevancia
de una página web dentro de los resultados, qué
prácticas se penalizan, o cómo funcionan los servidores
que realizan los cálculos.
Uno de estas personas autorizadas es Udi Manber,
uno de los pioneros de los métodos de búsquedas
en la WWW y responsable de calidad del buscador web de Google,
que con este post oficial inicia una serie de artículos
oficiales en los que pretende ofrecer un poco más de transparencia
sobre su funcionamiento. El objetivo: seguir contando con el respeto
de los webmasters que crean sitios web para posicionarse en Google
y, sobre todo, de los millones de usuarios que diariamente lo
utilizan para buscar información.
:: Hay más de 1.000 programadores y científicos
destinados exclusivamente a tareas relacionadas con el buscador
web de Google.
:: Uno de los problemas más importantes
a la hora de rastrear la información de la WWW es que las
páginas web están en cientos de idiomas diferentes,
y que además los webmasters no suelen seguir los estándares
a la hora de crear documentos web.
:: Otro problema es entender las consultas de
los usuarios, los cuales suelen utilizar menos de tres palabras
por cada búsqueda, lo que complica la tarea. Hace unos
meses se publicaron estos datos al respecto: solamente el 26%
de los usuarios utilizan cuatro o más términos por
búsqueda. Además, hay que recordar que el propio
Manber reconocía hace tiempo que una de cuatro búsquedas
en Google es inédita, lo que complica aún más
la labor de devolver resultados con información útil.
:: El algoritmo de PageRank
se sigue utilizando a día de hoy, pero se ha diluido dentro
de un sistema mucho más grande de evaluación de
la relevancia de los documentos web. Ahora, además de este
parámetro, se tienen en cuenta otros como los modelos del
lenguaje (Google procesa ahora las frases que se rastrean, los
sinónimos o las palabras mal escritas), o la antigüedad
o la frescura del documento web (algunas búsquedas tienen
su mejor información en las páginas que se han creado
en las últimas horas).
:: Continuamente se están realizando modificaciones
en los algoritmos del buscador.
:: Se ha implementado recientemente la herramienta
de revisión ortográfica (el famoso "Quizás
quiso decir") en diferentes idiomas, como el catalán,
el serbio o el ucraniano.
:: Google ha creado una red de personas en varios
países del mundo, que se encargan de "ofrecer feedback
a Google", en referencia al laboratorio 'Rater Hub', en el
que se contrata a usuarios de Internet (también de España)
para que entrenen a los algoritmos de búsqueda.
:: Google cuenta también con un importante
grupo de voluntarios dentro de la compañía que les
ayuda a mejorar las búsquedas en diferentes idiomas.
:: Muy pocos usuarios se leen las páginas
de ayuda del buscador web, y son mayoría los que desconocen
todas las posibilidades que ofrece. Por ello, nos encontramos
cada vez más con información proveniente de otras
herramientas de Google dentro de los resultados del buscador web.
:: Hay diferentes grupos de trabajo dentro del
Departamento de Calidad del buscador web, y dos de ellos están
relacionados con los webmasters. Uno de ellos, para detectar cualquier
intento de engaño por parte de algunos de ellos (el de
'Web Spam'), y otro para abrir un canal de comunicación
con Google (el de 'Google Webmasters Tools').
|