Bienvenidos sean a este post, hoy hablaremos brevemente sobre este proceso.
Ya mencionamos que entregar lo que el usuario solicita en un buscador es una de las caracteristicas mas importantes. Pero otra muy importante es la relevancia, por que? Porque no solo alcanza con la coincidencia sino que tambien debemos devolverla con un mayor ranking y los mas relevantes aparezcan primero.
Una estrategia que se puede aplicar para mejorar el ranking de los resultados de las busquedas es tambien almacenar el numero de repeticiones de cada palabra en un documento. Por ejemplo, un documento que describe una computadora puede contener multiples coincidencias con la palabra computadora y si el usuario busca por esta palabra, los resultados que se muestran en primer orden son aquellos que tengan mayor cantidad de coincidencias. Observemos la siguiente tabla:
| computadora | 1{18}, 4{13}, 400{3} |
| hola | 7{4}, 90{10}, 350{1} |
| mundo | 9{1} |
Al lado del identificador de documento de cada palabra le adjuntamos un valor que estara entre llaves. Este valor representa la cantidad de veces que se repite esta palabra en el documento. Pero este no es el unico factor que debemos tener en cuenta al momento de presentar los resultados de la busqueda sino que habra muchisimos mas. Algunos buscadores almacenan informacion personal del usuario para poder usarlo en respuestas mas personalizadas y cercanas al usuario. Inclusive otro que puede determinar las busquedas es el programa que usamos para acceder al buscador, usualmente es el navegador, ya que puede interferir en las busquedas. Tomemos como ejemplo, el usuario busca como reinstalar un linux y el buscador puede devolver respuestas de como resintalar un ubuntu como las primeras respuestas. Esto puede ser gracias a que el navegador le provee el S.O y/o la version del mismo pero tambien existen los que no comparten ninguna clase de informacion y no ayudar al buscador. Otra propiedad a tener en cuenta es la fecha de la ultima actualizacion del documento, dando mayor prioridad a los mas recientes.
Tal como mencionamos antes, las repeticiones de las palabras de busqueda no es el unico factor a tener en cuenta para establecer el ranking. Ya que ahora podemos agregar tambien la fecha de su ultima actualizacion, por lo tanto podemos proceder a ordenarlo en una lista generada por la fecha de ultima actualizacion. Sobre como establecer un ranking apropiado para la lista de respuestas es algo que veremos un poco mas adelante.
En resumen, hoy hemos visto una introduccion breve sobre el proposito de ordenar los resultados, un detalle basico para hacerlo, asi como tambien otros detalles a tener en cuenta. Espero les haya resultado de utilidad sigueme en tumblr, Twitter o Facebook para recibir una notificacion cada vez que subo un nuevo post en este blog, nos vemos en el proximo post.


Donación
Es para mantenimento del sitio, gracias!
$1.50
