sábado, 17 de octubre de 2015

Sobre la información (EB 13/10/2015)

Dándole vueltas y más vueltas a la búsqueda de información, tanto sin como con operadores booleanos, hemos ahondado bastante en el tema. También hemos repasado cómo hacer una búsqueda avanzada en el catálogo de Athenea.
Resulta que existen algunos motores de búsqueda especializados, como Google academics, por ejemplo.

Pero vamos a centrarnos en las técnicas de búsqueda. Para encontrar información podemos hacer uso de las ecuaciones de búsqueda, el problema con estas ecuaciones es que si sólo ponemos una palabra sale demasiada información (lo que llamaríamos ruido), cuanto más genérica es la palabra más ruido obtendremos.

También podemos encontrarnos con lo contrario que sería el silencio. El silencio es que no obtengas ningún resultado y podría pasar al poner una frase muy larga entrecomillada, en ese caso podría llegar a ser demasiado porque esa oración no existiría; por lo tanto nos interesa poner solamente las palabras clave. Ya que entrecomillada se busca la frase entera y sin comillas se hace una búsqueda de cada una de las palabras. Esto último puede generar otro tipo de problema que se llama falsas coordinaciones. Las falsas coordinaciones son el resultado de poner dos palabras sin nada de por medio que el buscador intenta encontrar en un mismo texto o artículo pero que no tienen relación en la oración, es decir, no están en el contexto en el que las estás buscando.

Para no tener ninguno de los problemas mencionados anteriormente lo mejor es que usemos los comodines o los operadores y las búsquedas parametrizadas.

  • And: al usar el operador and aparecen todos los documentos que contengan las dos o más palabras mencionadas. Aun así hay que tener en cuenta que no es  lo mismo un and de la lengua natural y un and en la búsqueda booleana. Si pones perros and gatos consigues páginas de perros y gatos juntos, por ejemplo.
  • Or: al utilizar or lo que consigues es encontrar todas las palabras que estás buscando. Se diferencia de and porque lo que consigues son los resultados que querías pero separados unos de otros. Si pones perros or gatos encontrarás páginas de perros y páginas de gatos.
  • Not: al separar palabras con not conseguimos unos resultados evitando otros. Si buscas alojamiento lo más lógico es que salgan apartamentos, pero al poner not apartamentos encontrarás información sobre alojamientos pero no sobre los apartamentos.
Un problema con el que me he encontrado al usar el operador not ha sido que me han aparecido la información que yo había especificado que no apareciese. Según me ha explicado la profesora eso es porque una web comercial siempre da mucho más ruido y que te aparezcan tiene mucho que ver con el contrato que tengan con google.





Ayuda para encontrar información en Athenea. Imagen extraída de Athenea

No hay comentarios:

Publicar un comentario