sábado, 4 de mayo de 2013

TÉCNICAS DE RECUPERACIÓN DE INFORMACIÓN

Antes de nada vamos ha hablar sobre el proceso de recuperación de información, sistema de recuperación de información...



El proceso de recuperación: se lleva a cabo mediante consultas a la base de datos donde se almacena la información estructurada, mediante un lenguaje de interrogación adecuado.
Uno de los problemas que surgen en la búsqueda de información es dependiendo del tipo de búsqueda se pueden recuperar multitud de documentos o simplemente un número muy reducido, a esto dicho se le denomina Silencio o Ruido Documental.

Sistema de recuperación de información:Proceso donde se accede a una información previamente almacenada, mediante herramientas informáticas.

Algunas de las herramientas son:
  • Base de datos
  • Internet(buscadores,metabuscadores,buscadores selectivos...)
  • Lenguajes de interrogación y ecuaciones de búsqueda.
Navegación VS Recuperación de información
La diferencia entre ambos conceptos, se origina en la forma de obtener información, mientras que en la recuperación de información se obtiene de forma lineal, la navegación tiene la capacidad de obtener información a través del hipertexto. Esto quiere decir que, la adquisición de conocimiento se realiza paulatinamente y dependiendo del interés del usuario se profundiza.
Técnicas de recuperación de información

  • Sistemas de recuperación de lógica difusa:Esta técnica permite establecer consultas con frases, de forma que la máquina al realizar la búsqueda elimina signos de puntuación, artículos,palabras comunes dejando sólo aquellas palabras que el sistema considera relevantes. La recuperación se basa en proposiciones lógicas con valores de verdadero y falso, teniendo en cuenta la localización de la palabra en el documento .
  • Técnicas de ponderación de términos:Los documentos recuperados se encuentran en función del valor obtenido en la ponderación.
  • Técnica de clustering: Se atribuyen unos valores,que actúan como agentes para agrupar los documentos por orden de importancia, mediante algoritmos K-means,COBWEB,algoritmo EM.
  • Técnicas de retroalimentación por relevancia:Esta técnica pretende obtener el mayor número de documentos relevantes tras establecer varias estrategias de búsqueda.Algoritmo Genético, es el que se ha utilizado para llevar a cabo este tipo de técnicas de recuperación.
  • Técnicas de stemming:La técnica de Stemming lo que pretende es eliminar las posibles confusiones semánticas que se puedan dar en la búsqueda de un concepto, para ello trunca la palabra y busca solo por la raíz.Algoritmos utilizados(Paice/husk...).
Calidad de la recuperación
Nombraremos algunos criterios para que la recuperación sea de calidad.


  •  Consistencia: Capacidad que tiene un sistema de búsqueda en coordinar su sistema de clasificación con el lenguaje de búsqueda.
  • Tasa de acierto: coeficiente que surge de dividir el número de documentos relevantes recuperados, sobre el número total de documentos relevantes de la colección.
  • Relevancia: Característica de un documento recuperado que cumple con la necesidades de información.
  • Tasa de relevancia: coeficiente que surge de dividir el número de documentos relevantes recuperados, sobre el número total de documentos recuperados.

No hay comentarios:

Publicar un comentario