martes, 11 de octubre de 2011

Recuperación de información en los sistemas de información

La recuperación de información es un proceso mediante el cual se crea un conjunto de documentos de una colección, a través de una pregunta realizada por un usuario para satisfacer esa necesidad de información. En el caso de Google podemos decir que es un sistema de recuperación de información exhaustivo ya que es muy complejo ubicar el documento exacto que busca el usuario, por esta razón su resultado se expresa en millones.

La extracción de información, es un subproceso de recuperación que se realiza a través de un conjunto de reglas establecidas en una colección de documentos que contengan información relevante, buscando y representando de forma estructurada.

Los sistemas de filtrado de documentos, realizan procesos de extracción de información con mecanismos para poder modelarlos a través de subconjuntos. Los procesos de clasificación automática de documentos digitales, está asociada en la ubicación de documentos en la carpeta que corresponda. Es decir si esta una palabra X ubicarlo en X carpeta.

Los objetivos de la recuperación son:

-Poder indizar y procesar cualquier tipo de documento.
-Poder entender cualquier pregunta que realice el usuario en su lenguaje natural
-Buscar el mejor mecanismo para entender la pregunta vs colección de documentos = resultado de documentos relevantes.

No hay comentarios.:

Publicar un comentario