domingo, 11 de septiembre de 2011

Componentes de los sistemas de recuperación de información

Componentes de los sistemas de recuperación de información

Los sistemas de recuperación de información SRI se componen de tres componentes transcendentales: La base de datos documental, el subsistema de consultas y el componente de igualación o evaluación.

En la Base de datos documental, podemos encontrar un conjunto de datos, que en su gran mayoría son textuales. Pero no sobre expresar que con los nuevos inventos tecnológicos para trasmitir información también encontramos los documentos multimedia, siendo estos como: las imágenes, fotos, videos, audios, gráficos, entre otros.

Tras la nueva aparición de aparición de nuevos documentos y el aumento en ellos los sistemas de recuperación de información se da en su gran mayoría en los documentos textuales aun falta profundizar en las nuevas formas para la recuperación de la información de estos tipos de formato. Para la recuperación de los documentos textuales entendemos que no son almacenados directamente en el sistema de recuperación de información y no que se estos documentos son referenciados por un conjunto de elementos llamados descriptores, por esta razón los descriptores tendrán una conjunto de descriptores.

Desde la perspectiva que tienen los Ingenieros de Sistemas, la base de datos es una listado primario en la que las filas representan un documentos y las columnas determinan si se encuentra un descriptor que corresponda al documento.

En los subsistemas cada documento es representado por un código vinario  (0-1) Pero en algunos casos es criticado esta manera ya que expresan que se podía considerar que en vez de la utilización del código se asignara un numero a cada termino descriptor empleando todo lo que llamamos base documental y la totalidad de conceptos. El subsistema de consulta esta compuesto por la interfaz la cual facilita al usuario plantear sus las consultas, el analizador recoge la consulta determinada y la descompone en parte para realizar una búsqueda más eficaz

En el proceso de indización de los documentos, en los que se extrae todos los contenidos del documento, en donde se asocia la información representativa del documento para recuperarlo al momento de realizar su búsqueda. Esta parte es muy importante al momento ya que al momento de que los términos extraídos como descriptores del texto  deben tener la función de brindar al usuario el tema que necesite, si este proceso se realiza mal los resultados que arrojara la búsqueda serán todos los documentos con las palabras seleccionados por el usuario, lo cual dejara en inconformidad por los listados de información presentados. En estos casos la frecuencia en la que aparece una palabra dentro de un texto resalta la importancia y la influencia.

Otros aspectos que se tendrán en cuenta radican en borrar las palabras que no presentan algún significado: verbos, preposiciones, adverbios, preposiciones. Las palabras con estas características no pueden ser utilizadas como descriptores de indización.

UNIVERSIDAD DE GRANADA. Modelos de sistemas de recuperación de información Documental Basados en información lingüística difusa [en línea]. http://sci2s.ugr.es/publications/ficheros/tesis_difinitiva.pdf [citado en septiembre 11 de 2011]

BUSTINZA ESPARTA, Jorge. Una interpretación del concepto de virtualidad [en línea].<http://bustinza.eu/tesis/4_virtual.pdf [citado en septiembre 11 de 2011]

1 comentario:

  1. Muy util la publicacion, sobretodo ahorita que ando leyendo sobre la Recuperación de datos. La verdad es que hay muchas tecnicas y herramientas

    ResponderBorrar