LA INDIZACIÓN EN LA DOCUMENTACIÓN


Definiciones|Cualidades de la indización|Tipos de indización|Enlaces|Contacto|rss RSS|

DEFINICIONES

  • Indización
  • Índice

CUALIDADES DE LA INDIZACIÓN

  • Pertinencia
  • Exhaustividad
  • Especificidad
  • Uniformidad

TIPOS DE INDIZACIÓN

  • Indización Libre
  • Indización Controlada

DEFINICIONES

INDIZACIÓN

Técnica del análisis documental para representar y describir el contenido de los documentos, mediante conceptos principales contenidos en ellos(palabras clave) o vocabularios controlados (descriptores, términos o encabezamientos de materia), con el fin de guiar al usuario en la recuperación de los documentos que necesita

ÍNDICE

Lista de términos sobre un tema específico

CUALIDADES DE LA INDIZACIÓN

Pertinencia:

Ajustar con mayor efectividad posible el empleo de un término útil para el usuario y útil en la representación del documento. Una Indización pertinente, será, aquella en la que 66% de documentos ofrecidos por los índices es realmente útil para el usuario

Exhaustividad:

Ofrecer el mayor repertorio posible y pertinente de temas, conceptos y objetos representados en el documento. En función del tipo de unidad informativa,puede ser útil una baja exhaustividad, (hasta 8 términos), una media exhaustividad (entre 8 y 12) o una alta (más de 12)

Especificidad:

Grado de precisión de los términos seleccionados en una recuperación. Está en relación directa con la eliminación de ambigüedades del lenguaje natural (sinonimias, polisemias...) También se halla en relación directa con la correcta jerarquización de los términos así como con una controlada asociación de términos equivalentes.

Uniformidad:

Grado de coincidencia en el uso de los términos por parte de un usuario recuperando información y un documentalista indizando. Se mide por la coherencia del lenguaje documental

TIPOS DE INDIZACIÓN:

INDIZACIÓN LIBRE:

Aquella en la que la identificación se realiza a través de una lista o conjunto abierto de términos.

INDIZACIÓN CONTROLADA:

Aquella en la que la identificación se realiza por medio de una lista o conjunto cerrado de términos. Existen una serie de herramientas de dónde extraer los términos, que permiten la comprensión de datos e información por parte de los ordenadores sin necesidad de la intervención del hombre.

  • Vocabularios controlados:
  • Son listas de términos con un significado concreto que facilitan la búsqueda y recuperación de información. Se caracterizan por utilizar sólo una parte del léxico de los Lenguajes Naturales y casi nada de su gramática. Además su manejo debe ser sencillo y preservar la riqueza informativa de los documentos, evitando la ambigüedad. Ejemplos de vocabularios controlados son los glosarios, diccionarios, etc

  • Mapas Conceptuales:

  • Representación formal de un conjunto de temas y los enlaces a los documentos relacionados con esos temas

  • Taxonomías:

  • Lista jerárquica en forma de árbol, que parte de los términos más generales a los más específicos, incluyendo también términos relacionados.

  • Tesauros:

  • Vocabulario estructurado en términos que guardan entre sí relaciones semánticas de equivalencia, jerarquía o asociación, y que está destinado a convertir el lenguaje natural de los documentos en un lenguaje controlado que represente de manera unívoca el contenido de los documentos y sirva tanto para la indización como para la recuperación

  • Ontologías:

  • Tipo de tesauro más desarrollado que representa la conceptualización de un determinado campo del conocimiento mediante estructuras semónticas. Definen los conceptos de forma específica describiendo las propiedades y relaciones de cada concepto y facilitan la comunicación entre los seres humanos y las máquinas.

ENLACES

  • Accesibilidad
  • Accesibilidad
  • Agente de búsquedas
  • Bases de datos
  • Bombing: Posicionamiento Web
  • Cloaking
  • Clustering
  • Cobertura como medida de Recuperación de Información
  • CSS: Hojas de Estilo
  • Datamining
  • Data warehousing
  • DHTML: Páginas Dinámicas
  • Directorios
  • Directorios
  • DMOZ
  • Doorway
  • DUBLIN CORE
  • Esfuerzo en la Recuperación de Información
  • Exhaustividad Relativa
  • Exhaustividad Relativa o Recall
  • Fichero Inverso
  • Frecuencia de Actualización
  • Google
  • HTML
  • Interfaz de búsqueda
  • Internet Invisible
  • Javascript
  • Lycos
  • Maps Topics
  • Metabuscadores
  • Metadatos
  • Modelo Vectorial
  • Motores de Búsqueda
  • Multibuscadores
  • Navegabilidad de páginas web
  • Novedad en la recuperación de la información
  • Optimización Web
  • Palabras Clave
  • Posicionamiento
  • Precisión
  • Proyectos Cranfield
  • Quaero: Buscador Europeo
  • Recuperación de Información
  • Robots de Búsqueda
  • RSS
  • Ruido en la Información
  • Sandbox
  • SGML
  • SIDAR: Acceso Universal
  • Silencio en la recuperación de la información
  • SQL
  • Tesauros
  • TREC (Text Retrieval Conference)
  • URI: Uniform Resource Identifier
  • URL
  • Usabilidad Web
  • W3C
  • XML
  • Yahoo
  • Valid RSS feed.
    Marta Godoy Velasco
    Universidad Carlos III
    Sistemas Avanzados de Recuperación de Información