Curso de Periodismo Digital
blue_thin_line_2.gif (1878 bytes)

Inicio

 

Volver página principal

¿Cómo se edita un periódico digital?

Los periódicos españoles se mantienen en la red por mantener su prestigio y por ofrecer una serie de servicios, aunque algunos de ellos comienzan a reconocer que han bajado sus ventas ligeramente porque son muchas las personas que leen las noticias que les interesan vía Internet. Pero los periódicos digitales se caracterizan por ofrecer muchos servicios vía sus páginas web. La mayoría comienzan a insertar banners y anuncios publicitarios con los que consiguen obtener unos recuros, aunque mínimos para mantener una estructura de diseñadores, publicistas y periodistas que cuelgan las noticias una vez que la edición en papel está punto de salir al mercado. A nivel español hemos observado que la gran mayoría de diarios digitales organizan la información de cada número de una forma similar y bastante regular. Así, los artículos periodísticos se agrupan en secciones temáticas fijas (por ejemplo: 'Internacional', 'Nacional', 'Deportes', etc.). Opcionalmente, dentro de estas secciones fijas se suelen crear secciones temáticas temporales referentes a algún evento de relevancia (por ejemplo: 'Olimpiadas', 'Elecciones Generales', etc.). Finalmente todas las secciones se agrupan en lo que conforma el número o ejemplar. Si se tiene en consideración el proceso de edición del periódico, el ejemplar final es un agregado de ficheros HTML con los distintos artículos periodísticos organizados en varios niveles.

 

Así pues, la edición digital de un periódico requiere una info-estructura donde los artículos periodísticos de un ejemplar se organizan de forma jerárquica según la estructura lógica del periódico. En la info-estructura de un periódico se pueden distinguir los siguientes tipos de documentos HTML:

  • Artículos periodísticos, los cuales contienen toda la información de periódico en forma de datos multimedia (texto, imágenes, etc.). Generalmente existen varios tipos de estos documentos, entre otros: 'Noticia', 'Columna', 'Fotonoticia', 'Crónica', etc. Aunque cada diario emplea sus propios tipos según su libro de estilo, suele haber una correspondencia clara entre ellos.
  • Índices, que son documentos que contienen todos los enlaces necesarios para agrupar los artículos periodísticos por secciones temáticas (temporales o fijas), y en última instancia por ejemplares. Además de organizar el periódico, estos ficheros permiten comprobar que todos los documentos referenciados existen, y que además son del tipo apropiado.
  • Portadas, que son documentos que contienen una selección de enlaces a artículos de diferentes secciones junto con un resumen de los mismos. En realidad, este tipo de documentos no forma parte del periódico, si no que son herramientas de ayuda a la navegación para los lectores. Las portadas pueden obtenerse de forma automática a partir de los índices y los propios artículos periodísticos.

El Valor de la Meta-Información

Conocer la estructura lógica de los periódicos resulta muy útil a la hora de recuperar la información, ya que el contenido de cada componente está relacionado con su ubicación en el periódico. Por ejemplo, una palabra será más representativa para describir el contenido de una noticia si se encuentra en el sub-título que en el último párrafo de texto. De igual manera, especificar la sección propia del tipo de noticia que se está buscando facilita su localización. Por lo tanto, para explotar eficazmente la información de los periódicos almacenados es necesario especificar cierto tipo de meta-información que entre otras cosas, permita reconocer el tipo de documento y su situación dentro de la organización lógica del periódico.

Sin embargo, también hay otro tipo de meta-información que aunque no se relaciona con la organización lógica del documento es igualmente útil para facilitar su recuperación. Nos estamos refiriendo a los términos que los redactores frecuentemente asignan a cada noticia con objeto de describir su contenido, así como a la localización temporal del periódico y de cada una de sus noticias. Otro tipo de meta-información de interés es la data (lugar y fecha) de cada artículo periodístico, o el nombre de su redactor.

De todo lo anterior se deduce que los documentos que conforman un periódico digital no deben ser una mera redacción de sus contenidos que se visualiza con un determinado formato, y que después de ser publicado dejan de tener valor. Por el contrario, estos documentos deben describir una estructura, un contenido, una localización temporal y unos atributos útiles para su futura recuperación o procesamiento. Es en este importante requerimiento donde el lenguaje HTML presenta sus mayores limitaciones.

Definición Conceptual de una Base de Periódicos

Con el propósito de llevar a cabo el desarrollo de una base de periódicos digitales con las especificaciones ya descritas, hemos desarrollado un nuevo modelo de datos orientado a objetos que presenta importantes ventajas con respecto a los actuales sistemas de representación de documentos. Según nuestro modelo de datos, el esquema conceptual de una base de periódicos requiere la definición de un conjunto de clases de objetos para los periódicos, los artículos que los forman (noticias, columnas, etc.), y los objetos multimedia que almacenan los textos y las imágenes publicadas. Estos tres grupos de clases se organizan en tres capas separadas por relaciones de composición. Esta forma de organizar la base de datos permite que los periódicos puedan ser accedidos comenzando por cualquiera de las clases de su árbol de composición, lo que simplifica la especificación de consultas como "recuperar todos las noticias de cine de cualquier periódico publicado ayer", a la vez que permite recuperar un periódico completo con su estructura original.

s

Para describir el contenido y la meta-información de los periódicos, nuestro modelo de datos cuenta con un lenguaje de definición de documentos cuyos constructores son similares a los provistos por el estándar de definición de documentos estructurados (SGML) . La principal característica de este lenguaje es su gran flexibilidad, necesaria para modelar documentos con estructuras tan complejas como son los periódicos. Incluye constructores para los tipos de datos básicos (conjuntos, listas, registros, etc.) y otros constructores específicos para documentos estructurados:

  • Un constructor de tuplas ordenadas (<...>) que permite expresar el orden de las componentes de un documento. Por ejemplo, dentro de una noticia el título siempre precede a la data y al texto, representándose así < titulo: string, data: string, cuerpo: text >
  • Algunas componentes de un documento pueden ser heterogéneas, en el sentido de que son definidas con tipos alternativos (...|T1 | T2 |..). Estas componentes podrán tomar valores de cualquiera de sus posibles tipos. De esta manera se expresan cosas como que en una sección puede aparecer indistintamente una noticia o una columna.
  • Algunas componentes toman como valor una lista ordenada de 1 o varios elementos (constructor +) que a veces también puede ser de cero o varios elementos (constructor *). Como ejemplo, el cuerpo de una noticia puede ser definido como una combinación de párrafos e imágenes de la siguiente forma: cuerpo:(Parrafo | Imagen)+.
  • También es posible encontrar componentes opcionales (cnstructor ?); es decir cuya presencia no es obligatoria en la estructura de un documento. Por ejemplo, si dentro de una viñeta el autor es un elemento que no siempre aparece, entonces se definiría como autor:string?

Adicionalmente, dado que la organización de los periódicos digitales suele evolucionar frecuentemente, este modelo de datos permite reemplazar la definición de una clase por otra cuando sea necesario. En la figura 3 se da un posible esquema conceptual para una base de periódicos que por razones de espacio ha sido simplificado. Como puede observarse, tanto la definición como la redefinición de una clase consta de las siguientes componentes [8]:

  • La componente type-span es un periodo de tiempo que indica cuando las instancias de la clase se van a crear de acuerdo a esta definición. Estos intervalos deben ser contiguos para las distintas definiciones de una misma clase.
  • La componente temp-dim se puede definir como 'static' o 'dinamic'. En el primer caso significa que la clase no puede ser redefinida.
  • La componente type contiene una definición de tipo de documento para la clase indicando la estructura genérica y atributos de sus instancias. Estas definiciones se hacen por medio de los constructores previamente descritos