A menudo damos por hecho que sabemos qué es un PDF, pero rara vez se explica en detalle. Este artículo busca ofrecer una explicación clara y sencilla de los PDFs sin ser demasiado técnico. Veremos los conceptos básicos, incluida la estructura interna de un PDF y por qué sigue siendo un formato tan popular. ¡Empecemos!
Conceptos básicos de PDF
Definición
PDF significa Portable Document Format. Es un formato de documento electrónico diseñado para verse y funcionar como los documentos en papel. El término "portable" indica que un PDF debe verse igual sin importar dónde o cómo se visualice.
Historia
El PDF fue creado por Adobe en 1991 y se convirtió en un estándar abierto para permitir que cualquiera desarrollara herramientas para crear, manipular y visualizar PDFs. En 2008 se estandarizó como una norma ISO, lo que impulsó aún más su amplia adopción.
Características
Una característica clave de un PDF es que es autocontenido; todo lo necesario para mostrar el documento está incluido en el archivo. Esto hace que los PDFs sean fáciles de transferir, almacenar y archivar. Además, Adobe Reader, el visor de PDF, es gratuito, lo que ha contribuido a su uso generalizado. Entender la estructura de los PDFs puede ayudarte a usar herramientas como Acrobat de forma más eficaz en tus proyectos de documentos.
¿Cómo funcionan los PDFs?
PDF simple
En esencia, un PDF es como una carpeta o archivador que contiene páginas. Puedes añadir páginas a un PDF, dividirlas y mover páginas de un PDF a otro, casi como si manejaras hojas de papel en un archivador.
Los PDFs también contienen un conjunto de datos que se aplica a todo el documento, conocido como datos a nivel de documento. Incluye información como los datos de seguridad del documento, metadatos, y otras propiedades aplicables a todo el documento.
Piensa en ello como un archivador físico de papel con un candado e información escrita en la parte interior o exterior de la tapa. Esta analogía del archivador ayuda a entender cómo funcionan estas propiedades en un documento PDF electrónico.
Más sobre un PDF
Por supuesto, hay mucho más en un PDF. Veamos más de cerca el nivel del documento.
El PDF contiene:
- Marcadores: Los marcadores sirven como un mecanismo de navegación, similar a una tabla de contenidos.
- Datos de seguridad: Controlan el acceso al documento.
- Archivos adjuntos: Son archivos reales adjuntos al PDF, haciendo que el PDF actúe como un archivo zip.
- Scripts del documento: Los scripts a nivel de documento se ejecutan mediante distintos eventos a nivel de documento, como abrir o imprimir el PDF.
- Campos de formulario y datos: Aunque el usuario interactúe con los campos de formulario en las páginas, estos se mantienen a nivel de documento. Los campos son globales a todo el documento, mientras que los widgets son la apariencia local y la interfaz de usuario de esos campos en páginas concretas.
- Metadatos del documento: Incluyen información como autor, título y palabras clave.
- Varios recursos: Incluyen fuentes, espacios de color, imágenes, vídeos y más, que se usan en otras partes del documento.
Las páginas de un PDF son las partes con las que el usuario ve e interactúa. Estas páginas se muestran mediante un motor de renderizado que dibuja el contenido de la página. El motor de renderizado necesita recursos como fuentes, definiciones de espacio de color e imágenes. Estos recursos están contenidos en el PDF, lo que contribuye a su portabilidad. Sin embargo, las fuentes son una excepción. No es obligatorio que vayan incrustadas en el PDF.
Cuando una fuente está incrustada, va incluida dentro del PDF. Si no lo está, Acrobat buscará la fuente en el sistema del usuario o usará una fuente predeterminada que no requiere incrustación. Por lo tanto, hay casos en los que el PDF no es completamente autocontenido.
Tipos de elementos
En una página hay dos tipos de elementos: contenido de página estático y una lista de anotaciones. El contenido de página estático incluye todo el texto normal, gráficos e imágenes (contenido principal del documento).
Anotaciones son elementos especiales con los que el usuario puede interactuar, como widgets de campos de formulario, herramientas de comentarios y marcado, y herramientas multimedia. A diferencia del contenido estático, las anotaciones no siempre tienen que ser visibles. Por ejemplo, un enlace es una anotación que ocupa espacio en la página pero puede no tener ninguna apariencia visible.
Cuando se dibuja una anotación, como un círculo, tiene la apariencia de una línea circular roja. Dentro de la estructura del PDF, tanto el contenido de la página como las anotaciones se definen usando el mismo lenguaje de gráficos vectoriales. El motor de renderizado dibuja primero el contenido de la página y luego las anotaciones en un orden específico. Este enfoque por capas hace que las anotaciones parezcan flotar sobre el contenido de la página.
Las anotaciones proporcionan dinámicas y funciones interactivas al PDF. Son los únicos elementos de una página que responden a las acciones del usuario, como pulsaciones de teclas y clics del ratón. Por ejemplo, una anotación de círculo se puede seleccionar, mover y redimensionar.
Los distintos tipos de anotaciones ofrecen interacciones variadas. Una anotación de nota solicita al usuario que introduzca texto y se puede mover, pero no redimensionar. Cada tipo de anotación responde de forma única a las acciones del usuario, mejorando las capacidades interactivas del PDF mientras aparece sobre el contenido principal de la página.
Edición de archivos PDF
Se supone que el contenido de la página de un PDF es estático. Cuando se visualiza en Adobe Reader, el contenido de la página permanece inalterable porque el lector no dispone de herramientas para realizar modificaciones. Sin embargo, en Adobe Acrobat, puedes editar el contenido directamente. Es preferible realizar las ediciones en la aplicación original con la que se creó el documento.
Después de realizar los cambios, guarda de nuevo el documento como PDF. Este método preserva la integridad del documento y evita posibles problemas de formato y precisión del contenido.
CONSEJO: Para quienes necesiten hacer ediciones rápidas, PDF2Go ofrece una práctica solución en línea con su Convertidor de PDF a Word. Esta herramienta te permite convertir tu PDF en un documento de Word editable, lo que facilita la realización de modificaciones completas. Una vez terminadas las ediciones, puedes guardar el documento de nuevo en formato PDF.
Operadores gráficos
Los operadores gráficos son elementos fundamentales para el renderizado preciso del contenido de un PDF. Estos operadores, que forman el núcleo del lenguaje de gráficos, determinan cada aspecto de lo que aparece en una página PDF, ya se trate de contenido estático como texto o de elementos dinámicos como anotaciones.
Un gráfico vectorial, la descripción exacta de lo que se dibuja, se compone usando estos operadores. Especifican detalles cruciales como el punto de inicio y final de una línea, su color, grosor y otros atributos visuales. Este conjunto detallado de instrucciones garantiza que cada elemento gráfico de un PDF se reproduzca con precisión en diversas plataformas de visualización y durante los procesos de impresión.
Estructura del PDF
La estructura interna de un PDF puede visualizarse como un árbol. En la parte superior están las propiedades a nivel de documento (metadatos, scripts, páginas, información de seguridad, AcroForm), seguidas de un conjunto de páginas, cada una de las cuales contiene contenido estático, un conjunto de recursos utilizados para renderizar ese contenido y una lista de anotaciones.
Ten en cuenta que las anotaciones utilizan recursos dentro de un PDF. Si una anotación tiene apariencia visual, emplea el lenguaje de gráficos vectoriales usado para el contenido principal de la página. En otras palabras, necesita los mismos recursos que el contenido principal para una representación y visualización precisas.
AcroForm
Una AcroForm es como una lista maestra de todos los campos de formulario y sus datos en todo el documento PDF. Cada widget de campo que ves en páginas individuales es básicamente una copia de una entrada de esta lista principal. Curiosamente, estos widgets de campos de formulario se enumeran junto con las anotaciones de comentarios y marcado en la estructura del PDF.
Para el motor de renderizado que muestra todo en la página, todas las anotaciones, ya sean campos de formulario o marcados, se tratan por igual como elementos que deben mostrarse. La verdadera diferencia entre estos tipos de anotaciones radica en cómo se gestionan de forma interactiva, no en cómo se representan visualmente.
Conclusión
Comprender la estructura y las capacidades de los PDF ayuda a aprovechar todo su potencial, ya sea para crear formularios, proteger documentos o simplemente compartir información de forma fiable. Con fiables herramientas PDF, puedes explorar y aprovechar las potentes funciones de este formato tan extendido.