Optimización en buscadores (SEO) para archivos PDF: 9 pasos para lograrlo

Santiago Suárez Mesa - Optimización en buscadores (SEO) para archivos En este oportunidad tenemos nuestro segundo bloguero invitado,  Santiago Suárez Mesa, que nos envió un excelente artículo sobre cómo optimizar los archivos PDF para lograr un buen posicionamiento en motores de búsqueda (SEO). Los dejo con su artículo:

En las estrategias de posicionamiento en motores de Búsqueda SEO, es importante tener en cuenta tanto los elementos de la página, como los contenidos. Dentro de la variedad de contenidos que se generan en un sitio Web, están los archivos PDF (Portable Document Format) los cuales son comúnmente utilizados para publicaciones de artículos, investigaciones, revistas entre otras cosas.

No olvidemos que este tipo de fichero es un estándar internacional que es fácilmente generado desde programas como Adobe Acrobat Pro, Microsoft Office, Open Office, entre otros. De manera que se puede convertir prácticamente cualquier documento en este fichero.

A continuación se presenta una lista con buenas prácticas para la optimización de PDF, las cuales no solo ayudan a mejorar la indexación de los ficheros sino su posición dentro de los resultados.

1. Herramientas para crear los PDF:

Lo ideal es usar Adobe Acrobat, pero debido a que es un Software pago les presento otras alternativas gratuitas que pueden bajar de internet. CutePDF es un controlador de impresora para Windows que convierte cualquier cosa que este imprimiendo en un PDF, y QuickPDF Tools le permite editar las propiedades del fichero. Las nuevas versiones de Office también permiten convertir cualquier documento y conservar los formatos originales.

2. Densidad de Palabras Claves:

Como con las páginas Web, es importante usar las palabras clave objetivo de una manera coherente y la cantidad de veces correcta para enviar la señal a los motores de búsqueda del tema que se está desarrollando a lo largo del archivo. Muchas personas en la industria han tratado de desacreditar el uso de las palabras claves y su densidad, pero la verdad es que es un elemento que se debe tener en las estrategias de posicionamiento. Para saber que palabras son más adecuadas a la hora de generar el contenido, es bueno apoyarse de herramientas gratuitas como la que ofrece Google Adwords.

3. Título del Archivo:

Debe ser el mayor fragmento de texto en la parte superior de la página y se debe usar un tamaño de fuente de por lo menos 24pt. Es importante ubicar el titulo dentro de una etiqueta “H1″ o “H2″ con HTML, o para mayor facilidad desde antes de generar el archivo (fichero), ej: MS Word. También se puede usar la clase de CSS llamada “citation_title” como alternativa para distinguir el título. Luego de optimizar el título con alguna de las opciones anteriores se debe asegurar de que el resto del texto, en especial el nombre del repositorio o la publicación estén en una letra más pequeña para evitar que sea mal interpretado por los motores.

Además de las buenas prácticas para que el título sea identificado correctamente, obviamente es importante la optimización como si fuera una página Web. Use palabras claves que desee posicionar, se deben poner las de mayor relevancia al principio y todos los elementos del posicionamiento convencional debido a que ese título es el que va a aparecer en la página de resultados del motor de búsqueda que muestra 65 caracteres.

4. Autores:

Los autores del archivo deben estar listados justo antes o después del título, en una letra un poco más pequeña pero que sea más grande que el texto normal. Se debe usar un tamaño de letra que este dentro de 16-23 pt y ponerlos dentro de una etiqueta “H3” en HTML, o crear una clase llamada “citation_author” dentro del CSS. Asegúrese de que el nombre de la publicación, como también los textos de los encabezados de secciones estén en un tamaño de letra menor al de los autores. De lo contrario, este otro texto que este más grande puede ser interpretado incorrectamente como los autores. Use el formato conocidos como “Sentence case” en lugar de “Title Case” para los encabezados de sección entre otros, para evitar confusión con los autores. Separe los diferentes nombres de autores con comas o punto y coma y omita las afiliaciones, títulos, y certificaciones de la línea de autores. Use un formato explicito tal como “Por Pedro Rojas” ó “Author: Pedro Rojas” en caso de ser apropiado.

SEO para archivos PDF: Configuración del autor

5. Asunto del fichero (Meta Description):

El meta-description se debe poner en el campo de “Asunto” del archivo PDF, se debe optimizar de igual manera con palabras claves y con una redacción atractiva para quienes están buscando información. Los lineamientos de posicionamiento convencional tanto como cantidad de caracteres, palabras claves, entre otros son aplicables a los archivos PDF. La información que se ponga en este campo es la que aparece como descripción en la página de resultados de los motores de búsqueda.

6. Citas Bibliográficas:

Es muy importante incluir una cita bibliográfica a una versión publicada del artículo en una línea independiente, y pongalo dentro del encabezado o el pie de página en la primera página en el archivo PDF, o al lado del título y los autores en el código HTML. Use un formato de citación explicito, por ejemplo: “Buenas prácticas para Optimizar PDF., vol. 234, no. 8, pp. 1971-1975, Agosto 2010″. Si este documento no está publicado, incluya la fecha completa de la versión actual en una línea independiente. Ejemplo; “Agosto 12, 2009″.

7. Evitar contenido Duplicado:

Si el fichero de PDF es una alternativa de impresión de una página Web existente y en realidad no la desea posicionar, es importante incluir el “noindex” en el robots.txt, de lo contrario estaría creando contenido duplicado y compitiendo por el posicionamiento con la página que en realidad desea rankear.

Hacer el documento basado en Texto – no en imagen: Si usted está generando el archivo PDF con un programa de Office, con CutePDF o similares. Seguramente no va a tener inconvenientes. Pero si está usando software de edición de imágenes o de diseño de páginas es importante revisar este tema para comprobar que el texto si sea visible y seleccionable. Si luego de crear el fichero PDF lo puede ver con Acrobat Reader y copiar y pegar texto de este, quiere decir que lo hizo de la manera correcta.

8. Crear enlaces:

En toda estrategia de posicionamiento los enlaces internos juegan un papel fundamental y los ficheros PDF no son la excepción, es necesario crear enlaces que referencia a otras publicaciones relacionadas, bibliografía, ampliación de la información, entre otras cosas. Además es una forma de transferir el PageRank a otras páginas, aunque no aparezcan como fuente de enlaces en las herramientas para Webmaster de Google “Webmaster Tools”.

9. Enlazar páginas en los PDF:

Este es un tip que les dejo para ir concluyendo el artículo, “Si se puede crear enlaces a una página específica”  sin importar que tenga un tag especial o algo así. Con solo agregar [#page=] y un número de página a la URL es suficiente, por ejemplo: www.misitio.com/optimización-de-archivos-pdf.pdf#page=5. Si bien esto no es algo que apoya en el SEO, si es un elemento importante de usabilidad.

Conclusión:

Los archivos de PDF forman parte del paquete de contenidos de todo sitio Web, y es importante tener en cuenta unas buenas prácticas para su optimización. La creación de un estándar de optimización para este tipo de archivos (ficheros) apoya la estrategia en gran medida cuando son cantidades importantes, en el caso de una universidad o centro de investigación por ejemplo.

Autor:

Santiago Suárez Mesa

Twitter: @ssuarezmesa

Especialista en Métricas Web y SEO de MarketView

Le agradecemos a Santiago por compartir con nostros tan relevante información.

Los invito a dejar su opinión sobre este artículo o realizar preguntas que con gusto las responderé.

Título del Archivo: Debe ser el mayor fragmento de texto en la parte superior de la página y se debe usar un tamaño de fuente de por lo menos 24pt. Es importante ubicar el titulo dentro de una etiqueta “h>” o “h2″ con HTML, o para mayor facilidad desde antes de generar el fichero, ej: MS Word. También se puede usar la clase de CSS llamada “citation_title” como alternativa para distinguir el título. Luego de optimizar el título con alguna de las opciones anteriores se debe asegurar de que el resto del texto, en especial el nombre del repositorio o la publicación estén en una letra más pequeña para evitar que sea mal interpretado por los motores.

Además de las buenas prácticas para que el título sea identificado correctamente, obviamente es importante la optimización como si fuera una página Web. Use palabras claves que desee posicionar, se deben poner las de mayor relevancia al principio, tener en cuenta la extensión (65 Caracteres) y todos los elementos del posicionamiento convencional debido a que ese título es el que va a aparecer en la página de resultados del motor de búsqueda.

Autores: Los autores del archivo deben estar listados justo antes o después del título, en una letra un poco más pequeña pero que sea más grande que el texto normal. Se debe usar un tamaño de letra que este dentro de 16-23 pt y ponerlos dentro de una etiqueta “<h3>” en HTML, o crear una clase llamada “citation_author” dentro del CSS. Asegúrese de que el nombre de la publicación, como también los textos de los encabezados de secciones estén en un tamaño de letra menor al de los autores. De lo contrario, este otro texto que este más grande puede ser interpretado incorrectamente como los autores. Use el formato conocidos como “Sentence case” en lugar de “Title Case” para los encabezados de sección entre otros, para evitar confusión con los autores. Separe los diferentes nombres de autores con comas o punto y coma y omita las afiliaciones, títulos, y certificaciones de la línea de autores. Use un formato explicito tal como “Por Pedro Rojas” ó “Author: Pedro Rojas” en caso de ser apropiado.

Asunto del fichero (Meta Description): El meta-description se debe poner en el campo de “Asunto” del archivo PDF, se debe optimizar de igual manera con palabras claves y con una redacción atractiva para quienes están buscando información. Los lineamientos de posicionamiento convencional tanto como cantidad de caracteres, palabras claves, entre otros son aplicables a los archivos PDF. La información que se ponga en este campo es la que aparece en la página de resultados de los motores de búsqueda.

Citas Bibliográficas: Es muy importante incluir una cita bibliográfica a una versión publicada del artículo en una línea independiente, y pongalo dentro del encabezado o el pie de página en la primera página en el archivo PDF, o al lado del título y los autores en el código HTML. Use un formato de citación explicito, por ejemplo: “Buenas prácticas para Optimizar PDF., vol. 234, no. 8, pp. 1971-1975, Agosto 1959″. Si este documento no está publicado, incluya la fecha completa de la versión actual en una línea independiente. Ejemplo; “Agosto 12, 2009″.

Evitar contenido Duplicado: Si el fichero de PDF es una alternativa de impresión de una página Web existente y en realidad no la desea posicionar, es importante incluir el “noindex” en el robots.txt, de lo contrario estaría creando contenido duplicado y compitiendo por el posicionamiento con la página que en realidad desea rankear.

Hacer el documento basado en Texto – no en imagen: Si usted está generando el archivo PDF con un programa de Office, con CutePDF o similares. Seguramente no va a tener inconvenientes. Pero si está usando software de edición de imágenes o de diseño de páginas es importante revisar este tema para comprobar que el texto si sea visible y seleccionable. Si luego de crear el fichero PDF lo puede ver con Acrobat Reader y copiar y pegar texto de este, quiere decir que lo hizo de la manera correcta.

Crear enlaces: En toda estrategia de posicionamiento los enlaces internos juegan un papel fundamental y los ficheros PDF no son la excepción, es necesario crear enlaces que referencia a otras publicaciones relacionadas, bibliografía, ampliación de la información, entre otras cosas. Además es una forma de transferir el PageRank a otras páginas, aun así no aparezcan como fuente de enlaces en las herramientas para Webmaster de Google “Webmaster Tools”.

Enlazar páginas en los PDF: Este es un tip que les dejo para ir concluyendo el artículo, “Si se puede crear enlaces a una página específica” sin importar que tenga un tag especial o algo así. Con solo agregar [#page=] y un número de página a la URL es suficiente, por ejemplo: www.elcolombiano.com/blogs/marketingdigital/optimización-de-archivos-pdf.pdf#page=5 Si bien esto no es algo que apoya en el SEO, si es un elemento importante de usabilidad.

Conclusión; Los archivos de PDF forman parte del paquete de contenidos de todo sitio Web, y es importante tener en cuenta unas buenas prácticas para su optimización. La creación de un estándar de optimización para este tipo de ficheros apoya la estrategia en gran medida cuando son cantidades importantes, en el caso de una universidad o centro de investigación por ejemplo.

7 comments

  1. Gustavo Parra   •  

    Buena esa por Santiago, es un apasionado del SEO. Excelente información, la publicación de contenidos en PDF es una práctica muy popular, sin embargo no se tiene en cuenta la posibilidad de optimizar este contenido para que los Buscadores lo indexen adecuadamente y sea útil a muchos navegantes de la Web. Gracias por el artículo, se que será muy útil para los navegantes interesados en el tema. Saludos.

    • Marketing Digital   •     Autor

      Hola Gustavo,

      Estoy de acuerdo contigo, la información tiene mucho valor técnico, ya que es un tema poco documentado en Internet.

      Saludos,

      Juan Carlos Mejía Llano

  2. FRANCISCO PARDO TELLEZ   •  

    Soy Arquitecto, utilizo los archivos PDF para poder suministrar a clientes, contratistas, proveedores de materiales y servicios planos y especificaciones que sean fácilmente examinados e imprimibles en cualquier formato, evitando así el envio de archivos pesados de AutoCad, que además muchas veces terminan siendo modificados o usados para otros proyectos, por ser en su mayoría imágenes como podría colocarle referencias o links a partes de la imagen, (un mismo plano puede contener plantas, cortes, fachadas y detalles) por ejemplo señalar los ascensores y que un link me conecte con la página de Otis, o que con ellas pueda mi corresponsal al ver un detalle de la cimentación pueda ir a las especificaciones relacionadas sin tener que subdividir “n” veces la imagen?
    Gracias
    FPT

  3. Andrea Cevallos   •  

    Yo les hago una recomedacion para que tambien puedan conseguir mas enlaces y visitantes a su pagina web para mayor posicionamiento y sobre todo aumentar el pagerank, me refiero a los sitios en donde se pueden publicar anuncios en toda la red. a mi me ha servido para conseguir clientes de mi pequenia empresa. le dejo unos sitios a continuacion. aunque hay muchisimos otros mas que no los listo aqui.

    1. http://www.evocero.com/
    2.

    les deseo mucho pagerank

  4. Pianista   •  

    Hola,
    lo que no me queda claro es cómo poner un buen anchor text, luego el link “dentro”, y hacer con eso un PDF. O acaso es que el programita que uso para hacer PDFs no lo permite?
    un saludo cordial
    Juan María Solare

  5. Pianista   •  

    Agrego: me parece que no es únicamente mi problema, puesto que he visto numerosos ficheros PDF que dicen “cliquee aquí”, lo hace y no ocurre nada porque no hay un link. Personalmente uso PDFFactory (y no quiero venderles nada a ustedes).
    Un saludo musical
    Juan María Solare
    ( pianista )

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *

Puedes usar las siguientes etiquetas y atributos HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>