por que ainda usamos PDF?

Nos tempos da graduação, mais de dez anos atrás, havia três maneiras principais de ter acesso aos textos cuja leitura era solicitada pelos professores. A primeira maneira era, é claro, adquirir os livros — o que se revelava simplesmente impossível na maior parte do tempo, seja porque não tínhamos dinheiro, seja porque muitos desses livros sequer estavam disponíveis para venda. Restavam, então, meios alternativos.

A segunda maneira era o empréstimo na biblioteca — ou o empréstimo com algum colega que por ventura tivesse o livro, o que era difícil pois, afinal, todos nós precisávamos ler os mesmos textos. Emprestar o livro da biblioteca, contudo, era mal visto por todos, já que muitas vezes tratavam-se de cópias únicas disponíveis no acervo e a sua circulação acabava travando o acesso aos demais colegas.

O que levava, então, à terceira maneira, certamente a mais comum: a famosa pasta da disciplina na lojinha de xerox. Não faço ideia se isso ainda existe, mas no início de cada semestre os professores deixavam cópias dos textos das disciplinas no setor de xerox da faculdade — o que nos levava a gastar quantias absurdas de dinheiro com essas fotocópias, ainda que inferiores ao valor dos livros originais.

Aquelas cópias eram grosseiras, pouco confortáveis e dotadas de uma legibilidade em grande medida prejudicada — sobretudo nas imagens. Mas eram imprescindíveis e muito práticas para levar na bolsa e ler no ônibus.

PDF é o novo xerox

Em tempos de pós-graduação pandêmica, porém, não faz mais sentido, é claro, falar em xerox.

Contudo, a antiga pasta da disciplina na lojinha do xerox foi substituída pela pasta de PDFs no Google Drive ou no Moodle. A situação para os alunos é bem mais confortável, já que temos acesso aos textos imediatamente, sem sair de casa. A experiência de leitura em tela, apesar disso, continua sendo tão ruim — ou pior — quanto a das antigas cópias xerox.

Certa vez li em algum lugar que o PDF seria uma linda inovação… se estivéssemos no século 15, quando foi inventada a imprensa.*

Hoje o PDF é um formato grosseiro, problemático, desconfortável. As alternativas a ele, contudo, permanecem ruins — sobretudo os vários tipos de “epub”, ótimos para leitura de ficção literária mas péssimos para a apreciação de textos acadêmicos mais densos, que exigem muitas idas e vindas, pausas, retornos, marcações, consultas às notas, confrontação com imagens e tabelas, etc. A leitura de PDFs em tablets eventualmente se revela um pouco mais confortável que na tela do computador, mas mesmo nesse caso ainda se trata de uma gambiarra e não da melhor solução possível.

O PDF é ótimo naquilo que ele se propõe: apresentar um mesmo leiaute fixo, sem alterações, em qualquer dispositivo e plataforma, mantendo a tipografia, a diagramação, as imagens, etc. Trata-se, afinal, de um bom equivalente digital para uma página impressa. Mas como meio de leitura em tela o PDF é na maior parte das vezes simplesmente horrível — sobretudo quando ele é tão somente a transposição digital da página impressa. O tamanho das manchas de texto raramente são adequados para leitura em tela sem qualquer tipo de ampliação. Páginas com mais de uma coluna revelam-se particularmente irritantes. Quando se trata de PDF simplesmente escaneado — mesmo que tendo passado por reconhecimento OCR — a leitura fica ainda mais desagradável e inapropriada para a tela.

São inúmeras as reclamações ao PDF como meio de leitura espalhadas pela web. Embora trate-se hoje de um padrão aberto, foi durante muito tempo um formato fechado, de propriedade da Adobe. O acesso ao conteúdo dos arquivos PDF é mediado por uma série de instâncias de formatação — excelentes para preservar o leiaute, mas problemáticas para ter acesso ao texto puro. Um exemplo banal disso é no caso de palavras hifenizadas quando de mudança de linha: ao copiar o texto, o hífen vem junto, ainda que ele não devesse estar ali. Isto também afeta o uso de ferramentas de busca no interior dos arquivos.

por um mundo pós-PDF

Como alternativa ao PDF, temos à disposição um formato de arquivo razoavelmente adequado para leitura em tela — tanto quanto telas emissoras de luz possam ser confortáveis para isso, o que ainda é bastante limitado —, adaptado e responsivo para as características do suporte digital (seja em computadores, seja em smartphones ou tablets), eficaz no manuseio de elementos multimídia (como imagens, filmes, sons, etc). Além disso, trata-se de um formato especialmente desenvolvido para otimizar a extração de dados de seu conteúdo, separando-o, quando necessário, de sua formatação, apresentação e estrutura. Ao mesmo tempo, ele se encontra razoavelmente bem desenvolvido para a manutenção de esquemas de diagramação e de leiaute que, ainda que sejam responsivos, independam de plataformas ou aparelhos específicos e sejam universalmente reproduzidas sem grandes alterações ou ruídos. Não se trata, contudo, de um formato adequado para impressão ou para apresentação fiel de um determinado leiaute — como é o PDF —, mas de algo adequado para a reprodução e leitura em diferentes contextos.

Ou seja, trata-se de algo com grande parte das virtudes do PDF e sem a maior parte de seus vícios. Esse formato, é claro, é o HTML. Uma página HTML bem desenhada e bem codificada se revela uma experiência de leitura razoavelmente agradável — tanto quanto, mais uma vez, seja agradável ler qualquer coisa que seja numa superfície emissora de luz com taxas de atualização limitadas e equilíbrio de cor deficiente.

A disponibilidade de textos acadêmicos em um formato como o HTML, contudo, permanece bastante reduzida. As revistas acadêmicas eletrônicas ainda mantêm total prioridade ao PDF como forma de disponibilização dos artigos — seja por uma questão de hábito, seja pela aparente perenidade que os PDFs sugerem. A produção de PDFs bem diagramados, aliás, ainda é mais prática que a produção de páginas HTML bem feitas, que demandam uma articulação sensível entre designer e programador.

Algumas plataformas para publicação acadêmica, contudo, vêm desenvolvendo formas de apresentação dos artigos diretamente no navegador, adotando boa tipografia e diagramação e aproveitando as possibilidades únicas que essa opção oferece, como o reconhecimento de citações (com o devido cruzamento com a bibliografia), o uso de links internos para notas de rodapé, etc.

Página tida como a primeira em HTML da história, desenvolvida por Tim-Berners Lee no CERN, em 1989

Vale lembrar, inclusive, que a mítica invenção do HTML por Tim-Berners Lee — e, em certa medida, da própria web — no contexto do CERN se deu em função da busca por uma forma mais adequada de disponibilização de textos científicos — a própria ideia do hyperlink veio da forma como autores e textos são citados e referenciados no interior de um artigo acadêmico. O trabalho de Lee ocorreu em 1989 — apenas quatro anos depois, em 1993, o CERN viria a disponibilizar no domínio público o padrão HTML e os protocolos que levariam à difusão da web. 1993 também foi o ano em que a Adobe anunciou a criação do PDF, que permaneceu um formato proprietário e fechado por quinze anos. Infelizmente o mundo da publicação acadêmica preferiu aderir às facilidades do PDF enquanto o HTML ainda não amadurecia. O resultado é o que temos hoje.


Apesar de todas as vantagens que o HTML apresenta hoje, o cenário no curto prazo ainda é o da persistência da versão digital da antiga pastinha da xerox: para nosso desespero, PDFs continuarão úteis como equivalentes digitais dos velhos textos em xerox, seja pela praticidade para sua produção, seja pela sensação de que estamos lidando de fato com “objetos” digitais, como os antigos textos espiralados ou grampeados.

Imagem de abertura: cópia da Bíblia de Gutenberg depositada na Biblioteca de Nova Iorque.

*Achei a referência a essa citação e na verdade se trata de algo ainda mais antigo: seria uma inovação no século terceiro, quando começamos a criar “páginas”.

5 comentários em “por que ainda usamos PDF?”

  1. Arre, eu sou velho de nascença e sinto o estômago borbulhar quando começam os papos de mudança…
    Eu recebi uma doação de iPad usado recentemente e entrei um pouco mais no mundo dos e-books. Acabo procurando ambas as versões (em PDF ou em algum formato e-book como epub/mobi/azw) porque se por um lado é melhor ter uma leitura continua sem arrastar a tela nos formatos ebook, a formatação e a numeração de páginas é algo que dá aflição em flutuação líquida. Acho que os trem vão ficar nesses 2 mesmo.
    Acho que quando a obra é mais referencial como livros de rpg ou artigos, livros de consulta científica ou artigos, creio que o pdf deve se manter. Livros de ficção ou pensados para uma leitura linear (imagina o jogo da Amarelinha do Cortázar no epub…) devem ter menos problema.
    Enfim, nem sei se entendi o ponto levantado ou se soube levantar um outro ponto, mas como sou fascinado pela simples ideia do livro acabei tentado a escrever.

    Curtir

  2. Meu principal motivo para gostar de pdfs é a estabilidade dos números de página para fazer e encontrar citações diretas. Sem a página precisamos usar a busca (control + f) e esse mecanismo me parece mais trabalhoso.

    Curtir

  3. Sempre gostei de arquivos PDFs para distribuição de material e ou mesmo para guardar notas e textos comigo, mas acho que principalmente pela falta de opções, o fato de ser simples de gerar o arquivo e manter a integridade do documento me fizeram gostar dele, lembro que numa época a Microsoft tentou popularizar os arquivos xps. como alternativa aos pdf, mas não pegou e caiu no esquecimento.

    Sobre usar o html, acho que a complexidade de gerar um arquivo acaba por espantar a maior parte dos usuarios.

    Curtir

  4. Quando estava na faculdade comprei um Kindle para facilitar a leitura dos textos, mas como quase todos eram em PDF a leitura se tornava impossível ou precisava de uma conversão para um formato mais tragável pelo Kindle e isso destruía tudo. Imagino que muito da popularidade do PDF se mantenha pela facilidade distribuição também, o HTML não é um meio de entrega desses textos em arquivo único caso ele tenha imagens e a leitura offline, pelo menos no Brasil é bem essencial. Fico imaginando que talvez um HTML que encapsulasse tudo em um único arquivo, como o DOCX seria um caminho bem interessante.

    Curtir

  5. leituras científicas sempre me remetem exatamente ao que foi dito no texto…ler, reler, riscar, voltar, avançar, analisar figuras e tabelas, relacionar texto com imagens…. o que digitalmente pra mim ainda é bem difícil, tanto com pdfs tanto com epubs (e variações)…

    uso pdf para material científico exatamente por manter toda as formatações no salvamento do arquivo e na leitura… mas no fundo a diagramação dos pdfs não são eficientes para leitura em diferentes tamanhos e mídias…

    enfim, o uso de pdf é um hábito que pode ser aperfeiçoado, espero.

    Curtir

Deixar mensagem para Anderson Oliveira Cancelar resposta

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.