Dicas de prepraração de eBooks para Amazon


POR Lúcia Reis | Publicado originalmente por COLOFÃO | 29 de outubro de 2014

No processo de produção de livros digitais, como já mencionado anteriormente, nem sempre a mesma linha de código terá uma mesma visualização nos diferentes aplicativos e dispositivos de leitura. No caso da Amazon, no entanto, não estamos lidando só com uma questão de renderização diferente dos códigos: se trata de outro formato de livro digital com diferentes potencialidades e limitações. Dessa forma, o processo de produção do livro digital para a Amazon acrescenta algumas etapas que não são necessárias para a venda nos demais players.

Neste post, resolvi enumerar as algumas questões que podem surgir e tentar explicar através delas o padrão utilizado pela Amazon.

1. Table of Contents [TOC]:

1.1] HTML de TOC

Nos ePubs nós temos um arquivo toc.ncx que serve como um sumário navegável que pode ser acessado através de um atalho do app de leitura ou e-reader. Como no formato da Amazon esse arquivo não consegue criar mais de 2 níveis hierárquicos [ou seja, é possível ter capítulos e subcapítulos, mas, se for aberto um subcapítulo do subcapítulo, esse link é perdido no toc.ncx da Amazon], se faz necessária a criação de um HTML de sumário, com a mesma função do toc.ncx.

1.2] Ordem de elementos no toc.ncx:

Mesmo após a criação deste HTML, o arquivo toc.ncx ainda precisa existir. No processo de conversão, se este arquivo estiver mal formatado, é possível que apareça o seguinte relatório de erro no Kindlegen:

Error(prcgen):E24011: TOC section scope is not included in the parent chapter:1: GENEALOGIA PATERNA
Error(prcgen):E24001: The table of content could not be built.
(…)
Warning(prcgen):W14001: Hyperlink not resolved: /tmp/mobi-fy53Lm/OEBPS/Text/chapter03.html#ch3
Warning(prcgen):W14002: Some hyperlinks could not be resolved.

Este relatório acontece quando a indicação dos elementos do toc.ncx não está seguindo a ordem de leitura dos HTMLs que formam o miolo.

Para explicar este caso específico, preciso antes explicar a relação entre HTMLs, ids e links dentro dos e-books. O texto do e-book está dividido em diversos arquivos HTML. Digamos que cada HTML contenha um capítulo de seu livro. No entanto, é possível que, dentro deste capítulo, existam subcapítulos, os quais são importantes de serem linkados no seu sumário. Os links de sumário geralmente apontam para um HTML. No exemplo selecionado, ele está apontando para o capítulo 3, que está no HTML chapter03.html. Para apontar para subcapítulos, é necessário criar um link, identificado pela tag <a>, que possui um identificador ou idpara que seja possível criar um link apontando para aquele exato ponto no HTML.

No exemplo, foi criado um id=”ch3? para marcar a subdivisão do chapter03.html.

Todo id está atrelado a um HTML, o que faz com que o id seja inferior hierarquicamente ao HTML. No relatório de erro do Kindlegen acima, essa hierarquia foi quebrada, tornando impossível de se criar o TOC. Para resolver este problema, basta utilizar o programa Sigil e seguir o caminho Tools > Table of Contents > Edit Table of Contents e inverter os links de ordem: primeiro o chapter03.html e depois o chapter03.html#ch03 e demais identificadores, na ordem em que aparecem no HTML, para que a hierarquia e a ordem de leitura sejam mantidas.

2. Semânticas

2.1] Capa

O formato da Amazon também não suporta a capa em formato HTML. Ele indica a capa apenas pelo arquivo de imagem. Para conseguir fazer isso corretamente, ele precisa que o arquivo .jpg de capa seja indicado com a semântica “Cover”, ou o Kindlegen dará o seguinte Warning:

Warning[prcgen]:W14016: Cover not specified

Para acrescentar semânticas pelo Sigil, basta clicar no arquivo que você deseja acrescentar a semântica, clicar com o botão direito do mouse e clicar em Add Semantics e selecionar, no caso, “Cover Image”.

3

2.2] Texto

Outra semântica importante de ser acrescentada é a “Text”, que marca o início do texto. Quem usa o Kindle já percebeu que geralmente, quando se abre um livro nele, ele já inicia no primeiro capítulo. Esse recurso é possível pelo acréscimo desta instrução. O problema é que, se o editor não marcar a semântica de texto, o Kindle marca automaticamente o primeiro HTML com mais de algumas poucas linhas de texto. Ou seja, qualquer elemento pré-textual, como dedicatórias ou epígrafes, podem ser perdidas, uma vez que dificilmente o leitor vai voltar para ver se não tinha nada antes do primeiro capítulo. Portanto, é recomendado adicionar esta semântica para se certificar que informações importantes [e sim, epígrafes são importantes] não sejam perdidas.

Para adicionar semânticas nos HTMLs, basta seguir o mesmo caminho utilizado para o .jpg de capa. No caso dos HTMLs aparecerão mais opções, como é possível visualizar na imagem acima.

2.3] TOC

É necessário também adicionar a semântica de “Table of Contents” no HTML de TOC. Quando criado pelo Sigil, a semântica já é acrescentada automaticamente, mas, de todo modo, é bom checar. Senão o link de sumário que existe nos Kindles fica inativo e, surpreendentemente, o Kindlegen não mostra Warning quando a semântica de TOC não está indicada.

5

3. Media Queries

A media query é um recurso de formatação direcionada. Você basicamente diz ao seu e-book: se estiver lendo numa tela de celular, mostre meu texto com a formatação x, mas se for num tablet, mostre ele com a formataçãoy. Se você tiver sorte, ele te obedece, mas nem sempre é o caso.

Antigamente eu utilizava media queries para retirar as capitulares dos e-books da Amazon, pois o recurso float: left, que deixa a capitular flutuando à esquerda, fazia a linha quebrar na primeira letra nos Kindles antigos, que não suportavam o recurso. Este problema já foi corrigido e não ocorre mais quebra de linha; no entanto, nos Kindles que suportam float, as capitulares são visualizadas de forma muito diferente do que nos demais e-readers e apps.

Pelos testes que fiz, deduzi que o problema é uma diferença no line-height, que indica o alinhamento do texto e/ou da capitular. Modificando o line-height da classe de capitular é possível fazê-la funcionar adequadamente nos diferentes dispositivos de leitura. O que é uma saída mais confíavel do que a media query.

6

Apesar do Guidelines da Amazon apresentar a media query como opção, meus testes mostraram que, na prática, o que ocorre atualmente é uma mescla do que está no código principal com o indicado na media query, ao invés de utilizar somente o código direcionado especificamente para o formato da Amazon. Como é possível ver na imagem abaixo, ele manteve a formatação em float, mas acrescentou a informação de bold, contida na media query.

Conclusão

Bom, acho que a conclusão é a mesma de sempre: é muito importante testar os arquivos, por mais que pareça que não há nada que possa dar errado com aquele livro de texto simples. Nunca se sabe quando o arquivo pode apresentar problemas inesperados ou quando atualizações de firmware criaram um novo bug que você nunca viu antes. Teste sempre, é mais seguro.

POR Lúcia Reis | Publicado originalmente por COLOFÃO | 29 de outubro de 2014

Lúcia ReisLúcia Reis é formada em Letras: Português/Literaturas, pela Universidade Federal Fluminense, trabalha com livros digitais desde 2011 e hoje atua como Coordenadora de Livros Digitais na editora Rocco. Como todo bom leitor compulsivo, tem mais livros do que a prateleira comporta, e possui muitos mais em sua biblioteca virtual! Lê e-books todo dia no trajeto para casa, ao som de sua banda favorita, Thin Lizzy.