Metadata, ou quando os editores brasileiros comem moscas, cobras e largatos


Por Felipe Lindoso | Publicado originalmente em “O Xis do Problema” | 27 de julho de 2011

A palestra mais interessante do primeiro dia do Congresso do Livro Digital da CBL foi sem dúvida a de Edward Nawotka, editor-chefe do Publishing Perspectives, já no final da tarde.

Ed tratou de vários pontos, voltando a dez anos atrás e mostrando alguns dos erros estratégicos que culminaram na falência da Borders e os perigos que rondam o mercado editorial. Mas o ponto central do que falou foi a advertência: algo que os editores podem e devem fazer para garantir seu futuro em um mercado onde pululam os autores que se auto-publicam, é trabalhar a metadata de seus livros.

De que se trata?

Metadata é o conjunto de dados sobre dados. Assim simples, parece pouco. Mas na verdade é algo realmente fundamental para adquirir o instrumento mais precioso que os editores podem ter para manter sua posição no mercado: informação.

O título de um livro, o nome do autor, da editora e o ISBN, por exemplo, são metadatas. Informações que se referem a um livro. Mas se restritos apenas a esses dados, a quantidade de informação que estes podem proporcionar é ridícula, diante da riqueza que pode ser mineirada se houver uma compreensão melhor sobre o assunto.

Agora quem recua a dez, doze anos atrás sou eu. Trabalhava na CBL, como Diretor de Relações Institucionais. Por volta de 1998/99, duas movimentações no mercado internacional atraíram minha atenção. A primeira foi a iniciativa do Book Industry Study Group – BISG [mantido pela indústria editorial americana para promover pesquisas e estudos sobre o mercado] e do Book Industry Comunication [do Reino Unido] de construir a primeira versão do ONIX – On Line Information Exchange. O padrão ONIX é desenhado para possibilitar a comunicação computador-computador entre os envolvidos na criação, distribuição, licenciamento ou qualquer outro modo de tornar disponível propriedade intelectual publicada, seja física ou digital. Todos os padrões ONIX são expressos em XML. Mais informações aqui .

A segunda iniciativa foi a da criação do DOI – Digital Object Information, também por iniciativa principalmente dos editores, destinada a identificar qualquer segmento de informação digital de forma unívoca [tal como o ISBN identifica uma edição, o DOI identifica objetos digitais]. Mais informações aqui . Qualquer segmento, nesse caso, pode significar desde o livro digital inteiro até qualquer parte dele [o título, o nome do autor, o ISBN, uma foto, a capa, um gráfico, uma ilustração, qualquer parte do objeto digital].

As duas iniciativas criaram as condições para que se pudesse rastrear a circulação na Internet de qualquer movimentação relacionada com os livros: no caso do ONIX, mesmo dos livros físicos; no caso do DOI, de qualquer segmento digital. O resultado disso foi, entre outras coisas, o surgimento dos diferentes sistemas de DRM – Digital Rights Management.

É importante destacar que o DRM pode ser um instrumento extremamente flexível e, acoplado com as informações dos arquivos no padrão ONIX e DOI, possibilitam ao editor obter dados valiosíssimos sobre a circulação das INFORMAÇÕES sobre seus produtos na Internet.

Digamos, por exemplo, que as informações sobre um título qualquer – livro físico – estão organizadas no padrão ONIX. O sistema permite que se recolham informações sobre qualquer acesso a qualquer tipo de informação que circule na Internet sobre esse livro. Se alguém acessa o site da editora e clica no título em questão, o sistema coleta informações as mais variadas a partir do IP de quem clicou. O mesmo se o título for consultado no site de uma livraria ou de um distribuidor. Depende de como foram organizados os metadados dentro do padrão ONIX. Ou seja, não é preciso que seja um livro digital para que os metadados referentes a esse livro já estejam gerando informações para os editores: sobre a distribuição geográfica dos acessos, por exemplo, que podem ser combinados com outras fontes de informações. Quem já viu as tabelas do Google Analytics pode imaginar o quanto é possível garimpar a partir de um simples clique no título do livro. E o ONIX não é apenas isso. Tem muito mais.

O DOI simplesmente amplifica essas possibilidades para os livros digitais.

As restrições à circulação dos e-books, que tornaram os DRMs mais conhecidos por conta das restrições nas transferências do conteúdo digital, são praticamente um subproduto da combinação ONIX/DOI. E a maioria das pessoas pensa que os DRMs dizem respeito apenas ao comércio dos e-books.

Nada disso. DRMs são uma expressão prática de coleta de metadados, e apenas uma delas, talvez a que tenha atraído maior rejeição por parte dos consumidores finais.

Representando a CBL, cheguei a assistir a duas séries de reuniões sobre o DOI, em Frankfurt e em Berlim, e o assunto já começava a ser discutido pela diretoria da CBL. Era uma visão de futuro para o mercado editorial.

Em 2002, na sucessão da administração do Raul Wassermann, o senhor Oswaldo Siciliano foi eleito e jogou fora tudo isso.

Somente no ano passado a CBL iniciou tratativas com a Federación de Gremios de Editores de España para adotar uma versão do padrão ONIX em um catálogo de livros disponíveis, que seria a versão brasileira do DILVE – Distribuidor de Información del Libro Español en Venta. Falou-se nisso e depois não ouvi mais a respeito. No site da CBL, não se encontra mais nada sobre o assunto.

Em resumo, no começo da década passada já se esboçava uma visão de futuro sobre a importância da coleta de informação, e da padronização do tipo de informações. O esforço foi jogado fora e interrompido.

É possível que algumas editoras mais bem informadas estejam trabalhando com o padrão ONIX. Não sei. Se estão, devem guardar esses dados como um tesouro de informações valiosíssimas.

Mas o fato é que o mercado editorial brasileiro, nessa altura dos acontecimentos, tem que correr atrás do prejuízo.

Por Felipe Lindoso | Publicado originalmente em “O Xis do Problema” | 27 de julho de 2011