Brasil ganha mais dois concorrentes na gestão de metadados


CBL anuncia, na Bienal do Rio, a Books in print, ligada à Frankfurt; e Eduardo Blucher lança a ferramenta Mercado Editorial

Metadados: o nó no mercado editorial que começa a ser desatado | © www.mercadoeditorial.org

Metadados: o nó no mercado editorial que começa a ser desatado | © http://www.mercadoeditorial.org

Não raro, os colunistas do PublishNews apontam que um dos maiores gargalos do mercado editorial brasileiro é, ainda, a gestão de metadados. Em 2011, por exemplo, Camila Cabete escreveu: “publicar um livro sem metadados é como ter um filho e não dar nome ao coitadinho”. Em 2012, ao participar do debate “Dilemas e conflitos do mercado editorial”, na Bienal de SP, Felipe Lindoso creditou à falha gestão dos metadados o problema da “descobertabilidade”: “o livro brasileiro não é achado, é patético descobrir algo que você não conhece em uma livraria”. Mais recentemente, o colunista voltou ao assunto ao escrever, em março passado: “o pior é que as editoras brasileiras simplesmente mal sabem o que são metadados, não têm ideia de como incluir tags significativos do conteúdo de seus livros”. O assunto, então, deixou de ser apenas a pauta das discussões e passou a fazer as engrenagens do mercado rodarem. Do início de 2014, para cá, o PublishNews noticiou a chegada da Bookwire, que, além da distribuição, faz também a otimização de metadados, e a mudança no modelo de negócios da Digitaliza Brasil que também passou a prestar o serviço. Em 2015, noticiamos a criação da Ubiqui, plataforma que promete reduzir custos com metadados em até 70%. Mais recentemente, a Bookpartners lançou o Portal do Editor, ferramenta pela qual editores podem revisar e atualizar produtos já cadastrados no sistema da holding. Agora, para os próximos dias, duas novidades prometem dar mais força a esse mercado. É que, ainda em agosto, Eduardo Blucher promete colocar no ar o Mercado Editorial e, no dia 2 de setembro, a CBL e a MVB [empresa coligada à Feira do Livro de Frankfurt] anunciam a chegada do serviço Books in Print Brasil.

Os serviços têm em comum um painel de controle por onde editores fazem o upload das informações dos seus livros e as ferramentas padronizam conforme as necessidades de cada um dos varejistas. A Books in print Brasil leva a chancela da MVB, subsidiária da Associação de Editores e Livreiros Alemães, e tem mais de 40 anos de experiência na Alemanha. A vinda da empresa para o Brasil é fruto da parceria entre CBL e a Feira do Livro de Frankfurt, que apresentaram, no começo da semana passada, o projeto ao Banco Nacional de Desenvolvimento Econômico e Social [BNDES]. O modelo de negócios da nova empresa no Brasil ainda está em discussão. Na Alemanha, editores pagam por títulos cadastrados e distribuidores, atacadistas e quem quiser os metadados pagam por uma assinatura que varia de acordo com o tamanho da empresa. Os principais clientes lá na Alemanha são: Amazon, Nielsen, GfK e Bookwire. “O trabalho conjunto da Feira do Livro de Frankfurt com a MVB, em parceria com a CBL, vai trazer para o Brasil a mais completa e moderna plataforma de metadados do mercado. Um grande diferencial que a nossa plataforma tem é o uso de algorítimos que garante uma inteligência ao nosso banco de dados. Isso mantém o padrão de entradas, o que dá mais qualidade ao metadado cadastrado”, afirma Ricardo Costa, representante da Feira do Livro de Frankfurt no Brasil. A previsão é que a empresa comece a operar dentro de um ano.

No caso da Mercado Editorial, o serviço de disparo de metadados será gratuito. Eduardo Blucher disse ao PublishNews que estuda cobrar por serviços avançados. “Optamos pelo modelo freemium nesse primeiro momento. Nem editoras e nem livrarias pagarão pelo serviço. Após lançada a plataforma, vamos testar com o mercado as formas de cobrar pelo serviço”, aponta. Blucher prevê o início das operações ainda no mês de agosto.

ISBN
O projeto da CBL prevê que o Books in print seja, além de uma plataforma de gestão de metadados, também a entrada nos cadastros de ISBN no Brasil. Caso o projeto ande, as editoras farão o input dos dados pela plataforma que se responsabilizará pela inscrição dos metadados na Biblioteca Nacional. “É assim que funciona na Alemanha. É uma experiência já consagrada”, aponta Luis Antonio Torelli, presidente da CBL. Outros projetos já foram iniciados pela Câmara, mas sem grandes sucessos, lembra Torelli. “Há alguns anos, os espanhóis cederam uma plataforma que acabou não funcionando. Abandonamos o projeto. A obsolescência de projetos assim é muito grande. A atualização constante do serviço está no DNA da empresa alemã. A pergunta que devemos nos fazer é: vamos continuar tentando ou vamos partir para uma experiência já consagrada? Não podemos errar de novo”, define Torelli.

O Books in print será apresentado oficialmente no dia 2 de setembro, das 15h às 17h30, no Hotel Grand Mercure [Av. Salvador Allende, 6.555 – Rio de Janeiro/RJ]. Na ocasião, Ronald Schild, CEO da MVB, vai apresentar a ferramenta. Segundo disse Torelli ao PublishNews, o CEO fará também uma reunião com a Fundação Biblioteca Nacional para apresentação do projeto e das possibilidades de integrar a plataforma ao serviço de cadastro do ISBN. Para a apresentação do dia 2, é necessário confirmar presença pelo e-mail eventos@cbl.org.br até o próximo dia 28.

Por Leonardo Neto | Publicado originalmente em PublishNews | 24/08/2015

THEMA | A nova ferramenta de metadados para livros


Por Felipe Lindoso | Publicado originalmente em PublishNews | 29/01/2014

Os leitores de O Nome da Rosa, de Umberto Eco, podem lembrar que os crimesno mosteiro acontecem, no final das contas, em torno de um assunto aparentemente prosaico: a classificação a ser dada ao suposto manuscrito de Aristóteles achado na biblioteca do convento. O suposto tratado sobre o riso seria obra filosófica [no sentido dado à palavra pela escolástica], ou um texto demoníaco que negava o cristianismo? Dessa classificação dependeria o acesso ao manuscrito ou sua condenação ao “inferno” dos livros proibidos. Da disputa, surge a razão dos assassinatos.

Por isso é que às vezes eu brinco, conversando com bibliotecários, que eles são capazes de assassinar em disputas sobre a classificação. O estruturado sistema decimal usado nas bibliotecas abre espaços para esse tipo de disputas [felizmente, rara vez resultando em assassinatos, mas muitas vezes em disputas acerbas entre os bibliotecários].

O sistema decimal serve muito bem aos sistemas de bibliotecas. Mas, para a indústria editorial e para o comércio de livros resulta demasiadamente complicado. O assunto foi progressivamente sendo enfrentado pela indústria. Primeiro veio o ISBN, um identificador unívoco de cada título e edição. Mas, se não se sabe qual o ISBN, as buscas devem utilizar algum outro metadado. Os mais comuns, certamente, são o título e o nome do autor. Durante várias décadas isso funcionou bem para o mercado e foi incorporado nos sistemas de bibliotecas. Mecanismos com o protocolo Z.39.5 permitem que os computadores de diferentes bibliotecas “conversem” entre si a partir de fragmentos como esses, e importem/exportem dados de classificação cooperativa [nossa BN, infelizmente, não abre esse mecanismo. O sistema de bibliotecas das universidades paulistas abre, em parte].

Mas a classificação por “assuntos” do ISBN sempre foi muito frouxa e desregulada. Quando aconteceu o avanço do comércio internacional de livros e particularmente o surgimento dos e-books, as deficiências dos mecanismos de busca por assunto revelaram de vez suas fragilidades. Daí que as entidades ligadas aos livros, em cada país [as que levam esses assuntos a sério, é claro], começaram a enfrentar o problema. O BISG – Book Industry Study Group, dos EUA, formulou o BISAC, os ingleses criaram o BIC, os franceses o CLIL e os alemães o WGS. E começaram os remendos, com gente armando esquemas para “traduzir” as classificações de um para o outro. Isso sem falar na Amazon, que usa o BISAC, mas acrescenta um monte de outros metadados que lhe permite fazer listas de best-sellers extremamente segmentadas e tornar mais fluido seu mecanismo de buscas.

No meio do caminho apareceu o DOI – Digital Object Identifier e o consórcio EdiTeur. O EdiTeur é, digamos assim, o meta incentivador/organizador de padrões para a indústria editorial. Praticamente tudo de relevante formatado em termos de padronização surgiu de iniciativas do grupo, embora a administração de cada um deles logo tenha passado para órgãos específicos. O padrão Epubé administrado por um consórcio específico, assim como o ISBN possui um escritório central sediado em Berlim. O ONIX [ON line Interface EXchange], criado pelo BISG, também se integra a essa constelação.

Gosto de citar o DOI porque acompanhei um tanto de perto as etapas finais de sua formulação, quando ainda trabalhava na CBL, e pela sua importância nos sistemas de gerenciamento de direitos. O DOI permite que qualquer segmento de informação digital, definido como tal pelo editor [de livros, de música, de filmes], receba um identificador único. Assim, um livro inteiro pode ter um identificador, ou um capítulo, ou uma ilustração, ou um gráfico, etc. Uma vez embutido, o DOI permite, em tese, que a circulação desse documento digital possa ser rastreado na Internet. O DOI é administrado pela DOI Foundation, e conta com a participação dos mencionados segmentos de música e filmes.

A mais recente iniciativa do EdiTeur é o THEMA, um sistema internacional para classificação de assuntos. O THEMA pretende incorporar progressivamente os demais sistemas de classificação de assuntos, permitindo uma uniformização dos objetos de pesquisa.

Durante a conferência Tools ofChangena edição de 2012 da Feira de Frankfurt foi anunciado o projeto do THEMA, que imediatamente ganhou apoio das associações de mais de doze países, tanto da América do Norte quanto da Europa. Logo se construiu um projeto piloto e uma proposta para a governança do sistema, que ficou adjudicado ao EdiTeur na última Feira de Frankfurt, em 2013. Na ocasião também foi criado um comitê para dirigir o seu desenvolvimento, que deverá se reunir durante as feiras de Londres e Frankfurt para acompanhar o projeto.

A proposta do THEMA é a construção de um sistema global de classificação de assuntos, aplicável facilmente por todos os integrantes da cadeia de produção e comercialização de livros, com flexibilidade para permitir que cada mercado retenha suas especificidades culturais. Integrado ao ONIX, permitirá o uso em múltiplas plataformas de comercialização e difusão do livro.

Mas, afinal, como funciona esse tal de THEMA? O sistema estabelece uma hierarquia de assuntos, com vinte assuntos de nível máximo, cada um dividido em quantas subcategorias forem necessárias, cada uma dessas categorias inferiores identificada por códigos alfanuméricos.

As hierarquias maiores correspondem a uma letra. A, por exemplo, são as Artes. Daí em diante vão se subdividindo: AB corresponde a Artes: assuntos gerais;ABA vai para Artes – Teoria. E assim por diante. A chave, evidentemente, é manter uniformes as categorias, na medida em que sejam formadas.

A hierarquia implica que os livros devam ser classificados até o nível de detalhe mais adequado, mas sempre relacionados com os níveis superiores. Por exemplo, um livro que entre na categoria AGA [História da Arte] será também automaticamente classificado nos níveis mais gerais – AG [Belas Artes: tratamentos e assuntos] e o A.

O sistema permite também a combinação de várias classificações e o detalhamento por países, época histórica ou corrente artística, idade possível de interesse para o livro e seja lá mais que dado possa ser considerado relevante. Como os códigos serão alfanuméricos e constantes, os cabeçalhos podem ser traduzidos para qualquer idioma.

Essa classificação deverá alterar também as categorias de assuntos das empresas de pesquisa de vendas, como a BookScan e a GfK. Cada uma delas usa critérios próprios para divisão de assuntos, o que certamente dificulta a comparação de dados entre os vários países.

A atribuição dos códigos de classificação é feita pelos editores, que devem atentar para que os assuntos de cada livro sejam considerados e se tornem localizáveis pelos mecanismos de busca. E é gratuito, mesmo para as que estão em países cujas organizações profissionais não façam parte nem contribuam para o comitê de governança do THEMA.

É mais um esforço das organizações sérias de editores e livreiros para facilitar o intercâmbio internacional. Aqui ainda teremos que enfrentar vários problemas prévios, em particular que os editores e livreiros compreendam em profundidade a importância da aplicação correta de metadados em suas informações.

Mas algum dia chegaremos lá. Nem que seja pela pressão do resto do mundo, inconformado com essa balbúrdia que reina por aqui.

Por Felipe Lindoso | Publicado originalmente em PublishNews | 29/01/2014

Felipe Lindoso

Felipe Lindoso é jornalista, tradutor, editor e consultor de políticas públicas para o livro e leitura. Foi sócio da Editora Marco Zero, diretor da Câmara Brasileira do Livro e consultor do CERLALC – Centro Regional para o Livro na América Latina e Caribe, órgão da UNESCO. Publicou, em 2004, O Brasil pode ser um país de leitores? Política para a cultura, política para o livro, pela Summus Editorial. Mantêm o blogwww.oxisdoproblema.com.br

A coluna O X da questão traz reflexões sobre as peculiaridades e dificuldades da vida editorial nesse nosso país de dimensões continentais, sem bibliotecas e com uma rede de livrarias muito precária. Sob uma visão sociológica, este espaço analisa, entre outras coisas, as razões que impedem belos e substanciosos livros de chegarem às mãos dos leitores brasileiros na quantidade e preço que merecem.