Ir para o conteúdo
ou

Thin logo

 Voltar a Blog metalogis
Tela cheia

gpdftext (extrai o texto do pdf), agora é aquele lixo sem...

24 de Junho de 2017, 18:37 , por metalogis - | No one following this article yet.
Visualizado 18 vezes


gpdftext (extrai o texto do pdf), agora é aquele lixo sem parágrafos, próximo passo é o libreoffice calc(!), duas ou três colunas para separar os parágrafos (essa é a parte triste, mas é melhor aqui que no writer, juro), mescla as linhas que compõe o parágrafo, desmescla, elimina as linhas em branco, repete, repete, repete…


Fonte: http://metalogis.tumblr.com/post/162213237086