Nota

O Fazendeiro que se transformo em bicho após a morte.

8 jun

O FAZENDEIRO QUE SE TRANSFORMOU EM BICHO APOS A MORTE
Autor Juvenal dos Santos
Pra escrever um poema
A mente tem que está boa
E enquanto a mão escreve
O pensamento já voa
Buscando o que é preciso
As palavras que utilizo
No lugar que a rima soa.

Pega ali ó juvenal-dos-santos-fazendeiro-mosntro

E em iso 8859-1 juvenal-dos-santos-fazendeiro-mosntro-iso-8859-1

Curiosidade nerd, esse texto foi usado para textar a capacidade de reconhecimento ocr com o tesseract. O procedimento usado fora, escanear o texto com o xsane em 150 dpi que foi a resolução minima, em testes, resoluções com mais de 600 dpi atrapalharam no reconhecimento, então optei por 150 dpi ao invés de 200 ou 300 , por questão de espaço e uma vez que o reconhecimento não mudou com boas resoluções. Depois de escaneado usei o frontend do tesseract um progama chamado gimagereader para reconhecimento do texto, que facilita bem o trabalho. Tive que corrigir o fonema “fi” ao invés de “fi” a letra latina. Também  a aspa ” por “. Depois de extraído e reconhecido o texto, optei por passar para pdf, para não perder a métrica da poesia. Usei o programa u2ps que converte de utf8 para postscript, embora o linux possua leitores tanto pdf como ps, optei por usar pdf por ser um formato aberto também, que me levou a uma segunda conversão usando o programa ps2pdf  que vem junto com o ghostscript. Não houve perca de dados. O Segundo arquivo foi convertido o texto de utf8 para iso-8859-1 usando o iconv e depois usei o a2ps que também oferece saída para pdf. Por fim podemos comparar os resultados. Todos esses são programas livres, e podem ser baixados, e instalados sem remorsos, no arquivo tem o contato com o autor.

Boa leitura.

Falæ