Página de Seraph

Extracción de información de PDFs con python (parte 3)

Posted on lun 12 octubre 2015 in Tutorial Python • Tagged with Canaima, Debian, Python, Ubuntu, pdf scraping • 5 min read

Continuando con los artículos de extracción de información de PDF con Python, en este caso como en los artículos anteriores el pdf ha utilizar es un reporte que tiene Cencoex en su página sobre la asignación de dolares para las empresas del sector salud (extracción de información de PDFs parte …

Extracción de información de PDFs con python (parte 2).

Posted on dom 30 agosto 2015 in Tutorial Python • Tagged with Debian, General, Python, pdf scraping • 4 min read

En el primer artículo de la serie se explicó el uso de peepdf, en este caso se utilizará pdfminer.

En el siguiente enlace consiguen un tutorial de como usarlo, u otro, y otro más.

El archivo a analizar será el mismo del artículo anterior el cual es un archivo de …

Extracción de información de PDFs con python (parte 1).

Posted on sáb 29 agosto 2015 in Tutorial Python • Tagged with Debian, General, Python, pdf scraping • 6 min read

Existen varias herramientas en python para obtener información de PDF. En este caso visite la página de Cencoex, en la sección de Cencoex en cifras hay un enlace a un pdf a Liquidaciones a Empresas Agremiadas del Sector Salud (Ordinarias + ALADI + SUCRE).

Para este primer artículo se usará pycurl para …