Gracias Rui Pinto (Rapinto)
COBOL Foro
Foro dedicado a COBOL, a la Programación y a la Informática.
Retroceder   COBOL Foro > IDE-s y compiladores COBOL > Fujitsu COBOL > PowerCOBOL (ActiveX, v4 - v11)
PowerCOBOL (ActiveX, v4 - v11) Versiones del IDE basadas en ActiveX
Comunicados
Otros temas que te pueden interesar
Tema Autor Foro Respuestas Último post
[Información] Creando PDF desde RMCOBOL85 JSVCOBOLERO RM/COBOL 4 25 de abril de 2020 02:28
[Información] Generar fichero PDF desde cobol Irene AcuCobol 6 15 de marzo de 2018 11:24
[Sintaxis] Leer archivos Cobol desde VB6 drvedia1981 PowerCOBOL V3L10 (Win32) 8 30 de enero de 2018 23:53
[Información] Leer puerto RS232 desde PowerCobol v9 Jovimabo PowerCOBOL (ActiveX, v4 - v11) 13 18 de octubre de 2016 15:00
[Información] Leer y llenar archivos PDF lfortuny PowerCOBOL (ActiveX, v4 - v11) 12 24 de abril de 2016 18:36
Respuesta
 
Herramientas

  #1
Antiguo 28 de marzo de 2021, 15:45
IDENTIFICATION DIVISION
dmosca
Novato Junior
ENVIRONMENT DIVISION
Avatar de dmosca
DATA DIVISION
Forero desde (Registrado)marzo 2017
Argentina
Ubicación Mendoza
Última Actividad19.04.2021 22:12
PROCEDURE DIVISION
PostsPosts: 67
Ha dicho GraciasEnviado: 32
Ha recibido agradecimientosRecibido: 4
Mejores respuestasSoluiones: 1
ReputaciónReputación: 5
dmosca is an unknown quantity at this point
Predeterminado leer informacion desde un pdf.

Buen dia

tengo facturas de proveedores en archivos pdf, necesito leer información que contienen los pdf.
Ej: datos del emisor, número de orden de compra, importes.
se puede desde Powercobol V9?

muchas gracias.
dmosca no ha iniciado sesión   Responder Con Cita
  #2
Antiguo 28 de marzo de 2021, 19:28
IDENTIFICATION DIVISION
Joseg
Forero
Innovación: Por aportar innovaciones - Razón: Por aportar soluciones innovadoras en varias ocasiones 
ENVIRONMENT DIVISION
Avatar de Joseg
DATA DIVISION
Forero desde (Registrado)abril 2015
Portugal
Última Actividad20.04.2021 09:20
PROCEDURE DIVISION
PostsPosts: 206
Ha dicho GraciasEnviado: 47
Ha recibido agradecimientosRecibido: 83
Mejores respuestasSoluiones: 12
ReputaciónReputación: 15
Joseg has a spectacular aura about Joseg has a spectacular aura about Joseg has a spectacular aura about Joseg has a spectacular aura about Joseg has a spectacular aura about Joseg has a spectacular aura about Joseg has a spectacular aura about
Predeterminado

Recomendo:
GitHub - tesseract-ocr/tesseract: Tesseract Open Source OCR Engine (main repository)

Binários, recomendo a versão 4.1.1
Index of /tesseract

Por command line funciona muito bem com o Powercobol
Command Line Usage | tessdoc

ex:

Código COBOL:
  1.   INVOKE pow-self "Execute" USING "tesseract imagename outputbase"

ver tb:
https://erik.joling.me/2019/03/09/co...ocr-on-ubuntu/
Joseg no ha iniciado sesión   Responder Con Cita
Ha dicho Gracias : 1
dmosca (29 de marzo de 2021)
  #3
Antiguo 31 de marzo de 2021, 17:21
IDENTIFICATION DIVISION
dmosca
Novato Junior
ENVIRONMENT DIVISION
Avatar de dmosca
DATA DIVISION
Forero desde (Registrado)marzo 2017
Argentina
Ubicación Mendoza
Última Actividad19.04.2021 22:12
PROCEDURE DIVISION
PostsPosts: 67
Ha dicho GraciasEnviado: 32
Ha recibido agradecimientosRecibido: 4
Mejores respuestasSoluiones: 1
ReputaciónReputación: 5
dmosca is an unknown quantity at this point
Predeterminado

Estimados

estuve viendo lo que dice JOSEG, pero es para archivos jpg, aclara que no lee pdf.
estamos trabajando con legajos digitales y todos los archivos estan en pdf, no puedo pasar todo a imagen...
alguna otra opción?
dmosca no ha iniciado sesión   Responder Con Cita
  #4
Antiguo 1 de abril de 2021, 09:37
IDENTIFICATION DIVISION
Joseg
Forero
Innovación: Por aportar innovaciones - Razón: Por aportar soluciones innovadoras en varias ocasiones 
ENVIRONMENT DIVISION
Avatar de Joseg
DATA DIVISION
Forero desde (Registrado)abril 2015
Portugal
Última Actividad20.04.2021 09:20
PROCEDURE DIVISION
PostsPosts: 206
Ha dicho GraciasEnviado: 47
Ha recibido agradecimientosRecibido: 83
Mejores respuestasSoluiones: 12
ReputaciónReputación: 15
Joseg has a spectacular aura about Joseg has a spectacular aura about Joseg has a spectacular aura about Joseg has a spectacular aura about Joseg has a spectacular aura about Joseg has a spectacular aura about Joseg has a spectacular aura about
Predeterminado

Cita del post de dmosca Ver Mensaje
Estimados

estuve viendo lo que dice JOSEG, pero es para archivos jpg, aclara que no lee pdf.
estamos trabajando con legajos digitales y todos los archivos estan en pdf, no puedo pasar todo a imagen...
alguna otra opción?
Ahh ok,

Se for apenas para extrair texto, há muitas ferramentas gratuitas.
Por exemplo: GitHub - jamalmazrui/PDF2TXT: Batch convert PDF files to text under Windows, using several text extraction methods or OCR

ou procurar no google
"free command line windows pdf to text"

Também existem vários OCX pagos que fazem o mesmo.
Joseg no ha iniciado sesión   Responder Con Cita
Ha dicho Gracias : 1
Kuk ( 3 de abril de 2021)
Respuesta


Usuarios activos actualmente viendo este tema: 1 (0 miembros y 1 visitantes)
 
Herramientas

Derechos de Publicación
No puedes publicar nuevos temas
No puedes publicar posts/responder
No puedes adjuntar archivos
No puedes editar tus posts

BB code is habilitado
Las caritas están habilitado
Código [IMG] está habilitado
Código HTML está deshabilitado



La franja horaria es GMT +1. Ahora son las 06:02.
Powered by: vBulletin, Versión 3.8.7
Derechos de Autor ©2000 - 2021, Jelsoft Enterprises Ltd.