Script_Convertir_PDF_IMG_TXT

Este script de pyhton convierte un pdf en Imagen luego utilizando tesseract como motor OCR convierte la Imagen a Texto.

  1. pip install PyMuPDF

  2. pip install Pillow

  3. pip install pytesseract

  4. pip install pdf2image

  5. Instalar Tesseract Motor OCR https://github.com/UB-Mannheim/tesseract/wiki

Abrir ruta del Script Python y darle : py pdfToIMG.py

Saludos ?

GitHub

View Github