Programa que viabiliza a OCR (Optical Character Reading - leitura óptica de caracteres) de um PDF.

Last update: Oct 11, 2021

Related tags

Overview

Este programa tem o intuito de ser um modificador de arquivos PDF. Os arquivos PDFs podem ser 3: PDFs verdadeiros - em que podem ser selecionados o tipo de texto, PDFs-de-imagem - arquivos feitos de imagens e que o conteúdo é "aprisionado" e não pode ser acessado. Como terceiro tipo temos o PDFs-buscáveis: estes são os PDFs que resultam de aplicação OCR (Optical Character Recognition - Reconhecimento óptico de caracter), em que o documento é analizado e estruturado com uma nova camada de texto por detrás da camada de imagem do PDF-de-Imagem.

A criação do terceiro tipo de PDF a partir do segundo tipo é o intuito deste programa. Para isto é necessário a aplicação de alguns programas externos ao python.

Abaixo listarei o processo que utilizei para instalar estes programas externos:

Além de ter o python instalado e um ambiente virtual iniciado, é necessário utilizar o comando pip: pip install ocrmypdf. Esta biblioteca é um conjunto de pacotes que atuará sobre o PDF.

Primeiro de tudo, caso seja usuário de windows, é necessário ter um administrador de pacotes chamado Chocolotey . Após ter instalado ele, é necessário escrever os seguintes comandos:

choco install --pre tesseract
choco install ghostscript

Para mais informações sobre esse processo, caso utilizar MacOS ou Linux, acesse aqui.

Programa que viabiliza a OCR (Optical Character Reading - leitura óptica de caracteres) de um PDF.

Related tags

Overview

Owner

Daniel Soares Saldanha

An Optical Character Recognition system using Pytesseract/Extracting data from Blood Pressure Reports.

Use Youdao OCR API to covert your clipboard image to text.

Rotational region detection based on Faster-RCNN.

Code for generating synthetic text images as described in "Synthetic Data for Text Localisation in Natural Images", Ankush Gupta, Andrea Vedaldi, Andrew Zisserman, CVPR 2016.

Handwritten Character Recognition using CNN

Corner-based Region Proposal Network

Page to PAGE Layout Analysis Tool

This is the code for our paper DAAIN: Detection of Anomalous and AdversarialInput using Normalizing Flows

Web interface for browsing arXiv papers

text detection mainly based on ctpn model in tensorflow, id card detect, connectionist text proposal network

Introduction to image processing, most used and popular functions of OpenCV

A tool to enhance your old/damaged pictures built using python & opencv.

Bu uygulamada Python ve Opencv kullanarak bilgisayar kamerasından yüz tespiti yapıyoruz.

[ICCV, 2021] Cloud Transformers: A Universal Approach To Point Cloud Processing Tasks

This is a pytorch re-implementation of EAST: An Efficient and Accurate Scene Text Detector.

A document scanner application for laptops/desktops developed using python, Tkinter and OpenCV.

Rest API Written In Python To Classify NSFW Images.

SemTorch

Binarize document images

learn how to use Gesture Control to change the volume of a computer