Tesseract

Tesseract

Tesseract.js est une bibliothèque javascript qui obtient des mots dans presque toutes les langues des images.
Tesseract.js est une bibliothèque javascript qui obtient des mots dans presque toutes les langues des images.Le moteur OCR Tesseract était l'un des 3 meilleurs moteurs du test de précision UNLV de 1995.Entre 1995 et 2006, il n'y a eu que peu de travail, mais c'est probablement l'un des moteurs OCR open source les plus précis disponibles.Le code source lira une image binaire, grise ou couleur et affichera le texte.Un lecteur tiff est intégré pour lire les images TIFF non compressées, ou libtiff peut être ajouté pour lire les images compressées.Il existe des fichiers de langue pour de nombreuses langues, même pour le texte défini dans les polices Fraktur et blackletter ....
tesseract

Les catégories

Alternatives à Tesseract pour Linux

GImageReader

GImageReader

gImageReader est un simple frontal Gtk / Qt pour le moteur OCR Tesseract.Caractéristiques: - Importez des documents PDF et des images à partir du disque, des périphériques de numérisation, du presse-papiers et des captures d'écran
CuneiForm

CuneiForm

CuneiForm (OpenOCR) est un logiciel de reconnaissance de texte pour les modèles imprimés.Manuscrits ou fichiers PDF, le programme ne reconnaît cependant pas les structures de table.
CopyFish

CopyFish

Extraire et traduire du texte à partir d'images / vidéos / PDF sur n'importe quel site Web.
OCRFeeder

OCRFeeder

OCRFeeder est un système d'analyse de mise en page de documents et de reconnaissance optique de caractères.
GOCR

GOCR

GOCR est un programme OCR (Optical Character Recognition), développé sous la licence publique GNU.Il convertit les images numérisées de texte en fichiers texte.
OCRopus

OCRopus

OCRopus (tm) est un système d'analyse de documents et d'OCR à la pointe de la technologie, comprenant une analyse de mise en page enfichable, une reconnaissance de caractères enfichable, une modélisation statistique du langage naturel ...
VietOCR

VietOCR

Interface graphique Java / .NET pour le moteur OCR Tesseract.Prend en charge la reconnaissance optique des caractères pour la langue vietnamienne.
OCRmyPDF

OCRmyPDF

OCRmyPDF ajoute une couche de texte OCR aux fichiers PDF numérisés, leur permettant d'être recherchés ou copiés-collés.
WatchOCR

WatchOCR

WatchOCR est un serveur OCR open source qui crée des fichiers PDF consultables à partir d'images dans un dossier surveillé.
YAGF

YAGF

YAGF, Yet Another Graphic Front-end for CuneiForm, est une interface graphique pour ...