Comment rendre le Texte PDF existant Consultable à l'aide d'une Bibliothèque Java? Avec OCR


Une bibliothèque java? Comment faire du texte consultable en utilisant n'importe quelle bibliothèque java? Open source ou payant.

Comment appliquer l'OCR au pdf en utilisant PDFBox? comment rendre le texte pdf consultable par programme en utilisant pdfbox J'ai cherché beaucoup. N'ai pas trouvé de solution. Quelqu'un peut-il coller du code pour OCR PDFBox.

Author: Paresh3489227, 2014-04-04

2 answers

Essayez Apache PDFBox.

Pour extraire du texte: Textextraction.

 0
Author: Jean Logeart, 2014-04-04 12:24:44

Toute bibliothèque java? Comment faire du texte consultable en utilisant n'importe quelle bibliothèque java? Open source ou payant.

Vous pouvez y parvenir en utilisant Gnostice XtremeDocumentStudio pour Java. Pour plus de détails, suivez le lien ci-dessous.

Http://www.gnostice.com/nl_article.asp?id=289&t=How_to_convert_scanned_images_to_searchable_PDF_in_Java

Pour INFO, dans l'article, nous avons démontré comment convertir une image numérisée en PDF consultable. En fait, l'entrée peut être scanné document (images, PDF ou DOCX).

Avertissement: Je travaille pour Gnostice.

 0
Author: Santhanam, 2015-04-30 13:22:22