text-extraction

Java-Extraction de texte à partir d'un PDF à l'aide de l'OCR

J'ai un fichier pdf (une partie de celui-ci donnée ci-dessous), et je veux en extraire du texte. J'ai utilisé PDFTextStream, ... tre fichier, qui a du texte simple). Quelles autres bibliothèques OCR sont capables de le faire? Veuillez aider. Merci.

Extraction d'un bloc de mots intégré à partir d'un document Microsoft Word (docx) à l'aide de java

J'ai un document Word qui contient plusieurs objets OLE(MS word,Excel,PowerPoint et Word Pad) MS word expose tous les autres ... es API Java pour extraire ou s'il est possible d'écrire du code personnalisé par moi-même pour convertir ces fichiers en RTF.

Java-Estrazione di testo da PDF utilizzando OCR

Ho un file pdf (una parte di esso riportata di seguito) e voglio estrarre il testo da esso. Ho usato PDFTextStream, ma non fu ... tro file, che ha un testo semplice). Quali altre librerie OCR sono in grado di farlo? Per favore Aiuto. Ringraziamento.

Estrazione di word pad incorporato dal documento Microsoft Word (docx) utilizzando java

Ho un documento Word che ha più oggetti OLE incorporati in esso(MS word,Excel,PowerPoint e Word Pad) MS word espone tutti gli ... ile con le API Java da estrarre o se è possibile scrivere un codice personalizzato da solo per convertire questi file in RTF.