extraction

Comment extraire des données d'un fichier PDF tout en gardant une trace de sa structure?

Mon objectif est d'extraire le texte et les images d'un fichier PDF tout en analysant sa structure. La portée de l'analyse de ... succès le HTML. Convertir PDF en XML. Même que ci-dessus. Quelqu'un a des suggestions sur la façon de résoudre ce problème?

Comment extraire le code source d'un *.fichier jar sur un Mac?

Je suis très confus. J'ai téléchargé un *.fichier jar comme un peu de logiciel. Donc, je voudrais extraire le code source pou ... te standard. Peut-être que ce n'est pas un logiciel open source? Est-il une autre solution pour voir ce qui a été fait ici?

Comment extraire des fichiers OLE intégrés au bureau sous Linux, Nativly (Python,C,Java)?

J'essaie d'extraire des documents Excel intégrés dans le document Word en tant qu'OLE, mais son échec est difficile. Je dois ... ffice est très gourmand en ressources .. Existe - t-il un outil ou des bibliothèques pour le faire ? S'il vous plaît aider..

Extraire des champs de données particuliers d'un document numérisé en java

Comment extraire des champs de données particuliers d'un document numérisé en java ? par exemple: dans un document numérisé, ... ant,nous devons récupérer les valeurs ABC, XYZ et copier dans nos variables java. S'il vous plaît aidez-moi à travers ce.

Come estrarre i dati da un file PDF tenendo traccia della sua struttura?

Il mio obiettivo è quello di estrarre il testo e le immagini da un file PDF durante l'analisi della sua struttura. L'ambito p ... orrettamente l'HTML. Convertire PDF in XML. Come sopra. Qualcuno ha qualche suggerimento su come affrontare questo problema?

Come estrarre il codice sorgente da un *.file jar su un Mac?

Sono molto confuso. Ho scaricato un *.file jar come un po ' di software. Quindi, vorrei estrarre il codice sorgente per guard ... editor di testo standard. Forse questo non è un software open source? C'è un'alternativa per vedere cosa è stato fatto qui?

Come estrarre i file OLE embedded di Office sotto Linux, Nativly (Python,C,Java)?

Sto cercando di estrarre documenti Excel incorporati nel documento Word come OLE ma non funziona. Ho bisogno di metterlo nel ... E automatizzare Open Office è molto affamato di risorse .. C'è qualche strumento o libreria per farlo ? Per favore, aiuto..

Estrarre particolari campi di dati da un documento scansionato in java

Come estrarre particolari campi di dati da un documento scansionato in java ? ad esempio: in un documento scansionato, ci so ... Place : XYZ Ora dobbiamo recuperare i valori ABC, XYZ e copiare nelle nostre variabili java. Ti prego, aiutami.