Bibliothèques de Reconnaissance d'entités nommées pour Java [fermé]


Je cherche une bibliothèque (et un dictionnaire) de reconnaissance d'entité nommée simple mais "assez bonne" pour java, je cherche à traiter les e-mails et les documents et à extraire des "informations de base" comme: Noms, lieux, Adresse et dates

J'ai regardé autour de moi, et la plupart semble être du côté lourd et plein de projets de type PNL.

Des recommandations ?

Author: webclimber, 2008-10-09

4 answers

Vous voudrez peut-être jeter un oeil à l'une de mes réponses précédentes à un problème similaire.

En dehors de cela, la plupart des systèmes NER plus légers dépendent beaucoup du domaine utilisé. Vous trouverez de nombreux outils et articles sur les systèmes biomédicaux NER, par exemple. En plus de mon post précédent (qui contient déjà ma recommandation principale si vous voulez faire NER), voici quelques autres outils que vous voudrez peut-être examiner:

  • Le Stanford CER-NER
  • Le Postech Biomédicale TNS Système si vous êtes intéressé à ce domaine particulier
  • OpenCalais semble être un système commercial. Il existe des wrappers UIMA pour OpenCalais mais ils semblent datés. Il existe également un annotateur Contextuel basé sur un dictionnaire pour UIMA qui peut vous aider. Sachez que l'UIMA implique une surcharge importante dans la courbe d'apprentissage; -)
  • OpenNLP a également un outil NER.
  • Balie ne NER, aussi, entre autres chose.
  • ABNER fait NER, mais encore une fois il se concentre sur le domaine biomédical.
  • LesOutils de laboratoire JULIE de l'université d'Iéna, en Allemagne, font également NER. Ils ont des versions autonomes et des moteurs d'analyse UIMA.

Une remarque supplémentaire: vous ne vous en tirerez pas sans tokenisation sur l'entrée. La tokenisation du langage naturel est légèrement non triviale, c'est pourquoi je vous suggère d'utiliser une boîte à outils qui fait les deux pour vous.

 22
Author: Aleksandar Dimitrov, 2017-05-23 12:17:33

BTW, j'ai récemment rencontréOpenCalais qui semble avoir la fonctionnalité dont je m'occupais.

 1
Author: webclimber, 2008-12-23 21:15:22

Vous pouvez également essayer Alchemy API. C'est similaire à Ouvrir Calais.

 0
Author: Arun R, 2011-04-27 20:42:32

Pour la PNL de grammaire que vous pouvez vérifier http://code.google.com/p/graph-expression/ et http://gate.ac.uk/

 0
Author: yura, 2011-04-28 07:06:17