DocToText - DocToText - Un outil d'extraction de données bien adapté aux projets d'extraction de données à petite et grande échelle. Ce logiciel convertit une grande variété de fichiers en texte brut et HTML.
DocToText est doté de capacités OCR et d'analyse des e-mails de haute qualité, scriptables et entraînables.
Formats inclus :
DOC, XLS, XLSB, PPT, RTF, ODF (ODT, ODS, ODP),
OOXML (DOCX, XLSX, PPTX), iWork (PAGES, NUMBERS, KEYNOTE),
ODFXML (FODP, FODS, FODT), PDF, EML, HTML, Outlook (PST, OST),
Image (JPG, JPEG, JFIF, BMP, PNM, PNG, TIFF, WEBP) | AI-U.com