Donnerstag, 24. Mai 2012


News

Mittwoch, 4. März 2009 | News

PDFlib TET 3 veröffentlicht

(Link zum Artikel: http://www.entwickler.de/php//047655)
  • Teilen
  • kommentieren
  • empfehlen
  • Bookmark and Share

Das Text Extraction Toolkit (TET) der PDFlib-Software-Suite wurde in der Version 3 veröffentlicht. Zu den neuen Features gehören unter anderem die Möglichkeit, Bilder aus PDF-Dateien zu extrahieren (inkl. geometrischer Angaben), eine überarbeitete Seitenanalyse (die noch besser mit mehrspaltigem Layout und Tabellen zurecht kommen soll) sowie verschiedene Connectoren für unter anderem Solr, Lucene oder auch MediaWiki.

Darüber hinaus steht für extrahierte Inhalte jetzt mit TETML ein an XML angelehntes Ausgabeformat zur Verfügung, das wiederum per XSLT-Stylesheets in weitere Formate übertragen werden können soll.

Ausführliche Details zu allen Neuerungen können Sie hier der offiziellen Releaseankündigung entnehmen.

PDFlib TET 3 ist für Windows Server 2000/2003/2008, Apple Mac OS X Server und Linux, sowie für Windows 2000/XP/Vista und Mac OS verfügbar; auf Anfrage ebenso auch für Sun Solaris, IBM AIX und HP-UX. Die Preise bewegen sich zwischen 795 Euro für die Serverversionen und 159 Euro für die Standardversionen.

(rl)

Kommentare

Folgende Links könnten Sie auch interessieren