PDFTextStream

Screenshot Software:
PDFTextStream
Szczegóły programowe:
Wersja: 2.6.0
Filmu: 20 Feb 15
Licencja: Shareware
Cena: 1900.00 $
Popularność: 2

Rating: nan/5 (Total Votes: 0)

Projekt PDFTextStream jest tekst w formacie PDF i metadane dostępne dla biblioteki ekstrakcji, Python, Java i .NET.
Obsługuje wszystkie wersje specyfikacji dokumentu PDF (w tym v1.6, używane przez Acrobat 7), ekstrakcja tekstu zakodowanego przy użyciu zestawów znaków dwubajtowych (w tym chiński, japoński i koreański), deszyfrowania 40-bit i 128- bitowe szyfrowane dokumenty i wydobycie wszystkich metadanych dokumentów dostarczonych przez dokumenty PDF (w tym dane z formularzy, zakładki i adnotacje).
Łatwa integracja z Jakarta Lucene jest wliczone

Co nowego w tym wydaniu:.

  • Ta wersja zawiera wiele poprawek wykonany w celu zapewnienia PDFTextStream jest w stanie wyciągnąć tekst z dokumentów w formacie PDF, które są na niezgodność ze specyfikacją PDF.
  • zawiera również szereg ulepszeń wydajności.

Co nowego w wersji 2.3.0:

  • Dodano metodę .isStruckThrough () do com. snowtide.pdf.TextUnit, ze wskazaniem, czy postać ma przekreślenie narysowany przez niego.
  • Ulepszone wsparcie dla wbudowanych PDFTextStream mapowania znaków.
  • obliczenie spacji między słowami została ustalona prawidłowo stanowią spacji, która jest wyraźnie zakodowanego w dokumentach źródła PDF.
  • Ulepszona obsługa PDFTextStream za kompozytowych kodowania zawartości, które wcześniej mogły nie wynikające w niektórych zakresach zawartości PDF są "ignorowane" podczas ekstrakcji.
  • Naprawiono błąd w VisualOutputTarget gdzie tekst z jednej linii będzie podzielony na wiele linii
  • Zwiększona pionowe wyrównanie tekstu uzyskiwane przy użyciu VisualOutputTarget
  • Lepsze VisualOutputTarget produkcji ekstraktów, aby wyeliminować fałszywe dodatkowe spacje pomiędzy ściśle przylegającymi słów

Co nowego w wersji 2.2.5:

  • W tej wersji dodano wsparcie dla wydobycia XFA formularze danych, jak XML.
  • To znacznie poprawia wydajność ekstrakcji tekstu przy użyciu VisualOutputTarget. Wsparcie dla dokumentów PDF większych niż 2 GB.
  • poprawka dla błędu gdzie kodowania z osadzonych czcionek Type1 nie były wcześniej stosowane właściwie w pewnych okolicznościach.
  • poprawka dla problemu, gdzie nowsze zawartość w zaktualizowanych dokumentów PDF niekiedy są ignorowane.
  • poprawka dla problemu, gdzie PDFDocEncoding zakodowane zakładki i metadane nie są prawidłowo dekodowane.
  • .getDestinationName () metoda com.snowtide.pdf.Bookmark.

Wymagania :

  • Apache Lucene

Komentarze do PDFTextStream

Komentarze nie znaleziono
Dodaj komentarz
Włącz zdjęć!