DKPro Core jest oprogramowanie open source napisany w języku programowania Java i zaprojektowane jako zbiór aplikacji do przetwarzania języka naturalnego (NLP).
Wśród niektórych funkcjonalności dostarczanej przez komponenty DKPro rdzenia, możemy wspomnieć, atomizacja, segmentacja, podział związek, wynikający, lemmatization, część-of-speech tagging, analizy morfologicznej, składniowej parsowania, zależności parsowania, rozdzielczość coreference, identyfikacji języka, korektą pisowni, i sprawdzania gramatyki.
Jest oparte na ramach Apache UIMA, DKPro Rdzeń Projekt został pierwotnie opracowany przez Laboratorium Przetwarzania Wszechobecne Knowledge (UKP) w Technische Universit & auml; t Darmstadt, Niemcy.
DKPro Rdzeń jest rozprowadzany jako oddzielnych edycjach, DKPro rdzeniowy GPL DKPro rdzeniowy ASL, licencjonowanych w ramach GPLv3 Apache Software License i. Każde wydanie zawiera inny zestaw funkcji
Co nowego w tym wydaniu:.
- Nowe moduły API
- api.phonetics - typy adnotacji na poziomie fonetycznym,
- api.semantics - typy adnotacji do informacji semantycznych (semantyczne pola i semantyczne znakowanie rola)
- Nowe moduły I / O,
- io.conll - Reader i pisarz dla formatu CONLL 2006
- io.tcf - Czytnik i pisarz formatu CLARIN TCF
- io.tgrep - Pisarz dla TGrep2 korpusie plików
- io.tiger - czytnik formatu Tiger XML
- Nowe moduły analizy
- commonscodec - transkrypcja fonetyczna w oparciu o biblioteki Apache Commons Codec
- decompounding - Elastyczny zestaw komponentów do decompounding, oparte na różnych algorytmów dzielenia i rankingu
- kolega-tools - Owijarki za apartament kolega-tools
- morpha - Owijarki do Stemmer morpha / lemmatizer
- mstparser - Owijarki do mstparser
- sfst - Nowy moduł SFST analizatorów morfologicznych oparte
- umlautnormalizer - Normalizer dla umlautów w tekstach niemieckich (ASL),
- Inne nowości w tym wydaniu to:
- Dodano wsparcie dla rozwiązywania modeli ze zdalnych repozytoriów w czasie wykonywania
- DodaneTypeCapabilities adnotacje oświadczenie, które adnotacje że zużycie i produkcja
- Dodane generowane automatycznie deskryptory XML dla elementów UIMA (przez uimafit-maven-plugin)
- Dodano wsparcie dla ClearNLP semantyczna Rola oznakowania
- Dodano wsparcie dla GATE Hepple POS Tagger
- Dodano wsparcie dla OpenNLP parsera i nazwa wyszukiwarki,
- Aktualizacja do Apache uimaFIT 2.0.0
- Aktualizacja do Apache UIMA 2.4.2
- Aktualizacja do ArkTweet-NLP 0.3.2
- Aktualizacja do ClearNLP 1.3.1
- Aktualizacja do CoreNLP 3.2.0
- Aktualizacja do BRAMY 7.1
- Aktualizacja do jweb1t 1.3.0
- Aktualizacja do LanguageTool 2.2
- Aktualizacja do Maltparser 1.7.2
- Aktualizacja do Mate-Tools anna 3.5
- Aktualizacja do OpenNLP 1.5.3
- Niektóre moduły są już nie utrzymuje i nie zostały uznane obsługi dla ogółu społeczeństwa, na przykład Moduł io.mmax2 i module io.wsdl. Zostały one na emeryturze i nie są uwzględnione w tej wersji.
- Po aktualizacji, należy pamiętać, że nie powinno się mieszać różne wersje składników DKPro podstawowych w swoich projektach. - Nie mogą być ze sobą zgodne,
Wymagania :
- Java 2 Standard Edition Runtime Environment,
Komentarze nie znaleziono