DSTK - Data Science Toolkit 3 to zestaw oprogramowania do eksploracji danych i tekstu, zgodnie z modelem CRISP DM. DSTK oferuje zrozumienie danych za pomocą analizy statystycznej i tekstowej, przygotowanie danych z wykorzystaniem normalizacji i przetwarzania tekstu, modelowania i oceny dla uczenia maszynowego i algorytmów uczenia statystycznego.
DSTK 3 oferuje atrakcyjne funkcje, takie jak Deep Neural Network (Deep Learning), Text Link Analysis z wizualizacjami, klastry KMeans. Niektóre z tych funkcji mogą być prezentowane w starszej wersji, ale ponieważ algorytmy zostały przepisane w celu ograniczenia wykorzystania zewnętrznych bibliotek, takich jak Weka, w celu zmniejszenia rozmiaru pliku, potrzebujemy więcej czasu na ich opracowanie. DSTK Engine jest wciąż w fazie beta, dlatego mogą występować błędy i nieścisłości.
DSTK 3 składa się z DSTK Engine, DSTK ScriptWriter, DSTK Studio i DSTK Text Explorer. DSTK Engine jest uproszczony w R, koncentrując się na Data Mining. DSTK ScriptWriter oferuje GUI do pisania skryptów dla DSTK Engine. DSTK Studio oferuje SPSS Statistics, takie jak GUI dla eksploracji danych, a DSTK Text Explorer oferuje GUI dla Text Mining.
Wymagania :
Java Runtime Environment, Microsoft. Net Framework
Ograniczenia :
10-użyj wersji próbnej
Komentarze nie znaleziono