Apache parkiet to "kolumnowy" format przechowywania danych, który został specjalnie stworzony dla Apache Hadoop rodzina projektów.
Parkiet jest zalecany do stosowania z dużych danych, głównie dlatego, że wykorzystuje złożony system kompresji danych, opierając się na szeregu zoptymalizowanych algorytmów rekord rozdrabniania i ponownego montażu.
Pozwala to dane, które mają być przedstawione w podziale, zorganizowany w zagnieżdżonych formacie, i ponownie, gdy zapytaliśmy.
Format Pokrycia mogą być również stosowane poza ekosystemu Hadoop, jest zaprojektowana jako co agnostic jak to możliwe, we współpracy z każdego rodzaju ramach przetwarzania danych i modelu przechowywania danych.
< strong> Co nowego w tym wydaniu:
- Zmień nazwę pakiety i Maven współrzędne org.apache
- Dodaj statystyk kodowania do ColumnMetaData li>
- Streaming zapobiegliwości API
- Nowe typy logiczne
Co nowego w wersji 2.3.0:
- Zmień nazwę pakiety i Maven współrzędne org.apache
- Dodaj statystyk kodowania do ColumnMetaData li>
- Streaming zapobiegliwości API
- Nowe typy logiczne
Ograniczenia :
- projekt jest wciąż w fazie rozwoju w repozytorium Apache Incubator i może zmienić się drastycznie od wersji wersji.
Komentarze nie znaleziono