Apache Hive został opracowany jako Apache Hadoop sub-projektu dla zapewnienia administratorów Hadoop z łatwym w użyciu, sprawny język zapytań do swoich danych.
Z tego powodu, Hive został opracowany od początku do pracy z ogromną ilością informacji dla każdego zapytania i jest doskonale przystosowane do dużych baz danych skalę i środowisk biznesowych.
Narzędzia są włączone do łatwego załadunku, wydobywania i przekształcania danych, podczas gdy struktury danych mogą być na zamówienie narzucony szerokiego zestawu formatów danych.
Ponieważ jest to związane z Hadoop Project HDFS i HBase projekty są automatycznie obsługiwane.
HiveQL jest prawdopodobnie najlepszą częścią projektu, zapewniając proste, innowacyjne i efektywne język zapytań, a jednocześnie jest w stanie poradzić sobie z twórców map i reduktory w sytuacjach, gdy składnia SQL Native nie może uzyskać pożądany danych.
Co nowego w tym wydaniu:
- Wsparcie nieskorelowane podzapytania w klauzuli WHERE
- Dodaj NULL definiowane jako wiosłować specyfikacji formatu
- w bazie Ccreate / spadek powinien wypełnić wejść / wyjść i sprawdzić, współbieżność i zgody użytkownika,
- Wsparcie określające skalę i precyzja z rodzaju Hive dziesiętnych
- Niech będzie Tez
- Funkcja, która zawiera pozycję elementu w tablicy wybuchnąć
- Dodaj char typ danych
- Tworzenie zebrać UDF i zrobić oceniającego wielokrotnego użytku,
- Rozszerz interfejsy rekord pisarz i ORC odczytu / zapisu, aby zapewnić statystyk
- Wdrożenie statystyki świadczące pisarza i czytelnika ORC interfejsy
- Opisywanie ula drzewo operatora ze statystyk metastore
- statystyk kolumn poziomu pasek w ORC
- Wsparcie podzapytania: uniemożliwić zagnieżdżenie Podzapytania
- Wsparcie podzapytania: pozwalają wyrażeń podzapytania w klauzuli HAVING
- podzapytanie wsparcia: więcej testów,
- Język parkiet Wsparcie w Ulu,
- Hive powinien być w stanie przejść wierszy nagłówka i stopki podczas czytania pliku danych dla tabeli
- Dodaj daty, znacznika czasu, po przecinku, CHAR, VARCHAR obsługują typy w HCat
- Wykorzystanie map dołącz podpowiedź buforować wynik pośredni
- Dodaj UDF do obliczenia odległości pomiędzy współrzędnymi geograficznymi,
Co nowego w wersji 1.2.0:
- Wsparcie nieskorelowane podzapytania w klauzuli WHERE
- Dodaj NULL definiowane jako wiosłować specyfikacji formatu
- w bazie Ccreate / spadek powinien wypełnić wejść / wyjść i sprawdzić, współbieżność i zgody użytkownika,
- Wsparcie określające skalę i precyzja z rodzaju Hive dziesiętnych
- Niech będzie Tez
- Funkcja, która zawiera pozycję elementu w tablicy wybuchnąć
- Dodaj char typ danych
- Tworzenie zebrać UDF i zrobić oceniającego wielokrotnego użytku,
- Rozszerz interfejsy rekord pisarz i ORC odczytu / zapisu, aby zapewnić statystyk
- Wdrożenie statystyki świadczące pisarza i czytelnika ORC interfejsy
- Opisywanie ula drzewo operatora ze statystyk metastore
- statystyk kolumn poziomu pasek w ORC
- Wsparcie podzapytania: uniemożliwić zagnieżdżenie Podzapytania
- Wsparcie podzapytania: pozwalają wyrażeń podzapytania w klauzuli HAVING
- podzapytanie wsparcia: więcej testów,
- Język parkiet Wsparcie w Ulu,
- Hive powinien być w stanie przejść wierszy nagłówka i stopki podczas czytania pliku danych dla tabeli
- Dodaj daty, znacznika czasu, po przecinku, CHAR, VARCHAR obsługują typy w HCat
- Wykorzystanie map dołącz podpowiedź buforować wynik pośredni
- Dodaj UDF do obliczenia odległości pomiędzy współrzędnymi geograficznymi,
Co nowego w wersji 1.1.0:
- Wsparcie nieskorelowane podzapytania w klauzuli WHERE
- Dodaj NULL definiowane jako wiosłować specyfikacji formatu
- w bazie Ccreate / spadek powinien wypełnić wejść / wyjść i sprawdzić, współbieżność i zgody użytkownika,
- Wsparcie określające skalę i precyzja z rodzaju Hive dziesiętnych
- Niech będzie Tez
- Funkcja, która zawiera pozycję elementu w tablicy wybuchnąć
- Dodaj char typ danych
- Tworzenie zebrać UDF i zrobić oceniającego wielokrotnego użytku,
- Rozszerz interfejsy rekord pisarz i ORC odczytu / zapisu, aby zapewnić statystyk
- Wdrożenie statystyki świadczące pisarza i czytelnika ORC interfejsy
- Opisywanie ula drzewo operatora ze statystyk metastore
- statystyk kolumn poziomu pasek w ORC
- Wsparcie podzapytania: uniemożliwić zagnieżdżenie Podzapytania
- Wsparcie podzapytania: pozwalają wyrażeń podzapytania w klauzuli HAVING
- podzapytanie wsparcia: więcej testów,
- Język parkiet Wsparcie w Ulu,
- Hive powinien być w stanie przejść wierszy nagłówka i stopki podczas czytania pliku danych dla tabeli
- Dodaj daty, znacznika czasu, po przecinku, CHAR, VARCHAR obsługują typy w HCat
- Wykorzystanie map dołącz podpowiedź buforować wynik pośredni
- Dodaj UDF do obliczenia odległości pomiędzy współrzędnymi geograficznymi,
Co nowego w wersji 1.0.0:
- Wsparcie nieskorelowane podzapytania w klauzuli WHERE
- Dodaj NULL definiowane jako wiosłować specyfikacji formatu
- w bazie Ccreate / spadek powinien wypełnić wejść / wyjść i sprawdzić, współbieżność i zgody użytkownika,
- Wsparcie określające skalę i precyzja z rodzaju Hive dziesiętnych
- Niech będzie Tez
- Funkcja, która zawiera pozycję elementu w tablicy wybuchnąć
- Dodaj char typ danych
- Tworzenie zebrać UDF i zrobić oceniającego wielokrotnego użytku,
- Rozszerz interfejsy rekord pisarz i ORC odczytu / zapisu, aby zapewnić statystyk
- Wdrożenie statystyki świadczące pisarza i czytelnika ORC interfejsy
- Opisywanie ula drzewo operatora ze statystyk metastore
- statystyk kolumn poziomu pasek w ORC
- Wsparcie podzapytania: uniemożliwić zagnieżdżenie Podzapytania
- Wsparcie podzapytania: pozwalają wyrażeń podzapytania w klauzuli HAVING
- podzapytanie wsparcia: więcej testów,
- Język parkiet Wsparcie w Ulu,
- Hive powinien być w stanie przejść wierszy nagłówka i stopki podczas czytania pliku danych dla tabeli
- Dodaj daty, znacznika czasu, po przecinku, CHAR, VARCHAR obsługują typy w HCat
- Wykorzystanie map dołącz podpowiedź buforować wynik pośredni
- Dodaj UDF do obliczenia odległości pomiędzy współrzędnymi geograficznymi,
Co nowego w wersji 0.8.1:
- Narzędzia, aby umożliwić łatwy wyciąg danych / przekształcenie / obciążenia (ETL).
- Mechanizm do nakładania struktury na różnych formatów danych.
- Dostęp do plików zapisanych bezpośrednio w Apache HDFS (TM) lub w innych systemach przechowywania danych, takich jak Apache HBase (TM).
- wykonywanie zapytań poprzez MapReduce.
Co nowego w wersji 0.8.0:
- Narzędzia, aby umożliwić łatwy wyciąg danych / przekształcenie / obciążenia (ETL),
- Mechanizm do nakładania struktury na różnych formatów danych
- Dostęp do plików zapisanych bezpośrednio w Apache HDFS (TM) lub w innych systemach przechowywania danych, takich jak Apache HBase (TM)
- wykonywanie zapytań poprzez MapReduce
Co nowego w wersji 0.7.1:
- Bugs:
- Wyjątek na okna, gdy przy użyciu sterownika JDBC. & quot; IOException:. System nie może odnaleźć określonej ścieżki & quot;
- Schemat tworzenia skryptów są niekompletne, ponieważ pozostawiają one na stoły, które są specyficzne dla DataNucleus.
- Usprawnienia:
- Pomóż Różny komunikaty o błędach.
- Powrót poprawne główny / poboczny numery wersji sterownika JDBC Hive.
- Dodaj realizacji HivePreparedStatement na podstawie aktualnych danych typu ula obsługiwane.
- Zadania:
- Hive w Maven.
- Metastore zaktualizować skrypty i domyślnych schematów dla PostgreSQL.
Co nowego w wersji 0.7.0:
- Nowa funkcja:
- infrastruktura Upoważnienie do Hive,
- Wdrożenie Indeksowanie w Ulu,
- Dodaj odzwierciedlać () UDF refleksyjnego wywołania metod Javy
- Hive TypeInfo / ObjectInspector do wsparcia Unii (oprócz struct, tablicy i mapy),
- Wdrożenie GenericUDF str_to_map
- patch do wsparcia HAVING w Ulu,
- śledzenia łączy, które są zamieniane na mapie dołącz automatycznie
- częstotliwość i czas trwania połączeń metryki dla HiveMetaStore poprzez JMX
- Utrzymanie lastAccessTime w metastore
- Wzrost:
- możliwość eksportowania nagłówek
- Wsparcie dla wyraźnego wyboru na dwie lub więcej kolumn,
- Opisz rozszerzoną wyjście stół / partycji jest tajemnicze,
- Missing niektóre funkcje JDBC jak getTables, getColumns i HiveResultSet.get * metod opartych na nazwie kolumny.
- Tapping logi z procesów potomnych,
- Wsparcie filtr rozwijana do dołu przed tabelach non-native
- Wymień zależności od HBase przestarzałe API
- Dodaj queryid blokując
- Aktualizuj transident_lastDdlTime tylko wtedy, gdy nie podano
- Dodaj więcej informacji debugowania do blokowania ula
- HiveInputFormat lub CombineHiveInputFormat zawsze synchronizować bloki pliku rc dwa razy
- Pokaż czas lokalny zadanie trwa
- Utwórz nową instancję Heca, gdy blokada ponawianie, a więcej informacji do debugowania
- Dodaj opcję, aby uruchomić zadanie, aby sprawdzić mapę dołącz możliwości w trybie non-lokalnym,
- Więcej debugowania do blokowania
- Dodaj opcję w dynamicznymi wstawkami działowych rzucać błąd, jeśli 0 utworzeniu partycji
- Bugs:
- & quot; LOAD DATA LOCAL INPATH & quot; nie wtedy, gdy tabela zawiera już plik o tej samej nazwie,
- NULL nie jest obsługiwany prawidłowo dołączyć
- HiveInputFormat.getInputFormatFromCache & quot; jaskółki & quot; przyczyną wyjątek podczas rzucania IOExcpetion
- Dodaj postępy dołączyć i GroupBy
- Proste UDAFs z więcej niż 1 parametru zderzenia na pustym zapytania rzędu
- pola UDF () nie działa,
- Dynamiczne wkładki działowe pozostawione puste pliki nieoczyszczonych w Hadoop 0,17 tryb lokalny,
- Przejdź aktualizacji licznika po RunningJob.getCounters () zwraca wartość null
Co nowego w wersji 0.5.0:.
- Pozwól użytkownikowi określić serde dla własnych skryptów
- Dodaj UDF unhex.
- Usuń lzocodec import z FileSinkOperator.
- Sterownik NullPointerException podczas wywoływania getresults bez pierwszej kompilacji.
- Poprawa wydajności do pliku rc i ColumnarSerDe w Ulu.
Komentarze nie znaleziono