Apache Oozie pomoże administratorom baz danych Hadoop zwiększyć wydajność swojego serwera przez dodanie do sposobu organizacji pracy obliczeniowe są obsługiwane na serwerze.
Domyślnie Oozie obsługuje wiele Hadoop miejsc pracy poza komputerem. Obejmuje Java map-redukcji, streaming map-reduce, świnia, Distcp, Sqoop, Hive, itp ..
Inne zadania mogą być również dodawane do systemu przepływu pracy, przy użyciu prostej składni oparte na XML deklaratywny.
Oozie także system skalowalny i elastyczny, dostosowując się do każdego scenariusza użytkowania i środowiska.
Oznacza to, że można wdrożyć go podczas testowania i rozwoju nowych produktów, ale można z niego korzystać także z żywymi środowiskach produkcyjnych na dynamicznie ukształtowanych systemów rozproszonych
Co nowego w tym wydaniu.:
- Dokumentacja Aktualizacja hcat wspominając Świnie JAR hcatalog adapter
- Aktualizuj stworzyć uwalnianiu-artefakt skrypt dla Git,
- koordynatorzy, że ulega zmianie, ale są doneMaterialization endtime, a nie uzyskiwanie zabierani na StatusTransit
- Przejdź do Hadoop 2.3.0 dla Hadoop-2 profil
- Workflow nie zabija pracę dzieci na map-zmniejszyć działania
Komenda kill
Co nowego w wersji 4.1.0:
- Aktualizacja dokumentacji hcat wspominając hcatalog-pig-adapter JAR
- Aktualizuj stworzyć uwalnianiu-artefakt skrypt dla Git,
- koordynatorzy, że ulega zmianie, ale są doneMaterialization endtime, a nie uzyskiwanie zabierani na StatusTransit
- Przejdź do Hadoop 2.3.0 dla Hadoop-2 profil
- Workflow nie zabija pracę dzieci na map-zmniejszyć działania
Komenda kill
Co nowego w wersji 3.2.0:.
- Usuń to przewody od źródła binarne
- Przykładem Demo przepływu pracy nie pozwala sharelib dla świń i streamingu.
- Raport apache-szczur powinien być jeden globalny plik raportu.
- Usuń to przewody plików binarnych ze źródła.
- Raport apache-szczur powinien być jeden globalny plik raportu.
- Przykład katalog ma kilka plików bez tekstu licencji.
- Usuń pliki o rozmiarze od 0 repozytorium.
- Dodaj ustawienia związane Hadoop PROXYUSER do skróconej instrukcji obsługi.
- Zmień nazwę pliku readme.txt do README.txt i aktualizować zawartość.
- StatusTransitService nie działać, jeśli nieświeży odniesienie do COORD pracę jest obecny.
- Usuń select * from zapytań związanych COORD działania.
- TestCoordKillXCommand w testCoordKillXCommandUniqueness testcase zawodzi po przerwań zmian.
- Działanie Shell wspieranie wartości env-var ze znaku =.
- Aktualizuj oozie-sharelib-ula używać Hive 0.9.0.
Wymagania :
- Apache Hadoop,
Komentarze nie znaleziono