HPC Challenge jest wyznacznikiem wysokiej jakości apartamencie. Wyzwanie polega na HPC 7 benchmarkach basically:
1. HPL - benchmark Linpack TPP, który mierzy szybkość operacji zmiennoprzecinkowych egzekucji do rozwiązywania układu równań liniowych.
2. DGEMM - mierzy szybkość operacji zmiennoprzecinkowych o podwójnej precyzji wykonania matrycy matryca rzeczywistym mnożenia.
3. STREAM - proste syntetyczne Program odniesienia, który mierzy zrównoważonego przepustowość pamięci (w GB / s) i odpowiedniej stopy obliczeń dla prostego jądra wektorowych.
4. PTRANS Transpozycja macierzy (równoległe) - ćwiczenia z komunikacji, gdzie pary procesory komunikują się ze sobą jednocześnie. Jest to użyteczne Test całkowitej pojemności komunikacyjnego sieci.
5. RandomAccess - środki stopa całkowitych przypadkowych aktualizacjach pamięci (GUPS).
6. FFTE - mierzy szybkość operacji zmiennoprzecinkowych na wykonanie precyzyjnych podwójne złożone jednowymiarowego dyskretnej transformaty Fouriera (DFT).
7. Komunikacja i przepustowości opóźnienie - zestaw testów do pomiaru opóźnienia i przepustowość kilka jednoczesnych wzorców komunikacji; w oparciu o efektywne benchmarku (b_eff przepustowość).
Kompilacja:
Pierwszym krokiem jest utworzenie pliku konfiguracyjnego, który odzwierciedla cechy urządzenia. Plik konfiguracyjny powinien być tworzony w katalogu HPL. Ten katalog zawiera instrukcje (pliki README i INSTALL), jak utworzyć plik konfiguracyjny. Katalog HPL / konfiguracja zawiera wiele przykładów plików konfiguracyjnych. Dobrym rozwiązaniem jest kopia jednego z nich do katalogu HPL, a jeśli to nie poskutkuje, to zmienić. Ten plik jest wykorzystywany przez wszystkich składników pakietu HPC Challange.
Kiedy skończysz konfigurację, plik powinien istnieć w katalogu, którego nazwa zaczyna HPL z Marka. i kończy się nazwą dla systemu stosowanego do badań. Na przykład, jeśli nazwa systemu jest Unix, plik powinien być nazwany Make.Unix.
Aby zbudować referencyjną wykonywalny (dla systemu o nazwie Unix) wpisz: make arch = Unix. Polecenie to powinno być wykonywane w głównym katalogu (nie w katalogu HPL). Będzie to wyglądało w katalogu HPL dla pliku konfiguracyjnego i użyć go do budowy benchmarku wykonywalny.
Konfiguracja:
HPC Challenge jest napędzany przez krótki pliku wejściowego wymienionego hpccinf.txt, który jest niemal taki sam, jak w pliku wejściowego HPL (zwyczajowo nazywany HPL.dat). Zajrzyj do pliku HPL / www / tuning.html Szczegółowe informacje na temat pliku wejściowego dla HPL. Plik wejściowy zawarty jest w dystrybucji HPC Challange.
Różnice między pliku wejściowego HPL i pliku wejściowego HPC Challange można podsumować w następujący sposób:
* Linie 3 i 4 są ignorowane. Wyjście zawsze trafia do pliku o nazwie hpccoutf.txt.
* Istnieją dodatkowe linie (zaczynające się od linii 33), które mogą (ale nie muszą) być wykorzystywane do dostosowywania benchmark HPC Challenge. Są one opisane poniżej.
Dodatkowe linie w pliku wejściowego HPC Challenge (w porównaniu do pliku wejściowego HPL) są:
Linie 33 i 34 opisują dodatkowe rozmiary matrycy być wykorzystywane do prowadzenia benchmarku PTRANS (jeden z elementów odniesienia HPC Challange).
* Linie 35 i 36 opisują dodatkowe czynniki blokujące być wykorzystywane do prowadzenia PTRANS benchmarku.
Tylko dla kompletności, tutaj jest lista linii pliku wejściowego HPC wyzwaniem jest z krótkie opisy ich znaczenia:
* Linia 1: ignorowane
* Linia 2: ignorowane
* Linia 3: ignorowane
* Linia 4: ignorowane
* Linia 5: liczba rozmiarów matrycy na (i PTRANS HPL)
* Linia 6: matryca o wielkości (i PTRANS HPL)
* Linia 7: Wiele czynników blokujących dla HPL (i PTRANS)
* Linia 8: blokowanie czynników dla HPL (i PTRANS)
* Linia 9: typ procesu zamawiania przez HPL
* Linia 10: liczba sieci technologicznych dla HPL (i PTRANS)
* Linia 11: liczba wierszy procesowych każdej sieci technologicznej do HPL (i
PTRANS)
* Linia 12: liczba kolumn procesowych każdej sieci technologicznej do HPL
(I PTRANS)
* Linia 13: wartość progowa nie może być przekroczona o resztkowej dla przeskalowany
HPL (i PTRANS)
* Linia 14: Panel wiele metod na czynniki dla HPL
* Linia 15: Panel faktoryzacji dla metody HPL
* Linia 16: liczba cyklicznych kryteriów zatrzymania dla HPL
* Linia 17: rekurencyjny kryterium zatrzymania dla HPL
* Linia 18: liczba panelu rekurencji liczy HPL
* Linia 19: rekurencja panel liczy HPL
* Linia 20: liczba cyklicznych metod panel na czynniki dla HPL
* Linia 21: Panel faktoryzacji metody rekurencyjne dla HPL
* Linia 22: liczba metod transmisji dla HPL
* Linia 23: metody transmisji dla HPL
* Linia 24: liczba głębi antycypowanego dla HPL
* Linia 25: antycypowanego głębokości dla HPL
* Linia 26: metody swap dla HPL
* Linia 27: zamiana próg HPL
* Linia 28: forma L1 przez HPL
* Linia 29: forma U dla HPL
* Linia 30: wartość, która określa, czy równoważący powinien być stosowany
przez HPL
* Linia 31: ustawienie pamięci dla HPL
* Linia 32: ignorowane
* Linia 33: liczba dodatkowych problemu rozmiary dla PTRANS
* Linia 34: Dodatkowy problem rozmiary dla PTRANS
* Linia 35: liczba dodatkowych czynników blokujących dla PTRANS
* Linia 36: Dodatkowe czynniki blokujące dla PTRANS
Co to jest nowy w tym wydaniu:
- Ta wersja Dodano zoptymalizowany warianty RandomAccess które używają generatora Linear przystający do generacji liczb losowych.
- Global redukcja została dodana do błędu obliczeń, w celu osiągnięcia MPI FFT bardziej dokładne oszacowanie błędów.
- Kolejność punktów odniesienia był uporządkowane tak, że komponent HPL przebiega ostatni i może być przerwane, jeśli wykonywanie innych elementów nie był zadowalający.
- RandomAccess jest już pierwsza pomoc w tuningu kod.
- Różne błędy zostały naprawione.
Komentarze nie znaleziono