Szczegóły programowe:
speedparser jest reimplementacja czarnej skrzynki Uniwersalnego RSS Parser. Wykorzystuje lxml do parsowania paszowym i opcjonalnej czyszczenia HTML. & Nbsp; kompatybilność speedparser za pomocą feedparser jest bardzo dobry dla ścisłego podzbioru pól, ale słabe dla pól spoza tego podzbioru. Zobacz testy / speedparsertests.py więcej informacji, na których pola są mniej lub bardziej zgodne, a które nie są.
Na Intel Core i5 750, działa tylko na jednym rdzeniu, feedparser udało 2,5 Pasze / s na planie paszowym testu (około 4200 "kanały" w testach / feeds.tar.bz2), a około 65 zarządza speedparser karmi / sek z HTML . czyszczenie na 200 kanały / s z czyszczenia off
Wymagania :
- Python
- lxml
Komentarze nie znaleziono