lxml

Screenshot Software:
lxml
Szczegóły programowe:
Wersja: 3.4.1
Filmu: 17 Feb 15
Wywoływacz: Martijn Faassen
Licencja: Wolny
Popularność: 12

Rating: nan/5 (Total Votes: 0)

lxml jest wyrafinowany, silny, wolny i unikalny moduł Pythona, który wiąże biblioteki libxml2 i libxslt, co pozwala programistom Pythona do pracy zarówno z plików XML i HTML poufnych ich przetwarzania XML, Python code.An jest XML librarylxml (Extensible Markup Language ) przetwarzanie biblioteki napisane w języku programowania Python, specjalnie zaprojektowany, aby postępować zgodnie ze specyfikacją API ElementTree jak najwięcej.
To może przedłużyć API ElementTree wystawiać konkretne funkcjonalności libxslt i libxml2 bibliotek, takich jak Relax NG (Next-Generation), XPath, XML Schema, XSLT, c14n (Extensible Stylesheet Language), etc.Use lxml zadzwonić Python kodu z stylesheetsDevelopers XSLT będą mogli korzystać z programu lxml zadzwonić Python kod z arkuszy stylów XSLT i XPath za pomocą funkcji rozszerzających. Szeroka gama ćwiczeń dostępne są na projekcie & rsquo; s strona główna (patrz link na końcu artykułu).
Oprogramowanie to jest open source przez projekt i łączy kompletność funkcji i szybkości wyżej wymienionych bibliotek z prostotą Python & rsquo; s API (Application Programming Interface) .Getting rozpoczął lxmlIt jest dość łatwe do zainstalowania lxml na dystrybucji GNU / Linux przy użyciu archiwum źródłowe Ukazuje się Softoware i rsquo; s projektu i oficjalna strona. Wystarczy pobrać pakiet źródłowy, zapisz go na swoim katalogu domowym, rozpakuj go, otwórz aplikację Terminal i przejdź do lokalizacji, w wyodrębnionych plików archiwalnych (np cd /home/softoware/lxml-3.4.1).
Uruchom & lsquo; & rsquo się; polecenie, aby skompilować program, który powinien trwać około 1-2 minut na nowoczesnym komputerze. Po udanej kompilacji, uruchom & lsquo; make install & rsquo; polecenie jako root lub & lsquo; sudo make install & rsquo; Komenda jako uprzywilejowanego użytkownika do zainstalowania lxml wide.Supports systemu GNU / Linux i Microsoft Windows działa hal oprogramowanie jest oficjalnie obsługiwane na GNU / Linux i Microsoft Windows systemów operacyjnych. To został z powodzeniem przetestowany na 32-bitowych i 64-bitowych komputerów

Co to jest nowy w tym wydaniu:.

  • Funkcje dodał:
  • Nowy generator htmlfile HTML towarzyszyć przyrostowe xmlfile serializacji API. Łata Burak Arslan.
  • błędy:
  • lxml.sax.ElementTreeContentHandler nie zainicjować jej nadklasy.

Co nowego w wersji 3.3.1:

  • błędy:
  • PR # 1014290: dokumenty HTML analizowany z parser.feed () nie udało się znaleźć elementy podczas iteracji tagu
  • .
  • PR # 1273709: Budynek w PyPy nie udało z powodu braku wsparcia dla PyUnicode_Compare () i PyByteArray _ * () w PyPy C-API jest
  • .
  • PR # 1274413: Kompilacja w MSVC nie udało z powodu braku & quot; stdint.h & quot; standardowy nagłówek pliku.
  • PR # 1274118: iterparse () nie powiodło się analizować BOM prefiksem plików
  • .

Co nowego w wersji 3.0 Alpha 2:

  • Funkcje dodane:
  • .iter () metoda elementów teraz przyjmuje argumenty znaczników, jak & quot; {*} nazwę & quot; aby szukać elementów z danej nazwy lokalnej w dowolnej przestrzeni nazw. Z tym dodatkiem, wszystkie kombinacje symboli wieloznacznych działa teraz zgodnie z oczekiwaniami: & quot; {ns} Nazwa & quot ;, & quot; {} nazwa & quot ;, & quot; {*} nazwa & quot ;, & quot; {d} * & quot ;, & quot; {} * & quot; i & quot; {*} * & quot ;. Należy pamiętać, że & quot; nazwa & quot; jest równoznaczne z & quot; {} nazwę & quot ;, ale & quot; * & quot; jest & quot; {*} * & quot ;. Sama zmiana ma zastosowanie do .getiterator (), .itersiblings (), .iterancestors (), .iterdescendants (), .iterchildren () i .itertext () metody, a strip_attributes (), strip_elements () i strip_tags () funkcje jak również () klasy iterparse.
  • C14N umożliwia określenie prefiksów inclusive awansować na najwyższym poziomie podczas ekskluzywnej serializacji.
  • błędy:
  • Przechodząc długie ciągi Unicode do pasz () interfejsu parsera nie przeczytać cały ciąg.

Co nowego w wersji 2.3.5:

  • Błąd podczas łączenia węzłów tekstowych w element.remove ( ).
  • Zawieszenie w sax / docelowej parsera przy zgłaszaniu pusty doctype.

Co nowego w wersji 2.3.4:

  • Błąd podczas budowania nsmap (właściwość Element) z Przestrzeń nazw URI pusta.
  • Miasto gniewu z powodu wyścigu, gdy błędy (lub wiadomości użytkownika) występuje podczas przetwarzania gwintowany XSLT.
  • Arkusz stylów XSLT kompilacja może ignorować błędy kompilacji.

Co nowego w wersji 2.3.2:

  • Funkcje dodane:
  • lxml.objectify.deannotate () ma nowy cleanup_namespaces opcji logiczna, aby usunąć obiektywizacji deklaracji przestrzeni nazw (i ogólnie posprzątać deklaracji przestrzeni nazw), po usunięciu adnotacje typu.
  • lxml.objectify zyskał funkcję własną podelement () jako kopia etree.SubElement aby uniknąć inaczej nadmiarowe import lxml.etree po stronie użytkownika.
  • błędy:
  • Poprawiono & quot; potomkiem & quot; błąd w cssselect raz drugi (po pierwszej poprawki w lxml 2.3.1). Poprzednia zmiana spowodowała poważny regres wydajności dla oceny opartej XPath do przetłumaczonego wyrazu. Zauważ, że to łamie korzystanie z niektórych wyrażeń XPath jak generowanych ścieżkami lokalizacji, XSLT, które wcześniej pracowały w 2.3.1.
  • Naprawiono parsowanie niektórych selektorów w cssselect. Białe znaki po kombinatorów & quot; & Gt; & quot ;, & quot; + & quot; i & quot; ~ & quot; jest teraz poprawnie ignorowane. Wcześniej był analizowany jest jako combinator potomka. Na przykład, & quot; div & gt; .foo & quot; był analizowany tak samo jak & quot; div & gt; * .foo & quot; zamiast & quot; div & gt; .foo & rdquo;.

Co nowego w wersji 2.3.1:

  • Funkcje dodane:
  • Nowa opcja kill_tags w lxml.html.clean usunięcia określonych znaczników i ich zawartość (tj ich całe poddrzewa).
  • pi.get () i pi.attrib na przetwarzania instrukcji analizować pseudo-atrybuty z treści tekstu instrukcji przetwarzania.
  • lxml.get_include () zwraca listę obejmują ścieżki, które mogą być wykorzystane do opracowania zewnętrznego kodu C przed lxml.etree. Jest to szczególnie konieczne dla statycznie związane lxml buduje, gdy kod musi się skompilować z dokładnymi samych wersji plików nagłówek jak lxml sobie.
  • Resolver.resolve_file () wykonuje dodatkowy close_file opcji, który konfiguruje jeśli plik (-jak) obiekt zostanie zamknięty po przeczytaniu, czy nie. Domyślnie, plik zostanie zamknięty, a użytkownik nie oczekuje się, aby zachować odniesienie do niej.
  • błędy:
  • sprzątanie HTML nie usuwać "danych:". Linki,
  • Integracja html5lib parser teraz korzysta z "oficjalnej" wdrożenie w samej html5lib, co sprawia, że ​​praca z nowszymi wersjami biblioteki.
  • W lxml.sax, endElementNS () może błędnie odrzucić zwykły nazwę znacznika, gdy odpowiednie zdarzenie początek wywnioskować ten sam zwykły nazwę znacznika, aby być w domyślnej przestrzeni nazw.
  • Po otwarty obiekt pliku przechodzi do parse () lub iterparse (), parser nie będzie już blisko, że po użyciu. To przywraca zmianę lxml 2.3, gdzie wszystkie pliki zostaną zamknięte. Obowiązkiem użytkowników prawidłowo zamknąć pliku (-Jak) obiektu, również w przypadku błędu.
  • Błąd Asertywność w lxml.html.cleaner za usuwanie elementów najwyższego poziomu.
  • W lxml.cssselect użyć XPath "// B" (skrót od "A / potomek-or-self :: node () / B ') zamiast" A / B "potomek :: dla css potomkiem wyboru ("B"). To sprawia, że ​​kilka przypadków krawędzi być zgodne z zachowaniem biegów w WebKit i Firefox, i sprawia, że ​​więcej wyrażeń CSS ścieżki lokalizacji (do wykorzystania w xsl: template match).
  • W lxml.html, tagi nieaktywnym pokazać już w zebranych wartości formularza.
  • Dodawanie / usuwanie wartości do / z wielu select pole formularza prawidłowo je wybiera i odznaczenie im.
  • Inne zmiany:
  • Statyczne buduje może określić katalog pobierania z opcją --download-reż.

Co nowego w wersji 2.3:

  • Funkcje dodane:
  • Patrząc na dzieci, lxml.objectify trwa "znacznik {} 'w ten sposób pustą przestrzeń nazw, w przeciwieństwie do nazw dominującej.
  • błędy:
  • Po zakończeniu czytania z obiektu pliku-jak parser natychmiast wywołuje metodę jej .close ().
  • Po zakończeniu analizowania, iterparse () natychmiast zamyka plik wejściowy.
  • obejście libxml2 błąd, który może opuścić parser HTML w stanie niefunkcjonalnych po analizowania poparzonych uszkodzonego dokumentu (ustalone w libxml2 2.7.8).
  • marka w HTML kod czyszczenia jest prawidłowo wskazany namiot.
  • Inne zmiany:
  • Niektóre funkcje publiczne w Cython poziomu C-API mają bardziej wyraźne typy powrotne.

Co nowego w wersji 2.2.8 / 2.3 Beta 1:

  • Zawieszenie w nowszych wersjach libxml2 kiedy jest ruchome elementy między dokumentami, które miały atrybuty zastąpione węzłami XInclude.
  • Funkcja XMLID () brakuje opcjonalne parametry parsera i base_url.
  • Wyszukiwanie tagów wieloznacznych w iterparse () został uszkodzony w Py3.
  • lxml.html.open_in_browser () nie działa w Pythonie 3 z powodu użycia os.tempnam. Obecnie trwa opcjonalny parametr "kodowania".

Wymagania :

  • Python

Podobne oprogramowanie

Inne programy z deweloperem Martijn Faassen

z3c.relationfield
z3c.relationfield

14 Apr 15

hurry.resource
hurry.resource

11 May 15

Komentarze do lxml

Komentarze nie znaleziono
Dodaj komentarz
Włącz zdjęć!