Szczegóły programowe:
Wersja: 3.5 Aktualizowane
Filmu: 20 Jul 15
Licencja: Shareware
Cena: 0.00
Popularność: 297
Pełny tekst RSS prace biorąc wprowadzonego adresu URL, analizowania treści i tworząc kanał pełnotekstowego z niego.
Pasza może następować zmiany poprzez internetowych lub stacjonarnych czytników, pracy, tak jak innych pasz, aktualizacji, kiedy zmiana jest wykrywany na oryginalnej stronie.
RSS pełnotekstowe w pełnej krasie jest dostępny w dwóch licencji komercyjnych. Darmowa wersja jest dostępna, ale wersje komercyjne dają lepsze wyniki ekstrakcji
Co nowego w tym wydaniu:.
- Otwórz Właściwości wykresu og: title, og: Typ, og: url, og: obrazu, a og: Opis wrócił teraz, gdy znalazł się na stronie są przetwarzane
- Bug fix: niektóre wyrażenia XPath nie były oceniane poprawnie podczas parsowania HTML5 została włączona
- obsługę plików cookie teraz tylko na przekierowania - problem rozwiązuje się w niektórych miejscach (dzięki Dave Wasilewskiego)
- Test zgodności nie będzie już pokazać HHVM jako niezgodne - Full-Text RSS pracował z HHVM 3.7.1 w naszych testach (ale bez wsparcia i bez Tidy aktualizacje automatyczne konfiguracyjnych miejscu)
- Humble agent HTTP aktualizowane wspierać wersję 2 rozszerzenia HTTP PHP
- HTML5-PHP aktualizowane
- pliki konfiguracyjne strony mogą teraz zawierać nagłówki HTTP (user-agent, cookies, Referer), np http_header (user-agent): PHP / 5.6
- usunięta opcja Config:. $ opcje - & # x3e; user_agents - pliki konfiguracyjne używanie strony
- config stron, które używają single_page_link może teraz po nim if_page_contains: XPath aby warunkowe .
- Minimalna obsługiwana wersja PHP jest teraz 5.3. Jeśli musisz użyć PHP 5.2, należy pobrać pełny tekst RSS 3.4
- Strona zaktualizowane pliki konfiguracyjne dla lepszej ekstrakcji
- Inne drobne poprawki / ulepszenia
Biblioteka
Pliki
Co nowego w wersji 3.4:
- Nowy parametr żądania: siteconfig pozwala przedstawić zasady wydobycia bezpośrednio życzenie
- Nowy wniosek paramter: accept = (auto | RSS | html) określa, jakie będziemy przyjmować jako odpowiedź (deprecates html = 1 parametr)
- Nowy parametr żądania: key_redirect = 0, aby zapobiec przekierowanie HTTP ukryć klucz API
- strony mogą teraz zawierać native_ad_clue: [XPath] aby sprawdzić, czy elementy, które oznaczają, że artykuł jest rodowitym ad
- Nowa opcja config: remove_native_ads - wartość true, a kiedy zauważysz rodzimych reklam (patrz wyżej), usuniemy je z wyjścia (tylko podczas przetwarzania pasz, nie ma wpływu na wydajność, gdy punkty wejścia URL do strony HTML) .
- Wyjście Kanał będzie zawierać Native ogłoszenie do artykułów, które wydają się być rodzime reklamy.
- Nowa opcja config: user_submitted_config celu ustalenia, czy włączony jest parametr siteconfig czy nie
- Wyjście Kanał zawiera teraz z adresu URL wygenerowanego paszy
- Wyjście Kanał zawiera teraz z URL pierwotnej (wejście) URL
- Wyjście Kanał zawiera teraz z adresem URL, aby zapisać się do wygenerowanego paszy (przy użyciu subtome.com)
- podgląd Kanał arkusz stylów (feed.xsl) teraz prezentuje Subskrybuj kanał łącza
- Naprawiono problem kodowania znaków dla niektórych tekstów,
- Naprawiono problem kodowania znaków dla niektórych znaków w trybie HTML5 analizowania
pliki konfiguracyjne
Co nowego w wersji 3.3:
- Nowy parser HTML5: HTML5Lib został zastąpiony przez HTML5-PHP (stary miał zbyt wiele problemów)
- Nowy config opcja: cache czas ($ opcje-> cache_time)
- Nowa opcja config: włączyć / wyłączyć pobieranie pojedynczą stronę ($ options- & gt; singlepage)
- Nowa opcja config: parser HTML pozwalają obejścia poprzez kwerendy ($ options- & gt; allow_parser_override)
- Nowy parametr żądania: parser - używać go zmusić nowy parser HTML5 być stosowane, & amp; parser = html5php (będzie wolniej)
- Expanded parametr żądania debug: & amp; debug = rawhtml (pokazuje oryginalne nagłówki odpowiedzi i ciało), & amp; debug = parsedhtml (pokazuje ciało reakcji po parsowania)
- statystyki APC strona oczekuje teraz APCu (starszej wersji APC nadal obsługiwany, ale statystyki w panelu administracyjnego nie będzie widoczny)
- Automatyczna aktualizacja zasad ekstrakcji site-specific stałe
- nagłówki HTTP Content Security teraz używane do podglądu pasz
- Parametry żądania i przykłady odpowiedzi teraz wymienione w tabeli na stronie indeksu (nowa Zapytanie Parametry karta)
- plik Test kompatybilności aktualizowane, aby pokazać, jeśli parsera PHP HTML5 jest obsługiwana (zależność od PHP 5.3), a do testowania HHVM (dotychczas nie obsługiwane)
- usunięta opcja Config: $ options- & gt; registration_key
- Preserve elementu TTL w kanały RSS 2.0
- Inne drobne poprawki / ulepszenia
Co nowego w wersji 3.2:
- Pełna treść mogą być wyłączone z produkcji (przesuń & amp; content = 0 w ciągu kwerendy, zobacz $ options- & gt; zawartość w pliku konfiguracyjnym, aby uzyskać więcej informacji)
- Site pliki konfiguracyjne mogą być teraz zaktualizowany automatycznie repozytorium GitHub z naszej (URL zadzwonić widoczne w panelu administracyjnego)
- Strona zaktualizowane pliki konfiguracyjne dla lepszej ekstrakcji
- PHP Czytelność aktualizowane być bardziej wyrozumiali, gdy przycinanie HTML
- Biblioteka wykrywania Język aktualizowane
- HTML meta refresh przekierowania teraz także po
- statystyki APC (APC jest dostępny na serwerze) teraz widoczny w obszarze administracyjnym,
- Bug fix: Duplikat find_string i replace_string wartości w plikach konfiguracyjnych witryny nie usunięte (! dzięki Fabrizio)
- Bug fix: typ MIME stosowane działania teraz, gdy po pojedynczych adresów URL
- Inne drobne poprawki / ulepszenia
Co nowego w wersji 3.1:
- Zezwalaj na wiele elementów (wcześniej tylko jeden zachował się)
- Bug fix: Nie więcej samozamykające elementy iframe
- Bug fix: Naprawiono manifest.yml zapobiec komunikat o błędzie podczas wdrażania do AppFog
- Inne drobne poprawki / ulepszenia
Co nowego w wersji 3.0:
- Wielu Strona supportnext_page_link teraz obsługiwane w konfiguracji witryny (włączyć / wyłączyć z $ options- & gt; wielostronicowy)
- HTML5 parser availableuse parser: html5lib w miejscu config, również zobaczyć $ options- & gt; allowed_parsers
- Zaktualizowane wzory strona dla lepszej ekstrakcji
- Nowa globalna strona config, aby być stosowane do wszystkich stron (global.txt)
- Gazy "http: //" prefix, gdy dostarczany jest klucz API
- config strony połączenia (na zamówienie + standardowe + odcisk palca + globalne)
- Strona config replace_string (znaleźć): wymienić można obecnie podzielić na dwie linie: find_string: znaleźć, replace_string: wymienić
- YouTube i Vimeo URL teraz powrócić iframe kod do osadzenia
- Teraz poszukaj tytuł i datę OpenGraph elementów
- Poprawa ekstrakcji z AJAX pageswe teraz poszukaj AJAX wyzwala osadzony w HTML, na Google specyfikacji
- JSONP supportuse & amp; format = json & amp; callback = functionName w ciągu kwerendy
- Nowa opcja config, aby umożliwić Cross-Origin Resource Sharing (CORS): $ opcja- & gt; kor
- Nowa opcja config, aby włączyć filtrowanie XSS, w razie potrzeby: $ Option- & gt; xss_filter
- Zend_Cache aktualizowane
- Funkcja Smart cachingexperimental pamięci podręcznej do przechowywania identyfikatorów w APC pierwszy i napisz wyjście do dysku na późniejsze żądanie (patrz $ options- & gt; smart_cache)
- Łatwiejszy chmura deploymanifest.yml dodany do AppFog
- APC buforowanie witryny plików konfiguracyjnych w celu zwiększenia wydajności, jeśli APC availablesee $ options- & gt; apc
- Edytor config strony admin / łatwo znaleźć, edytować, testowanie i stronę testową pliki konfiguracyjne, lub dodać nowe
- Tryb Debug, aby zobaczyć, co się dzieje za scenessee $ Options & gt; debug
- Usunięto nieaktualne opcje konfiguracyjne: ograniczyć, message_to_prepend_with_key, message_to_append_with_key, error_message_with_key
- Usunięto ekstrakcji CSS poprzez kwerendy
- Usunięto opcja config: $ options- & gt; alternative_url
- Bug fix: umożliwiają wydobycie jednego elementu
- Bug fix: przekierowanie manipulacja poprawiła
Wymagania :
- PHP 5.2 lub nowszy,
Komentarze nie znaleziono