LanguageTool

Screenshot Software:
LanguageTool
Szczegóły programowe:
Wersja: 2.9 Aktualizowane
Filmu: 14 Apr 15
Wywoływacz: Daniel Naber
Licencja: Wolny
Popularność: 18

Rating: nan/5 (Total Votes: 0)

LanguageTool jest program open source korekta zaprojektowane, aby znaleźć błędy, że regularne narzędzia sprawdzania pisowni nie może wykryć. Jest oparty na zasadach sprawdzania gramatyki i stylu, że znajdzie błędy, dla których reguły określone w jego pliki konfiguracyjne XML, takie jak mieszanie się & ldquo; ich & rdquo; z & ldquo; tam & rdquo.


Wykrywa różne problemy gramatyczne

Program może również wykrywać różne problemy gramatyczne i posiada wsparcie dla ponad 20 języków, w tym angielski, niemiecki, polski, francuski, hiszpański, szwedzki, grecki, chiński, duński, japoński, islandzki, portugalski i portugalski brazylijski.
Dodatkowo, posiada łatwy w użyciu, proste i graficzny interfejs użytkownika, który pozwala każdemu wkleić tekst, który musi być zaklęcie sprawdzane. Można go sprawdzić tekst w schowku, tekst tag, wytnij / kopiuj / wklej tekst, i przebywania w obszarze zasobnika systemowego.


Wykrywa szeroki zakres problemów

W oknie dialogowym Opcje, które można włączyć typu problemy mogą wykryć aplikacji, w tym złym stylu, błędy gramatyczne, błędy interpunkcyjne, slang, możliwych literówek, zwrotów, powszechnie zbędnych słów, kolokacji zdezorientowanych kapitalizacji, semantyki, a także, a nie standardowe zwroty.


LanguageTool dla LibreOffice i OpenOffice

Poza tym jest autonomiczną aplikację, LanguageTool jest również dostępny jako rozszerzenie dla dwóch najbardziej popularnych i rozbudowanych pakietów biurowych open-source, LibreOffice i Apache OpenOffice.org, pozwalając użytkownikom na korektę swoje teksty, klikając prawym przyciskiem na wybrane frazy lub ust.


LanguageTool dla przeglądarki Mozilla Firefox

Ponadto, aplikacja jest dostępna do pobrania jako dodatek dla świata & rsquo; s najbardziej popularnym open-source przeglądarka na świecie, Mozilla Firefox. Nie wymaga ponownego uruchomienia komputera i umieszcza mały przycisk na głównym pasku narzędzi, co pozwala na korektę tekstu wyróżnionego ze stron internetowych lub formularzy.


Pod maską i dostępności

aplikacja jest w całości napisany w języku Java, co oznacza, że ​​& rsquo; sa oprogramowanie cross-platform, przeznaczony do pracy z dowolnym dystrybucji GNU / Linux, jak i BSD, Solaris, Microsoft Windows i Mac OS X operacyjnego Systemy, w których jest zainstalowany Java Runtime Environment.

Co nowego w tym wydaniu:

  • kataloński:
  • słownik tag aktualizowane POS
  • dodano nowe zasady
  • stałe fałszywe alarmy
  • angielski:
  • Dodano kilka zasad i trwałe kilka fałszywych alarmów,
  • Dodano wiele przepisów w nowym stylu przyczyniły Heikki Lehvaslaiho. Ponieważ mogą one powodować fałszywe alarmy, nie są domyślnie włączone. Można je uaktywnić przez włączenie wszystkich reguł w nowej kategorii "Plain English '.
  • Esperanto:
  • dodano kilka nowych zasad,
  • francuski
  • słownik tag aktualizowane POS i słownik hunspell do Dicollecte-5.3
  • niemiecki:
  • dodano kilka nowych zasad i środków fałszywych alarmów
  • Dodano nowy przepis, który sprawdza umowy podlega czasownika. Na razie tylko przypadki "ist", "sind", "wojna", i "Waren" są obsługiwane. Przykład błędów wykrytych: ". Der Hund sind SCHA & para; n ',' Die Autos ist schnell". Do tej pracy regułę, frazy są teraz zjednoczona w disambiguation.xml, na przykład: "Mann" w zdaniu "ein Mann" zachowa tylko jego mianownik odczyt (SUB: NOM: Sin: MAS), a dawniej także bierniku i celowniku odczyty (SUB: AKK: SIN: MAS, SUB: DAT: SIN: MAS). (Https://github.com/languagetool-org/languagetool/issues/233)
  • włoski:
  • poprawiła kilka zasad,
  • Polski:
  • dodaje kilka nowych zasad,
  • Portugalski:
  • dodane / poprawione kilka zasad,
  • 3695 wyrazów złożonych (przed reformą) - największy darmowy bazy danych
  • rosyjski
  • i ulepszone zasady dodaje
  • ukraiński:
  • duża aktualizacja Słownik
  • Nowe zasady gramatyczne,
  • Nowa reguła dla prostego zastąpienia miękkich sugestii
  • poprawa disambiguator
  • związek tagging i pisowni ulepszenia

  • Ulepszenia
  • inicjały tagging
  • zdanie i słowo ulepszenia tokenizing
  • poprawiona obsługa stres symbol i miękkiej myślnikiem
  • zasady Bitext:
  • dodaje prostej zasady sprawdzania, czy tłumaczenia kończy się tym samym znakiem interpunkcyjnym co oryginał (w tym tylko.?! Znaków).
  • jest obecnie możliwe, aby dodać reguły bitext zewnętrznych plików w wierszu poleceń, za pomocą
  • Opcja -bitextrule. Ścieżka do pliku musi być bezwzględna. Uwaga:. To pozwala bitext zasady także dla języków, które nie mają zasady bitext zawarte domyślnie
  • Pisownia:
  • Nowe pliki w /hunspell/spelling.txt może być używany, aby dodać akceptowane słowa do sprawdzania pisowni, które są uważane również podczas tworzenia sugestie dotyczące pisowni. Jest to podobne do /hunspell/ignore.txt lista plików, które są przyjęte słowa, które * nie * używane podczas tworzenia sugestie dotyczące pisowni.
  • API:
  • JLanguageTool.activateDefaultPatternRules () i JLanguageTool.activateDefaultFalseFriendRules () zostały usunięte - wszystkie zasady i reguły fałszywe wzór znajomemu (jeśli drugi język jest określony) są teraz automatycznie, gdy konstruktor JLanguageTool nazywa. Jeśli potrzebujesz, bez sprawdzania wzór zasad opartych na XML, rozszerzyć klasę języka (np "English") z jednym, który nadpisuje getPatternRules () metoda i zwraca pustą listę istnieje.
  • ManualTagger.lookup () został zastąpiony przez ManualTagger.tag () po przestarzałe od najnowszej wersji
  • Wszystkie metody statyczne i pola z klasą "język" zostały przeniesione do nowej klasy "języki". Na razie, metody / pól w klasie, ale nadal istnieją Języka została zaniechana.
  • LanguageIdentifierTools została usunięta. Wykorzystanie LanguageIdentifier zamiast.
  • Usunięto (domyślne) ResourceDataBroker.setResourceDir () i setRulesDir (), ponieważ mogą one być ustawione w konstruktorze
  • oczyścić się klasy specjalista, np usuwanie getRemark ()
  • Category.setDefaultOff () została usunięta, to można ustawić za pomocą konstruktora teraz
  • Zmiana nazwy klasy: o.lt.rules.patterns.Element = & gt; o.lt.rules.patterns.PatternToken o.lt.rules.patterns.ElementMatcher = & gt; o.lt.rules.patterns.PatternTokenMatcher
  • Inne małe porządki API, które nie powinno wpływać na wspólne przypadków użycia, np IncorrectExample.getCorrections () zwraca teraz i żadnych modyfikacji listy, usuwanie przestarzałych metod.
  • Wbudowany serwer:
  • XML Cytowanie został rozwiązany, może to spowodować nieprawidłowe dokumenty XML do zwrotu
  • Nowa opcja w pliku konfiguracyjnym, które pozwala ustawić maksymalną wielkość kolejki żądań "maxWorkQueueSize" - jeśli robi się większy niż ten, wnioski zostaną odrzucone (503 Usługa niedostępna)
  • Serwer odpowiada teraz z bardziej szczegółowych kodów stanu HTTP do tych warunków błędu: 413 Zbyt duże żądanie - jeśli tekst przekroczy maksymalny rozmiar tekstu 503 Usługa niedostępna - jeśli kontrola przekracza maksymalny czas wyboru
  • GUI:
  • samodzielnym GUI może teraz podjąć plik tekstowy jako argument ten plik zostanie załadowany na starcie (problem # 232 Github).
  • linia poleceń:
  • Teraz można dodać zewnętrznego pliku reguł podczas wywoływania LanguageTool z linii poleceń. Użyj --rulefile dodać plik. Jeśli nazwa pliku ma format, który zawiera nazwę języka, będzie on używany wraz z innymi przepisami; w przeciwnym razie, to wymienić zasady. Można również wczytać zewnętrzny plik z fałszywymi przyjaciółmi za pomocą opcji --falsefriends. Nazwa pliku powinna być absolutna ścieżka do pliku, a fałszywe pliki przyjaciel zawsze dodawane do tych, które są ładowane do języka. (Sprawa nr 192 Github)
  • zasady składni:
  • zasada może teraz jeden przykład zdanie, o ile posiada atrybut "korekcji" - może to zaoszczędzenie redundancję, jeżeli tylko prawidłowe zdanie same niepoprawną zdaniu z korekcja zastosowana. Przed reguła potrzebne co najmniej dwa przykładowe zdania.
  • 'Przykład' Element: type = "nieprawidłowe" jest teraz opcjonalna, jeśli jest atrybutem "korekta". Atrybut "korekta" oznacza, że ​​zdanie jest błędne.
  • 'Przykład' Element: type = "poprawne" jest teraz opcjonalne. Nie "typem" atrybut, a nie atrybutem "korekta" oznacza, że ​​zdanie jest poprawne.
  • Wewnętrzne:
  • przeszli z Apache Tika do detektora (języka) do automatycznego https://github.com/optimaize/language-detector identyfikacji języka tekstu. Powinna ona być szybciej i wyniki powinny być bardziej niezawodny. Wykrywanie Asturii i galicyjski musiał zostać wyłączony, ponieważ jakość detekcji była zbyt niska, a także wpływ na wykrycie hiszpańskim.
  • Poprawiono regresji, które sprawiło, że niemożliwe, aby załadować pliki zewnętrznych reguł w GUI.

Co nowego w wersji 2.8:

  • Asturii:
  • usunięta zależność od hunspell, teraz używa Morfologik do sprawdzania pisowni,
  • Breton:
  • dodaną i poprawić kilka zasad,
  • kataloński:
  • zaktualizowane Słownik
  • i ulepszone zasady dodaje
  • stałe fałszywe alarmy
  • Dutch:
  • dodane i ulepszone wiele zasad,
  • angielski:
  • niektóre nowe zasady (dzięki Nick Hough)
  • aktualizowane słowniki Tagger i syntezatora, ustalające problem nr 202
  • Nowy filtr do stosowania do dopasowania partofspeech części słów, np. W * to będziesz zawsze meczach za słowa, które zaczynają się "w" i gdzie część po "w" jest przymiotnikiem (tag POS "JJ"). "Nie: 1" jest znak pozycji, czyli o pierwszym (i jedynym) jest określany dopasowanie
  • .
  • francuski:
  • dodaną i poprawić kilka zasad,
  • niemiecki:
  • dodaną i poprawić kilka zasad,
  • Polski:
  • dodane i ulepszone kilka zasad,
  • dodawane i poprawiła fałszywych przyjaciół z angielskim
  • Portugalski:
  • dodane / poprawione kilka zasad,
  • Hiszpański:
  • usunięta zależność od hunspell, teraz używa Morfologik do sprawdzania pisowni,
  • sformatowany plik zasady
  • Dodano więcej zasad,
  • tagalog:
  • usunięta zależność od hunspell, teraz używa Morfologik do sprawdzania pisowni,
  • znak kreska ("") jest separator teraz, gdy tokenizing tekst
  • rosyjski
  • i ulepszone zasady dodaje
  • dodano kilka zasad fałszywy przyjaciel (rosyjski / angielski)
  • ukraiński:
  • wiele nowych przepisów (w tym umowy z rzeczowników, wyrażeń czasowych itp)
  • poprawa pokrycia zasada
  • Aktualizacja słownika (duże ulepszenia dla nazw własnych i przypadku wołaczu)
  • nowy znak i rządzić, aby ostrzec o alternatywnych pisowni
  • dodany informacje częstotliwości słowo aby poprawić propozycje ortograficzne
  • niektóre nowe przepisy disambiguator
  • Zasada Składnia:
  • ... może teraz być dodawane do rulegroup wpływa na wszystkie zasady tej grupy
  • Jeśli rozwijać swoje własne zasady, które nie są częścią LT można teraz dodać zewnętrzny = "yes" do kategorii, aby zapobiec link reguły do ​​community.languagetool.org pojawianiu się w naszym samodzielnym GUI (Link nie działa przepisy, które nie są częścią głównej dystrybucji LT). (Sprawa nr 223 Github)
  • Jeśli grupa reguła określa domyślną = "off", zasady wewnątrz grupy reguł nie może również określić domyślne = "on" / "OFF".
  • API:
  • Usunięto klasy i metody, które były nieaktualne już od 2,7 lub
  • Wbudowany serwer:
  • opcje pliku konfiguracyjnego "requestLimit" i "requestLimitPeriodInSeconds" mogą być również wykorzystywane do serwera HTTP (nie tylko dla serwera HTTPS)
  • Nowa opcja config "trustXForwardForHeader": ustawić na 'true' po uruchomieniu serwera za reverse proxy i chcesz pracować limitu wniosek na oryginalnych adresów IP w nagłówku HTTP 'Xforwardedfor', zazwyczaj ustawione przez proxy. Jeśli używasz serwera proxy, ale nie ustawia tę właściwość na wartość true, jeden użytkownik może korzystać z wszystkich żądań tak, inni użytkownicy będą również wyświetlony komunikat o błędzie, ponieważ limitu żądania.
  • Odpowiedź Fix Po trybie Termin: ... był czasem puste, myląc sprawdzanie tekstu w WordPress
  • zasady Bitext nie zostały wyłączone prawidłowo, nawet jeżeli zostały one określone za pomocą odpowiedniego parametru do serwera; teraz jest stałe
  • Naprawiono problem z niewłaściwych pozycjach dla niektórych zasad bitext (sprawa nr 218)
  • GUI:
  • Nowe ustawienie "errorColors" został dodany do pliku konfiguracyjnego languagetool.cfg. Może być używany do ustawienia koloru tła błędów. Na przykład, errorColors = typograficzne: # b8b8ff, styl: # ffb8b8 pokaże "typograficzne" błędy z niebieskim tle i błędy "w stylu" z czerwonym tle w górnej części okna LT. "Typograficzne" i "styl" to typy, które są ustawione w grammar.xml jako "type = ...". Nie ma jeszcze interfejs do konfiguracji tych kolorów. Należy pamiętać, że należy edytować tylko plik languagetool.cfg kiedy LT nie jest uruchomiony.
  • Wewnętrzne:
  • Bugfix: zasady wewnątrz grupy reguły nie zostały aktywowane, jeśli poprzednie rządy od samego rulegroup używany domyślnie = "off",
  • Słowa już nie są ignorowane przez sprawdzania pisowni tylko dlatego, że występują w sugestią reguła jest. Jeśli chcesz sprawdzania pisowni ignorować słowa na całym świecie, dodaj je do hunspell / ignore.txt. Aby zignorować je w zależności od kontekstu, dodać "ignore_spelling" regułę disambiguation.xml.
  • plik 'hunspell / prohibit.txt "może być teraz używany do oznaczania słowa jak błędy ortograficzne, nawet jeśli sprawdzanie pisowni normalnie je przyjąć. Jest to przydatne do poprawy sprawdzania pisowni LanguageTool nie czekając na upstream sprawdzania aktualizacji. "Prohibit.txt" plik jest przeciwieństwem "ignore.txt", co powoduje, że moduł sprawdzania pisowni, aby zignorować słowa.
  • tagger partofspeech dla większości języków mogą zostać rozszerzone poprzez dodanie wpisów do pliku org / LanguageTool / resource / XX / XX (będąc added.txt kodem języka). Format jest "fullform baseform postag", trzy kolumny oddzielone kartach. Ułatwia to dla użytkowników i deweloperów) (rozszerzenie tagger POS, ponieważ nie trzeba eksportować, modyfikować i odtworzyć binarny słownika dla każdej zmiany.

Co nowego w wersji 2.7:

  • Breton:
  • i ulepszone zasady dodaje
  • Nowa reguła, która sprawdza czy dnia tygodnia dopasowuje datę, np wykrywa "Gwener 28 Eost mianowicie 2014", jako że data nie jest piątek.
  • kataloński:
  • i ulepszone zasady dodaje
  • stałe fałszywe alarmy
  • Dutch:
  • dodane i ulepszone wiele zasad,
  • włączony do Morfologik opartej sprawdzania pisowni,
  • -English:
  • Czy chcesz być częścią zespołu, który rozwija się na świecie najpotężniejszym narzędziem Korekta Open Source? Szukamy dla opiekuna zasad angielskiego w LanguageTool. Zobacz http://wiki.languagetool.org/tasks-for-language-maintainers szczegóły.
  • Wszystkie angielski słowniki zostały rozszerzone zajęcia częstotliwości zawiera słowo poprawić sugestie sprawdzania pisowni (dane częstotliwości pochodzi z https://github.com/mozilla-b2g/gaia/tree/master/apps/keyboard/js / imes / Latin / słowniki, jak dla innych języków, które już korzystają z tej funkcji).
  • lepsze propozycje dla uczących się języka angielskiego: czasowników nieregularnych, rzeczowników i przymiotników, teraz mają zwykle lepszy pomysł. Na przykład, "thinked" sugeruje "myślał", "womans 'sugeruje' kobiety '.
  • Więcej błędy ortograficzne zasugeruje teraz, na przykład "Garentee" (gwarancja), "wdzięczny" (wdzięczna). Może to spowodować zmniejszenie wydajności ~ 10% (więcej na tekstach z wielu nieznanych słów).
  • Nowa reguła, która sprawdza czy dnia tygodnia dopasowuje datę, np wykrywa "Poniedziałek, 07 październik 2014", jako że data nie jest poniedziałek. Zasada ta działa tylko wtedy, gdy wykryje, format daty w użyciu. Do tej pory te formaty są obsługiwane: * "Poniedziałek, 07 października 2014" * "Poniedziałek, 07 października 2014" * "Poniedziałek, 07 października 2014" * "Poniedziałek, 07 października 2014" * (działa to również w skróconym tygodniu dni jak Mo lub Mon Poniedziałek)
  • Esperanto:
  • Nowa reguła, która sprawdza czy dnia tygodnia dopasowuje datę, np wykrywa "Vendredon la 28-an de AAgusto 2014", jako że data nie jest piątek.
  • francuski:
  • słownik tag aktualizowane POS i słownik hunspell do Dicollecte-5.2
  • dodany syntezator - zasada Umowa może teraz sugestie dla niektórych błędów,
  • dodane / poprawione kilka zasad,
  • Nowa reguła, która sprawdza czy dnia tygodnia dopasowuje datę, np wykrywa "vendredi 28/08/2014", jako, że data nie jest piątek.
  • niemiecki:
  • Naprawiono rzadko NullPointerException i ArrayIndexOutOfBoundsException
  • Poprawiono kilka fałszywych alarmów,
  • Dodane i łatwiejsze zasady
  • Nowa reguła sprawdza zdaniach bez czasownika (domyślnie wyłączone ze względu na ryzyko fałszywych alarmów)
  • Nowa reguła, która sprawdza czy dnia tygodnia dopasowuje datę, np wykrywa "Wtorek, 29.09.2014", jako, że data nie jest wtorek.
  • Poprawiono wydajność do sugestii sprawdzanie pisowni
  • perski:
  • dodał wstępne wsparcie dla Perski (Farsi)
  • Polski:
  • dodaną i poprawić pewne zasady,
  • Nowa reguła, która sprawdza czy dnia tygodnia dopasowuje datę
  • Portugalski:
  • dodane / poprawione kilka zasad,
  • dodano wiele dziesiątki wyrazów złożonych,
  • rosyjski
  • dodano nowe zasady
  • Funkcja żądania naprawić SourceForge 38 miejsce (sprawdzić w różnych znaków cudzysłowu)
  • dodano kilka zasad fałszywy przyjaciel (rosyjski / angielski)
  • Nowa reguła, która sprawdza czy dnia tygodnia dopasowuje datę, np wykrywa "ÐонеÐ'еÐ"NŒÐ½Ð¸Ðº, 30 N ?? & ETH; & micro; & ETH; & frac12; N & sbquo N ?? & ETH; & plusmn; N & euro; N ?? 2014 & ETH; & sup3 ;. ", jako, że data nie jest poniedziałek,
  • .
  • rozszerzona Rosyjski reguły związek z nowych słów ze słownika postag
  • Hiszpański:
  • Dodano nową kategorię POS Z (dla orkiszu numerów, np "Uno", "dos", ...)
  • napisane numery mogą być wykryte i zarządzany zarówno w dezambiguacji i zasad.
  • Poprawiono kilka błędnych lematy w słowniku POS.
  • Dodane Hybrid Chunker-disambiguator.
  • Tamil:
  • Dodano wstępne wsparcie dla tamilskim. Jeśli czcionki dla tamilskim nie jest poprawnie wyświetlana na komputerze i używasz Windows, może być konieczne zastosowanie obejścia opisane tutaj: https://bugs.openjdk.java.net/browse/JDK-8008572
  • ukraiński:
  • duża aktualizacja dla słownika POS (poprawek i nowych słów)
  • niektóre tag POS przemianowany na spójność; nowe znaczniki dla skrótów i rzadkich słów
  • wiele nowych przepisów i poprawek do istniejących przepisów,
  • Nowa reguła, która sprawdza czy dnia tygodnia dopasowuje datę, np wykrywa "& ETH; & ETH; & frac34; & ETH; & frac12; & ETH; & micro; & ETH; 'N- & ETH;" & ETH; & frac34; & ETH; & ordm ;, 7 & ETH; & para; & ETH; & frac34; & ETH; & sup2; 2014 ", jako że data nie jest poniedziałek,
  • Reklamowe poprawa wydajności normalizacji
  • Integracja LibreOffice:
  • Nie daj się mylić przypisów w LibreOffice 4.3, a później (teraz dostarcza nam stanowiskach przypisów jak metadanych, dzięki czemu możemy je zignorować).
  • API:
  • Podstawowe ulepszenia wydajności dla przypadku użycia wielowątkowego, gdzie zostanie utworzony na JLanguageTool nici, ale obiekt język (np 'niemiecki') zostanie utworzona tylko raz. Overhead tworzenia JLanguageTool powinno być teraz znacznie niższe.
  • Usunięto kilka klas i metod, które były nieaktualne, ponieważ w wersji 2.6
  • Usunięto DutchSpellerRule - używać MorfologikDutchSpellerRule zamiast
  • podpis Language.getRelevantRules () został zmieniony,
  • JLanguageTool i MultiThreadedJLanguageTool konstruktorzy nie deklarują już rzucić IOException
  • WhitespaceRule została zmieniona na MultipleWhitespaceRule (WhitespaceRule wciąż istnieje, ale została zaniechana)
  • Nieaktualne niektóre metody, których widoczność zostanie obniżona (np od społeczeństwa, aby chronione)
  • MorfologikSpellerRule.getRuleMatch (String, int) została zmieniona na MorfologikSpellerRule.getRuleMatches (String, int)
  • Konstruktor RuleMatch teraz zgłasza wyjątek, jeśli toPosition nie jest większy niż fromPosition
  • Wprowadzono nową klasę abstrakcyjną TextLevelRule, który rozciąga się regułą, a które mogą być używane do zasad, które obejmują więcej niż pojedynczych zdań.
  • Wiersz poleceń:
  • Włączanie i wyłączanie szczegółowych przepisów w tym samym czasie jest teraz dozwolone. W celu przetestowania tylko niektóre zasady (wyłączenie wszystkich pozostałych), która wcześniej została wykonana z "--enable LIST_OF_RULES", teraz wykorzystać "--enabledonly --enable LIST_OF_RULES" (lub "EO -e LIST_OF_RULES").
  • Wbudowany serwer:
  • Dwa nowe opcje można ustawić w pliku właściwości LanguageTool powrócić do tego samego formatu XML, jak po terminie (ATD). W ten sposób może być stosowany jako zamiennik dla ATD: * Tryb - "LanguageTool" lub "AfterTheDeadline '* afterTheDeadlineLanguage - kod języka domyślnego, jeżeli tryb jest ustawiony na" AfterTheDeadline' Uwaga: Tryb "AfterTheDeadline" należy uznać za eksperymentalna teraz.
  • Nowa opcja "maxCheckThreads 'Pozwala ustawić maksymalną liczbę wątków roboczych w sprawie wniosków równolegle. Domyślnie jest to 10, jak było kiedyś.
  • Wewnętrzne:
  • Nowa reguła AbstractDateCheckFilter abstrakcyjna, która pozwala sprawdzić, czy dzień tygodnia i datę meczu. Na przykład "Wtorek, 29 września 2014" można wykryć, a 29 września 2014 w rzeczywistości nie jest wtorek. Ten eksperymentalny wykorzystuje nowy interfejs RuleFilter, że może być wywoływana z XML z nowym "filtra" elementu. "Filtr" ma te atrybuty: "klasa": w pełni kwalifikowaną nazwę klasy Java, który implementuje RuleFilter, np "org.languagetool.rules.de.DateCheckFilter" args "": ciąg jak "rok: 1 miesiac: 2 dzień: 3 dzień tygodnia: 4", czyli lista rozdzielonych odstępami par klucz / wartość, gdzie x zostanie rozwiązany do wartość tokena wzoru (jak w "wiadomości" elementu)
  • Teraz ignoruje zasadę związek tokeny, które zostały w disambiguation.xml szczepią
  • "filtr" działanie w disambiguator jest obecnie stosowana jedynie tagów POS pasujących tag POS nadany. Jeśli nie pasują, zasada nie jest stosowana.
  • Jeśli rozszerzenie reguł XML, zgodnie z opisem http://wiki.languagetool.org/tips-and-tricks#toc2, zewnętrzne pliki reguł i ujednoznaczniania mogą być umieszczona na serwerze chronionym hasłem, określając URL tak: http: // user: password@example.org/path/user-rules.xml
  • em myślnik ("& euro;" ") jest obecnie charakter tokenizing dla wszystkich języków,
  • Nowa funkcja:
  • Wykorzystanie modeli językowych
  • LanguageTool mogą teraz korzystać z danych ngram. Dane ngram informacje o tym, jak to często występują zwroty w języku. Obecnie ten używa frazy o długości 3.
  • Dane te są wykorzystywane przez regułę angielskim znaleźć błędy homophone, jak mieszanie się zgrubne / kurs lub flair / flary. LanguageTool miał jakieś zasady tego rodzaju, przed, ale nowa reguła obsługuje około 900 takich par / zestawach tekstu.
  • Dane potrzebne do tego jest ogromna (7GB w języku angielskim), a tym samym nie jest częścią ani LanguageTool.
  • Dane (na razie tylko w języku angielskim), a dokumentacja jest dostępna w http://wiki.languagetool.org/finding-errors-using-big-data
  • Korzystanie ngrams sprawia LanguageTool nieco wolniej, gdy dane są przechowywane na dysku SSD.
  • Jeśli nie są przechowywane na dysku SSD, może drastycznie zmniejszyć wydajność.
  • Użyj nowego --languagemodel opcję z klienta wiersza poleceń, aby włączyć regułę, która wykorzystuje dane. Ta opcja nie jest jeszcze dostępna dla GUI autonomicznym.

Co nowego w wersji 2.4.1:

  • Zaktualizowane biblioteki Morfologik do 1.8.3 Utrwalić sugestie sprawdzania pisowni, która dotknęła co najmniej en-US;

Co nowego w wersji 2.4:

  • Breton:
  • SRX zdanie tokenizacja
  • dodania / poprawić kilka zasad,
  • Poprawiono kilka fałszywych alarmów,
  • Poprawiono nieprawidłowe sugestie dzięki dodanych testów na korekt
  • kataloński:
  • dodane / poprawione kilka zasad,
  • stałe fałszywe alarmy
  • wykonane dodatki i poprawki do słownika Tagger
  • usunąć kilka słów ze słownika syntezy (patrz filterarchaic.txt)
  • dodany dane częstotliwości do słownika Tagger; wordlist częstotliwości pochodzi z projektu Gaia, z Apache License, wersja 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
  • angielski:
  • dodania / poprawić kilka zasad,
  • Poprawiono kilka fałszywych alarmów,
  • francuski:
  • dodane / poprawione kilka zasad,
  • Poprawiono kilka fałszywych alarmów,
  • niemiecki:
  • dodane / poprawione kilka zasad,
  • dodany syntezator reguły umowa może teraz zasugerować pewne błędy (nie wszystkie propozycje są prawidłowe, chociaż)
  • Polski:
  • dodane / poprawione kilka reguł, zwłaszcza dla łącznika i użytkowania rozdzielczej
  • dodał informacji o częstotliwości do słownika pisowni; wordlist częstotliwości pochodzi z projektu Gaia, z Apache License, wersja 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
  • Poprawiono kilka fałszywych alarmów,
  • Portugalski:
  • dodane / poprawione kilka reguł (obecnie obejmuje zasady równości płci "a" / "o")
  • to teraz ma 3400+ wyrazów złożonych,
  • plik JAR została zmieniona na languagetool.jar, ze dawniej languagetoolstandalone.jar aby uniknąć nieporozumień na temat tego, co "standalone" oznacza w tym kontekście (GitHub Wydanie nr 29)
  • dla języków z wielu zasad (takich jak francuskim lub niemieckim) wydajności na długich tekstów została zwiększona o około 2030%
  • poprawka dla threadsafety (może powodować powiesić MultiWordChunker)
  • Naprawiono błąd, gdzie adnotacje chunk nie były testowane w grupach
  • fix: 1 i nie został oceniony ...
  • Naprawiono błąd w mechanizmie zjednoczeniowego, że odrzucono niektóre interpretacje pasujące przedwcześnie
  • dodano wsparcie dla adnotacji fragmentu w disambiguator, a jeden błąd w stałej filtracji z adnotacjami tokeny fragmentach
  • zaktualizowane biblioteki Morfologik do 1.8.2 (poprawki, wejście surowsze sprawdzenia kondycji, dodać dane częstotliwości do słowników)
  • dodana możliwość włączenia dane częstotliwości do słowników ortograficznych lub taggging. Oczekuje format list słów częstotliwości jest jeden w projekcie Gaia, z Apache License, wersja 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries)
  • Nowe narzędzia wiersza poleceń do eksportu i tworzenia słowników binarne:
  • org.languagetool.dev.DictionaryExporter
  • org.languagetool.dev.POSDictionaryBuilder
  • Integracja LibreOffice / OpenOffice:
  • dodał obejście nieprawidłowego wykrywania zdanie na sprawy, które pojawiły się po przypis zdanie kropką (bug # 191 Sourceforge)
  • samodzielnym GUI:
  • dialogowe otwiera "Więcej ..." pozycji w menu kontekstowym błędu będzie teraz także wyświetlenia poprawnych i niepoprawnych przykładowe zdania,
  • API:
  • SentenceTokenizer jest teraz interfejs, realizacja została przeniesiona do RegexSentenceTokenizer, ale to jest przestarzałe i SRXSentenceTokenizer powinny być stosowane zamiast
  • Niektóre metody z org.languagetool.tools.StringTools zostały przeniesione do klasy org.languagetool.gui.Tools w projekcie languagetoolguicommons
  • LanguageToolListener.languageToolEventOccured () została zmieniona na LanguageToolListener.languageToolEventOccurred ()
  • org.languagetool.tools.SymbolLocator publiczna nie jest już (nie powinno wpływać na nikogo)
  • usunięte DanishSentenceTokenizer która została zaniechana przez trzy lata
  • Rule.getCorrectExamples () i Rule.getIncorrectExamples () nie zwracają już null, ale pusta lista, jeśli nie ma żadnych przykładów. W związku z tym, setCorrectExamples () i setIncorrectExamples () nie akceptują już puste.
  • Rule.getId () może zwrócić dowolny ciąg teraz, nie tylko ASCIIonly struny (właściwie to było w przypadku wcześniej, jako ograniczenie ASCIIonly nigdy nie została wykonana i tylko wymienione w javadoc)
  • languagetoolwikipedia: opcje wiersza poleceń do sprawdzania zrzutu Wikipedii zostały uproszczone. Polecenie to może być teraz nazywa tak: java jar languagetoolwikipedia.jar checkdata l pl f enwiki20130621pagesarticles.xml Zadzwoń java jar tylko "", aby languagetoolwikipedia.jar checkdata uzyskać informację o użytkowaniu. Więcej niż jeden plik może być określony za pomocą opcji f. Dodatkowo do Wikipedii wysypisk XML, CSV z Tatoeba (http://tatoeba.org) są teraz również wspierany, muszą być filtrowane pierwszy zawiera tylko odpowiedni język.

Co nowego w wersji 2.3:

  • Breton:
  • dodania / poprawić kilka zasad,
  • stałe fałszywe alarmy
  • zaktualizowane Słownik POS z apertium (SVN r47282)
  • kataloński:
  • dodano wsparcie dla kodów języków ca-ES-Walencja (Walencja), kataloński, do wykorzystania w LibreOffice 4.2.0
  • dodany proste zastąpienie reguły z setek propozycji zamiennych
  • dodane / poprawione kilka zasad,
  • stałe fałszywe alarmy
  • Chiński:
  • dodaje obejście dla StringIndexOutOfBoundsException (http://sourceforge.net/p/languagetool/bugs/186/)
  • angielski:
  • dodany wzory zamienne do sprawdzania pisowni, aby sugestie lepiej (teraz oferuje "nauczał" dla "nauczył")
  • dodania / poprawić kilka zasad,
  • francuski:
  • dodania / poprawić kilka zasad,
  • stałe fałszywe alarmy
  • słownik tag aktualizowane POS i słownik hunspell do Dicollecte-4.12
  • niemiecki:
  • dodane / poprawione kilka zasad,
  • Portugalski:
  • dodania / poprawić kilka zasad,
  • to teraz ma 3300+ wyrazów złożonych,
  • ukraiński:
  • dodane / poprawione kilka zasad,
  • Kod źródłowy został przeniesiony do github: https://github.com/languagetool-org/languagetool
  • LanguageTool teraz wymaga Java 7
  • LanguageTool korzysta z wielu wątków teraz tekst sprawdzanie na nowoczesnym sprzęcie, zwiększając wydajność (dotyczy to wersji stand-alone, wersję wiersza poleceń i rozszerzenie LibreOffice / OpenOffice)
  • zasady składni:
  • wstępne wsparcie dla nowych atrybutów min / max, które pozwalają dopasować element, który pojawia się na określoną liczbę razy. Na przykład: foo będzie pasował nic lub "foo", czyli "foo" jest opcjonalne foo będzie pasował "foo" lub "bla bla" foo będzie pasował nic, "foo", lub "foo foo" Użyj max = "- 1" aby umożliwić nieograniczone wystąpienia. Dla minut, tylko 0 lub 1 jest obsługiwany (1 jest domyślnie).
  • wsparcie dla OR-sprawozdania. Na przykład: w wewnętrznie i w okresie czasu, z reguły zawierających lub sprawozdaniami przekształca się kilku zasad zwrotów lub bez;
  • .
  • angielski ma teraz Chunker wykrywania, między innymi, rzeczowników w liczbie pojedynczej i mnogiej kawałki. Jest to udokumentowane w http://wiki.languagetool.org/using-chunks
  • w wersji standalone: ​​
  • wersja standalone podkreśla się błędy z czerwoną (błędy ortograficzne) lub niebieski (inne błędy) linii (Panagiotis Minos)
  • Pamiętaj, wybór języka do następnego startu
  • Ulepszone okno dialogowe i jego lokowania w konfiguracji z kilkoma monitorami,
  • Wbudowany serwer: używa domyślnego portu (8081) ponownie, jeśli uruchamiany bez argumentów,
  • zaktualizowane Morfologik-wynikająca biblioteki do wersji 1.7.1, aby umożliwić lepsze propozycje, w tym prawidłowe operowanie znaków diakrytycznych i wzorów zamiennych (odpowiedniki mapa i REP funkcji w hunspell słowników)
  • Integracja OpenOffice / LibreOffice:
  • fix: "O" dialog nie działa w Apache OpenOffice 4.0
  • fix: szczegółowe przepisy krajowe (jak dla British English) nie działa,
  • API:
  • W klasie języka, getCountryVariants () została zmieniona na metodę: getCountries (), a nowa metoda getVariant został dodany.
  • Niektóre metody są nieaktualne,
  • Niektóre metody zostały przeniesione z klasy Narzędzia (LanguageTool-core) do nowej klasy CommandLineTools (LanguageTool-poleceń)










Co nowego w wersji 2.2:



Co nowego w wersji 2.1:





Co nowego w wersji 2.0:







Wymagania :

  • Java 2 Standard Edition Runtime Environment

Inne programy z deweloperem Daniel Naber

LanguageTool
LanguageTool

21 Jan 15

Jwordsplitter
Jwordsplitter

21 Jan 15

Komentarze do LanguageTool

Komentarze nie znaleziono
Dodaj komentarz
Włącz zdjęć!