UnicodeConverter to program Java, który konwertuje pliki tekstowe i HTML w ISC, TCVN3 (ABC), VISCII, VNI i format VPS na UTF-8 Unicode. Wsparcie dla Unicode Konwersja Composite, liczbowe cechy charakteru (NCR) i VIQR (Vietnet) jest również. We wszystkich przypadkach, wyjście będzie normalizacji Unicode formularzu C, lub lepiej znany jako formacie Precomposed Unicode.
UnicodeConverter, wykonywalny w obu trybach graficznych interfejsu użytkownika (GUI) i wiersza poleceń, pozwalający na konwersję wielu plików w katalogu, lub całego katalogu, w tym jego podkatalogów. W efekcie zwiększona zdolność umożliwia konwersję całej strony internetowej do formatu Unicode UTF-8 z jednego polecenia lub kilku kliknięć myszką. Wsparcie przeciągnij i upuść jest również.
Wsparcie dla konwersji dokumentów Word i skoroszytów programu Excel na platformie Windows jest wliczony w cenę. Funkcja ta jest realizowana za pomocą Jakuba Java-COM jest most, który umożliwia klientom zadzwonić elementów automatyki COM z Jawy. JACOB wykorzystuje Java Native Interface (JNI), aby rodzime połączenia do COM i bibliotek Win32; W związku z tym dodaje funkcjonalność nie jest przenośny, ani dostępne dla innych platform. Jest również wsparcie dla konwersji plików w formacie Rich Text.
UnicodeConverter jest uwalniany i rozpowszechniany na licencji GNU General Public License. Jego strona główna jest http://unicodeconvert.sourceforge.net.
WYMAGANIA SYSTEMOWE
Musisz mieć Java 2 Runtime Environment, Standard Edition (JRE) 1.4 lub nowszej zainstalowanego na komputerze do wykonania UnicodeConverter. J2RE można pobrać za darmo z http://java.sun.com/j2se/. Java 2 Runtime Environment, Standard Edition (JRE) składa się z wirtualnej maszyny Java, podstawowych klas platformy Java oraz plików pomocniczych, co pozwala na uruchamianie aplikacji napisanych w języku Java.
W systemie Mac OS X Tiger i Panther, UnicodeConverter działa bez dodatkowych wymagań. Dla Jaguara 10.2.6 lub nowszy, Java 1.4.1 Update 1 można zainstalować.
Aby móc konwertować dokumenty Word lub Excel, musisz być w systemie Windows z Microsoft Word lub Excel zainstalowany. Umieść jacob.dll pliku na swojej drodze, na przykład, do system32 lub folderu jre / bin.
Jak uruchomić UnicodeConverter
UnicodeConverter jest napisany w języku Java i spakowane jako archiwum na Java wykonywalnego. Pobierz i rozpakuj UnicodeConverter-1.3.zip. UnicodeConverter.jar jest wykonywalny Java, Archiwum do uruchomienia. Można go albo klikając dwukrotnie plik UnicodeConverter.jar lub wykonując polecenia uni w linii poleceń, aby uruchomić program w trybie GUI uruchomić. Alternatywnie, dłuższe polecenia
java -jar UnicodeConverter.jar
lub (w systemie Windows)
javaw -jar UnicodeConverter.jar
będzie działać, też. Nazwa pliku jest wielkość liter w niektórych systemach operacyjnych. Upewnij się, że katalog, który zawiera plik UnicodeConverter.jar jest katalog bieżący.
Uwaga: Zaleca się, aby program Microsoft Word / Excel nie otworzyć dowolny plik po konwersji dokumentów Word / Excel. Może to spowodować błędy lub spowolnić proces konwersji.
Wskazówka: Minimalizacja liczby pól tekstowych w obrębie dokumentów Word do kilku; posiadanie zbyt wielu konwersji spowolni znacząco.
Możesz wybrać jeden lub wiele plików lub katalogów d nawrócenia. Powstałe pliki wyjściowe Unicode zostaną umieszczone w katalogu d_Unicode znajduje się na tym samym poziomie, jak drzewa katalogu źródłowego, który zawiera oryginalne pliki, które pozostają bez zmian. Można również przeciągnąć pliki lub katalog z menedżera plików ojczystym i upuść na oknie aplikacji, aby zainicjować operację konwersji.
Program może również funkcjonować jako programu wiersza polecenia, które są często stosowane w przetwórstwie pliku wsadowego:
java -jar UnicodeConverter.jar
gdzie możliwe opcje kodowania źródłowego są VNI, VISCII, VPS, VIQR, TCVN3 i UNI-COMP. Funkcja ta działa tylko dla plików tekstowych, a nie dokumentów Word / Excel.
Kompozyt Unicode (UNI-COMP) pliki tekstowe źródłem powinny być zapisane w formacie UTF-8 dla prawidłowego konwersji na Unicode precomposed.
Domyślne czcionki wyjście plików HTML UTF-8 jest Times New Roman, Arial i. Użytkownicy mogą zmieniać do innych czcionek Unicode zgodny z wykorzystaniem zgodnych ze standardem Unicode, takie jak edytory HTML FrontPage lub kompozytora. Nie należy używać edytorów niezgodna Unicode (takich jak Notatnik z Win9x / ME), aby edytować pliki w formacie UTF-8. Może to będzie uszkodzony sekwencję bajtów UTF-8, czyniąc znaki lub plik nieczytelny.
Użyj Firefox, Netscape, Internet Explorer (Windows), Opera, Mozilla, Safari, OmniWeb lub przeglądarek internetowych Chimera aby zobaczyć UTF-8 plików HTML. Nie trzeba będzie zmienić ich ustawienia domyślne; tag mówi przeglądarek używać Unicode UTF-8 kodowanie znaków w wyświetlaniu strony.
PRZETWORY plik do konwersji
Aby zapewnić udaną konwersję plików HTML w formatach starszych i zminimalizować edycji po konwersji, niektóre sprzed konwersji klimatyzacji konieczne może być wykonywane na plikach źródłowych. Zmiana oryginalnych czcionek dokument do bardziej spotykane w odniesieniu do pierwotnego kodowania może być potrzebne (patrz tabela poniżej). Usuwanie przestarzałych dynamicznych linków Font (.pfr lub .eot) i skryptów ActiveX do sterowania i kontroli (np tdserver.js) zaleca się również, na pozostawienie ich w będzie niepotrzebnie spowalniają stronie pobierania.
Te podstawowe zadania edycyjne należy wykonać przed rzeczywistym procesu konwersji i może być szybko wykonane za pomocą MDI (Multi Document Interface), które pozwalają edytory tekstu otwierania wielu plików i wykonywania globalnego find / zastąpić działania na wszystkich otwartych plików na raz. CuteHTML, TextPad, UltraEdit, EditPlus, a EditPad kilka edytorów, że sportowe takie przydatne funkcje. Mogą być wyszukiwane i pobrać z http://www.download.com.
Czcionki Źródło kodowanie oryginalnych dokumentów HTML
VNI VNI-Times, VNI Times, VNI-Aptima, VNI Aptima, VNI-Helve, VNI Helve
VPS VPS Times, VPS Helv
VISCII VI Times, VI Arial, HoangYen, MinhQu, PhuongThao, ThaHuong, UHO
TCVN3 .VnTime, .VnTimeH, .VnArial, .VnArialH
VIQR formatowanie czcionki nie
Uwaga: Ze względu na charakter kodowania TCVN3, nawrócenie niektórych samogłosek kapitałowych wietnamskich spowoduje nieprawidłowe, małymi literami. Niektórzy po konwersji do edycji mogą być konieczne.
CZCIONKI zgodny UNICODE
Unicode ma tylko ograniczone wsparcie dla Windows 95/98 / Me, ale nadal są w stanie wyświetlać wszystkie znaki wietnamskich użyciu odpowiednich czcionek Unicode. Pełne wsparcie dla Unicode jest wbudowany w Windows NT / 2000 / XP. Linux i Mac OS 8.5 lub wyższy zaczęły dostarczać wsparcie dla Unicode. Mac OS X i Palm OS zapewnić pełne wsparcie dla Unicode.
Następujące czcionki TrueType, które dostarczane są z systemem Windows 98SE / ME / 2000 / XP, zawiera wiele znaków Unicode, w tym wietnamski:
Times New Roman, Courier New, Arial, Tahoma, Verdana, Palatino Linotype
Ta lista czcionek Unicode to nie jest pełna, ponieważ istnieje coraz więcej czcionek są komercyjnie opracowane lub poszerzony znaków Unicode.
Wymagania:
Szczegóły programowe:
Komentarze nie znaleziono