Интернационализација, локализација, кодирање, Исланд и превод на јапонска веб-страница за фотографии со мачки

превод на интернационализација

ИнтернационализацијаИма многу информации таму кога станува збор за интернационализација, локализација и кодирање во рамките на веб-апликациите. Исто така, има многу недоразбирање за тоа што секој обезбедува за веб-апликација. Еве го мојот придонес

Кога веб-прелистувач прави врска со веб-сервер, тој поминува доста променливи и прави дополнителни барања, еве еден пример:

GET / HTTP / 1.1
Домаќин: www.dknewmedia.com
Корисник-агент: Mozilla / 5.0 (Macintosh; U; Intel Mac OS X; en-US; rv: 1.8.1.3) Gecko / 20070309 Firefox / 2.0.0.3
Прифати: HTTP Прифати = текст / xml, апликација / xml, апликација / xhtml + xml, текст / html; q = 0.9, текст / обичен; q = 0.8, слика / png, * / *; q = 0.5
Прифати-јазик: en-us, en; q = 0.5
Прифати-кодирање: gzip, издувам
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7

Интернационализација

Интернационализацијата е составен дел од многу работи:

  1. Локализација: Способност да се идентификува од кој јазик и локација посетува еден посетител. Ова е направено преку HTTP Барања каде посетителот е идентификуван од локално ниво. Во мојот случај, тоа е во САД. „En“ е англиски и „US“ е Соединетите држави. Ова е поставка за мојот оперативен систем.
  2. Временски зони: Способност за прилагодување за временските зони. Ова нормално се постигнува со поставување на вашиот сервер на средно време во Гринич (GMT) и потоа им се дозволува на корисниците да го постават своето локално поместување од GMT.
  3. Кодирање на карактерот: Ова е можност за правилно прикажување на множествата на јазичните карактери. Тоа е различно од локализацијата, бидејќи локализацијата може да ми го каже јазикот и регионот на компјутерот од кој се бара, но нема да ми каже на кој јазик е читач бара ... тоа зависи од читателот!

Забележете во мојот HTTP Header кога прелистувачот го поднесе барањето, тој му соопшти на серверот дека ми го бара локалното ниво (Accept-Language: en-us); сепак, тој исто така треба да му каже на серверот што е побарано множество знаци (Accept-Charset: Accept-Charset: ISO-8859-1, utf-8; q = 0.7, *; q = 0.7) ISO-8859-1 и utf -8 се обата дозволени множества на карактери.

локализација

Во овој фантастичен свет на мешање, локализацијата повеќе не диктира јазик. И покрај тоа што сум во САД, апсолутно можам да прочитам различен јазик користејќи различен сет на карактери ... тоа е она што се случува кога користам Гугл хинди (Јас навистина не користам хинди на Гугл). Моето барање за локација и множеството знаци се идентични како кога го барам Google English страница, но јас сум всушност најавена страница што не можам да ја прочитам затоа што немам поставено знаци. Сето тоа се појавува ???????????… Сепак, можам да го вчитам тој карактер поставен во Firefox (Firefox> Преференции> Напредни> Јазици):

Јазик на вчитување на Firefox

Ако го вчитам тој јазик, тогаш можам да ја побарам страницата во нејзиниот природен сет на карактери и да ја прикажам на мојот компјутер, иако мојата стандардна локација е во САД!

Значи, ако сум студент од Хинди, студирам англиски јазик на Пердју и се поврзам преку VPN на серверот на училиштето, на одмор во Австралија… има 3 различни поставки што треба да се применат на апликацијата за вистински да се интернационализира - и никој зависат од другиот.

Моето локално ниво ќе се појави како во САД, но мојата временска зона е Австралија, но јазикот што го барам од веб-страницата може да биде хинди. Ако ја програмирав мојата апликација да ја направам претпоставки врз основа на локалното ниво на мојот компјутер, јас би бил целосно во ред - хранејќи го лицето Англичанец во источна временска зона. Идеално, би ја програмирала мојата апликација да ја понудам и поставки за јазик и временска зона… но не би претпоставил дека се засноваат на локално ниво.

Исланд - врвен пример

Ние сме неуки за повеќејазични и повеќе локални предизвици во Соединетите држави каде што сме сите зборуваат англиски [подразбира сарказам]. Во некои земји, како што е Исланд, иако мајчин јазик е исландскиот, неверојатните исландски луѓе растат учејќи 3 јазици! Бидејќи Исланд е земја во средината на Европа и Северна Америка, нивните компании работат низ повеќе континенти, јазици, дијалекти на јазиците и повеќе временски зони од нивната работна површина!

Многу исландски веб-страници се изградени на американски англиски, британски англиски, исландски, шпански, шпански, француски и германски! Замислете само колку е предизвик да се гради Icelandair's апликации за веб-страници и системи за билети… леле!

Откажување: Имав апсолутно задоволство да работам со убави луѓе од Исландер и можам да ви кажам дека тие се едни од најталентираните и најпријателските професионалци со кои имав задоволство да работам. Едноставно, тоа е неверојатна земја и луѓе! Одете во посета ... земете го Исланд Аир и не заборавајте да ја посетите Сина лагуна!

Јазик наспроти кодирање

Постојат дури и различни кодирања на карактери во еден јазик кои не играат добро едни со други! Пример: Јапонска е-пошта напишана во Shift-JIS може да стане нечитлива на компјутерот на Јапонка со локализација поставена на ja-JP бидејќи нивниот сервер за пошта препознава само EUC-JP. Идеално, клиентот треба да може да постави какво кодирање би сакал, како и кој јазик - едноставно осигурувајќи дека кодирањето и јазикот се компатибилни со она што го бара клиентот.

Ако сакам да читам јапонски јазик, можеби ќе треба да ги изберам и јапонскиот јазик и SHIFT-JIS за кодирање за да го прикажам тој јазик правилно. Еве уште една конфузија за да додадете во мешавината… некои типови на кодирање поддржуваат неколку јазици. UNICODE / UTF8 поддржува десетици. И обратното е точно. Некои јазици можат да се читаат во многу типови на кодирање. Ако тоа нема смисла ... се извинувам, тоа е многу сложено прашање.

Некогаш верувам (се надевам) дека сето ова ќе се промени. Мислам дека оригиналните дизајнери на кодови за локализација се надеваа дека комбинираното за јазик ќе биде сè што е потребно… но ние станавме далеку пософистицирани. Запомнете, голем дел од ова беше развиен пред да постои Интернет. Со доаѓањето на ГИС, можеби некое лице може да го избере своето кодирање и ГИС би се справил со временската зона и информациите за локацијата.

Интернационализација

Назад кон поддршката за интернационализација. Ако сакате да обезбедите интернационализирана апликација, треба:

  1. Поддржете повеќе типови на кодирање, јазици и имате датотеки за превод за да ги прикажете тие преводи.
  2. Дозволете му на клиентот да го постави својот јазик, па дури и можеби нивниот тип на кодирање, доколку е потребно.
  3. Поддржете ги временските зони дозволувајќи им на корисниците да ја упатуваат својата временска зона во споредба со GMT.
  4. Користете ги кодовите за локализација со претпазливост… тие НЕ препишуваат точно што бара вашиот корисник, ниту што може да прочита.

Превод

Машинскиот превод е сè уште во зачеток. Постојат голем број веб-страници таму (и WordPress Приклучоци) кои нудат машински превод на вашата страница. Не паѓајте во искушение да го направите ова ... постојат две причини зошто:

  1. Ако работи машинскиот превод, корисникот што ја проверува вашата страница веќе ќе има преведувач со кој ќе работи.
  2. Машински превод смрди.

Не ми веруваш? Еве јапонски превод за вас:
Залепено од Датотека Масатсу - фраер со тон слики од мачки:

Внесување на јапонски блог

??
- 00:29:35 од масатсу

??????????????????????????????
??????????????????????????????

?????????? (?)?

??????????????????????????????
??????????????????????????????

?????????????????????????????? (?)

?????????????????

??????????????
??
??

???????????????????????????????????????

???????????????????????????????

??????????????????????????????
??????????????????????????????
?????????? Аг ??????????????

??????????????????????

Машински превод:

?? Хан ?????
-00: 29: 35 од масатсу

Името на првиот светец на еден / слонот што се појави на вчерашната флота на тупаница „а / astвер ?? ренџер “„ ?? Хан ???? “ со радио-актерот Јутака Мизушима.

? (?) што ја прави сипава лесно.

Затоа што дури и радио актерот на тупаница светец, мајстор ????? на а / мачката се кинески дуња од Нагаи Ичиро = змејска топка персоналот на а / а ?? ренџер изгледа како луѓе кои духовит забелешка знае лесно.

(Потта) што оваа година целосно ја заборавав „тајната на името на супер флота“, на вообичаена практика секоја година?,

?????? Ако пишувам со задоцнување оваа година,

??????? светилиште ??? (може како?)? череп на глава (?? не сече) Фуками ?? (? или да набудувам способен?) an / the е тоа што го прави тоа

Со тоа, станува „конзерва /? /?“, Со други зборови, „кунг фу“, кога ќе се редат и ќе се смени главата на името / името.

?????? Иако се вели дека се зголемуваат дополнителни два, наводно, може да стане какво име.

За вистината се вели дека е „старост“ затоа што симболот на сребрениот елемент е Ag?, Иако името на „???? сребро “Такаоката? техничар на ??????? мислеше дека ликот наречен „?“ се користеше со асоцијација на филм за сребрено платно, ако го нарекува со член на додаток.

Сепак, јас себично размислувам дека мојата теорија не е неповрзана дека „?“ е вклучено во кинески карактер.

Сигурен сум дека враќањето на поларитетот на овој превод ќе обезбеди исто толку читлива дикција на англиски јазик. Го разбравте записот, нели?

2 Коментари

  1. 1

    мислеше на Пурдју?
    Секако - испотен радио-актер се прашуваше на правилниот начин да се кажат одредени работи.

Што мислите?

Оваа страница користи Akismet за намалување на спам. Научете како се обработува вашиот коментар.