Russian Apache Switch to English
Switch to Russian koi8-r
windows=1251
cp-866
iso8859-5
Russian Apache Как это работает Рекоммендации Где взять Как установить Как настроить Статус и поддержка
Краткий обзор FAQ Список рассылки Благодарности Поиск по серверу Powered by Russian Apache
Russian Apache mailing list archive (apache-rus@lists.lexa.ru)

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [apache-rus] так где язык и где его кодировка?



>
> Hi!
>
> Предложение первое, не торопиться. А по существу, сделать драфт
> по всей русской части apache, как предположительно это будет работать.
> Если бы это удалось, то появится первый полноценный многоязычный сервер.
>
Вот-вот. Неделей раньше, неделей позже -- никто не умрет, а если сейчас
сдлеать так, что потом придется переделывать, то... Ну в общем этого бы
*очень* не хотелось.

> > 5) Предлагается:
> > a) сделать какой-то механизм объявления серверу, что такому-то Document
> > Language может соответствовать такой-то возможный список charsets.
> >    Вариантов два:
> >   - CharsetDecl koi8-r ru ua by
> >   - CharsetLanguageBind ru koi8-r windows-1251 iso-8859-5
> Я думаю что лучше:  CharsetDecl koi8-r windows-1251 iso-8859-5 ru,
> то есть последний таг - язык, так уже работало для CharsetTable.
> Это так же правильно, как и CharsetLanguageBind, но совместимо.
>
Проблема в том, что одной кодировке может соответствывать много языков.
Но в сущности оба варианта более-менее идентичны...

> >   При этом в обоих случаях _удобно_ (мне как программисту) понимать под
> >   Charset   внутреннее название таблицы перекодировки (в большинстве
> >   случаев оно  совпадает с выдаваемым пользователю
> >  Content-Type:... charset=name)
> Я тут хочу повторить свое предложение: использовать одну таблицу
> для каждого Charset - через UNI-code (utf8?), a из него генерировать
> все остальные. Я тут в одном месте долго искал ошибку: почему сервер
> в  windows-1251, не перекодирует,как оказалось что сервер настроен на koi8-r,
> а тут была перекодировка из iso-8859-5 в windows-1251 - пока нашел - вспотел.
> А было бы здорово для каждой кодировки иметь только один файл:
> CharsetRecodeUniTable koi8-r conf/uni-koi.tab
>
К сожалению это *невозможно*. Ибо с таблицей "откуда"-"куда" легко обслуживаются
случаи, когда некоторым символам в "исходной" таблице не нашлось места в
"итоговой" (translit или windows-1252 => ISO-8859-1), а при перекодировании
через Unicode так сделать автоматом невозможно, а если вводить дополнительные
правила, то сделать это *просто* не удастся :(( Заметим, что иногда даже прямая
и обратная теблицы не могут порождаться автоматом (если в обоих кодировках есть
символы, непредставимые в другой -- KOI8-R и windows-1251 для этого вполне
достаточно, если там рассматривать не только русские буквы).










Спонсоры сайта:

[ Russian Apache ] [ Как это работает ] [ Рекомендации ] [ Где взять ] [ Как установить ] [ Как настроить ] [ Статус и поддержка ] [ Краткий обзор ] [ FAQ ] [ Список рассылки ] [ Благодарности ] [ Поиск по серверу ] [ Powered by Russian Apache ] [ Apache-talk archive ]

"Russian Apache" includes software developed by the Apache Group for use in the Apache HTTP server project (http://www.apache.org/) See Apache LICENSE.
Copyright (C) 1995-2001 The Apache Group. All rights reserved.
Copyright (C) 1996 Dm. Kryukov; Copyright (C) 1997-2009 Alex Tutubalin. Design (C) 1998 Max Smolev.