>
> Hi!
>
> Предложение первое, не торопиться. А по существу, сделать драфт
> по всей русской части apache, как предположительно это будет работать.
> Если бы это удалось, то появится первый полноценный многоязычный сервер.
>
Вот-вот. Неделей раньше, неделей позже -- никто не умрет, а если сейчас
сдлеать так, что потом придется переделывать, то... Ну в общем этого бы
*очень* не хотелось.
> > 5) Предлагается:
> > a) сделать какой-то механизм объявления серверу, что такому-то Document
> > Language может соответствовать такой-то возможный список charsets.
> > Вариантов два:
> > - CharsetDecl koi8-r ru ua by
> > - CharsetLanguageBind ru koi8-r windows-1251 iso-8859-5
> Я думаю что лучше: CharsetDecl koi8-r windows-1251 iso-8859-5 ru,
> то есть последний таг - язык, так уже работало для CharsetTable.
> Это так же правильно, как и CharsetLanguageBind, но совместимо.
>
Проблема в том, что одной кодировке может соответствывать много языков.
Но в сущности оба варианта более-менее идентичны...
> > При этом в обоих случаях _удобно_ (мне как программисту) понимать под
> > Charset внутреннее название таблицы перекодировки (в большинстве
> > случаев оно совпадает с выдаваемым пользователю
> > Content-Type:... charset=name)
> Я тут хочу повторить свое предложение: использовать одну таблицу
> для каждого Charset - через UNI-code (utf8?), a из него генерировать
> все остальные. Я тут в одном месте долго искал ошибку: почему сервер
> в windows-1251, не перекодирует,как оказалось что сервер настроен на koi8-r,
> а тут была перекодировка из iso-8859-5 в windows-1251 - пока нашел - вспотел.
> А было бы здорово для каждой кодировки иметь только один файл:
> CharsetRecodeUniTable koi8-r conf/uni-koi.tab
>
К сожалению это *невозможно*. Ибо с таблицей "откуда"-"куда" легко обслуживаются
случаи, когда некоторым символам в "исходной" таблице не нашлось места в
"итоговой" (translit или windows-1252 => ISO-8859-1), а при перекодировании
через Unicode так сделать автоматом невозможно, а если вводить дополнительные
правила, то сделать это *просто* не удастся :(( Заметим, что иногда даже прямая
и обратная теблицы не могут порождаться автоматом (если в обоих кодировках есть
символы, непредставимые в другой -- KOI8-R и windows-1251 для этого вполне
достаточно, если там рассматривать не только русские буквы).
"Russian Apache" includes software developed
by the Apache Group for use in the Apache HTTP server project
(http://www.apache.org/) See
Apache LICENSE.
Copyright (C) 1995-2001 The Apache Group. All rights reserved.
Copyright (C) 1996 Dm. Kryukov; Copyright (C)
1997-2009 Alex Tutubalin. Design (C) 1998 Max Smolev.