In-Reply-To: <36E1D7D9@lexa.ru> from Alex Tutubalin at "Mar 6, 99 08:35:21 pm"
Hi!
> alr> Этот patch добавляет определение оригинальной кодировки документа из тега
> alr> <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=...">
> alr> при его удалении через strip-meta-http Handler.
> alr> Побочным действие - возможность писать utf-8 документы в 8-битовом
> Вот второе побочное действие не может быть одобрено т.к. содержимое документа и
> заголовок расходятся.
Как раз в этом случаи совпадают -), смотри сам: что бы получить
документ в utf-8 нужно ее выбрать. Не совпадение будет, только если
пользователь выбрал, например, koi8-r, в META Content-Type стоит iso8859-1.
Но с выбором есть проблемы:
Первая, если пользователь выдал "Accept-Charset: koi8-r, *", и теперь
даже если пользователь выбрал по порту или по dirpref utf-8, он ее
не получит. И если для всех других кодировок русского языка это правильно,
то для utf-8 нет, т.к. koi8-r по мощности не эквивалент utf-8.
Более того когда ставим другой язык (CharsetDecl utf-8 en), то все равно
получаем koi8-r, что совсем грустно, сервер явно слаб в работе с utf-8.
Второе, есть весьма нужная команда 'CharsetByExtension', но работает она
весьма странно - если перекодировка происходит, то в HTTP заголовке
появляется charset=, а если нет, то нету -))). А это могло бы частично
решить предыдущую проблему (CharsetByExtension utf-8 .utf) и само
по себе было бы весьма правильно - выдать всю известную информацию.
--
С наилучшими пожеланиями, Евгений Бырганов.
Best regards, Eugene Byrganov.
mailto:E.B.Byrganov@inp.nsk.su
work - http://www.inp.nsk.su/
"Russian Apache" includes software developed
by the Apache Group for use in the Apache HTTP server project
(http://www.apache.org/) See
Apache LICENSE.
Copyright (C) 1995-2001 The Apache Group. All rights reserved.
Copyright (C) 1996 Dm. Kryukov; Copyright (C)
1997-2009 Alex Tutubalin. Design (C) 1998 Max Smolev.