Hi!
Я тут переписываюсь с одним чехом. Как выясняется, Russian Apache довольно
широко у них используется т.к. проблемы те же самые. Но дело не в этом.
Есть такая штука как Netscape Communicator 4.0. Которая шлет Accept-Charset:
utf-8,*,iso-8859-1. Для русского языка это пофигу, а у чехов есть поддержка
именно iso-8859-1 (как я понял, там часть символов попавшая в iso-8859-1
8-битная, а остальным режется 8-й бит и получается вполне читаемо).
Но наиболее используемая кодировка у них - cp1250. Так вот, о чем это я.
По всей видимости, получаемую от ряда броузеров строчку Accept-Charset нужно
просто игнорировать. Делать это можно двумя способами - либо чисто по
User-Agent, либо по сочетанию UserAgent/Accept-Charset, что более "надежно".
Выглядеть это должно примерно так:
1) CharsetIgnoreBrokenAccept "Mozilla 4.0"
2) CharsetIgnoreBrokenAccept "Mozilla 4.0" "utf-8,*,iso-8859-1"
Вопрос обычный - более читаемое имя для директивы и общая оценка идеи.
Да, чех (Tomas Kraus, kratz@internet.cz) предложил расширить директиву
CharsetSelectionOrder. На мой взгляд это неправильно т.к. может затронуть и
пользователей с корректным Accept-Charset (например, счастливых обладателей
хакнутой Mozilla 3.01/Unix :).
С уважением,Alex Tutubalin
--- GoldED 2.42.G1114+
"Russian Apache" includes software developed
by the Apache Group for use in the Apache HTTP server project
(http://www.apache.org/) See
Apache LICENSE.
Copyright (C) 1995-2001 The Apache Group. All rights reserved.
Copyright (C) 1996 Dm. Kryukov; Copyright (C)
1997-2009 Alex Tutubalin. Design (C) 1998 Max Smolev.