> > Параметр вида
> > CharsetIgnoreBrokenAccept "Mozilla/4.0" "iso-8859-1,*,utf-8"
> > спасет умирающего кота ? Имеется в виду, что описывается явно пара
> > User-Agent/Accept-Charset и при совпадении обоих значений AcceptCharset будет
> На первый взгляд, именно это и спасет.
> Однако, такое поведение должно быть как-то согласовано с
> CharsetPriority и CharsetSelectionOrder, и может, еще какими...
> ...хотя, если сначала проигнорировать, а после напустить всю логику
> перебора кодировки, включая CharsetAgent, то все будет правильно.
Естественно, сначала проигнорировать, а потом уже напустить. Более того,
в случае с Чехами, у которых одна из кодировок называется именно iso-8859-1
без этого не получится даже для одноязычного сайта.
> Однако учетывать исключения - тоже не дело, IMHO.
Скажи это Гейтсу и Андерсену :)
>
> [...]
> > Это тоже, по мотивам нашего того еще (какого не помню :) разговора попало в
> > ToDo.
> (который, потерялся? ... я бы сейчас не возникал... ;)
Он не то чтобы потерялся. Он более чем существует, учитывая мою любовь к
хранению мейлбоксов 4 (по меньшей мере) экземплярах. Но мне захотелось
его таки восстановить заново.
> Более точно было бы конфигом не запрещать, а объявлять
> списки -
> CharsetLangCharset ru koi8-r windows-1251 ibm866 ....
> CharsetLangCharset en ISO-8859-1
Эти списки уже объявляются в директиве CharsetDecl (там третий параметр -
язык) но учитываются только при выдаче charset=...
Кажется (надо проверять) на этапе выбора charset язык уже доступен. Если
доступен, то что-то типа CharsetStrictLanguageMatch тоже может помочь.
> но тогда возникает та самая проблема чехов, которых
> Билл наградил еще круче, и еще пара граблей... ;-)
Дело не в паре граблей. Дело в том, что хранить документы как file.html.ru
не всегда хочется - те же Windows-based редакторы не захотят сохранять с
таким расширением (я столкнулся с тем, что некоторые даже .shtml не хотят).
А двуязычные сайты хочется.... и разбивка по директориям достаточно
удобна на мой взгляд. В-общем, хочется еще подумать.
>
> > (Предлагаемый) Механизм CharsetDisable позволит объявить все используемые
> > charsets в основном конфиге, а потом запретить русские Charsets для одной части
> > сервера и нерусские для другой.
> IMHO, все же не запретить, а сказать, что здесь - вот эти кодировки
> допустимы, а там - по другому списку.
OK. Пусть будет CharsetEnable. Умолчание - все описанные Charset ?
>
> > Ничего сложного. На это есть AddLanguage. Т.е. совсем strict механизм может
> > предлагать вообще не обрабатывать автовыбор charset если язык документа не
> > совпадает с языком language. Правда, на мой взгляд, это слишком жестокое
> > решение и народ меня не поймет. Хотя твою конкретную проблему это бы решило.
> Вот. Как скажет народ?
> IMHO, это был бы наиболее четкий вариант, если учесть все детали, и не
> факт, что с конфигами
> в этом случае будет больше возни. Особенно тем, кому достаточно
> одного языка на всем сайте - новые директивы им просто будут
> по-барабану...
Т.е. включить такое поведение отдельным флажком и не выпендриваться ?
Резюме. Возможных поведений слишком много, надо еще думать
Alex
"Russian Apache" includes software developed
by the Apache Group for use in the Apache HTTP server project
(http://www.apache.org/) See
Apache LICENSE.
Copyright (C) 1995-2001 The Apache Group. All rights reserved.
Copyright (C) 1996 Dm. Kryukov; Copyright (C)
1997-2009 Alex Tutubalin. Design (C) 1998 Max Smolev.