Russian Apache Switch to English
Switch to Russian koi8-r
windows=1251
cp-866
iso8859-5
Russian Apache Как это работает Рекоммендации Где взять Как установить Как настроить Статус и поддержка
Краткий обзор FAQ Список рассылки Благодарности Поиск по серверу Powered by Russian Apache
Russian Apache mailing list archive (apache-rus@lists.lexa.ru)

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [apache-talk] meta charset problems



> 
>  alr> У меня есть патч к этому handler-у, который меняет таблицу перекодировки
>  alr> в зависимости от charset, найденого в META, причем, если такой таблицы
>  alr> нет (например: iso8859-1 в koi8-r), то оставляет META как есть.
> А что пpоисходит с <title>, котоpый обычно выше <meta> ?
Я писал об ограниченности моего изменения, но эта же проблема возникнет и 
браузеров, они тоже не определят charset.

Но все не так плохо, я просмотрел все html файлы которые содержат HTTP-EQUIV у
своих 800 пользователей, в том числе их NN cache - это порядка 7000 шт. И нашел
что почти все GENERATOR-ы: "Mozilla/4", "Microsoft Word 97", "Microsoft
FrontPage", "Internet Assistant for Microsoft Word 2.04z", "SGML-Tools" и
другие соблюдают порядок: сперва charset, потом <title>. Я заметил проблему
только у Mozilla/3.xxGold и LaTeX2HTML.

Но как писалось ранее, можно пропарсить N строк и определить charset заранее до
его выдачи, тем более что делается на 10 строк кода ранее, чем вырезание META.

На мой взгляд, это вполне разумная и давно назревшая фича, вот по каким
соображениям: 
1. 99% html файлов будут содержать этот таг в <HEAD>.

2. 90% html файлов будут содержать в этом таге ПРАВИЛЬНЫЙ!!! charset, в отличии
от метода описания в конфиг файлах когда число авторов на одном сервере, ничего
не знающих об желании webmaster-a держать все файлы в одной кодировке, будет
расти. В общем случаи эта вероятность для метода описания в конфиг файлах будет
стремится к 50% - угадал или не угадал. Кстати, метод по расширению  (.html -
koi8,  .htm - cp1251) уже почти не работает, уже и под Win делают расширениеe
.html

3. Заметных ресурсов процессора это не занимает, естественно, по сравнению с
обычным вырезанием или SSI, не говоря об динамических документах. Для тех кому
это критично, то они будут использовать другие способы.

Естественно остается проблема "только одного handler-а", тут не чего
не попишешь.

P.S. Все что описано выше - мой реальный опыт работы.
-- 

                      С наилучшими пожеланиями, Евгений Бырганов.
                      Best regards, Eugene Byrganov.

  mailto:E.B.Byrganov@xxxxxxxxxx
  work - http://www.inp.nsk.su/
=============================================================================
=               Apache-Talk@xxxxxxxxxxxxx mailing list                      =
Mail "unsubscribe apache-talk" to majordomo@xxxxxxxxxxxxx if you want to quit.
=       Archive avaliable at http://www.lexa.ru/apache-talk                 =






Спонсоры сайта:

[ Russian Apache ] [ Как это работает ] [ Рекомендации ] [ Где взять ] [ Как установить ] [ Как настроить ] [ Статус и поддержка ] [ Краткий обзор ] [ FAQ ] [ Список рассылки ] [ Благодарности ] [ Поиск по серверу ] [ Powered by Russian Apache ] [ Apache-talk archive ]

"Russian Apache" includes software developed by the Apache Group for use in the Apache HTTP server project (http://www.apache.org/) See Apache LICENSE.
Copyright (C) 1995-2001 The Apache Group. All rights reserved.
Copyright (C) 1996 Dm. Kryukov; Copyright (C) 1997-2009 Alex Tutubalin. Design (C) 1998 Max Smolev.