Russian Apache Switch to English
Switch to Russian koi8-r
windows=1251
cp-866
iso8859-5
Russian Apache Как это работает Рекоммендации Где взять Как установить Как настроить Статус и поддержка
Краткий обзор FAQ Список рассылки Благодарности Поиск по серверу Powered by Russian Apache
Russian Apache mailing list archive (apache-rus@lists.lexa.ru)

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [apache-talk] encoding URL: localized version needed (fwd)



In <03fa01bed409$7d13db00$cd0d11ac@xxxxxxxxxxxxxxxxxxxxxxxxx> Alexander Voropay (a.voropay@xxxxxxxxxxxx) wrote:

>>>>Беда в том, что она эскейпит все русские буквы, посему перестает работать
>>>>перекодировка (при посылке параметров к скрипту, например).
>>AV>  В принципе по новым стандартам все не-Latin-1 символы в URL
>>AV> должны кодироваться в UNICODE.
>>
>>Это по каким-таким "новым стандартам" ? RFC, please.

AV> http://www.w3.org/International/

AV> 4. URIs & other identifiers including non-ASCII characters

Из СТАНДАРТОВ я нашел там только RFC 2396 ... В котором ничего про UNICODE
не говорится. Все остальное -- draft'ы (=вилами по воде) или стандарты, не
имеющие отношения к HTTP ...

>>AV>  Собственно, MS IE 5.0 так и делает.
>>
>>Гм. Неужели этот монстр хоть что-нибудь делает в соответствии
>> со стандартами, а не вопреки им ?

AV>  Ну, от комментариев на тему моральной позиции, мотивов
AV> поведения, рыночной доли и т.д. фирмы MS я воздержусь... :)

При чем тут рыночная доля ?

AV>  Что касается технологии -- да, я утверждаю что Microsoft Internet
AV> Explorer 4 и 5 вполне точно соответствуют стандартам от W3C.
AV> Если вы знаете _явное_ несоответствие, хотелось бы услышать.

Легко. История всегда одна и та же: Microsoft решает, что существующие
стандарты никуда не годятся и "улучшает" их никому ничего не говоря. Собственно
ровно это произошло с Java'ой, после чего Sun взбесился и в суд подал.
А IETF смотрит на это сквозь пальцы, да и с точки зрения юриспридунции
не ясно -- может ли кто-нибудь судить Microsoft за нарушения в реализации
MIME, HTTP, SSL и т.п.  Разве что общество потребителей за недобросовестную
рекламу...

Примеры:

MIME, RFC 2045, 6.7.  Quoted-Printable Content-Transfer-Encoding
-- cut --
    (4)   (Line Breaks) A line break in a text body, represented
          as a CRLF sequence in the text canonical form, must be
          represented by a (RFC 822) line break, which is also a
          CRLF sequence, in the Quoted-Printable encoding.  Since
          the canonical representation of media types other than
          text do not generally include the representation of
          line breaks as CRLF sequences, no hard line breaks
          (i.e. line breaks that are intended to be meaningful
          and to be displayed to the user) can occur in the
          quoted-printable encoding of such types.  Sequences
          like "=0D", "=0A", "=0A=0D" and "=0D=0A" will routinely
          appear in non-text data represented in quoted-
          printable, of course.
-- cut --
Пошлите письмо из Otlook'а или Outlook Express'а и при'attach'те к нему .rc
файл. Это $^%%&*^* приклеит к нему Content-Type: application/octet-stream и
оформит все как text/plain в Quoted-Printable (то есть с теми самымы ЯВНО
ЗАПРЕЩЕННЫМИ "hard line breaks").

HTTP, RFC 2068, 7.2.1 Type
-- cut --
When an entity-body is included with a message, the data type of that
body is determined via the header fields Content-Type and Content-
Encoding. These define a two-layer, ordered encoding model:

       entity-body := Content-Encoding( Content-Type( data ) )

Content-Type specifies the media type of the underlying data.
Content-Encoding may be used to indicate any additional content
codings applied to the data, usually for the purpose of data
compression, that are a property of the requested resource. There is
no default encoding.

Any HTTP/1.1 message containing an entity-body SHOULD include a
Content-Type header field defining the media type of that body. If
and only if the media type is not given by a Content-Type field, the
recipient MAY attempt to guess the media type via inspection of its
content and/or the name extension(s) of the URL used to identify the
resource. If the media type remains unknown, the recipient SHOULD
treat it as type "application/octet-stream".
-- cut --
Теперь попробуйте положить на web-server текстовый файл README.DOC и добимться
от MS IE того, чтобы он этот text/plain (ЯВНО УКАЗЫННЫЙ text/plain) показал
как text/plain (а не в WordPad'е и не в WinWord'е :-)

И все остальное в том же духе: HTML и XML, CSS и SSL, и т.д. и т.п. Практически
нет ни одного сколько-нибудь значимого стандарта, который бы MS IE не нарушал.
Я могу понять и простить случайные ошибки, но когда стандарты нарушаются
сознательно... Извините -- я в такие игры не играю. "You can use MS IE at your
will but please do not send me ANY bug-reports if you are using it".



=============================================================================
=               Apache-Talk@xxxxxxxxxxxxx mailing list                      =
Mail "unsubscribe apache-talk" to majordomo@xxxxxxxxxxxxx if you want to quit.
=       Archive avaliable at http://www.lexa.ru/apache-talk                 =






Спонсоры сайта:

[ Russian Apache ] [ Как это работает ] [ Рекомендации ] [ Где взять ] [ Как установить ] [ Как настроить ] [ Статус и поддержка ] [ Краткий обзор ] [ FAQ ] [ Список рассылки ] [ Благодарности ] [ Поиск по серверу ] [ Powered by Russian Apache ] [ Apache-talk archive ]

"Russian Apache" includes software developed by the Apache Group for use in the Apache HTTP server project (http://www.apache.org/) See Apache LICENSE.
Copyright (C) 1995-2001 The Apache Group. All rights reserved.
Copyright (C) 1996 Dm. Kryukov; Copyright (C) 1997-2009 Alex Tutubalin. Design (C) 1998 Max Smolev.