----- Original Message -----
From: Mikhail Zabaluev <mzabal@module.ru>
Sent: 16 декабря 1999 г. 18:38
> Ilya Segalovich wrote:
> >
> > ----- Original Message -----
> > From: Victor Wagner <vitus@ice.ru>
> > Sent: 16 декабря 1999 г. 17:47
> >
> > > Все-таки я бы зарекался (а в catdoc и зарекаюсь) на то, что надо
парсить
> > > непосредственно текстовый файл, скачанный с ftp.unicode.org.
>
> > Один формат это хорошо, конечно. Только ведь в этом формате еще и
> > мульти-байтовые кодировки описаны. И что, их тоже предполагается
> > поддерживать?
>
> Для начала, наверное, не стоит - алгоритм все-таки сложнее и неодинаков
> для разных мультибайтовых кодировок, внутренняя работа с таблицами другая
> и т.д. Но в перспективе - почему бы не сделать UTF-8?
Уважаемый Михаил. UTF-8 это не charset, а encoding, причем для charset-а под
названием UCS (или Unicode -- кому как нравится). И он, конечно, на
unicode.org в виде таблиц не описан. Там совсем другие многобайтовые чарсеты
лежат -- например, cp932_ShiftJIS.
И для того чтобы "сделать" utf-8, не требуется парсировать никакие
таблицы -- это простая алгоритмическая упаковка и все.
По-моему, прелесть русского апача как раз в том, чем он именно для Европы
хорош -- в эффективном использовании однобайтовых кодировок. Именно
однобайтовую в однобайтовую можно перекодировать максимально эффективным
образом в стиле Русского Апача. Если же делать поддержку многобайтовых
кодировок - то это действительно, как заметил Alex Tutubalin в общем случае
будет тормозить, это раз, а во вторых, для этого есть Apache-MultiWeb.
=============================================================================
= Apache-Rus@lists.lexa.ru mailing list =
Mail "unsubscribe apache-rus" to majordomo@lists.lexa.ru if you want to quit.
= Archive avaliable at http://www.lexa.ru/mail-archive =
"Russian Apache" includes software developed
by the Apache Group for use in the Apache HTTP server project
(http://www.apache.org/) See
Apache LICENSE.
Copyright (C) 1995-2001 The Apache Group. All rights reserved.
Copyright (C) 1996 Dm. Kryukov; Copyright (C)
1997-2009 Alex Tutubalin. Design (C) 1998 Max Smolev.