On Fri, 17 Dec 1999, Ilya Segalovich wrote:
> > Для начала, наверное, не стоит - алгоритм все-таки сложнее и неодинаков
> > для разных мультибайтовых кодировок, внутренняя работа с таблицами другая
> > и т.д. Но в перспективе - почему бы не сделать UTF-8?
>
> Уважаемый Михаил. UTF-8 это не charset, а encoding, причем для charset-а под
> названием UCS (или Unicode -- кому как нравится). И он, конечно, на
> unicode.org в виде таблиц не описан. Там совсем другие многобайтовые чарсеты
> лежат -- например, cp932_ShiftJIS.
> И для того чтобы "сделать" utf-8, не требуется парсировать никакие
> таблицы -- это простая алгоритмическая упаковка и все.
Кстати, в виде таблицы utf-8 в Apache давно есть. Я ее сделал как только
появились Wide-таблицы, и в дистрибутив она вошла. Хотя, пожалуй,
реализация ее в коде была бы эффективнее, чем реализация в виде
wide-таблицы. А в последней russian2 есть все таблицы для перекодировки
из русских charset в utf8.
Другое дело, что wide таблицы не годятся для работы с формами. Но вот
тут стоило бы пойти на компромисс и реализовать работу с %uXXXX в
запросах. Хотя бы потому, что у одного распространенного браузера есть
чекбокс "Always send queries as Unicode".
--------------------------------------------------
Victor Wagner vitus@ice.ru
Programmer Office:7-(095)-203-50-60
Institute for Commerce Home: 7-(095)-135-46-61
Engineering http://www.ice.ru/~vitus
=============================================================================
= Apache-Rus@lists.lexa.ru mailing list =
Mail "unsubscribe apache-rus" to majordomo@lists.lexa.ru if you want to quit.
= Archive avaliable at http://www.lexa.ru/mail-archive =
"Russian Apache" includes software developed
by the Apache Group for use in the Apache HTTP server project
(http://www.apache.org/) See
Apache LICENSE.
Copyright (C) 1995-2001 The Apache Group. All rights reserved.
Copyright (C) 1996 Dm. Kryukov; Copyright (C)
1997-2009 Alex Tutubalin. Design (C) 1998 Max Smolev.