On Wed, 5 Aug 1998, Alex Tutubalin wrote:
> Если мне кто-нибудь расскажет алгоритм перекодировки гребаного Unicode
> (превращения %uNNNN в букву) то никаких проблем я не вижу. Если это требует
> внешних таблиц, то давайте эти таблицы тоже в каком-нибудь удобоваримом виде
> (буква -> hexdump, например).
Я тут собрался и выложил набор ссылок на различные таблицы и
прочие ресурсы по UNICODE
см http://www.ice.ru/catdoc/ver-0.9.html
Вообще, у меня в catdoc ВСЕ преобразование charset делается через
Source charset->UNICODE->target charset
Я, конечно понимаю, что одно дело утилита, которую пользователь
пускает руками, а другое дело сервер и 3-4 машинных команды на символ,
необходимые при такой перекодировке, могут сервер серьезно пригрузить.
Тем не менее, убежден что за UNICODE будущее. Уже сейчас это спасение
для русских за рубежом, которым местные злобные системные администраторы
не дают ихнюю NT корректно русифицировать. (а равно и для иностранцев,
слегка знающих русский)
Опять же наличие сайта ftp.unicode.org, на котором лежат описания
практически всех бывающих в природе charset сильно облегчает людям жизнь.
Пожалуй, надо собраться и написать перловый скрипт, который тянет
оттуда два описания charset и генерит по ним прямую и обратную таблицу
в Apache-rus формате.
А еще, голосую за полноценную (с перекодировкой результатов submit)
поддержку utf8 в Apache.
>
>
> С уважением,Alex Tutubalin
>
> --- GoldED 2.42.G1114+
>
>
--------------------------------------------------
Victor Wagner vitus@ice.ru
Programmer Office:7-(095)-333-2022
Institute for Commerce Home: 7-(095)-135-46-61
Engineering http://www.ice.ru/~vitus
"Russian Apache" includes software developed
by the Apache Group for use in the Apache HTTP server project
(http://www.apache.org/) See
Apache LICENSE.
Copyright (C) 1995-2001 The Apache Group. All rights reserved.
Copyright (C) 1996 Dm. Kryukov; Copyright (C)
1997-2009 Alex Tutubalin. Design (C) 1998 Max Smolev.