On Wed, 5 Aug 1998, Alex Tutubalin wrote:
> Привет,
>
> alr> А сильно в ломы будет сделать вот какую штуку :
>
> alr> if(*buf=='%' && buf[1]=='u' && isdigit(buf[2]) && isdigit(buf[3])&&
> alr> isdigit(buf[4])&& isdigit(buf[5]){
> alr> перекодировать этот гребаный UNICODE в обычные escape
> alr> }
> Если мне кто-нибудь расскажет алгоритм перекодировки гребаного Unicode
> (превращения %uNNNN в букву) то никаких проблем я не вижу. Если это требует
> внешних таблиц, то давайте эти таблицы тоже в каком-нибудь удобоваримом виде
> (буква -> hexdump, например).
Таблица соответствия koi-8 и UNICODE приведена в rfc1489
Для всех остальных charset оные таблицы в формате
8-bit hex code UNICODE hex code
тащатся с ftp.unicode.org
Если по каким-то причинам не хочется отдавать 65536 байт на тупую
таблицу перекодировки unicode->target charset
то можно украсть у меня из catdoc-0.90 Там это занимаeт для
koi8 примерно 2k и требует 2 обращения к таблице и одну проверку на
NULL для каждого символа.
>
>
> С уважением,Alex Tutubalin
>
> --- GoldED 2.42.G1114+
>
>
--------------------------------------------------
Victor Wagner vitus@ice.ru
Programmer Office:7-(095)-333-2022
Institute for Commerce Home: 7-(095)-135-46-61
Engineering http://www.ice.ru/~vitus
"Russian Apache" includes software developed
by the Apache Group for use in the Apache HTTP server project
(http://www.apache.org/) See
Apache LICENSE.
Copyright (C) 1995-2001 The Apache Group. All rights reserved.
Copyright (C) 1996 Dm. Kryukov; Copyright (C)
1997-2009 Alex Tutubalin. Design (C) 1998 Max Smolev.