On Tue, 14 Dec 1999, Mikhail Zabaluev wrote:
> У подхода с Unicode есть еще один существенный плюс:
> таблицы для практически всех известных кодировок можно взять прямо с
> ftp://ftp.unicode.org
Ну да. С некоторых пор там появилась KOI8-R. Я ее правда со своей
(сгенеренной из RFC) не сравнивал. А KOI8-U нет. Ее придется брать
у меня с http://www.ice.ru/~vitus/catdoc/ver-0.9.html
> Насколько я мог судить, формат тамошних файлов стандартизован и их можно
> разбирать автоматически, что, к слову, уже реализовали авторы perl-овых
> модулей Unicode::Map и Unicode::Map8.
Более того, их не сложнее разбирать автоматически, чем существующий
формат таблиц. Я делаю это даже в командно-строчной утилите catdoc, а уж
при старте демона - сам бог велел.
Правда это все начинает напоминать проект MultiWeb, существовавший
некогда. Там все внутри делалось через Unicode. Ну и где он сейчас?
Все почему-то пользуют русский Apache.
Подход для работы с unicode хорош еще тем, что можно будет легко
разбирать %uXXXX в QUERY_STRING. Перекодировщик из Unicode в 8-битный
charset из catdoc требует два обращения к массиву на символ, при том что
размер данных куда меньше 64К (типичный размер таблицы 256*sizeof(char *)+
3*256)
--------------------------------------------------
Victor Wagner vitus@ice.ru
Programmer Office:7-(095)-203-50-60
Institute for Commerce Home: 7-(095)-135-46-61
Engineering http://www.ice.ru/~vitus
=============================================================================
= Apache-Rus@lists.lexa.ru mailing list =
Mail "unsubscribe apache-rus" to majordomo@lists.lexa.ru if you want to quit.
= Archive avaliable at http://www.lexa.ru/mail-archive =
"Russian Apache" includes software developed
by the Apache Group for use in the Apache HTTP server project
(http://www.apache.org/) See
Apache LICENSE.
Copyright (C) 1995-2001 The Apache Group. All rights reserved.
Copyright (C) 1996 Dm. Kryukov; Copyright (C)
1997-2009 Alex Tutubalin. Design (C) 1998 Max Smolev.