Ilya Segalovich wrote:
>
> ----- Original Message -----
> From: Victor Wagner <vitus@ice.ru>
> Sent: 16 декабря 1999 г. 17:47
>
> > Все-таки я бы зарекался (а в catdoc и зарекаюсь) на то, что надо парсить
> > непосредственно текстовый файл, скачанный с ftp.unicode.org.
Так что же, проблема в том, что на unicode.org неправильные таблицы?
Просто получится очень удобно, если пользователь сможет брать оттуда
кодировки, какие ему нужны, и без излишнего камлания получать худую-бедную
трансляцию. А желает душа умляутов или 'small cyrillic ghe with upturn' -
пожалуйста, строй кастомные таблицы в том виде, как сейчас.
> Один формат это хорошо, конечно. Только ведь в этом формате еще и
> мульти-байтовые кодировки описаны. И что, их тоже предполагается
> поддерживать?
Для начала, наверное, не стоит - алгоритм все-таки сложнее и неодинаков
для разных мультибайтовых кодировок, внутренняя работа с таблицами другая
и т.д. Но в перспективе - почему бы не сделать UTF-8?
=============================================================================
= Apache-Rus@lists.lexa.ru mailing list =
Mail "unsubscribe apache-rus" to majordomo@lists.lexa.ru if you want to quit.
= Archive avaliable at http://www.lexa.ru/mail-archive =
"Russian Apache" includes software developed
by the Apache Group for use in the Apache HTTP server project
(http://www.apache.org/) See
Apache LICENSE.
Copyright (C) 1995-2001 The Apache Group. All rights reserved.
Copyright (C) 1996 Dm. Kryukov; Copyright (C)
1997-2009 Alex Tutubalin. Design (C) 1998 Max Smolev.