In message <Pine.LNX.3.96.980209132038.2845B-100000@frodo.dyn.ml.org>
Stanislav Malyshev a.k.a. F. writes:
>>Как собственно search engine привертывать ? И какой ?
>>Пробую у себя glimpse с обвязкой webglimpse, индексирует,
>>но по русским словам не ищет...
>>Смутные подозрения на неправильность процесса возникают
>>от того, что локаль стоит KOI8-R, а документы лежат в
>>виндовой кодировке... но опыта в этом нету совсем.
>Ну это надо или локаль написать под виндовую кодировку, или поправить
>(в agrep кажется?) чтобы он считал все > 0x80 буквами. Но для case
>conversion второй вариант не поможет никак.
Это в locale ставиться и работает в glimpse.
>>Пробовал создовать индекс при виндовой локали, не лечит.
>Странно. Должно бы. Может он при вызове поиска локаль не ставит?
>>Но ведь как-то это(?) у всех работает?
>Не знаю как у всех, я лично не видал хорошую искалку, которя бы нормально
>по-русски искала. А ведь локаль к тому же не везде и настроишь... Кроме
>коммерческих, типа Альты Вистовны и всяких рамблеров, которые, понятно, к
>себе получить низзя.
>Пробовал glipmse, но поскольку с webglimpse проблемы с безопасностью и
>они его забросили, заменив на какую-то сверхумную систему по обработке
>заказов на запросы по обслуживанию поиска ;)) то пришлось и мне его
>забросить.
>У меня есть также мелкая искалка самостоятельного изготовления, которая
>ищет в любой кодировке (т.к. их игнорирует :) и еще кое чего умеет, в
>довольно рабочем состоянии (можно видеть например на
>http://www.cityline.ru/vi/smotri.cgi).
>Кого заинтересует - пишите лично.
После чтения последней книги попробовал привернуть Isearch от CNIDR.
Завелось установкой locale и ищет достаточно пристойно.
Особенности морфологии конечно игнорирует.
--
-----
Andrew Shinkarev
andrsh@rcom.spb.su
"Russian Apache" includes software developed
by the Apache Group for use in the Apache HTTP server project
(http://www.apache.org/) See
Apache LICENSE.
Copyright (C) 1995-2001 The Apache Group. All rights reserved.
Copyright (C) 1996 Dm. Kryukov; Copyright (C)
1997-2009 Alex Tutubalin. Design (C) 1998 Max Smolev.