Re,
>Как собственно search engine привертывать ? И какой ?
>Пробую у себя glimpse с обвязкой webglimpse, индексирует,
>но по русским словам не ищет...
>Смутные подозрения на неправильность процесса возникают
>от того, что локаль стоит KOI8-R, а документы лежат в
>виндовой кодировке... но опыта в этом нету совсем.
Ну это надо или локаль написать под виндовую кодировку, или поправить
(в agrep кажется?) чтобы он считал все > 0x80 буквами. Но для case
conversion второй вариант не поможет никак.
>Пробовал создовать индекс при виндовой локали, не лечит.
Странно. Должно бы. Может он при вызове поиска локаль не ставит?
>Но ведь как-то это(?) у всех работает?
Не знаю как у всех, я лично не видал хорошую искалку, которя бы нормально
по-русски искала. А ведь локаль к тому же не везде и настроишь... Кроме
коммерческих, типа Альты Вистовны и всяких рамблеров, которые, понятно, к
себе получить низзя.
Пробовал glipmse, но поскольку с webglimpse проблемы с безопасностью и
они его забросили, заменив на какую-то сверхумную систему по обработке
заказов на запросы по обслуживанию поиска ;)) то пришлось и мне его
забросить.
У меня есть также мелкая искалка самостоятельного изготовления, которая
ищет в любой кодировке (т.к. их игнорирует :) и еще кое чего умеет, в
довольно рабочем состоянии (можно видеть например на
http://www.cityline.ru/vi/smotri.cgi).
Кого заинтересует - пишите лично.
--
frodo@sharat.co.il \/ There shall be counsels taken
Stanislav Malyshev /\ Stronger than Morgul-spells
phone +972-2-5369213 /\ JRRT LoTR.
http://www.sharat.co.il/frodo/ whois:SM719-RIPE@whois.ripe.net
"Russian Apache" includes software developed
by the Apache Group for use in the Apache HTTP server project
(http://www.apache.org/) See
Apache LICENSE.
Copyright (C) 1995-2001 The Apache Group. All rights reserved.
Copyright (C) 1996 Dm. Kryukov; Copyright (C)
1997-2009 Alex Tutubalin. Design (C) 1998 Max Smolev.