VK> >VK>
VK> >VK> Сам я русским поиском заниматься не буду - не с руки.
VK> >VK>
VK> >Неприятно, но... "насильно мил не будешь".
VK>
VK> Я предлагаю свои руки и голову в помощь. Но "координатором" не буду -
VK> слишком ленивый.
VK>
А кто не ленивый ? Я просто до сих пор не пытался никаких поисковых систем
настраивать. Так что я даже толком покритиковать не смогу, не говоря уже про
написание чего-нибудь... А координировать пока еще никто не вызвался :((
Люди, где вы ?
VK> >P.S. Пока что с повестки дня не снят вопрос -- с чего начать ? Имеется в
VK> виду:
VK> >какую search-engine без поддержки русских букв взять за основу. Честно
VK> говоря
VK> >rwww мне кажется не слишком подходящей основой (хоть он уже и умеет
VK> работать
VK> >с русскими буквами, но только в KOI8-R, и, кроме того, просто довольно-таки
VK> >слаб), но, может быть, я и ошибаюсь.
VK>
VK> А стоит ли брать готовый engine? Не дешевле ли обойдется писать "с нуля"?
VK>
Не знаю. Думаю, что нет. Специфически русского в search engine -- морфология,
да несколько кодировок (это, впрочем, не то, чтобы уж очень специфически
"русское" :). Все остальное может быть "как у людей". Но есть ли искалки с
приемлемой лицензией и приличным набором функций для того, чтобы с них начать?
Вот в чем вопрос...
VK> Я тут уже много накопал, мой search как-то работает, я думал прикрутить к
VK> нему механизм морфологии от Рустема и индексацию от Stanislav Malyshev.
VK>
Я не говорю, что этот путь однозначно не подходит, но все-таки обращаюсь к
тем, кто смотрел на неруссифицированные Search Engine'ы -- нет ли среди них
чего-то, что всем (кроме поддержки русского -- это-то как раз мы и собираемся
исправлять :) подходило ? Отдельные идеи из разных продуктов -- тоже вещь
хорошая, но пока надо понять: нет ли чего-нибудь, что можно взять за основу ?
Насчет Рустем'а: это уже "голая" форфология -- то есть это чисто программа для
виделения "условных основ". А что такое "индексация от Stanislav Malyshev" ?
VK> Думаю ко вторнику будет нечто показуемое.
Ну что же. Дай-то бог -- посмотрим.
VK> По крайней мере, можно использовать несколько кодировок,
Я бы сказал -- нужно. Ибо иногда ну просто очень неудобно (хотя и возможно)
держать весь сервер в одной кодировке ...
VK> а таблички взять из апача.
Тоже разумно.
P.S. Извиняюсь про crosspost в Russian Apache mailing list, но IMHO пока что
еще далеко не все желающие подписались на rus-web-search@sch57.msk.ru (анонс
был кинут 6 часов назад :)
"Russian Apache" includes software developed
by the Apache Group for use in the Apache HTTP server project
(http://www.apache.org/) See
Apache LICENSE.
Copyright (C) 1995-2001 The Apache Group. All rights reserved.
Copyright (C) 1996 Dm. Kryukov; Copyright (C)
1997-2009 Alex Tutubalin. Design (C) 1998 Max Smolev.