Hello Alex,
AT> Привет,
AT> интересует мнение обчественности.
AT> Вот допустим есть поисковая система по сайту. Раз в deltaT она делает
AT> переиндексацию - старые документы сносит, новые - добавляет.
AT> Возникает вопрос - нужно ли делать обновление поискового индекса в
AT> транзакции - т.е. пока все изменения не произошли для собственно поисковика
AT> индекс остается старым, либо же делать отдельную транзакцию для каждого
AT> документа ?
AT> Понятно что в нормальной системе content management этой проблемы нет
AT> и индекс должен меняться в одной транзакции с изменением (удалением|добавлением)
AT> документа, но я про ненормальную - где все в файлах.
AT> Да, предвидя вопросы. Я использую http://openfts.sourceforge.net
AT> c Ispell-словарями (либо с другой морфологией - это не так важно). ht://Dig
AT> с lexa.ru скоро будет удален, равно как и Yandex.Site с apache.lexa.ru :)
Почему бы Вам не посмотреть на http://mnogosearch.ru/
Сам индексатор на си написан.
Back-End - некоторое кол-во SQL серверов,собственный формат.
Front-End - Perl,Си,PHP.
Best regards,
Andrew Sitnikov
e-mail : sitnikov@xxxxxxxxxx
GSM : (+372) 56491109
=============================================================================
= Apache-Talk@xxxxxxxxxxxxx mailing list =
Mail "unsubscribe apache-talk" to majordomo@xxxxxxxxxxxxx if you want to quit.
= Archive avaliable at http://www.lexa.ru/apache-talk =
"Russian Apache" includes software developed
by the Apache Group for use in the Apache HTTP server project
(http://www.apache.org/) See
Apache LICENSE.
Copyright (C) 1995-2001 The Apache Group. All rights reserved.
Copyright (C) 1996 Dm. Kryukov; Copyright (C)
1997-2009 Alex Tutubalin. Design (C) 1998 Max Smolev.