Tengo un sitio interno (intranet) que se compone de varios blogs y foros, cientos de páginas estáticas, muchos PDF archivos y varios otros tipos de documentos. Se ha pegado libremente en los últimos años y ahora es mi trabajo mantenerlo.
Estoy buscando un motor de búsqueda que pueda alojarme de manera ideal:
Permite buscar directamente en las bases de datos del Blog/Foro si se le proporciona la información de la base de datos y las tablas para buscar.
Maneja la mayoría de los documentos de texto (PDF/DOC/ODF)
Es de código abierto, o permite el acceso al código fuente una vez comprado
No me importa en qué idioma o plataforma está escrito. Normalmente, solo usaría la búsqueda en el sitio de Google, pero esa no es una opción para una intranet.
Echa un vistazo Lucene
Escrito en Java también disponible para .NET framework
Aquí hay un artículo de CodeProject que explica cómo funciona y cómo se usa. http://www.codeproject.com/KB/library/IntroducingLucene.aspx
He usado Sphider antes y me ha impresionado bastante.
SearchBlox que se basa en Lucene puede satisfacer sus necesidades. Es gratis y viene con un rastreador.
Normalmente, solo usaría la búsqueda en el sitio de Google, pero esa no es una opción para una intranet.
De hecho, existe el dispositivo de búsqueda de Google, que es el equivalente de la búsqueda de intranets en el sitio de Google. Sin embargo, esto no es de código abierto (la búsqueda en el sitio de Google tampoco lo es, en caso de que no lo haya notado).