it-swarm-es.com

¿Cuál es el motor de búsqueda autohospedado ideal?

Tengo un sitio interno (intranet) que se compone de varios blogs y foros, cientos de páginas estáticas, muchos PDF archivos y varios otros tipos de documentos. Se ha pegado libremente en los últimos años y ahora es mi trabajo mantenerlo.

Estoy buscando un motor de búsqueda que pueda alojarme de manera ideal:

  1. Permite buscar directamente en las bases de datos del Blog/Foro si se le proporciona la información de la base de datos y las tablas para buscar.

  2. Maneja la mayoría de los documentos de texto (PDF/DOC/ODF)

  3. Es de código abierto, o permite el acceso al código fuente una vez comprado

No me importa en qué idioma o plataforma está escrito. Normalmente, solo usaría la búsqueda en el sitio de Google, pero esa no es una opción para una intranet.

11
Tim Post

Echa un vistazo Lucene

Escrito en Java también disponible para .NET framework

Aquí hay un artículo de CodeProject que explica cómo funciona y cómo se usa. http://www.codeproject.com/KB/library/IntroducingLucene.aspx

7
jessegavin

He usado Sphider antes y me ha impresionado bastante.

2
Darryl Hein

SearchBlox que se basa en Lucene puede satisfacer sus necesidades. Es gratis y viene con un rastreador.

2
user5213

Normalmente, solo usaría la búsqueda en el sitio de Google, pero esa no es una opción para una intranet.

De hecho, existe el dispositivo de búsqueda de Google, que es el equivalente de la búsqueda de intranets en el sitio de Google. Sin embargo, esto no es de código abierto (la búsqueda en el sitio de Google tampoco lo es, en caso de que no lo haya notado).

0
delete