it-swarm-es.com

¿Hay alguna manera de que los motores de búsqueda no indexen una determinada sección de una página?

Tengo la configuración de Blogger con el panel Blog Archive que se muestra en cada página para que los usuarios puedan acceder fácilmente a las publicaciones antiguas. El problema es que enumera el título de cada página en este panel, lo que significa que la página actual está obteniendo palabras clave que no son directamente relevantes para ella sino para una página diferente.

Por ejemplo, podría estar escribiendo sobre naranjas, pero hace una semana estaba escribiendo sobre manzanas. Los motores de búsqueda ahora ven que la página sobre naranjas también está hablando de manzanas, ya que hay un enlace en el panel Archivo a mi publicación de hace una semana sobre las manzanas. Lo contrario también es cierto cuando la página de manzanas también está indexando las palabras clave de color naranja.

¿Hay alguna forma de excluir una determinada sección de una página de ser indexada? (por ejemplo, como tener un <div> completo que está etiquetado como noindex o algo similar).

Sé que Blogger tiene una opción para eliminar el título de las páginas en el Panel de archivo, pero preferiría que permanecieran allí para que los usuarios sepan qué publicaciones están disponibles.

13
Senseful

Supuestamente, puede agregar la clase robots-nocontent a elementos en su página, de esta manera:

<div class="robots-nocontent">

    <p>Ignore this stuff.</p>

</div>

Yahoo respeta esto , aunque no sé si otros motores de búsqueda respetan esto. Parece Google no es compatible con esto en este momento. Sospecho que si carga su contenido a través de ajax, obtendría el mismo efecto de no estar presente en la página.

7
artlung

No hay una forma general de hacerlo y personalmente no me molestaría. Los motores de búsqueda son bastante buenos para reconocer el contenido relevante en una página, y aunque ese contenido puede aparecer en las palabras clave que los motores de búsqueda han encontrado, no significa que haga que la página sea relevante para esas palabras clave.

Si tiene una página sobre "Pez" y una página sobre "Perros" (que tiene el enlace a la página sobre "Pez" en algún lugar de la barra lateral), los motores de búsqueda generalmente podrán reconocer que la página sobre "Pez" es mucho más relevante para "Pez" que la página sobre "Perros" que menciona "Pez" en la barra lateral. Es posible que ambas páginas se encuentren en algún momento, pero en general, dado que en su mayoría se muestra una página del sitio en los resultados de búsqueda, no es algo de lo que deba preocuparse.

No hay necesidad de ser elegante con eso, y es probable que los motores de búsqueda se confundan más si lo intenta (por ejemplo, si usa JavaScript para ocultar el contenido, nunca se sabe cuándo los motores de búsqueda comenzarán a encontrar ese contenido independientemente). Del mismo modo, el uso de iframes con robots.txt no permite o AJAX con frecuencia degradará la calidad de sus páginas para los usuarios (lo ralentizará o lo hará menos utilizable en una variedad de dispositivos), por lo que, a menos que haya un muy, muy fuerte y probada razón por la que necesita hacer esto, le recomiendo encarecidamente que no se moleste.

3
John Mueller

Creo que puede usar un iFrame y el código dentro solo se indexará si deja que Google indexe esa página. Entonces, si coloca un nofollow en su robots.txt para el archivo que se carga en el iFrame, debería estar bien.

1
Ben Hoffman

El texto de la palabra clave en un enlace se aplica principalmente a la página a la que apunta el enlace, no a la página en la que está el enlace. Personalmente, no me preocuparía demasiado por eso. Probablemente sería peor quitar/encubrir los títulos que dejarlo.

0
Eric Petroelje

Google ofrece su propia forma de excluyendo el texto no deseado del índice .

En su ejemplo, habló sobre el ancla, que Google ofrece este ejemplo:

<!--googleoff: anchor-->
  <A href=sharks_rugby.html>shark</A>
<!--googleon: anchor-->

Y hay algunos otros modos.

0
lulalala