it-swarm-es.com

Buena herramienta para rastrear mi sitio y ayudarme a encontrar enlaces muertos y archivos no vinculados

Tengo un sitio heredado bastante grande con literalmente miles de archivos PDF que a veces representan en una base de datos, pero a menudo son solo enlaces en la página y se almacenan en la mayoría de los directorios del sitio.

He escrito un rastreador de php para seguir todos los enlaces en mi sitio, y luego lo estoy comparando con un volcado de la estructura del directorio, pero ¿hay algo más fácil?

21
MrChrister

He usado Xenu's Link Sleuth . Funciona bastante bien, ¡solo asegúrate de no hacer DOS tú mismo!

15
plntxt

Si está utilizando Windows 7, la mejor herramienta es SEO Toolkit 1.0 de IIS7. Es gratis y puedes descargarlo gratis.

La herramienta escaneará cualquier sitio y le dirá dónde están todos los enlaces muertos, qué páginas tardan en cargarse, qué páginas tienen títulos faltantes, títulos duplicados, lo mismo para palabras clave y descripciones, y qué páginas tienen HTML roto.

6
Ben Hoffman

Pruebe herramienta de código abierto W3C Link Checker . Puede usarlo en línea o instalarlo localmente

4
mvark

Hay varios productos de Microsys , especialmente su A1 Sitemap Generator y A1 Website Analyzer que rastreará su sitio web e informará todo lo que pueda imaginar eso.

Eso incluye enlaces rotos, pero también una vista de tabla de todas sus páginas para que pueda comparar cosas como etiquetas idénticas de <título> y meta descripción, enlaces nofollow, meta noindex en páginas web y muchas enfermedades que solo necesitan un buen ojo y Una mano rápida para arreglar.

1
Evgeny

Link Examiner es un freeware realmente bueno también para tu necesidad.

1
Dark

Soy un gran admirador de linklint para verificar enlaces en sitios estáticos grandes, si tiene una línea de comando unix alrededor (I ' he usado en linux, MacOS y FreeBSD). Consulte su sitio para obtener instrucciones de instalación. Una vez instalado, creo un archivo llamado check.ll y hago:

linklint @check.ll

Así es como se ve mi archivo check.ll

# linklint
-doc .
-delay 0
-http
-htmlonly
-limit 4000
-net
-Host www.example.com
-timeout 10

Eso rastrea www.example.com y genera archivos HTML con informes de referencias cruzadas de lo que está roto, falta, etc.

1
artlung