it-swarm-es.com

¿Se asegurará el sistema que MDADM se sincronice antes de completar un reinicio?

Este es un seguimiento hasta mi loco mdadm problema . Estoy tratando de averiguar qué podría haber causado sda para salir de la sincronización en primer lugar. Lo único en lo que puedo pensar es que acababa de ejecutar un montón de actualizaciones y se estaba reiniciendo para volver a cargar la actualización del kernel. ¿Es posible que ambas unidades no hubieran sincronizado? ¿El sistema evitaría un reinicio si hubiera sincronización MDADM? ¿Se podría hacer? ¿Alguna otra sugerencia sobre lo que podría haber ocurrido? y cómo se podría prevenir en el fondo. Nada parece estar mal con la unidad.

7
xenoterracide

Ciertamente lo hace en un apagado limpio:

  • El DIRIAN MDADM Preguntas frecuentes implica que el kernel hace lo correcto:

    8. (Uno de) Mis matrices de RAID están ocupadas y no se pueden detener. ¿Lo que da?
    Es perfectamente normal que MDADM denuncie la matriz con el sistema de archivos raíz para estar ocupado en el apagado. La razón de esto es que el sistema de archivos raíz debe montarse para poder detener la matriz (o de lo contrario/SBIN/MDADM no existe), sino para detener la matriz, el sistema de archivos de la raíz no se puede montar. Call 22. El kernel realmente detiene la matriz justo antes de detenerse, por lo que todo está bien.

  • El Driver MD establece todos los dispositivos como lectura solo en el apagado (e incluso le da a los dispositivos físicos aproximadamente un segundo para instalarse).

Incluso si su sistema se bloquea en medio de una escritura, el conductor tiene cuidado de marcar bloques de forma tan sucia mientras se escriben, y a los bloques sucios de RESIV si comienza desde una matriz inmunda. Ver el comentarios relacionados con los estados de matriz . La Documentación del kernel advierte que las matrices que están sucias (no se apagan limpiamente) y degradadas (que tienen piezas faltantes) no se ensamblan automáticamente, ya que esto no estaría seguro. Cuando ensamble una matriz sucia, usted (posiblemente muy brevemente) lo vea resync en /sys/block/md99/md/rd0/state. En general, el controlador MD se encarga de proteger sus datos contra una falla total de un componente de hardware (CPU o disco), que es lo que se espera.

Lo que MD no le protegerá contra la corrupción de datos debido a una falla bizantina (es decir, un volteo silencioso de uno o más bits) en RAM, CPU, placa base o disco. El hardware de disco tiene cheques, pero no son perfectos (consulte E.G. Literatura promocional ZFS ). ZFS y BTRFS puede proteger contra la corrupción del dispositivo de almacenamiento. el árbol de comprobación de BTRFS garantiza que se le notifique si su disco duro se vuelve un poco. ZFS ofrece una selección de suma de comprobación (según Blog de Jeff Bonwick ), hasta SHA-256, que protege no solo contra la corrupción aleatoria, sino también contra un ataque deliberado, a costa de los ciclos de CPU.

¿Creó el RAID1 BEVORE, usted pondrá un sistema de archivos en él? Si no, ¿se encogió el sistema de archivos antes de que sea un dispositivo RAID?

Si no lo hizo, el resultado podría ser una mala superbloque en su dispositivo RAID.

0
Nils