it-swarm-es.com

¿Los controladores RAID comúnmente tienen problemas de compatibilidad de marca SATA DRIVE?

Hemos luchado con el controlador RAID en nuestro servidor de base de datos, A Lenovo ThinkServer RD120. Es un adaptación de rebaída que Lenovo/IBM dubs el ServeAid 8k .

Hemos parchado esto ServeAid 8K hasta lo último y más grande:

  • Versión de RAID BIOS
  • Versión de BIOS BOUSPLANE RAID
  • Controlador de Windows Server 2008

Este controlador RAID ha tenido múltiples actualizaciones de BIOS críticos, incluso en el corto período de 4 meses, lo tenemos, y el Historial de cambios es solo ... bueno, aterrador.

Hemos intentado estrategias de escritura y escritura en las unidades de redadas lógicas. Todavía tenemos errores intermitentes de E/S con actividad de disco pesado. No son comunes, pero serios cuando suceden, ya que causan SQL Server 2008 I/O Tiempo de espera y, a veces, fracaso de los grupos de conexión SQL.

Estábamos al final de nuestra cuerda Solución de problemas de este problema. Corto de cosas hardcore como reemplazar todo el servidor, o reemplazar el hardware RAID, nos estábamos desesperados.

Cuando conseguí por primera vez el servidor, tuve un problema donde el Drive Bay # 6 no fue reconocido. Apagar los discos duros a una marca diferente, extrañamente, solucionó esto, y la actualización de la BIOS RAID (para la primera de muchas veces) lo fijó de forma permanente, así que pude usar la unidad original "incompatible" en la bahía 6. En un Hunción, comencé a asumir que los discos duros de SATA Digital occidental elegí fueron de alguna manera incompatibles con el controlador de 8K de ServeAid.

Comprar 6 nuevos discos duros fue una de las opciones más baratas de la mesa, por lo que fui por 6 hitachi (aka ibm, aka lenovo) DRIVES DRUCTOS bajo la teoría de que un controlador RAID de IBM/Lenovo es más probable Para trabajar con las unidades en las que se vende normalmente.

Parece que el corazonado se pagó: hemos pasado por tres de nuestros días de carga más pesados ​​(MON, TUE, WED) sin un solo error de E/S de ningún tipo. Antes de esto, con regularidad, teníamos al menos un "evento" de E/S en este marco de tiempo. Seguro que parece que las marcas de conmutación de disco duro han fijado nuestros problemas intermitentes de E/S RAID!

Si bien entiendo que IBM/Lenovo probablemente prueba su controlador RAID exclusivamente con su propia marca de discos duros, me molesta que un controlador RAID tendría problemas de E/S sutiles con marcas particulares de discos duros.

Entonces, mi pregunta es, ¿Es este tipo de incompatibilidad de la unidad SATA común con los controladores RAID? ¿Hay algunas marcas de unidades que funcionan mejor que otras, o son " validado "Contra el controlador RAID particular? Había asumido que todos los discos duros de SATA de productos básicos eran iguales y trabajarían razonablemente bien en cualquier controlador RAID dado (de calidad suficiente).

22
Jeff Atwood

Incluso para los discos duros de escritorio sin incursión, de antigüedad, la compra de unidades del proveedor (en el marcado ridículo esperado) a menudo puede hacer una diferencia. Por ejemplo, Apple es cuidadoso solo para enviar las unidades que en realidad son capaces de ¡Honrar Mac OS X F_FULLSYNCfcntl() bandera , Lo que va un largo camino para asegurarse de que las cosas como Máquina de tiempo las copias de seguridad funcionan de manera confiable.

Nuevamente, esta es la vainilla sencilla Escritorio Use sin RAID involucrado. Cualquier cosa más compleja que eso y definitivamente desea comprar, si no las propias unidades de precio excesivo del proveedor, al menos impulsan los modelos que usted conoce, seguro que está en la lista "Aprobado" de los proveedores.

Entonces, para responder a tu pregunta, ¿es común? Yo diría, sí, más común de lo que podría pensar, incluso más allá del ámbito empresarial.

13
John Siracusa

No creo que sea común per se. Sin embargo, tan pronto como comience a utilizar los controladores de almacenamiento de Enterprise, ya sea que sean los controladores RAID de San SAN o independientes, generalmente querrá adherirse a su lista de compatibilidad de cerca.

Es posible que pueda ahorrar unos dólares en el precio de la etiqueta adhesivo comprando una gama barata de discos, pero es probable que sea una de las últimas áreas en las que quisiera ahorrar dinero, dada la importancia de los datos en la mayoría de los escenarios.

En otras palabras, la incompatibilidad explícita es muy poco frecuente, pero la adherencia de compatibilidad explícita es recomendable.

4
Mark S. Rasmussen

No soñaría con usar discos SATA para un servidor, ninguno de ellos tiene el ciclo de trabajo esperado de una unidad de calidad del servidor y no tienen el conjunto de comandos enriquecidos que SCSI/SAS tiene para monitorear el rendimiento y la salud de la unidad. Los servidores de Lenovo son baratos y excelentes, si tiene muchos servidores con ninguno de ellos, realmente tan importantes, pero hay una razón por la que los servidores de la serie 300 de HP representan el 40% del mercado: trabajan. En particular, sus controladores de discos 'SmarTarray' son inigualables en la confiabilidad y el rendimiento y su garantía previa a la falla es una adición de bienvenida. ¿No es el más barato, pero cuánto vale su tiempo? He estado comprando sus (Bien compaq primero tbh) servidores durante veinte años y no tenemos ningún problema que comprenda los 500-800 nuevos nuevos al año que hago. En serio revísalos.

4
Chopper3

La respuesta como siempre es "depende".

Para ciertos almacenamiento empresarial (Diga EMC), el proveedor calificará específicamente las unidades e incluso vaya a la extensión de la carga de firmware personalizado.

Como dice Mark, me parece que es lo mejor cuando sigues la lista aprobada por un proveedor si hay uno. Los ahorros de costos iniciales están superados en el tiempo dedicado a intentar cazar a los gremlins.

2
Jauder Ho

Tiene un controlador SAS, que podría ser el problema. Mientras que SAS El protocolo se puede usar para túneles Comandos ATA La señalización a nivel físico es un poco diferente (SAS utiliza un voltaje más alto y un diferencial más amplio). Casi todos los controladores pueden hablar directamente con las unidades de SATA, ¡pero si hay un (gran? Hierbas ") Backplane en el medio La señal podría interrumpirse. Generalmente en el mundo empresarial adjuntando a los conductores SATA. directamente a A SAS Controller no se admite oficialmente, debe usar un interponador (un tablero lógico pequeño que se conecta directamente al disco que, en un lado, entiende el protocolo completo SAS, en el otro Habla ATA - De esta manera, el backplane lleva la señalización más alta SAS _ de señalización).

Algo relacionado: Mezcla SAS y las unidades SATA en el mismo posterior tienden a fallar, porque la señalización de todas las unidades (incluidas las SAS) se reduce al nivel SATA.

2
Luca Tettamanti

Lo más probable es probable Sus unidades WD necesitan una actualización de firmware . Ver esta Nota de IBM para descargar y solicitar la actualización. Como puede ver desde el Instrucciones , las unidades WD están lejos de las únicas con problemas.

Si va a colocar sus unidades en un entorno de servidor de impuestos, está obligado a que se convertirá en más problemas que en una configuración de escritorio de entusiastas típicos.

¿Podrías algún comentario sobre por qué eligió ir con la clase de escritorio Deskstar serie de unidades en lugar de la clase Empresarial/RAID ltrastar series? ¿Sientes que el costo adicional no vale la pena la confiabilidad y la velocidad añadidas?

1
Peter Stuer

Como ingeniero que trabaja con controladores RAID, puedo decir que no es infrecuente que algunas marcas de unidades tengan problemas con ciertos controladores RAID. Cada unidad tiene sus peculezas particulares, y cualquier modelo de unidad que figura en la lista "Dispositivos compatibles" del controlador tendrá sus compitidas contabilizadas por el controlador. Para un modelo de unidad para aparecer en la lista, tiene que cumplir con los estándares del fabricante del controlador para el rendimiento y la confiabilidad. Cualquier unidad que no esté en esta lista podría funcionar, pero como no ha pasado por las mismas pruebas rigurosas que los dispositivos "aprobados", YMMV.

En particular, el protocolo SATA permite comandos específicos de proveedores (no estandarizados) que pueden definirse por la unidad o el controlador. En su caso, puede estar viendo un controlador que está esperando una unidad para responder a un comando propietario en particular o una unidad que espera ver un comando propietario que nunca llegue.

Otra posibilidad es que sus unidades problemáticas no se comporten muy bien bajo ciertas cargas de trabajo estresantes, y el comportamiento que ves fue suficiente para que Adaptec/IBM no enumere ese modelo de unidad como soportado.

Desafortunadamente, los protocolos de almacenamiento (SATA, SAS, etc.) no son tan agradables como otras interfaces estandarizadas (USB, PCI, etc.) donde todo lo que necesita es un autobús y un dispositivo que habla el mismo idioma y todo está bien. Especialmente cuando se trata de equipos de grado empresarial, los fabricantes de dispositivos y los fabricantes de la unidad gastan una gran cantidad de tiempo y energía de colaboración, lo que garantiza que los clientes obtengan el mejor rendimiento posible de las configuraciones utilizadas por la mayoría de los clientes (es decir, usando las unidades fuera de la unidad de la Lista de "dispositivos compatibles"). Una unidad que no está en esa lista puede haber sido diseñada para realizar óptimamente con una marca de controlador diferente, y los errores que está viendo son un efecto secundario de la optimización.

0
bta