miércoles, octubre 05, 2005

El tonto

Eso es lo que hice ayer, el tonto, con el servidor del que vengo hablando desde hace unos cuantos posts.

La idea era esta: Reinstalarlo con una versión anterior del Redhat, que lleva mucho más tiempo en el mercado y (en teoría) es más estable que la que tenía puesta. Como el sistema de archivos que tiene es ext3, estandar a más no poder, no hace falta formatear la partición de datos ni hacer copia de seguridad. Todo muy lógico, ¿no? Pues no:

Los CDs
Tengo sin abrir la caja con los CDs de Redhat que venían con el equipo al comprarlo. Está sin abrir, porque era la versión 3 y yo ya había instalado la 4 en una estación de trabajo que funciona a las mil maravillas, y por eso decidí ponerla también en el servidor.

Abro la caja, saco el primer CD y veo que pone: Redhat Enterprise AS 3 for x86. ¿x86? ¿y eso es 32, 64 bits, o las dos cosas?. Busco en la web y resulta que 'x86' es de 32 bits, y para 64 bits hay 'for Intel Itanium' y 'for AMD64/Intel EM64T'. El que yo quiero poner es este último, por lo que los CDs que tenía no me sirven, así que tengo que ir a la página de Red Hat Network y bajarme las 4 ISOs.

Un largo rato después, cuando ya las tengo, me dispongo a tostarlas. Tras varios intentos y tres CDs en la basura, llego a la conclusión de que mi grabadora está averiada, los lée bien pero cuando intentas grabarlos hace ruiditos extraños y al final escupe el CD con unas rayas muy raras en su superficie y un error del software de grabación. Cojonudo.

Consigo otra grabadora, externa, y al fin tengo las ISOs en un soporte físico.

La reinstalación
Arranco con el primer CD y va todo bien. El proceso de instalación es realmente sencillo. Al llegar al particionado, le digo que las deje como está, sin formatear, y que escriba encima, tanto en las de datos como en las de sistema. No pone ninguna objeción, elijo los paquetes, y en unos minutos comienza a copiarlos y me va pidiendo los CDs uno detrás de otro.

Cuando termina, saco el último CD y reinicio. Aparece el Grub con el logotipo de Red Hat y la versión del kernel que va a arrancar. Bien, tiene buena pinta, le doy a Enter para que arranque sin esperar los 10 segundos. Comienzan a aparecer los mensajes en la consola y.... ¡tachán! se detiene la carga con un error que dice algo parecido a:

- El sistema ext3 que estás intentando arrancar tiene extensiones que no soy capaz de leer, y además la versión de fsck que tengo es demasiado vieja también. Jodete y baila

Aaaagh, tanto trabajo para nada. pero... ¿seguirán ahí los datos de los que no había hecho copia de seguridad?

Knoppix al rescate
Busco rápidamente un CD de knoppix para arrancar y ver si las particiones originales siguen ahí. Lo pongo, y lo inicio con knoppix 2 acpi=off noapic para que arranque en modo consola y pase de lo que le diga la BIOS, porque si no no se queda frito en la primera pantalla.

Hago un fdisk -l y veo que las particiones siguen ahí. Monto en un directorio temporal la que tenía los datos y... ufff, ahí siguen, menos mal. Como ya se había pasado más de media tarde y no me daba tiempo de hacer nada más, configuro manualmente la red y paso todos los datos de la partición a otro servidor, con el programa rsync. Como son unos 74 gigas, lo dejo ahí para que lo haga por la noche.

El descubrimiento
Antes de irme para casa miro en los foros de Dell a ver si hay alguien al que le pase lo mismo que a mi. No encuentro nada, pero me entero de que hay una actualización de la versión 4 del Red Hat, así que entro de nuevo en la página de antes y pongo a bajarme de nuevo las 5 ISOs del Red Hat Enterprise Linux AS 4 Update 1 (AMD64/Intel EM64T), por si acaso.

Por hacer algo más, salgo de los foros y entro en la zona de descargas de la web de Dell, a ver si hay algo nuevo. Y sí, lo hay, nada menos que una versión nueva de BIOS del 29 de septiembre (hace menos de una semana). Probablemente entré a esa misma sección hace una semana y un día, y por eso no la vi. Miro los fallos que arregla, y me encuentro estas líneas:

* Added workaround for lockup resulting from the systems with 8GB RAM or more and RAID storage controller potentially claiming inappropriate addresses.

Justo lo que nos pasa a nosotros. Me la bajo, y la instalo en el otro servidor gemelo que tenemos, al que todavía no he metido mano. Para que tome efecto hay que reiniciarlo, así que lo programo para que lo haga a la mañana siguiente, y me voy a casa.

La rerreinstalación
Hoy por la mañana retomo el tema. El servidor gemelo arranca sin novedad con la nueva versión de la BIOS sin que haya nada más que mencionar. Los datos del servidor problemático se han copiado a otro sitio bien, por lo que respiro tranquilo, podría formatear todo el disco si fuera necesario sin que luego me colgaran por cierta dolorosa parte del cuerpo. Pero parece que el problema no es del sistema operativo, sino de la máquina en sí misma.

Había dejado también por la noche bajándose las ISOs del Red Hat 4 Update 1, así que las tuesto en CDs y vuelvo a hacer la instalación.

Tras arrancar, detecta que está la versión 3 y me da la opción de actualizarla. Le digo que sí, y cuando me pide el segundo CD, se queda colgado. Compruebo que el CD está bien grabado con las sumas MD5, y vuelvo a intentarlo. Lo mismo. Al final, le digo que pase de actualizar nada, que haga una instalación nueva.

Vuelvo a decirle que conserve las particiones, que le ponga tal dirección IP y que meta estos paquetes sí y estos otros no. Sigue la instalación sin ningún problema más, y reinicio. Todo va bien, arranca y ¡sorpresa! pero esta vez buena, a parte de que los datos siguen ahí, todo lo demás que tenía antes configurado (usuarios, aplicaciones, permisos) sigue estando también intacto, así que me ahorro ese trabajo que pensaba que tendría que hacer.

¿Fin?
Cuando he terminado he avisado a los usuarios de que ya podían entrar, y de momento no se ha vuelto a caer. Si hubiera descubierto la actualización de BIOS ayer por la mañana, simplemente la habría instalado a ver que pasa, pero no hubiese montado el show del donwgrade a la versión 3 y luego la vuelta a la 4, con todo el tráfico de CDs y juramentos de por medio

Mientras escribía este post he entrado en la página de Red Hat Network para ver cuál era el nombre exacto de la versión del sistema operativo, y he descubierto que ha salido la Update 2. Juraría que ayer no estaba, pero con lo desquiciado que estaba a lo mejor sí que estaba y no lo ví.

Da igual, espero no tener que bajármelo otra vez...

2 comentarios:

pin dijo...

para cuando un post "especial wesconsin"??? creo que lo de ayer da para un post larguito...

OS_C dijo...

Pues sí, a ver si lo escribo :)