Su una delle 12 macchine che compongono il cluster, ognuna con Ubuntu 12.04 e connesse tra di loro, oltre alla classica ethernet, via infiniband è stato necessario sostituire i due dischi in raid e ripristinare la configurazione originaria.
Arrivati alla gestione dell’Infiniband ho risolto con un paio di ricerche su Google e qui riassumo per memoria futura i vari passi da compiere:
Si installano i seguenti componenti tramite il classico apt-get install:
apt-get install infiniband-diags ibutils ibverbs-utils qlvnictools srptools sdpnetstat rds-tools rdmacm-utils perftest libmthca1 libmlx4-1 libipathverbs1
La procedura dovrebbe terminare senza alcun problema.
Adesso occorre far caricare all’avvio macchina i nuovi moduli del kernel necessari a gestire l’infiniband. Questo lo si fa modificando il file presente in /etc/modules ed aggiungendo le seguenti righe:
# moduli per gestire infiniband ib_ipoib ib_umad rdma_cm rdma_ucm
Riavviando la macchina se si esegue il comando
ifconfig -a
Troveremo tra le consuete eth0, eth1 e lo anche la ib0 che ovviamente andrà configurata in base alla vostra rete infiniband modificando il file /etc/network/interfaces. Nel mio caso:
# Infiniband IPoIB interface auto ib0 iface ib0 inet static address 192.168.0.2 netmask 255.255.255.0 network 192.168.0.0
Parte delle informazioni utili le ho trovate qui: