Pianificare l’high availability per server dedicati economici, parte 1
Una delle obiezioni che mi sento fare più spesso dai potenziali clienti riguarda l’affidabilità dell’hardware: “è davvero sicuro questo server, se si rompe qualcosa quanto impiegate a ripararlo?”
Non è un’obiezione da poco, perchè non c’è situazione più pericolosa per un fornitore di servizi hosting che il downtime di un server, questo per due motivi: il primo è che il mercato dell’hosting italiano è dominato da strategie di massimo ribasso sul prezzo, il secondo è che si tratta di un servizio relativamente intercambiabile.
Se i server dedicati costano relativamente poco ed è facile trovare online un nuovo fornitore, quando un server si pianta il cliente potrebbe decidere di passare ad un hosting alternativo (ad esempio da aruba a register), e qui viene il bello…
Prima o poi il tuo server si pianterà.
Se sei vagamente skillato avrai impostato un servizio di monitoring per inviare degli SMS ad un cellulare di emergenza, e porterai quel cellulare con te come una seconda pelle per tutto il tempo che il tuo business sarà online – il che probabilmente equivale al resto dei tuoi giorni – e ti verrà un tuffo al cuore ogni volta che quel cellulare emetterà un suono.
Non è che ti voglio portare sfiga. E’ che ho un datacenter pieno di server e so che ogni tanto uno si guasta. Se in datacenter avessi 1000 server e la probabilità di un guasto fosse di uno ogni 1000 giorni, dovrei probabilmente affrontare un guasto al giorno.
Quindi, per approcciare correttamente il tema dell’high availability bisogna convincersi che prima o poi un down è inevitabile, e in un certo senso anche benvenuto!
Perchè l’evento di “down del server”, per quanto sia un momento critico, è la cartina al tornasole con la quale misuri l’andamento del tuo business: il down è dovuto ad un eccesso di traffico rispetto a quanto previsto? Bene! Stai vendendo di più, risolvi i tuoi problemi di hardware e goditi gli utili!
Inoltre è un buon momento per verificare che gli investimenti che hai fatto nel provider di servizi hosting stiano dando i loro frutti: sei stato seguito correttamente, il tuo provider sapeva del down prima di te, è stato risolto velocemente o almeno con perizia?
Secondo me, quello che un buon provider di servizi hosting deve offrire in termini di high availability e gestione del down macchina, potrebbe riassumersi in questi punti:
> stabilire un canale di comunicazione diretto con il cliente
> stabilire un canale di comunicazione diretto con il cliente
> stabilire un canale di comunicazione diretto con il cliente
> costruire infrastrutture su misura, con più di un server dedicato, con la ridondanza built-in nel progetto in modo che l’incidenza di eventuali problemi hardware sia minima
> utilizzare un sistema di alert proprietario, procedure di escalation chiare e tecnici con reperibilità notturna/festiva, in modo da essere avvisati per tempo e poter ristabilire il servizio velocemente
> imparare dagli errori in modo da non ripeterli
Ti invito a fare una riflessione: quante volte hai intrapreso la scelta di cambiare provider di hosting dopo un evento di down risolto in modo non adeguato?
Se hai vissuto questa esperienza più di una volta, la ragione è che normalmente il provider offre elevate garanzie di persistenza a livello di datacenter (e ci mancherebbe pure!!) e non necessariamente a livello di singolo server dedicato / shared / vps.
In effetti, le chiavi di volta nella gestione del down macchina sono solo due: comunicazione e prevenzione.
Quindi per poter gestire correttamente i down di un server hai bisogno di:
> poter parlare con il responsabile tecnico della tua macchina presso l’hosting provider, e possibilmente che questo non cambi ogni tre mesi.
> aver concordato con il tecnico di cui sopra una serie di procedure di alert, escalation e recovery, e assicurarti al primo down che queste vengano rispettate
> in caso di imprevisti – e ce ne saranno, credimi – condividere l’esperienza acquisita con il tecnico di cui sopra, aggiornare le procedure di alert, escalation e recovery, apprendere per il futuro.
Poi, l’high availability dei tuoi servizi web può essere migliorata ulteriormente progettando correttamente l’infrastruttura, magari su di un layer di virtualizzazione dedicata, ma di questo parlerò nella seconda parte di questo post, fra qualche giorno.
Nel frattempo, se hai un’infrastruttura web critica per il tuo business e desideri confrontarti con un partner di hosting affidabile e preparato, potrai contattarmi tramite questo form.
