Downtime em data center: o que é e por que acontece

Tempo de leitura:

A correta gestão da tecnologia da informação (TI) pode garantir muito mais eficiência operacional levando ao aumento de desempenho da organização. Porém, qualquer tipo de falha em TI, a exemplo do downtime em data center, tem potencial de trazer instabilidade e prejuízos à empresa.

Segundo pesquisa realizada pelo Global Data Center Survey do Uptime Institute, com 900 operadores de data center e profissionais de TI, 31% dos entrevistados relataram que sofreram um incidente de inatividade ou degradação severa no serviço em 2017.

Falhas de energia no local, de rede e erros de software ou de sistemas são as causas primárias mais comuns do downtime em data center. A pesquisa indica ainda que quase 80% dessas interrupções poderiam ter sido evitadas.

Mas a questão é: como e por que esse tipo de falha acontece? Qual a melhor definição para downtime em data center e como evitá-lo? A resposta para essas perguntas você confere neste post. Boa leitura!


#1 Downtime em data center: conheça o conceito


Parada não planejada, indisponibilidade, queda ou ainda downtime: são vários os termos usados para descrever um data center parado. Consequentemente, diante de qualquer parada, a empresa acumula prejuízos. Seja pela queda na produtividade do time, seja pela perda de vendas, com as aplicações indisponíveis o transtorno é certo e os resultados são comprometidos.


Muito além disso, o downtime também pode levar à perda de dados e até mesmo ameaçar a reputação das empresas por conta de uma falha operacional ou de uma intervenção mal intencionada durante a indisponibilidade.


De acordo com estudo do Ponemon Institute, realizado nos Estados Unidos, embora os eventos e a frequência da inatividade tenham diminuído, o downtime em data center ainda é um problema recorrente nas organizações. Lá, cada minuto de indisponibilidade gera um prejuízo médio de U$ 7.900.


Neste cenário, é urgente compreender porque esse fenômeno acontece, bem como quais práticas podem ser adotadas para evitá-lo ou, pelo menos, reduzi-lo ao máximo.


#2 As principais causas da inatividade dos data centers


A infraestrutura adequada em TI e os cuidados na manutenção de todos os componentes como os data centers são fundamentais para garantir a disponibilidade da rede e, com isso, o acesso aos serviços para o usuário final.


Sem uma gestão correta desses recursos as chances de uma indisponibilidade afetar as operações da empresa são altas. Conheça, a seguir, as principais causas que geram a inatividade dos data centers. Assim, você fica sabendo como evitar o downtime e suas respectivas consequências.


1. Controle de acesso inadequado: é preciso garantir o máximo de segurança. A instalação de câmeras e o uso de dispositivos biométricos como cartão e leitura de íris ajudam a evitar acesso de pessoas não autorizadas e incidentes por falhas humanas.

2. Ausência de manutenção e testes nos equipamentos redundantes: uma das causas mais comuns de downtime são as falhas no sistema elétrico. O planejamento do data center precisa considerar o investimento em fontes redundantes como geradores e Nobreaks/UPS.

São eles que fornecem a energia necessária diante de qualquer problema no abastecimento pela concessionária. Em alguns casos, a ausência dessas fontes redundantes é um problema. Já em outros, a falta de manutenção delas é o que compromete o funcionamento do data center.


Como as baterias não são substituídas e os geradores não são testados com frequência, quando acontece downtime os componentes redundantes também ficam indisponíveis. Ou seja, os recursos que deveriam manter a disponibilidade do data center quando você mais precisa não cumprem sua função.


3. Manutenção não planejada: solicitações de alterações em um servidor ou troca de peça de um equipamento de rede são frequentes. Em tese e por padrão, tais procedimentos deveriam ser feitos somente com agendamento prévio.


Porém, na prática, a formalidade do processo não costuma ser respeitada. No calor da hora, parece que resolver o problema mesmo sem planejamento é a melhor solução. Mas, depois, essa decisão pode levar ao downtime e trazer consequências inesperadas.


4. Hardware desatualizado: é fato que em algum momento o hardware vai falhar. Contudo, também é verdade que um dispositivo antigo pode comprometer a estabilidade da aplicação crítica.


Daí a importância de elaborar um projeto de modernização e migração abrangente para a implantação de uma nova plataforma de hardware ou software.


Ainda que o investimento na iniciativa seja alto, mensure os riscos de manter o hardware obsoleto. Na maioria das vezes, vale mais a pena arcar com o custo de upgrade do que com os prejuízos do downtime.


5. Procedimento de tolerância a falhas não automatizados: empresas com operações extremamente críticas têm data centers espelhados ou sistemas redundantes para garantir a disponibilidade das aplicações. Desse modo, na inatividade do data center, tais procedimentos movem o tráfego para a instalação de backup ou iniciam os sistemas redundantes.


Ou seja, o nível de serviço é mantido. No entanto, nem sempre esses procedimentos funcionam como esperado por conta da falta de testes regulares. Para mantê-los em pleno funcionamento sempre que preciso, mesmo diante de pequenas alterações na infraestrutura, é recomendado examinar os procedimentos. Só assim é possível garantir que tudo ocorrerá bem em caso de indisponibilidade.


#3 Prioridade: garantir a atividade dos data centers


Cada vez mais as empresas investem em tecnologia visando aumentar a eficiência operacional e ganhar competitividade. Na era da transformação digital, sem dúvida, essa é a melhor estratégia. Porém, é preciso saber conduzi-la. A utilização de um bom data center não garante disponibilidade nas situações mais adversas. Daí, a importância de se atentar às causas de downtime elencadas e fazer o possível para evitá-las.


Deseja saber como melhorar a gestão da TI e garantir a disponibilidade do data center e dos serviços para o usuário final? Acompanhe o nosso blog e saiba tudo sobre o tema.

New call-to-action

 

Comentários

Assine a newsletter