Eduardo M Fagundes

Artigos

Coletânea de artigos técnicos e reflexões de Eduardo M. Fagundes publicados entre 2011 e 2017

Assine a Newsletter no Linkedin

Tag: DRP

  • Planos de Continuidade de Negócios no cenário de Cloud Computing

    O ambiente tecnológico atual facilita a construção de planos de continuidade de negócios, incluindo planos de recuperação de desastres (DRP) dos data centers. Aplicações executando em ambientes Cloud Computing em mais de um data center permite uma rápida mudança de ambiente em caso de falha. A configuração de data centers por software permite criar ambientes completos em poucas horas. Existem softwares que configuram ambientes de data centers de fornecedores diferentes, automaticamente. A virtualização de PCs permite a construção de ambientes de escritórios externo com maior rapidez, pois não é necessário configurar os equipamentos para o ambiente de software corporativo da empresa. O uso de sistemas de voz baseados IP (VoIP) em Cloud Computing permite levar os números telefônicos para qualquer lugar. Nesse cenário, o maior desafio é o armazenamento de dados que deve estar disponível em diferentes ambientes, totalmente sincronizado.

    Um cenário bem diferente de quando iniciei minha carreira no suporte de infraestrutura de TI. Naquela época, os servidores e os sistemas de armazenamento de dados ficavam no data center da empresa e o acesso era restrito na rede corporativa. Tempos depois, com conexões seguras via Internet foi possível o trabalho remoto em locais com banda larga.

    Recordo que devido a uma longa greve no setor automobilístico tivemos que trabalhar mais de um mês fora da fábrica. Por sorte, um acordo com os grevistas foi permitido que os operadores de computadores trabalhassem. Mesmo assim, o desafio foi grande em operar a empresa toda fora da fábrica. Funções que acreditávamos que não eram prioritárias para a empresa tornaram-se críticas com o passar do tempo, pois geravam informações para outros departamentos. Depois de um mês todos os departamentos tiveram que trabalhar para garantir a operação da empresa.

    Em outra ocasião, tivemos que acionar o plano de recuperação de desastre (DRP) devido a um incêndio próximo do data center. Como naquela época era inviável manter data centers espelhos, migramos apenas os sistemas considerados críticos para a empresa, como o faturamento e vendas. O grande desafio depois de liberado o data center principal foi sincronizar os dados com os outros sistemas que não executaram durante o período de contingência.

    Felizmente, isso é coisa do passado para a maioria das empresas. Com as características de escalabilidade e criação de data centers via software é possível voltar a operar em poucas horas, desde que os dados estejam disponíveis e assumindo que o acesso à Internet também esteja disponível.

    Dentro desse cenário, o desafio é estabelecer uma estratégia eficiente de armazenamento e proteção dos dados, incluindo os códigos fontes dos sistemas.

    Em 2007, usando uma fibra ótica escura fazíamos o espelhamento dos dados do SAP entre o data center principal em Ashburn-Virginia (US) e o data center em Camdem em Londres. Uma solução viável devido a necessidade de ter um data center para atender as operações da empresa nos Estados Unidos e outro na Europa. Para cumprir as exigências da SOX, periodicamente, eram realizados testes de conformidade com o plano de recuperação de desastre.

    No Brasil, com a disponibilidade de vários fornecedores de Cloud Computing e de serviços de fibra ótica é possível elaborar um plano de continuidade de negócios com mais facilidade e custo compatível com os riscos operacionais das empresas, incluindo os serviços de voz, caso a empresa utilize serviços de VoIP com comutação virtual.

  • Gerenciamento da Disponibilidade

    Gerenciar a disponibilidade dos serviços de TI é fundamental para avaliar se os objetivos do negócios estão sendo atendidos de acordo com os níveis de serviços (SLA) assinados. Normalmente, a disponibilidade é calculada pela média do período negociado no SLA. Considera-se o período onde possa haver impacto nos negócios da empresa. Ou seja, se um empresa tem suas atividades entre 9 horas e 18 horas deve-se considerar esse período para calculo da disponibilidade.

    Uma questão interessante é definir o período de disponibilidade para empresas que operam 24 horas, 7 dias por semana. Uma falha pode ocorrer por falta de recursos da infraestrutura em horários de maior acesso de clientes. Se considerarmos o período de 24 horas essa falha poderá não ter demonstrar o impacto nos negócios da empresa. Desta forma, mesmo para serviços que operam ininterruptamente deve-se estabelecer os períodos que representam maior impacto nos negócios.

    O calculo para a disponibilidade é

    Disponibilidade = (( TST – DT ) / TST) * 100, onde TST é o tempo total do serviço no período e DT é o tempo de indisponibilidade.

    Para se calcular o custo do tempo de indisponibilidade podemos utilizar a seguinte formula:

    Custo da Indisponibilidade = (DT x U x PU) + (DT x LBR) + OT + S, onde DT é o tempo de indisponibilidade, U é o número de usuário afetados, PU é o total dos custos médios por usuário afetado, LBR é perda de receita por hora, OT é a quantidade de horas extras para recuperar o trabalho (se aplicável) e S são outros custos da operação.

    Dependendo dos custos de indisponibilidade é mandatório um forte plano de continuidade de negócios para não prejudicar o desempenho da empresa e a satisfação dos clientes.