Cloud Capacity Management: o que é e o que você precisa saber antes de aplicá-lo?

Capacity Management, ou gerenciamento de capacidade, é uma prática utilizada há décadas para otimizar recursos on-premises. Com a chegada do cloud computing, muitas equipes de TI vêm ampliando suas práticas de gerenciamento de capacidade, afim de garantir o planejamento e o gerenciamento integral de todos os recursos, sejam eles locais ou na nuvem. A ideia é promover a administração de todos os recursos ao mesmo tempo e em um único local.
Para quem quer saber o que é e como aplicar o Capacity Management na nuvem, preparamos este post. Nele, você vai entender o que é preciso para estender o seu gerenciamento de capacidade para os recursos na nuvem, bem como, de que maneira esse tipo de gerenciamento se difere do tradicional capacity management. O gerenciamento de capacidade na nuvem é uma ótima forma de promover economia, auxiliar no processo de tomada de decisão e otimizar a capacidade para o uso de dados.
Capacity Management antes e depois do cloud computing
O gerenciamento de capacidade não é algo novo para quem atua com TI. Muito antes do cloud computing, na era do mainframe, o capacity management já era algo vital.
Como era preciso encomendar seu mainframe com pelo menos um ano de antecedência, era preciso saber exatamente aquilo que você precisava em termos de capacidade. Caso contrário, tanto o desempenho quanto a disponibilidade do sistema poderiam ser comprometidos.
Sem o Capacity Management era arriscado maximizar seus recursos e ser pego de surpresa com MIPS insuficientes para dar suporte às tarefas mais críticas que precisavam ser executadas.
Com o surgimento dos servidores mais baratos e mais fácies de se instalar, muitas empresas passaram a minimizar o gerenciamento de capacidade, dando mais importância ao gerenciamento de desempenho. No entanto, este tipo de conduta também significava aceitar o alto custo do provisionamento ineficiente, já que as VMs surgiam em todo ambiente sem que isso promovesse um claro entendimento sobre a capacidade ou a utilização de cada servidor.
Com o tempo, na medida em que a expansão de dados promovia o aumento de custos, muitas empresas acabavam voltando ao gerenciamento de capacidade em algum nível, usando ferramentas próprias ou mesmo planilhas.
O cloud computing, no entanto, aumentou significativamente a complexidade dos ambientes de TI para a maioria das organizações.
De acordo com um levantamento feito pela ESG, hoje 81% das empresas utiliza dois ou mais ambientes na nuvem pública e 51% das organizações usam mais de três ambientes. Apenas 16% das empresas usam recursos locais ou ambientes de uma única nuvem pública.
Hoje é um desafio gerenciar a capacidade dentro desse ambiente complexo, a fim de garantir que cada serviço tenha a capacidade que necessita.
O gerenciamento de capacidade, no entanto, é essencial para a tomada de decisão. Afinal, através dele é possível avaliar quais aplicativos, serviços e cargas de trabalho devem ser migradas para a nuvem, bem como, qual é o meio de se fazer essa operação. A visão sobre aquilo que você tem, o que de fato você está usando e o que está pagando em termos de capacidade, auxilia no gerenciamento de custos e evita o inchaço tanto do orçamento quanto dos recursos on-premises.
Gerenciamento de capacidade de custos: o jeito de manter o orçamento sob controle
Para negócios que atuam com tecnologia, tanto o gerenciamento de capacidade quanto o de custos são essenciais para garantir que os recursos não saiam do orçamento, independentemente de eles serem on-premises ou na nuvem.
Durante a migração de dados para a nuvem, por exemplo, fazer o dimensionamento correto dos dados antes da mudança evita tanto o super provisionamento, quanto despesas operacionais que acabam sendo desnecessárias. Com um benchmarking de desempenho é possível garantir que os recursos na nuvem ofereçam o mesmo desempenho dos recursos locais.
Hoje, o que se verifica é que o gerenciamento de capacidade acaba desempenhando um papel crítico para os recursos locais. Segundo um levantamento realizado pelo Gartner, cerca de 28% da capacidade dos servidores não é utilizada, assim como 40% da capacidade de armazenamento.
Na medida em que aplicativos estão migrando para a nuvem pública, o gerenciamento de capacidade está ajudando equipes de TI a compreenderem quais são os recursos locais que podem ser descomissionados e qual a melhor maneira de reutilizar as cargas de trabalho locais decorrentes dos recursos on-premises que permanecem sendo utilizados.
Com o Capacity Management de recursos locais e na nuvem é possível ter um planejamento e uma previsão mais precisa, ajudando a determinar os níveis de capacidade incluindo as configurações de computação, armazenamento, banco de dados e largura da banda de rede. Através desse tipo de gerenciamento é possível provisionar seus recursos de forma mais eficaz.
Como realizar o gerenciamento de capacidade?
Para realizar o gerenciamento de capacidade, é essencial observar alguns passos:
Passo n.º 1: Importação de dados
Dados são importantes, afinal, não há muito o que fazer sem eles! Uma primeira etapa crítica no gerenciamento de capacidade é importar métricas de desempenho, capacidade e configuração, bem como KPIs de negócios e para recursos, incluindo:
- Infraestrutura física / virtual / em nuvem
- Bancos de dados
- Armazenamento
- Redes
- Ambientes de Big Data
- Instalações
Há várias maneiras de coletar esses dados, incluindo a importação de ferramentas de monitoramento em tempo real, extração de ETL padrão do setor ou integração direta de API. Você também precisará determinar a frequência com as qual deseja coletar os dados. A maioria das organizações faz isso a cada 24 horas.
Quanto mais dados você coletar, mais precisas serão as informações subjacentes, o que permite melhores insights por meio de análises complexas. Isso ajuda você a tomar melhores decisões de negócios e se tornar mais proativo como organização.
Reunir dados de desempenho é apenas metade da equação de um ciclo de vida de um gerenciamento de capacidade totalmente maduro. Você também precisará de modelos de serviços de negócios, provavelmente preenchidos com algum tipo de solução de descoberta em um banco de dados de gerenciamento de configuração (CMDB).
As ferramentas de descoberta fornecem às organizações um inventário completo de seus ativos, conhecidos e desconhecidos. Muitas vezes, a solução de descoberta também pode mapear aplicativos. Isso permite a percepção necessária de quais aplicativos estão usando qual infraestrutura, bem como se determinados aplicativos exigem proximidade para obter um melhor desempenho. As práticas recomendadas hoje utilizam tags identificadas como itens de configuração (CIs) no CMDB como critérios de filtragem durante a criação de análises, modelos, relatórios e painéis.
O uso de uma metodologia de marcação é outra maneira de obter visualizações de serviço e vem sendo incentivada por provedores de serviços em nuvem. Com uma boa metodologia de marcação, as organizações podem criar exibições personalizadas de dados que atendam às necessidades de vários interessados com a necessidade de visibilidade do uso e dos custos de recursos no local e na nuvem. As tags típicas incluem categorização por departamento, criticidade de dados, conformidade, tipos de instância, clusters, grupos de usuários, entre outras. As tags podem ser aplicadas conforme os recursos são provisionados, mas é provável que você também precise definir e aplicar tags adicionais ao longo do tempo usando seu aplicativo de gerenciamento de capacidade.
Passo n.º 2: analisar dados
Agora que você já importou os dados, também precisa de visibilidade dos seus recursos para entender o que realmente está acontecendo. Muitas organizações não têm visibilidade de seus serviços porque seus negócios são organizados em “silos de tecnologia”, gerenciados por várias ferramentas de monitoramento, cada uma com sua própria interface de usuário. Aproveitar uma solução que extraia e organize esses dados em um local é fundamental. É isso o que nos leva ao segundo passo: a análise de dados.
A análise de utilização deve ser realizada de várias formas, como veremos a seguir:
Visibilidade: a visibilidade em todo o seu ambiente é a base de qualquer processo de gerenciamento de capacidade. Analise seus dados descobertos para saber quais são os recursos que você possui, como estão configurados e onde estão localizados.
Linhas de base: em seguida, avalie os perfis de utilização normal e linhas de base (esta etapa requer machine learning ). Você precisará entender os padrões de uso ao longo do tempo e identificar os tipos de comportamento cíclicos que existem na organização e quais são as suas causas. Quanto maior o período de tempo analisado e quanto mais dados você coletar, mais precisa será sua linha de base e perfil. A coleta e a análise de dados em andamento são a chave para o perfil e a linha de base adequados.
Análise de pico: Identifique comportamentos periódicos e períodos mais movimentados. Compreender quando ocorrem alterações nas cargas de trabalho é essencial para um uso eficiente, especialmente na nuvem, em que você paga por recursos diariamente, por hora, por minuto ou de acordo com o segundo. Compreendendo esses comportamentos, você pode tomar decisões melhores e mais informadas sobre como lidar e usar recursos para garantir o desempenho sem desperdiça-los.
Otimização: procure oportunidades para otimizar o uso de recursos. Isso pode envolver a adaptação da configuração de computação a alterações nas cargas de trabalho, como a adição de memória ou CPU. Isso requer que a automação seja feita de forma eficaz; os esforços manuais estão normalmente com 30 dias de atraso e não conseguem acompanhar o ritmo das mudanças na empresa moderna.
Passo n.º 3: dados de previsão
Com uma compreensão do que você tem hoje e de como seus recursos estão sendo usados, você pode ser mais proativo no gerenciamento de seu ambiente, prevendo a utilização futura e eventuais restrições de capacidade potencial ou saturações. Esse conhecimento pode ajudá-lo a evitar a degradação do serviço e evitar possíveis interrupções. A previsão também permite compreender como as mudanças futuras na configuração afetarão o desempenho atual e projetado, outro aspecto crítico do processo de gerenciamento de capacidade.
Para identificar proativamente a saturação da capacidade de armazenamento:
-
Identifique quando os conjuntos de armazenamento podem ficar sem capacidade.
-
Quantifique a capacidade adicional necessária para atender aos requisitos de alocação.
-
Verifique se há discos não usados suficientes em seus sistemas de armazenamento para estender os pools de armazenamento existentes.
Esse processo permite evitar compras insuficientes e atender aos requisitos de armazenamento atuais e futuros, para que você possa evitar o tempo de inatividade. Ao mesmo tempo, o dimensionamento precisa ajudar a evitar a compra excessiva e a capacidade de armazenamento desperdiçada.
Passo n.º 4: planejar com dados
Agora que você entendeu o crescimento orgânico projetado em sistemas, aplicativos e serviços empresariais existentes, você está pronto para o passo 4, que se concentra no planejamento de novos projetos, aplicativos e serviços comerciais. Isso geralmente é chamado de gerenciamento de demanda ou gerenciamento de capacidade com reconhecimento de reservas.
Nesta etapa, as organizações se concentram em duas questões:
-
Eu tenho capacidade suficiente para esses novos projetos?
-
Como esses novos projetos afetarão os outros aplicativos e serviços de negócios em execução no momento?
Os dados de gerenciamento de capacidade podem ser inseridos em um painel de reservas de recursos para fornecer respostas a perguntas, incluindo:
-
O que você tem e como você está usando?
-
O que está sendo incorporado e quando?
-
Você tem recursos existentes ou está adicionando novos?
-
O que você está offboarding e quando?
-
Quanta capacidade isso libera?
-
Quando os recursos serão recuperados e adicionados novamente ao pool de recursos disponíveis?
Passo n.º 5: Prever Mudanças e Recuperar Capacidade
O próximo passo na prática de gerenciamento de capacidade é prever o impacto de mudanças na demanda de serviços em sistemas, aplicativos e serviços de negócios existentes. Isso é, geralmente, chamado de modelagem de rede de filas no nível de serviço de negócios ou como otimização de recursos de infraestrutura de TI (computação e armazenamento).
Nesta etapa, os gerentes de capacidade simulam as alterações do sistema necessárias por cenários comerciais específicos. Por exemplo:
-
Simular o impacto das alterações da infraestrutura de TI em conjunto com o crescimento dos negócios no tempo de resposta calculado e nas restrições de utilização de recursos.
-
Simular de cenários de consolidação e virtualização para identificar como as alterações em potencial poderiam adiar ou eliminar a saturação.
-
Simular impactos de serviço resultantes de um cenário de recuperação de desastre ou o descomissionamento de recursos como parte de uma iniciativa de migração de nuvem.
O gerenciamento de capacidade possibilita a previsão do comportamento futuro dos recursos do sistema em cenários como esses e muitos outros, bem como, o impacto resultante nos KPIs de negócios. Isso ajuda a TI a correlacionar** as necessidades de negócios à demanda de capacidade e alinhar os recursos conforme necessário para suportá-los.
Se um evento futuro puder alterar as necessidades de recursos do aplicativo, você poderá modelar e planejar adequadamente. Por exemplo, uma companhia de seguros pode precisar de recursos adicionais para suportar um período de inscrição aberto. As universidades precisam de mais recursos no início do ano letivo para apoiar o ingresso de estudantes. Os varejistas precisam de recursos para dar suporte à Black Friday, Cyber Monday, lançamentos de campanhas e produtos e outros eventos de vendas. Toda empresa tem eventos que alteram drasticamente as cargas de trabalho dos aplicativos selecionados. Esses aplicativos normalmente são voltados para o cliente, são essenciais para os negócios e são fornecidos com recursos que abrangem ambientes de várias camadas e compartilhados.
O exemplo da Black Friday ilustra claramente o valor desse nível de maturidade do gerenciamento de capacidade. Em alguns casos, mais da metade da receita anual de uma organização é gerada durante a temporada de fim de ano, que agora também inclui a Cyber Monday e a Cyber Week. Se o site de um varejista ficar inativo ou atrasar durante a importantíssima temporada de compras de fim de ano, os consumidores adiam rapidamente o site de um concorrente e as organizações não apenas perdem uma venda, mas também um cliente. A modelagem de capacidade pode evitar que essa falta de recursos aconteça.
À medida que o aumento previsto na demanda se aproxima, precisamos ter certeza de que temos capacidade suficiente para lidar com isso sem comprometer nossos tempos de resposta calculados. Além disso, precisamos saber onde, em nossa infraestrutura compartilhada e com várias camadas, as restrições serão necessárias e o que precisamos fazer para mudar nosso ambiente, a fim de suportar o aumento na demanda de serviços.
Ao modelar o impacto dessas mudanças na demanda de serviços, podemos estimar as restrições de saturação e capacidade, bem como compreender quais configurações e / ou modificações de capacidade são necessárias para aliviar a restrição. Sabemos exatamente o que precisamos fazer e quando precisamos fazê-lo para apoiar o negócio.
Outras questões que podem ser abordadas nesta etapa incluem:
-
Quantas VMs adicionais ainda podemos implantar?
-
Qual é o melhor cluster para alocá-los?
-
Nossas zonas de disponibilidade estão próximas da saturação?
-
Como podemos aumentar a eficiência de nossos hosts virtuais?
-
Qual é o recurso mais restrito e com maior probabilidade de impactar nossos serviços com base nas tendências atuais?
-
Quanta capacidade de reposição nós temos? Quando vamos saturar recursos com base no crescimento dos negócios?
Para recursos em nuvem, o gerenciamento de capacidade pode esclarecer o seguinte:
-
Precisamos comprar mais VMs, aumentar ou diminuir o tamanho das que estamos usando atualmente ou alterar o tipo?
-
Precisamos aumentar ou diminuir o armazenamento de um determinado aplicativo?
-
Quanto essas alterações custarão?
-
Seria mais barato migrar para um fornecedor de nuvem diferente?
Passo n.º 6: relatório com dados
Após a importação, visibilidade, análise, previsão, planejamento e modelagem de dados, a próxima etapa em direção à maturidade do gerenciamento de capacidade é a capacidade de gerar automaticamente relatórios e painéis que podem ser distribuídos às partes interessadas. Essas partes interessadas podem incluir o pessoal responsável apenas por silos de tecnologia individuais, a integridade do negócio, aplicativos específicos ou uma seção transversal de todos os itens acima. Como resultado, é importante gerar periodicamente relatórios e visualizações variados com conteúdo diferente para cada parte interessada. Isso também pode incluir gerar relatórios baseados em exceção ou relatórios de showback.
Gerenciamento de capacidade na nuvem: por quê realizar?
Para oferecer o maior valor para os negócios, a TI precisa atingir o equilíbrio ideal entre capacidade, custo e utilização de recursos nos ambientes locais e na nuvem. Ao garantir uma capacidade adequada de fornecimento de serviços de alta qualidade, evitando desperdícios, você pode obter o máximo retorno dos gastos, evitando o tempo de inatividade e interrupções gerem a perda de clientes. Uma abordagem integral para o gerenciamento de capacidade e custo fornece a visibilidade, a percepção e o controle necessários para manter seus negócios funcionando da melhor maneira possível.
Gostou de saber mais sobre o gerenciamento de capacidade? Descubra também como migrar sua aplicação desktop para a nuvem. Clique aqui e saiba mais!