domingo, 10 de março de 2013

Gestão de Problemas em ITIL


Gestão de Problemas em ITIL

Gestão de Incidentes, que resumindo, tem a responsabilidade de restaurar um serviço o mais rápido possível com o mínimo de impacto para o negócio. Porém, a Gestão de Incidentes não se preocupa em tomar medidas que evitem que a falha ocorra novamente, e esta é a principal responsabilidade da Gestão de Problemas.

A GP também auxilia a Gestão de Incidentes no caso de incidentes graves. Na prática, uma mesma equipe pode ser responsável por estes dois processos, pois elas se complementam. Porém, é interessante que as pessoas sejam designadas para atender Incidentes ou Problemas. Talvez realizar um rodízio entre a equipe por mês ou semana seja interessante para que todos não fiquem sempre “fazendo a mesma coisa”.

A GP tem também a missão de registrar todos os erros conhecidos e suas soluções de contorno. Veja abaixo algumas definições importantes de serem observadas:
 •Problema: É a causa desconhecida de um ou mais incidentes
 •Causa: É um Erro em um Item de Configuração
 •Erro Conhecido (Known Error): É um problema cuja causa foi diagnosticada e para qual existe uma Solução de Contorno
 •Soluções de Contorno (Workaround): solução não definitiva
 •Solução: Solução definitiva

Outro papel importante da GP é vasculhar os incidentes/chamados que foram abertos e já encerrados e verificar se um algum ativo (item de configuração) pode estar com problemas ou pode ser melhorado.

Um exemplo prático: O pessoal da GP verificou que no último mês houve 3 paradas na rede do departamento Y, e que para resolver o incidente, o pessoal de Gestão de Incidentes está sempre reiniciando o switch XYZ. O pessoal da GP solicitou a substituição deste equipamento depois de realizar uma análise do hardware do mesmo, descobrindo a causa do problema. É de extrema importância que tudo seja corretamente registrado. Todas estas informações geradas pela GP podem ser utilizadas pela Gestão de Incidentes, por exemplo, para saber que para o incidente do Software A existe um workaround para ser aplicado e corrigi-lo temporariamente.

Na análise de um problema (incidente com causa desconhecida) é fundamental que se encontre a “causa raiz” do problema pois, o mesmo é que desencadeia todos os incidentes posteriores. Ao se achar uma solução para o problema, este problema se transforma em um “erro conhecido”. Para resolver este “erro conhecido” deve-se adotar uma solução ou solução de contorno através do gerenciamento de mudanças, que é quem irá avaliar a viabilidade e o impacto sobre o negócio desta solução pois, a mudança num hardware ou software podem afetar outros itens de configuração.


Nenhum comentário:

Postar um comentário