- Este tópico contém 21 respostas, 5 vozes e foi atualizado pela última vez 16 anos, 1 mês atrás por
CleitonHanzen.
-
AutorPosts
-
2 de fevereiro de 2010 às 8:15 pm #92413
maperes
ParticipanteCaros colegas
Estou com um problema grave com um dos nodes RAC, esse node não volta de jeito nenhum. Não conseguimos acessar a instancia ASM, esse node está inacessivel. Todos os serviços crs estão travados nesse node, nada responde….
Tivemos uma queda de energia no nosso Datacenter, num primeiro momento as maquinas voltaram, mas logo em seguida perdemos esse node.
Foi detectado um problema na área de SO desse node, nosso sysadmin restaurou uma imagem do SO, porém muito antiga, o que acabou de matar o node.
Alguem sabe de algo que possa ser feito??
Ambiente :
AIX 5.3
Oracle RAC 10.2.0.4Agradeço
Marco Aurelio
2 de fevereiro de 2010 às 8:25 pm #92415Peterson
ParticipanteMarco,
quantas instâncias você tem? Pela outra instância que continua funcionando, você verificou se a database está íntegra?
2 de fevereiro de 2010 às 8:39 pm #92417maperes
ParticipanteColega
Tenho duas instancias, no meu caso – DBSM1 (integra) e DBSM2(crash).
Eu consigo ver os processos crs (crs_stat -t) a partir do DBSM1, todos os serviços ativos aparecem somente no node1(DBSM1) veja abaixo :Nome Tipo Destino Estado Host
————————————————————
ora….M1.inst application ONLINE ONLINE goya-01
ora….M2.inst application ONLINE OFFLINE
ora.DBSM.db application ONLINE ONLINE goya-01
ora….SM1.asm application ONLINE ONLINE goya-01
ora….01.lsnr application ONLINE ONLINE goya-01
ora….-01.gsd application ONLINE ONLINE goya-01
ora….-01.ons application ONLINE ONLINE goya-01
ora….-01.vip application ONLINE ONLINE goya-01
ora….SM2.asm application ONLINE OFFLINE
ora….02.lsnr application ONLINE OFFLINE
ora….-02.gsd application ONLINE OFFLINE
ora….-02.ons application ONLINE OFFLINE
ora….-02.vip application ONLINE ONLINE goya-01
[ goya-01 | oracle | DBMS1 | /home/oracle ]Agradeço seu interesse
Marco Aurelio
2 de fevereiro de 2010 às 8:58 pm #92419maperes
ParticipantePeterson
Só pra complementar, a instancia do node que esta em crash esta totalmente inacessivel, só tenho no ar nesse momento o outro node, que esta sobrecarregado…..
2 de fevereiro de 2010 às 9:32 pm #92421Regis Araujo
ParticipanteSalve Maperes..!!
Seguinte amigo.. pelo que entendi.. seu problema é com o SO e não com o database, como seu sysadmin restaurou um backup antigo do SO.. amigo.. sinto lhe dizer.. que vc vai precisar remover este nó do RAC, ou seja, transformar em sigle instance.. e refazer toda a instalação da máquina.. e do cluster.. depois vc adiciona esta máquina ao RAC…
Quando o problema é no banco.. existem maneiras de ajustar e tal.. mas pelo q vc disse crashou o SO.. desta maneira fica complicado tentar algo.. vc deve estar utilizando uma Storage para armazenar os Datafiles e controls.. desta maneira fica bem mais facil recriar o NODE q deu problema e depois subir ele e adicionar ao RAC…!!!
Abraços..!
2 de fevereiro de 2010 às 9:37 pm #92423vieri
ParticipanteOpções:
1)Pede para o sysadmin montar um servidor idêntico ao node1,
via tar,rebuild, n ferramentas e após isso adapte todas as config’s de rede,e db… TODAS. E tente subir o nóde 2.2)Vc também pode remover o node ferrado e manter a máquina com apenas um nó…não vejo sérios problemas ai… mas quem não entende pode implicar.
3)Pode também restaurar esse servidor em uma base stand alone,
porêm de maior potência.4)Adicionar um node3 com IP’s e nomes diferentes do 2.
Boa sorte!
2 de fevereiro de 2010 às 9:42 pm #92424Peterson
ParticipanteEu garantiria que há backups deste banco (nunca se sabe o que pode ocorrer com o node restante), removeria o node “crashado”, solicitaria ao sysadmin a reinstalação do sistema operacional e o reincluiria no RAC.
2 de fevereiro de 2010 às 9:48 pm #92425maperes
ParticipanteCaro Regis
Realmente o problema foi em relação ao SO, mas comprometeu todo o ambiente RAC desse node, se eu remover e recriar novamente, eu consigo restabelecer o serviço, para isso eu uso o svrctl remove e depois add, seria mais ou menos isso…..
2 de fevereiro de 2010 às 10:15 pm #92427Regis Araujo
ParticipanteMaperes..
É tranquilo.. pois o RAC tem um parametro que se um NÓ fica sem responder por mais de 5 min(não me lembro o tempo default).. ele automaticamente remove este NÓ do RAC.. E tbm quando precisa ele reinicia o NÓ que esta com problemas..
É bem isto que vc falou.. para remover..
— é certo que o comando de stop não de resultado.. pois o servidor crashado esta inacessível.. caso queira.. rode direto o “REMOVE”…
srvctl stop -n
srvctl remove -n
E para adicionar.. vá no ORACLE_HOME/oui/bin ou CRS_HOME/oui/bin e roda o arquivo addNode.sh …
Mas não esqueça doq o pessoal falou antes.. faça backup da sua base para garantir.. pois agora seu banco não tem mais “alta disponibilidade”..
Não esqueça.. vc vai fazer uma instalação do zero.. e esta “nova” máquina precisa ter as configurações e parametros indenticos ao outro nó…
Caso queira dar uma lida sobre criação de oracle RAC e adcionando e deletando nodes.. olhe estes links abaixo..
Instalando:
http://www.oracle.com/technology/pub/ar … stall.html
Adicionando / Removendo
http://www.filibeto.org/sun/lib/nonsun/ … elunix.htm
Abraços..!!
2 de fevereiro de 2010 às 10:25 pm #92429maperes
ParticipanteRegis
Só mais uma coisinha.
Para eu fazer esse processo é preciso parar o outro node, ou eu posso fazer isso com o outro node no ar.
Minha preocupação é que esse é um ambiente de produção e não pode haver erros.
2 de fevereiro de 2010 às 10:52 pm #92432Peterson
ParticipanteCara,
Esse é um procedimento que pode ser realizado sem parar o outro nó. Mas como o seguro morreu de velho… você poderia avaliar fazer isso em um horário com impacto menor.
2 de fevereiro de 2010 às 10:56 pm #92433Regis Araujo
ParticipanteOpa..!
Sim.. isto pode ser efetuado com o banco no ar.. alias.. é para ser efetuado assim..
Pois imagina sempre q vc precisar adicionar um no em um ambiente RAC vc precisa ficar baixando o banco todo.. é complicado.. um ambiente 24×7 não permite isto.. então tem q ser HOT…
Mas amigo.. faça antes uma avaliação de tudo.. oq eu falei parece ser simples.. mas não é.. vc precisa fazer algumas verificações para garantir a integridade das informações.. é quase que criar um RAC do zero..
Vc vai precisar instalar o database, o cluster e configurar as informações no HOST(se for linux) e tal.. de uma bela lida no artigo de instalação que eu lhe passei.. ele lhe poderá ser muito util..
Qualquer coisa… é só ir postando aqui…!!!
Abraços..!
3 de fevereiro de 2010 às 5:26 pm #92442Peterson
ParticipanteMaperes,
E aí cara, conseguiu adicionar novo Node no RAC?
3 de fevereiro de 2010 às 8:24 pm #92450maperes
ParticipanteColega, ainda não, estou fazendo um mapeamento de toda a situação, antes de qq coisa, além disso, estou verificanco com o sysadm a questão do SO.
3 de fevereiro de 2010 às 8:44 pm #92451maperes
ParticipanteAlém disso, colega, nosso sysadmin está inseguro em acertar a questão de SO.
-
AutorPosts
- Você deve fazer login para responder a este tópico.