Pular para o conteúdo
  • Este tópico contém 21 respostas, 5 vozes e foi atualizado pela última vez 16 anos, 1 mês atrás por CleitonHanzen.
Visualizando 15 posts - 1 até 15 (de 22 do total)
  • Autor
    Posts
  • #92413
    maperes
    Participante

      Caros colegas

      Estou com um problema grave com um dos nodes RAC, esse node não volta de jeito nenhum. Não conseguimos acessar a instancia ASM, esse node está inacessivel. Todos os serviços crs estão travados nesse node, nada responde….

      Tivemos uma queda de energia no nosso Datacenter, num primeiro momento as maquinas voltaram, mas logo em seguida perdemos esse node.

      Foi detectado um problema na área de SO desse node, nosso sysadmin restaurou uma imagem do SO, porém muito antiga, o que acabou de matar o node.

      Alguem sabe de algo que possa ser feito??

      Ambiente :

      AIX 5.3
      Oracle RAC 10.2.0.4

      Agradeço

      Marco Aurelio

      #92415
      Peterson
      Participante

        Marco,

        quantas instâncias você tem? Pela outra instância que continua funcionando, você verificou se a database está íntegra?

        #92417
        maperes
        Participante

          Colega

          Tenho duas instancias, no meu caso – DBSM1 (integra) e DBSM2(crash).
          Eu consigo ver os processos crs (crs_stat -t) a partir do DBSM1, todos os serviços ativos aparecem somente no node1(DBSM1) veja abaixo :

          Nome Tipo Destino Estado Host
          ————————————————————
          ora….M1.inst application ONLINE ONLINE goya-01
          ora….M2.inst application ONLINE OFFLINE
          ora.DBSM.db application ONLINE ONLINE goya-01
          ora….SM1.asm application ONLINE ONLINE goya-01
          ora….01.lsnr application ONLINE ONLINE goya-01
          ora….-01.gsd application ONLINE ONLINE goya-01
          ora….-01.ons application ONLINE ONLINE goya-01
          ora….-01.vip application ONLINE ONLINE goya-01
          ora….SM2.asm application ONLINE OFFLINE
          ora….02.lsnr application ONLINE OFFLINE
          ora….-02.gsd application ONLINE OFFLINE
          ora….-02.ons application ONLINE OFFLINE
          ora….-02.vip application ONLINE ONLINE goya-01
          [ goya-01 | oracle | DBMS1 | /home/oracle ]

          Agradeço seu interesse

          Marco Aurelio

          #92419
          maperes
          Participante

            Peterson

            Só pra complementar, a instancia do node que esta em crash esta totalmente inacessivel, só tenho no ar nesse momento o outro node, que esta sobrecarregado…..

            #92421
            Avatar photoRegis Araujo
            Participante

              Salve Maperes..!!

              Seguinte amigo.. pelo que entendi.. seu problema é com o SO e não com o database, como seu sysadmin restaurou um backup antigo do SO.. amigo.. sinto lhe dizer.. que vc vai precisar remover este nó do RAC, ou seja, transformar em sigle instance.. e refazer toda a instalação da máquina.. e do cluster.. depois vc adiciona esta máquina ao RAC…

              Quando o problema é no banco.. existem maneiras de ajustar e tal.. mas pelo q vc disse crashou o SO.. desta maneira fica complicado tentar algo.. vc deve estar utilizando uma Storage para armazenar os Datafiles e controls.. desta maneira fica bem mais facil recriar o NODE q deu problema e depois subir ele e adicionar ao RAC…!!!

              Abraços..!

              #92423
              vieri
              Participante

                Opções:

                1)Pede para o sysadmin montar um servidor idêntico ao node1,
                via tar,rebuild, n ferramentas e após isso adapte todas as config’s de rede,e db… TODAS. E tente subir o nóde 2.

                2)Vc também pode remover o node ferrado e manter a máquina com apenas um nó…não vejo sérios problemas ai… mas quem não entende pode implicar.

                3)Pode também restaurar esse servidor em uma base stand alone,
                porêm de maior potência.

                4)Adicionar um node3 com IP’s e nomes diferentes do 2.

                Boa sorte!

                #92424
                Peterson
                Participante

                  Eu garantiria que há backups deste banco (nunca se sabe o que pode ocorrer com o node restante), removeria o node “crashado”, solicitaria ao sysadmin a reinstalação do sistema operacional e o reincluiria no RAC.

                  #92425
                  maperes
                  Participante

                    Caro Regis

                    Realmente o problema foi em relação ao SO, mas comprometeu todo o ambiente RAC desse node, se eu remover e recriar novamente, eu consigo restabelecer o serviço, para isso eu uso o svrctl remove e depois add, seria mais ou menos isso…..

                    #92427
                    Avatar photoRegis Araujo
                    Participante

                      Maperes..

                      É tranquilo.. pois o RAC tem um parametro que se um NÓ fica sem responder por mais de 5 min(não me lembro o tempo default).. ele automaticamente remove este NÓ do RAC.. E tbm quando precisa ele reinicia o NÓ que esta com problemas..

                      É bem isto que vc falou.. para remover..

                      — é certo que o comando de stop não de resultado.. pois o servidor crashado esta inacessível.. caso queira.. rode direto o “REMOVE”…

                      srvctl stop -n

                      srvctl remove -n

                      E para adicionar.. vá no ORACLE_HOME/oui/bin ou CRS_HOME/oui/bin e roda o arquivo addNode.sh …

                      Mas não esqueça doq o pessoal falou antes.. faça backup da sua base para garantir.. pois agora seu banco não tem mais “alta disponibilidade”..

                      Não esqueça.. vc vai fazer uma instalação do zero.. e esta “nova” máquina precisa ter as configurações e parametros indenticos ao outro nó…

                      Caso queira dar uma lida sobre criação de oracle RAC e adcionando e deletando nodes.. olhe estes links abaixo..

                      Instalando:

                      http://www.oracle.com/technology/pub/ar … stall.html

                      Adicionando / Removendo

                      http://www.filibeto.org/sun/lib/nonsun/ … elunix.htm

                      Abraços..!!

                      #92429
                      maperes
                      Participante

                        Regis

                        Só mais uma coisinha.

                        Para eu fazer esse processo é preciso parar o outro node, ou eu posso fazer isso com o outro node no ar.

                        Minha preocupação é que esse é um ambiente de produção e não pode haver erros.

                        #92432
                        Peterson
                        Participante

                          Cara,

                          Esse é um procedimento que pode ser realizado sem parar o outro nó. Mas como o seguro morreu de velho… você poderia avaliar fazer isso em um horário com impacto menor.

                          #92433
                          Avatar photoRegis Araujo
                          Participante

                            Opa..!

                            Sim.. isto pode ser efetuado com o banco no ar.. alias.. é para ser efetuado assim..

                            Pois imagina sempre q vc precisar adicionar um no em um ambiente RAC vc precisa ficar baixando o banco todo.. é complicado.. um ambiente 24×7 não permite isto.. então tem q ser HOT…

                            Mas amigo.. faça antes uma avaliação de tudo.. oq eu falei parece ser simples.. mas não é.. vc precisa fazer algumas verificações para garantir a integridade das informações.. é quase que criar um RAC do zero..

                            Vc vai precisar instalar o database, o cluster e configurar as informações no HOST(se for linux) e tal.. de uma bela lida no artigo de instalação que eu lhe passei.. ele lhe poderá ser muito util..

                            Qualquer coisa… é só ir postando aqui…!!!

                            Abraços..!

                            #92442
                            Peterson
                            Participante

                              Maperes,

                              E aí cara, conseguiu adicionar novo Node no RAC?

                              #92450
                              maperes
                              Participante

                                Colega, ainda não, estou fazendo um mapeamento de toda a situação, antes de qq coisa, além disso, estou verificanco com o sysadm a questão do SO.

                                #92451
                                maperes
                                Participante

                                  Além disso, colega, nosso sysadmin está inseguro em acertar a questão de SO.

                                Visualizando 15 posts - 1 até 15 (de 22 do total)
                                • Você deve fazer login para responder a este tópico.