- Este tópico contém 13 respostas, 6 vozes e foi atualizado pela última vez 17 anos, 1 mês atrás por
jspaulonci.
-
AutorPosts
-
3 de fevereiro de 2009 às 8:28 pm #85049
jspaulonci
ParticipanteBoa tarde moçada, temos uma máquina sun fire com 7 processadores RISC de 750 mhz cada um, com 10gb de RAM Sun Solaris 5.10, a máquina não está paginando, pelo contrário está até sobrando cpu, porem meu RMAN está lento, esta base em questão possui 388 Gb , utilizo paralelização com 3 canais, faço backup com compress em disco, ressaltando que esta instância está em ASM, porem acho que meu RMAN está lento, disparei um backup full as 09:00 da manhã e até agora não terminou , agora é exatamente 14:25, ou seja já se passaram 5 horas.
Será que existe algo que posso melhorar no meu RMAN ?
Obrigado
3 de fevereiro de 2009 às 8:34 pm #85050Ricardo Portilho Proni
ParticipanteOi joão.
Qual o tempo que seu backup leva, sem paralelismo, e sem compressão?Também, o backup em RMAN é impactado pelo restante do uso do Banco, e vice-versa.
3 de fevereiro de 2009 às 8:38 pm #85052vieri
Participanteselect sid,
serial#,
context,
sofar,
totalwork,
round(sofar/totalwork*100,2) “%_complete”
from
v$session_longops
where
opname like ´RMAN%´
and opname not like ´%aggregate%´
and totalwork != 0
and sofar totalwork;select operation as “OPERACAO”,
object_type as “TIPO”,
status,
output_device_type as “MEDIA”,
to_char(end_time,´DD-MM-RRRR HH24:MI:SS´) as “DATA”,
round(MBYTES_PROCESSED/1024,2) as “TAMANHO(MB)”
from
v$rman_status
where
operation ´CATALOG´
and trunc(end_time)>=trunc(sysdate-1)
order by
end_time ;Cole o resultado das queryes acima.
Abra 4 canais para ver se melhora!
3 de fevereiro de 2009 às 11:01 pm #85054Rodrigo Almeida
ParticipanteOlá João,
Primeiramente velho, algumas perguntas com dúvidas:
1) Qual o motivo de soltar o backup full no horário comercial?
2) O backup será feito diretamente para o FRA do ASM ou para FITA?
3) Não é possível realizar apenas um backup incremental?E agora, á suas dúvidas.
Bom, a lentidão pode ser causa sim pelo excesso de carga no banco de dados por estar no horário comercial, sobre caga nos diskgroups do ASM, falta de configuração de ratio para FITA e etc…
O que pode ser feito, é um tipo de backup que ajuda a minizar o impacto na produção e aumentar o paralelismo no backup. Exemplo:
run {
allocate channel t1 type disk;
allocate channel t2 type disk;
allocate channel t3 type disk;
allocate channel t4 type disk;
allocate channel t5 type disk;
allocate channel t6 type disk;
set command id to ‘MEU_BACKUP’;
backup duration 06:00 minimize load partial database tag ‘BKP_FULL’;
release channel t1;
release channel t2;
release channel t3;
release channel t4;
release channel t5;
release channel t6;
}Esse script irá fazer ou “tentar” realizar um backup completo da sua base numa janela de 6 horas e minimizando a carga na base, para não impactar tanto a produção.
Tu pode acompanhar os processos dos canais com o script abaixo:
SELECT session_recid, input_bytes_per_sec_display,
output_bytes_per_sec_display,
time_taken_display, end_time
FROM v$rman_backup_job_details
ORDER BY end_time;ou
SELECT b.sid, b.serial#, a.spid, b.client_info
FROM v$process a, v$session b
WHERE a.addr = b.paddr
AND b.client_info LIKE ‘%MEU_BACKUP%’;Depois disso, existe diversas coisas que podem afetar a performance do RMAN, como rede, configuração do processo de RBAL do ASM, se os discos estão em ASYNC_IO ou SYNC_IO, tamanho do LARGE_POOL_SIZE e etc…
Seu backup deve estar demorando, porque utilizar o backup as compressed backupset irá consumir bons ciclos de CPU.
O vieri passou também alguns selects que identificam os canais do RMAN e seu progress bar, com isso, terá os valores do SID para cada canal alocado, deste modo, faça um consulta no V$SESSION_WAIT e veja quais eventos está gerando e ocasionando a lentidão….
Depois… se ver que está travadão… habilite um DEBUG no rman e veja como ele está se comportando e enroscando! Exemplo:
rman target=@ catalog=@ trace=debug_rman.trc
run {
debug on;
…. (todo o script acima ou sem o DURATION ..)
debug off;
}E posta para nós!
Abraços,
Rodrigo Almeida4 de fevereiro de 2009 às 1:04 pm #85068jspaulonci
ParticipanteBom dia Moçada, hoje o problema está persistindo,
Bom primeiro quero começar a exclarecer algumas perguntas do Rodrigo1) Qual o motivo de soltar o backup full no horário comercial?
Soltei o full em horário comercial para que a área de flash do banco fosse
limpa, pois minha flash que possui 200 gb estava com 60 gb sobrando
A retenção da minha flash é 14402) O backup será feito diretamente para o FRA do ASM ou para FITA?
O que é FRA ?
O backup é feito do ASM diretamente para um file system na mesma máquina, depois o file system vai pra fita
3) Não é possível realizar apenas um backup incremental?
Posso pensar nisso sim..pode ser uma possibilidadeO que é falta de configuração de ratio para a Fita ?
Minha LARGE_POOL_SIZE está com zero, posso aumenta-la ?
Para quanto ?Como verifico se meus discos estão com ASYNC_IO ou SYNC_IO ?
Qual é o melhor ?A view de progress do Vieri estou usando também por favor peço ajuda de vocês
Obrigado Rodrigo e obrigado Vieri
Fico no aguardoSpaulonci
4 de fevereiro de 2009 às 4:17 pm #85077Rodrigo Almeida
ParticipanteJoão,
Segue as respostas:
1) Qual o motivo de soltar o backup full no horário comercial?
Soltei o full em horário comercial para que a área de flash do banco fosse
limpa, pois minha flash que possui 200 gb estava com 60 gb sobrando
A retenção da minha flash é 1440R: No RMAN tem a opção de utilizar BACKUP RECOVERY AREA, que irá realizar o backup do toda á area de RECOVERY AREA –> “FRA” e mandar para fita, não é possível mandar para disco nessa opção.
2) O backup será feito diretamente para o FRA do ASM ou para FITA?
O que é FRA ?
O backup é feito do ASM diretamente para um file system na mesma máquina, depois o file system vai pra fitaR: FlashBackup Recovery Area, e uma área padrão do Oracle 10g que é utilizada para armazenar os arquivos de archives, redo logs, flashback logs, backupsets e etc. A mesma mencionada acima.
3) Não é possível realizar apenas um backup incremental?
Posso pensar nisso sim..pode ser uma possibilidadeSeria mais viável. se for realizar o backup INCREMENTAL, habilite a opção CHANGE BLOCK TRACKING para mehorar a performance.
O que é falta de configuração de ratio para a Fita ?
R: Ratio é uma opção que o RMAN fornece para que está alocando canais diretamente para FITA (LTO, DLT, LTO2 e etc), pois dependendo do fabricando e dos drivers utilizados, consegue melhorar a performance de gravação e leitura com esse recurso do RMAN.
Minha LARGE_POOL_SIZE está com zero, posso aumenta-la ?
R: SIM! O RMAN indiretamente utiliza a LARGE_POOL, deixe com um valor de 32M ou superior, recomendado uns 100MB, pois a partir dele que o algoritmo do RMAN realiza algumas tarefas.Para quanto ?
R: O valor padrão é 32MB, mas dependendo do seu hardware, pode ser aumentado.
Como verifico se meus discos estão com ASYNC_IO ou SYNC_IO ?
Qual é o melhor ?R:
select name, value, description from v$parameter where name like ‘%disk%io%’;
select name, value, description from v$parameter where name like ‘%tape%io%’;Para saber qual é melhor, veja a documentação da Oracle, irá depender muito do seu ambiente, tipo de disco utilizado e tecnologia do disco. Geralmente para ASM deve estar desabilitado, não sei se é seu caso!
A view de progress do Vieri estou usando também por favor peço ajuda de vocês
Algumas perguntas:
Seu ASM está utilizando FAILGROUPS?
Seus diskgroups do ASM, foram montados com o mesmos discos, quantidade e tecnologia?
Qual o seu valor de RBAL da instância +ASM?Abraços,
Rodrigo Almeida4 de fevereiro de 2009 às 4:58 pm #85079jspaulonci
ParticipanteBom dia Rodrigo,
Vamos lá
Esclarecendo,
– Nosso backup é feito do asm direto para um file system, depois este file system sobe pra fita.- Quanto ao backup incremental é interessante, vou pensar no caso e ativar o CHANGE BLOCK TRACKING.
-
Quanto ao Ratio, não é o nosso caso, pois não utilizamos fita
-
Minha Large_pool está com zero, por a SGA_TARGET está com 8 gb, entaum o Oracle definie automaticamente o melhor valor a LARGE_POOL, mas se for o caso posso definir um valor, sem problemas.
-
Quanto ao ASYNC_IO ou SYNC_IO
segue as informações
No nosso ambiente é
SQL> select name, value, description from
v$parameter where name like ‘%disk%io%’;NAME VALUE DESCRIPTION
disk_asynch_io TRUE Use asynch I/O for random access devicesSQL> select name, value, description
from v$parameter where name like ‘%tape%io%’;NAME VALUE DESCRIPTION
tape_asynch_io TRUE Use asynch I/O requests for tape devices
backup_tape_io_slaves FALSE BACKUP Tape I/O slavesRespostas
Seu ASM está utilizando FAILGROUPS?
Olha Rodrigo, tenho os diskgroups dados e flash
O disckgroup dados está em EXTERNALLY mas o flah nãoSeus diskgroups do ASM, foram montados com o mesmos discos, quantidade e tecnologia?
Segundo nosso administrador Unix, ela está numa SAN de 1gb, mas poderia estar em 4Gb, ele disse que o problema pode ser esse tambémQual o seu valor de RBAL da instância +ASM?
Meu ASM power LIMIT está em 1Obrigado
Spaulonci5 de fevereiro de 2009 às 4:49 am #85091CleitonHanzen
ParticipanteOpá…
Bom, já tive um problema bem semelhante à este em Linux, com processadores X86_64. O que acabamos detectando, é que os discos que estavam sendo colocados os backups, por estar sendo utilizado paralelismo e por ter alguns outros processos que faziam I/O. Acabava gerando um Wait I/O fu…do, e por incrível que pareça, tirando o paralelismo diminuiu o processo em mais de 2 horas… 🙂
Em outros testes que fizemos, o paralelismo para FileSystem em um único volume, não teve ganho significativo, mas quando fizemos direto pra fita (Tivoli), aí sim é que tivemos ganhos reais de desempenho.
Eu ia partir para análise destes discos que você está utilizando, não adianta nada o banco está rodando em cima de ASM e discos super rápidos, e os discos de backup serem discos com velocidade inferior, seja tanto pela característica do Disco, tanto pelo tipo de RAID escolhido.
5 de fevereiro de 2009 às 12:17 pm #85093jspaulonci
ParticipanteBom dia moçada…. muito complexo as coisas…né…?
Cheguei agora cedo, pois meu horário é das 06:00 as 15:00, a máquina não encavalou os backups de archive, é claro né….em vez de fazer backup a cada hora , aumentei o intervalo para 6 horas.
Bom, pelo que vi aqui…está indicando que meu problema é a rede SAN que atualmente está com 1 Gb, aí vai valer aquele ditado né…. o que o Database não vê o DBA não sente, acredito que hoje a tarde, eu e o adminstrador de Storage, iremos sentar e definir o aumento dessa rede de 1 para 4 Gb.
Bom….espero que o problema seja isso….vamos aguardar,,,, demorando ou não vou postar o resultado, até agora muito obrigado pela disponibilidade e dedicação de todos que se envolveram, esse forum nos ajuda a melhorar como profissional e melhor ainda,,,,fazer amigos…
Um forte abraço a todos
Spaulonci
5 de fevereiro de 2009 às 7:21 pm #85112Rodrigo Almeida
ParticipanteO Post do Cleiton ajuda bastante tb esclarecer esse problema, muito bom os pontos de vistas. O que foi dito é realmente verdade!!!
Analisar a infra nesse caso seria o ideal, ajustar as HBAs, SAN, verificar os discos que estão sendo utilizados e etc… depois de feito td isso… passa para o banco de dados.
E geralmente o valor para RBAL que usamos nas empresas estão sempre acima de 5, algumas até trabalhamos com 11, mas se o banco é muito grande, deixamos em 5.
Abraços,
Rodrigo Almeida5 de fevereiro de 2009 às 7:35 pm #85115jspaulonci
ParticipanteRodrigo, por favor me esclareça um acoisa…..
O RBAL trabalha a todo instante, ou somente quando adicionamos discos ?
Obrigado
Spaulonci
5 de fevereiro de 2009 às 9:07 pm #85122juliano_sf
ParticipanteOlha,
Qual a versão do seu Oracle? A 10.2.0.3.0 tem um bug onde ele não limpa algumas tabelas no catálogo, o que faz com que essas tabelas cresçam muito, e degrada as operações feitas no RMAN…
Isso já aconteceu comigo, eu atualizei para 10.2.0.4 e resolveu…
Abs,
5 de fevereiro de 2009 às 9:52 pm #85128Rodrigo Almeida
ParticipanteMe corrijam se eu estiver errado…
Mas o RBAL (background process do Oracle) server para realizar a balanceamento quando é incluído novos discos no DG, para montar e abrir os DGs e senão me engano com a historia do ASM saber diferenciar os segmentos (tabelas e índices) ele consegue distribuir os segmentos internamentos em partes iguais nos discos pertecentes ao DG, para melhorar a performance de I/O. Esse último tem que confirmar na net e no documento.
E JULIANO! Show esse AVATAR de ORACLE POWER ENERGY!!! kkkk BOA!!
Abraços,
Rodrigo Almeida
6 de fevereiro de 2009 às 12:15 pm #85140jspaulonci
ParticipanteBom dia Rodrigo, obrigado pelo esclarecimento, aproveitando a oportunidade também quero dizer que tenho usado uma das querys que vc postou no IMASTER para acompanhamento do RMAN, inclusive o Vieri sugeriu usar uma delas
Abraços
Spaulonci
-
AutorPosts
- Você deve fazer login para responder a este tópico.