Skip to content

Status de saude dos grupos

O status de saude dos grupos ajuda a saber se uma falha de chamada e um problema isolado de requisicao ou um problema concentrado em um plano, modelo, grupo upstream ou membro da equipe. Administradores de empresa e equipe podem usa-lo para responder rapidamente a tres perguntas:

  • Qual grupo teve queda na taxa de sucesso no periodo selecionado
  • Qual usuario ou token concentrou mais requisicoes, consumo ou erros
  • Se o erro esta concentrado em um unico Token ou ja afeta todo o grupo

Ao diagnosticar falhas de API, veja primeiro o status do grupo e depois use os logs de uso para localizar o request_id especifico.

Escopo dos dados

A pagina publica status incorporada aqui consulta o status de saude dos grupos usados por todos os usuarios aicentos durante o periodo selecionado. Ela reflete a disponibilidade global dos grupos da plataforma e e em tempo real, imparcial e estavel.

A visao Logs de uso -> Status de saude dos grupos dentro do console mostra os dados visiveis conforme as permissoes da conta atual. Usuarios pessoais normalmente veem apenas seus proprios tokens; administradores de empresa e equipe podem analisar uso por usuario, nome de usuario, token e grupo.

Se a pagina de status acima nao carregar, abra diretamente o status de saude dos grupos aicentos.

Entrada no console: Console -> Logs de uso. Em logs de erro ou na visao estatistica, filtre por periodo, modelo, Token, grupo, mensagem de erro e codigo de status.

Exemplo no console

A imagem abaixo e um exemplo de Logs de uso -> Status de saude dos grupos no console. Ela mostra taxa de sucesso, numero de requisicoes, consumo, cache, tempo medio, requisicao mais recente e motivos de falha.

Exemplo de status de saude dos grupos no console

Principio de uso

Primeiro determine o alcance do impacto, depois trate o erro individual. Logs individuais servem para localizar a requisicao; status de grupo serve para saber se o problema esta concentrado.

Para interpretar uma mensagem de erro individual, veja Explicacao dos logs de erro.

Colunas da lista

A lista do console e a exportacao CSV usam as mesmas colunas exibidas. A lista contem dois tipos de linha:

  • Linha de grupo: resume a saude geral de um grupo no periodo selecionado.
  • Linha de token: mostra detalhes de usuario e token dentro de um grupo, ajudando administradores de empresa e equipe a localizar membros, projetos ou servicos.
Coluna exibidaAplica-se aDescricaoComo usar
TipoLinha de grupo, linha de tokenIndica se a linha e resumo Grupo ou detalhe TokenVeja primeiro as linhas de grupo, depois as linhas de token para localizar membro ou Token
GrupoLinha de grupo, linha de tokenGrupos que apareceram no periodo selecionado, incluindo grupos por uso, grupos de plano, grupo padrao ou grupo de modeloSaber se o problema esta concentrado em um plano, modelo ou pool upstream
ID do usuarioLinha de tokenID do usuario que usou o tokenLocalizar a conta do membro em diagnosticos empresariais
Nome de usuarioLinha de tokenNome do usuario que usou o tokenRelatorios de equipe, contato com membro e verificacao de permissoes
TokenLinha de tokenNome do Token configurado no consoleSaber se a anomalia esta isolada a um Token
Taxa de sucessoLinha de grupo, linha de tokenTaxa de sucesso = requisicoes bem-sucedidas / total de requisicoesAbaixo de 80% merece atencao; se estiver claramente menor que linhas semelhantes, investigue primeiro esse grupo ou token
RequisicoesLinha de grupo, linha de tokenTotal de requisicoes no periodo selecionadoEvite interpretar demais a taxa de sucesso quando a amostra for pequena
SucessoLinha de grupo, linha de tokenRequisicoes bem-sucedidas que retornaram 2xxLeia junto com Requisicoes e Erros para avaliar disponibilidade
ErrosLinha de grupo, linha de tokenRequisicoes com erro (4xx/5xx)Se subir, veja primeiro Motivo da falha e logs de erro
ConsumoLinha de grupo, linha de tokenConsumo acumulado de cota/custo no periodo, exportado no formato monetario do consoleContabilidade da equipe, rateio por projeto e deteccao de consumo anormal
Taxa de cacheLinha de grupo, linha de tokenTaxa de cache = tokens com hit de cache / total de tokensQuanto mais alta, mais economia; a parte em cache costuma ser cobrada mais barato ou de graca
Tokens em cacheLinha de grupo, linha de tokenNumero de tokens que atingiram cache no periodoEssa parte costuma ser cobrada com alto desconto; quanto mais, maior a economia
Requisicoes em cacheLinha de grupo, linha de tokenNumero de requisicoes que atingiram cache pelo menos uma vezMede quantas requisicoes realmente usaram cache
Proporcao de requisicoes em cacheLinha de grupo, linha de tokenProporcao de requisicoes em cache = requisicoes com cache / requisicoes totaisQuanto mais alta, mais chamadas recebem desconto de cache
Media de tokens em cacheLinha de grupo, linha de tokenMedia de tokens por hit de cacheComparar eficiencia de reutilizacao entre membros, servicos ou grupos
Tempo medioLinha de grupo, linha de tokenTempo medio por requisicao, em segundosQuanto menor, mais rapido o upstream responde; se subir, investigar contexto longo, saida longa e ferramentas
Hora de inicioLinha de grupo, linha de tokenPrimeira aparicao desse grupo ou token no periodo atualLocalizar inicio do problema ou do trafego
Ultima requisicaoLinha de grupo, linha de tokenAparicao mais recente desse grupo ou token no periodo atualSaber se o problema ou trafego continua
Motivo da falhaLinha de grupoPrincipais motivos de falha por frequencia, com codigo de status e contagem; vazio ou - quando nao ha errosPriorizar o erro com mais ocorrencias, nao apenas o ultimo log

Fonte dos campos

As colunas exibidas sao geradas a partir de estatisticas agregadas. Para uso diario, siga a lista do console e as colunas do CSV; faca o mapeamento para campos brutos apenas em integracoes de API ou diagnostico tecnico.

Diagnostico de equipe

Veja primeiro as linhas de grupo para decidir se e problema do pool de recursos, depois as linhas de token para saber se um usuario ou token causou o problema. Se a taxa de sucesso do grupo estiver normal mas um token tiver muitos erros, verifique primeiro o Token, nome do modelo, configuracao do cliente ou corpo da requisicao desse membro.

Exportacao CSV

A exportacao CSV usa as mesmas colunas da lista atual. Ela e adequada para relatorios semanais, rateio de custos, revisoes de incidentes e conciliacao de uso por membro.

Depois de exportar, voce pode previsualizar o arquivo com o visualizador CSV online. Ele permite arrastar ou selecionar um arquivo CSV, e tambem colar texto CSV, util para verificar rapidamente colunas e motivos de falha.

Comportamento da exportacaoDescricao
Linha de grupoTipo e Grupo; ID do usuario, nome de usuario e Token normalmente ficam vazios, representando o resumo do grupo
Linha de tokenTipo e Token; mostra ID do usuario, nome de usuario e Token, representando detalhe de membro ou Token dentro do grupo
Formato monetarioConsumo usa o formato monetario do console, por exemplo ¥905.48
Formato percentualTaxa de sucesso, taxa de cache e proporcao de requisicoes em cache saem como percentuais
Formato numericoNumeros grandes podem incluir separadores de milhares, uteis para leitura direta ou importacao em planilhas
Formato de tempoHora de inicio e Ultima requisicao saem como horario local para alinhar com o incidente
Motivo da falhaVarios erros frequentes sao combinados com contagem no final; vazio ou - quando nao ha erros

Fluxo de diagnostico

1. Determine o alcance do impacto

Veja primeiro as linhas em que Tipo=Grupo. Se a Taxa de sucesso esta perto do normal e Erros e baixo, geralmente e uma falha ocasional; copie o request_id da requisicao individual para continuar.

Se a Taxa de sucesso de um grupo esta claramente abaixo dos outros, ou Erros esta concentrado, investigue primeiro modelo, Token, conta upstream, permissao do plano e recursos da plataforma por grupo.

Em cenarios de empresa ou equipe, veja depois as linhas Tipo=Token dentro desse grupo. Se apenas um usuario ou token estiver anormal, verifique primeiro configuracao do cliente, Token, nome do modelo, corpo da requisicao e estrategia de concorrencia desse membro.

2. Veja os principais motivos de falha

Motivo da falha normalmente aparece ordenado por ocorrencias. Trate primeiro o erro mais frequente e depois os de baixa frequencia. Erros frequentes representam o principal tipo de falha no periodo atual.

Tipo de erroPalavras-chave comunsAtribuicao inicialJulgamento prioritario
Limite de frequenciaAccount RPM limit exceeded, Max 10/min, Max 5/minProblema de uso ou limite upstreamConcorrencia ou requisicoes por minuto altas demais
Limite diarioAccount daily limit exceededLimite upstreamCota diaria da conta upstream esgotada
Credenciais em cooldownAll credentials ... are cooling downLimite upstreamCredenciais upstream do modelo estao em cooldown
Corpo grande demaisstatus_code=413, openai_errorProblema de usoContexto, arquivo, imagem ou resultado de ferramenta grande demais
Permissao ou autenticacao401, 403, Invalid API key, pending admin approvalProblema de uso ou estado da contaToken, plano, grupo ou permissao do modelo anormal
Sem recurso disponivelNo available accounts, No available channel, auth_unavailableProblema da plataforma ou configuracaoGrupo atual sem conta, canal ou recurso de auth disponivel
Erro upstream502, all upstreams failed, Upstream request failedProblema upstreamServico upstream ou rede intermediaria anormal
Timeout de gateway504, 521, 522, 524Problema upstream ou de redeConexao, leitura ou resposta upstream excedeu timeout
Protecao de recurso da plataformasystem disk overloaded, Service UnavailableProblema da plataformaNo da plataforma ou recurso upstream temporariamente indisponivel
Formato de API de imagemgpt-image-2, prompt is required, multipart formProblema de usoEndpoint de imagem, prompt ou formato de upload errado
Formato de tool calltool_use, tool_result, Invalid schemaProblema de usoMensagens de ferramenta ou JSON Schema do cliente invalidos

3. Trate pelo alcance do impacto

SintomaCausa mais provavelAcao sugerida
Apenas um Token falhaConfiguracao do Token, permissao ou formato local da requisicaoCopiar o Token novamente, verificar configuracao do cliente e corpo da requisicao
Apenas um modelo falhaPermissao do modelo, canal do modelo ou recurso upstream do modeloTrocar para modelo similar e confirmar se o plano atual suporta esse modelo
Apenas um grupo tem taxa baixaPool do grupo, permissao do plano ou conta upstreamTrocar grupo/modelo; ao contatar suporte, informar grupo e periodo
Varios grupos mostram 502, 504, 521, 522, 524Upstream ou rede intermediaria anormalTentar mais tarde e reduzir tarefas longas; se persistir, contatar suporte
Varias requisicoes mostram 413Corpo grande demaisReduzir contexto, dividir arquivos, comprimir imagens ou reduzir resultados de ferramentas
Varias requisicoes mostram 429Frequencia alta demais, cota diaria esgotada ou credenciais em cooldownReduzir concorrencia; diferenciar RPM, daily limit e cooling down pelo log

4. Combine consumo e cache

SintomaCausa mais provavelAcao sugerida
Consumo claramente maior que outros tokens do mesmo grupoContexto grande, saida longa, chamadas frequentes ou tarefas repetidasCombinar Requisicoes, Tempo medio e logs de erro para localizar servico ou membro
Taxa de cache alta mas Proporcao de requisicoes em cache baixaPoucas requisicoes grandes atingem cacheVerificar se apenas tarefas fixas reutilizam contexto
Proporcao de requisicoes em cache alta mas Media de tokens em cache baixaMuitas requisicoes atingem cache, mas cada uma economiza poucoVerificar se o contexto e curto demais ou se o conteudo cache e instavel
Um token tem Tempo medio claramente altoTarefas pesadas no cliente, contexto longo, saida longa ou upstream lentoComparar Requisicoes, cache, Motivo da falha e logs individuais desse token

Informacoes para suporte

Para problemas simples, veja primeiro Explicacao dos logs de erro e Status de saude dos grupos. Se o problema continuar, abra os detalhes do log de erro em console/log e clique no icone de copiar para copiar os detalhes de diagnostico em um clique. Ao contatar suporte, envie as informacoes abaixo de uma vez para a equipe tecnica investigar com menos ida e volta:

  • ID do usuario
  • Periodo: quando o problema comecou e ultimo horario em que apareceu
  • Nome do grupo: group
  • Nome do modelo usado pela requisicao
  • Codigo de status, como 429, 413, 502, 503
  • Conteudo do erro: error_reasons.content
  • Request ID: request_id do log individual ou da resposta da API
  • Alcance: um Token, um modelo, um grupo ou varios grupos ao mesmo tempo

Conclusao rapida

401 / 403 normalmente pede verificacao de permissao, 413 pede corpo menor, 429 pede frequencia e cota, 502 / 504 / 524 pede upstream e tarefas longas, 503 pede verificar recurso temporariamente indisponivel.