Skip to content

Etat de sante des groupes

L'etat de sante des groupes sert a distinguer une erreur isolee d'un probleme concentre sur un forfait, un modele, un groupe amont ou un membre d'equipe. Les administrateurs entreprise et equipe peuvent l'utiliser pour repondre rapidement a trois questions :

  • Quel groupe a un taux de succes plus bas sur la periode choisie
  • Quel utilisateur ou token concentre le volume de requetes, le cout ou les erreurs
  • L'erreur est-elle limitee a un token ou touche-t-elle deja tout le groupe

Quand une API echoue, consultez d'abord l'etat de sante des groupes, puis ouvrez le journal d'utilisation de la requete pour retrouver le request_id.

Perimetre des donnees

La page publique status integree ici interroge l'etat de sante des groupes utilises par tous les utilisateurs aicentos sur la periode selectionnee. Elle reflete la disponibilite globale des groupes de la plateforme, avec un suivi en temps reel, impartial et stable.

La vue Journaux d'utilisation -> Etat de sante des groupes dans la console affiche les donnees visibles selon les droits du compte courant. Un utilisateur personnel voit generalement ses propres tokens ; les administrateurs entreprise et equipe peuvent analyser l'utilisation par utilisateur, nom d'utilisateur, token et groupe.

Si la page d'etat ci-dessus ne se charge pas correctement, ouvrez directement l'etat de sante des groupes aicentos.

Entree console : Console -> Journaux d'utilisation. Dans les journaux d'erreur ou les vues statistiques, filtrez par periode, modele, token, groupe, message d'erreur et code de statut.

Exemple console

Voici une capture d'exemple de Journaux d'utilisation -> Etat de sante des groupes. Elle montre le taux de succes, le nombre de requetes, le cout, les donnees de cache, le temps moyen, la derniere requete et les causes d'echec.

Exemple d'etat de sante des groupes dans la console

Principe

Evaluez d'abord l'impact, puis traitez l'erreur unitaire. Un journal unitaire sert a diagnostiquer une requete precise ; l'etat de sante des groupes sert a voir si le probleme est concentre.

Pour expliquer un message d'erreur unitaire, consultez le guide des journaux d'erreur.

Colonnes de la liste

La liste de la console et l'export CSV utilisent les memes colonnes d'affichage. La liste contient deux types de lignes :

  • Ligne groupe : resume l'etat global d'un groupe sur la periode choisie.
  • Ligne token : affiche les details utilisateur et token sous un groupe, pour aider les administrateurs entreprise et equipe a localiser un membre, un projet ou un service.
Colonne afficheeLignes concerneesDescriptionUtilisation
TypeLigne groupe, ligne tokenIndique si la ligne est un resume Groupe ou un detail TokenVoir d'abord les lignes groupe, puis les lignes token pour localiser le membre ou token
GroupeLigne groupe, ligne tokenGroupes vus sur la periode choisie, incluant groupes a l'usage, groupes de forfait, groupe par defaut ou groupe de modeleVoir si le probleme se concentre sur un forfait, un modele ou un pool amont
ID utilisateurLigne tokenID de l'utilisateur qui a utilise le tokenLocaliser le compte membre lors d'un diagnostic entreprise
Nom d'utilisateurLigne tokenNom d'utilisateur qui a utilise le tokenRapports d'equipe, communication avec le membre et controle des droits
TokenLigne tokenNom du token configure dans la consoleVerifier si l'anomalie est limitee a un token
Taux de succesLigne groupe, ligne tokenTaux de succes = requetes reussies / total des requetesA surveiller sous 80 % ; si le taux est nettement plus bas que les lignes voisines, verifier ce groupe ou token en priorite
RequetesLigne groupe, ligne tokenNombre total de requetes sur la periode choisieNe pas sur-interpreter le taux de succes si l'echantillon est faible
SuccesLigne groupe, ligne tokenNombre de requetes reussies ayant retourne 2xxLe lire avec Requetes et Erreurs pour evaluer la disponibilite
ErreursLigne groupe, ligne tokenNombre de requetes en erreur (4xx/5xx)Si le nombre monte, verifier d'abord Cause d'echec et les journaux d'erreur
CoutLigne groupe, ligne tokenConsommation de quota/cout cumulee sur la periode, exportee au format monetaire de la consoleComptabilite d'equipe, repartition par projet et detection de cout anormal
Taux de cacheLigne groupe, ligne tokenTaux de cache = tokens en cache / total des tokensPlus il est haut, plus c'est economique ; les parties en cache sont souvent facturees moins cher ou gratuitement
Tokens en cacheLigne groupe, ligne tokenNombre de tokens ayant touche le cache sur la periodeCette partie est souvent facturee avec une forte reduction ; plus il y en a, plus l'economie est grande
Requetes en cacheLigne groupe, ligne tokenNombre de requetes ayant touche le cache au moins une foisMesurer combien de requetes ont vraiment utilise le cache
Part requetes cacheLigne groupe, ligne tokenPart requetes cache = requetes avec cache / total des requetesPlus elle est haute, plus d'appels beneficient de la remise cache
Tokens cache moyensLigne groupe, ligne tokenNombre moyen de tokens par hit de cacheComparer l'efficacite de reutilisation entre membres, services ou groupes
Temps moyenLigne groupe, ligne tokenTemps moyen par requete, en secondesPlus il est bas, plus l'amont repond vite ; si le temps monte, verifier longs contextes, longues sorties et chaines d'outils
Heure de debutLigne groupe, ligne tokenPremiere apparition de ce groupe ou token dans la periode couranteSituer le debut du probleme ou du trafic
Derniere requeteLigne groupe, ligne tokenApparition la plus recente de ce groupe ou token dans la periode couranteVoir si le probleme ou le trafic continue
Cause d'echecLigne groupePrincipales causes d'echec par frequence, avec code de statut et nombre ; vide ou - sans erreurTraiter d'abord l'erreur la plus frequente, pas seulement la derniere ligne

Source des champs

Les colonnes affichees sont generees a partir de statistiques agregees. Pour l'usage quotidien, prenez la liste console et l'export CSV comme reference ; ne faites le lien avec les noms de champs bruts que pour une integration API ou un diagnostic technique.

Diagnostic d'equipe

Regardez d'abord les lignes groupe pour savoir s'il s'agit d'un probleme de pool de ressources, puis les lignes token pour voir si un utilisateur ou un token en est la cause. Si le taux de succes du groupe est normal mais qu'un token a beaucoup d'erreurs, verifiez d'abord le token, le nom du modele, la configuration cliente ou le corps de requete de ce membre.

Export CSV

L'export CSV reprend les memes colonnes que la liste courante. Il convient aux rapports hebdomadaires, a la repartition des couts, aux revues d'incident et au rapprochement d'usage des membres.

Apres export, vous pouvez previsualiser le fichier avec le visualiseur CSV en ligne. Il prend en charge le glisser-deposer ou la selection d'un fichier CSV, ainsi que le collage de texte CSV, pratique pour verifier rapidement les colonnes et les causes d'echec.

Comportement exportDescription
Ligne groupeType vaut Groupe ; ID utilisateur, nom d'utilisateur et token sont generalement vides, ce qui represente le resume du groupe
Ligne tokenType vaut Token ; ID utilisateur, nom d'utilisateur et token sont affiches, ce qui represente le detail membre ou token sous le groupe
Format monetaireCout utilise le format monetaire de la console, par exemple ¥905.48
Format pourcentageTaux de succes, taux de cache et part requetes cache sont exportes en pourcentage
Format numeriqueLes grands nombres peuvent contenir des separateurs de milliers, utiles pour lecture directe ou import tableur
Format temporelHeure de debut et Derniere requete sont exportees en heure locale pour les aligner avec l'incident
Cause d'echecPlusieurs erreurs frequentes sont fusionnees avec leur nombre d'occurrences ; vide ou - sans erreur

Procedure de diagnostic

1. Evaluer l'impact

Regardez d'abord les lignes ou Type=Groupe. Si le Taux de succes reste proche du niveau habituel et que les Erreurs sont faibles, il s'agit souvent d'une erreur occasionnelle. Copiez le request_id de la requete et poursuivez dans le journal unitaire.

Si le Taux de succes d'un groupe est clairement plus bas que les autres, ou si les Erreurs augmentent fortement, depannez d'abord par groupe : modele, token, compte amont, droits du forfait et ressources de plateforme.

En contexte entreprise ou equipe, regardez ensuite les lignes Type=Token de ce groupe. Si un seul utilisateur ou token est anormal, verifiez d'abord sa configuration cliente, son token, son nom de modele, son corps de requete et sa strategie de concurrence.

2. Lire les principales causes d'echec

Cause d'echec est generalement affichee par nombre d'occurrences. Traitez d'abord les erreurs les plus frequentes, puis les erreurs rares. Les erreurs frequentes representent le type d'incident dominant dans la periode.

Type d'erreurMots-cles frequentsAttribution initialeVerification prioritaire
Limite de frequenceAccount RPM limit exceeded, Max 10/min, Max 5/minProbleme d'utilisation ou limite amontTrop de concurrence ou trop de requetes par minute
Limite journaliereAccount daily limit exceededLimite amontQuota journalier amont epuise
Credentials en refroidissementAll credentials ... are cooling downLimite amontTous les credentials amont du modele sont en refroidissement
Corps trop grandstatus_code=413, openai_errorProbleme d'utilisationContexte, fichier, image ou resultat d'outil trop grand
Droits ou authentification401, 403, Invalid API key, pending admin approvalProbleme d'utilisation ou etat du compteToken, forfait, groupe ou droits modele incorrects
Aucune ressource disponibleNo available accounts, No available channel, auth_unavailableProbleme plateforme ou configurationAucun compte, canal ou credential disponible dans ce groupe
Erreur amont502, all upstreams failed, Upstream request failedProbleme amontService amont ou reseau intermediaire anormal
Delai passerelle504, 521, 522, 524Probleme amont ou de liaisonConnexion, lecture ou reponse amont trop lente
Protection ressources plateformesystem disk overloaded, Service UnavailableProbleme plateformeNoeud plateforme ou ressource amont temporairement indisponible
Format API imagegpt-image-2, prompt is required, multipart formProbleme d'utilisationEndpoint image, prompt ou format d'upload incorrect
Format d'appel outiltool_use, tool_result, Invalid schemaProbleme d'utilisationMessages outil client ou JSON Schema non conformes

3. Traiter selon l'impact

SymptomeCause plus probableAction conseillee
Un seul token echoueConfiguration du token, droits ou format de requete localRecopier le token, verifier la configuration cliente et le corps de requete
Un seul modele echoueDroits modele, canal modele ou ressource modele amontChanger vers un modele equivalent, confirmer que le forfait prend en charge ce modele
Un seul groupe a un faible taux de succesPool du groupe, droits du forfait ou compte amontChanger de groupe/modele, fournir au support le groupe et la periode
Plusieurs groupes montrent 502, 504, 521, 522, 524Probleme amont ou de reseauReessayer plus tard, reduire les longues taches ; contacter le support si cela persiste
Plusieurs requetes montrent 413Corps de requete trop grandReduire le contexte, diviser les fichiers, compresser les images ou reduire les resultats d'outils
Plusieurs requetes montrent 429Frequence trop elevee, quota journalier epuise ou credentials en refroidissementReduire la concurrence ; distinguer RPM, daily limit et cooling down dans les logs

4. Croiser cout et cache

SymptomeCause plus probableAction conseillee
Cout nettement plus haut que les autres tokens du meme groupeGrand contexte, longue sortie, appels frequents ou taches repeteesCroiser Requetes, Temps moyen et journaux d'erreur pour localiser le service ou membre
Taux de cache eleve mais Part requetes cache faiblePeu de grosses requetes touchent le cacheVerifier si seules des taches fixes reutilisent le contexte
Part requetes cache elevee mais Tokens cache moyens faiblesBeaucoup de requetes touchent le cache, mais le gain unitaire est faibleVerifier si le contexte est trop court ou si le contenu cache est instable
Un token a un Temps moyen nettement plus hautTaches client lourdes, long contexte, longue sortie ou amont lentComparer Requetes, cache, Cause d'echec et journaux unitaires de ce token

Informations utiles au support

Pour les problemes simples, consultez d'abord le guide des journaux d'erreur et l'etat de sante des groupes. Si le probleme persiste, ouvrez les details du journal d'erreur dans console/log et cliquez sur l'icone de copie pour copier les details de diagnostic en un clic. Quand vous contactez le support, fournissez ces informations en une fois a l'equipe technique pour limiter les allers-retours :

  • ID utilisateur
  • Periode : debut du probleme et derniere occurrence
  • Groupe : group
  • Modele : modele utilise par la requete
  • Code de statut : par exemple 429, 413, 502, 503
  • Contenu de l'erreur : error_reasons.content
  • ID de requete : request_id dans le journal unitaire ou la reponse API
  • Impact : un seul token, un seul modele, un seul groupe ou plusieurs groupes

Conclusion rapide

401 / 403 concernent surtout les droits, 413 le corps de requete, 429 la frequence et le quota, 502 / 504 / 524 l'amont et les longues taches, 503 les ressources temporairement indisponibles.