Introduzione
Questo documento descrive ACI Fault F3696: coop-ep-dampening e passaggi di correzione.
Premesse
Questo errore specifico viene attivato quando gli EP entrano in uno stato di blocco a causa della funzione di attenuazione dell'endpoint COOP. Gli EP vengono messi in uno stato di blocco quando hanno un comportamento di movimento coerente, causando più aggiornamenti a COOP in un breve intervallo di tempo.
COOP EP Dampening è un meccanismo di protezione del processo COOP che aiuta anche a identificare il motivo per cui EP(s).
L'attenuazione dell'impatto dell'EP COOP è introdotta e abilitata per impostazione predefinita in Cisco Application Policy Infrastructure Controller (APIC) versione 4.2(3).
code : F3696
descr : 1 EPs are in freeze state.
cause : coop-ep-dampening
Nota: la natura dell'errore e i timer di masterizzazione associati potrebbero causare l'attivazione dell'errore, quindi essere cancellati da soli.
Intersight Connected ACI Fabric
Questo guasto viene monitorato attivamente come parte degli accordi ACI proattivi.
Se si dispone di un'infrastruttura ACI connessa a Intersight, è stata generata una richiesta di assistenza per conto dell'utente per indicare che sono state trovate istanze di questo errore nell'infrastruttura ACI connessa a Intersight.
Attenuazione dell'endpoint COOP
Il protocollo COOP (Council of Oracle Protocol) viene utilizzato per comunicare le informazioni di mapping degli endpoint (EP) (posizione e identità) al proxy dorso. Gli switch foglia inoltrano le informazioni sull'indirizzo dell'endpoint agli switch della spine tramite COOP, il che assicura che tutti i nodi della spine mantengano una copia coerente delle informazioni sull'indirizzo e sulla posizione dell'endpoint.
Lo spostamento coerente dell'EP, ad esempio tra interfacce o dispositivi, provoca aggiornamenti costanti degli endpoint verso gli spine per garantire l'accuratezza del database COOP. Un volume elevato di aggiornamenti dovuto allo spostamento continuo dell'endpoint può causare un sovrautilizzo delle risorse COOP, impedendo l'elaborazione di aggiornamenti validi dell'endpoint.
Rogue Endpoint Detection, una funzione dello switch foglia, impedisce agli aggiornamenti EP aggressivi di raggiungere lo switch dorso, purché i movimenti abbiano l'ambito di una singola foglia. Ci sono altri scenari di movimento EP, come il movimento EP a foglie incrociate, che richiede un meccanismo di protezione diverso per proteggere COOP. A questo punto entra in gioco l'attenuazione degli endpoint COOP.
Per ridurre la pressione sul COOP nelle situazioni di movimento EP, gli interruttori a colonna vertebrale richiedono a tutti gli interruttori a foglia di ignorare gli aggiornamenti dagli endpoint contrassegnati per un periodo di tempo specificato. In questo caso, lo stato di smorzamento di uno di questi endpoint è 'Freeze' e viene generato un errore F3696.
Ulteriori dettagli sui valori di penale e sulle soglie sono menzionati nel collegamento alla guida di configurazione, ad esempio 4.2.
https://www.cisco.com/c/en/us/td/docs/switches/datacenter/aci/apic/sw/4-x/basic-configuration/Cisco-APIC-Basic-Configuration-Guide-42x/Cisco-APIC-Basic-Configuration-Guide-42x_chapter_0101.html#Cisco_Task.dita_b4647f36-3e4f-43bc-bea3-7572badebc01
Fare riferimento alla guida alla configurazione specifica della versione per le ultime informazioni su questa funzione.
Nota: le altre funzionalità aggressive di Protezione aggiornamento EP, ad esempio Controllo EP non autorizzato e Protezione loop EP, devono essere abilitate in modo esplicito. Per ulteriori informazioni su queste funzioni, consultare il white paper ACI Fabric Endpoint Learning
https://www.cisco.com/c/en/us/solutions/collateral/data-center-virtualization/application-centric-infrastructure/white-paper-c11-739989.html
Possibili cause dei blocchi del PE
I due scenari tipici che possono causare questo comportamento sul campo sono:
- Server con due connessioni foglia separate che utilizzano Active-Active, anziché una configurazione a collegamento logico singolo (vPC)
- Un loop nei dispositivi di rete a valle
Avvio rapido per risolvere gli errori
- Identificare gli endpoint impostati sullo stato 'congelato'
- (Facoltativo) Se l'impatto del piano dati viene rilevato, cancellare il blocco del PE per una risoluzione dell'impatto temporanea
- Identificare e comprendere il motivo per cui gli EP sono stati spostati e se ciò è previsto e richiesto nella progettazione della rete.
- Se non necessario, intervenire per risolvere la condizione che ha causato il movimento EP
- Se il movimento in questione è richiesto e necessario per la progettazione della rete, si consiglia di disabilitare lo smorzamento COOP EP.
Nota: lo smorzamento COOP EP è un meccanismo di protezione per il processo COOP. In generale, è preferibile adottare misure che limitino, ove possibile, gli spostamenti inutili del Parlamento europeo.
Passi dettagliati per la risoluzione degli errori
Identificare gli endpoint 'bloccati'
Usare questa procedura CLI dello switch per visualizzare tutti gli endpoint attenuati in una direttrice o in un nodo foglia.
- Accedere alla CLI dello switch dorso o foglia e immettere il comando:
- switch# show coop internal info repo ep smorzamento
(Facoltativo) Cancella endpoint 'bloccati'
Tramite GUI
Se eseguito tramite la GUI, tutti gli EP bloccati sul nodo selezionato verranno cancellati. Questa operazione deve essere eseguita su tutti gli interruttori a dorso e sullo switch foglia di origine dell'endpoint bloccato.
- Sulla barra dei menu, fare clic su Fabric > Inventory (Fabric > Inventario).
- Nel riquadro di spostamento espandere il pod e il nodo dorso o foglia.
- Fare clic con il pulsante destro del mouse sul nodo e scegliere Cancella endpoint attenuati.
- Fare clic su Sì per confermare l'azione.
Nota: se gli EP in questione si trovano ancora nella tabella degli endpoint sullo switch foglia, l'endpoint viene pubblicato nel database COOP dello switch dorso. In caso contrario, l'endpoint smorzato viene eliminato dal database COOP dello switch a dorso dopo due minuti.
Tramite la CLI dello switch
Se eseguita tramite la CLI di uno switch, questa procedura cancella un solo endpoint alla volta. Questa operazione deve essere eseguita su tutti gli switch dorsali e sullo switch foglia di origine dell'endpoint.
- Accedere alla CLI dello switch dorso o foglia e immettere il comando
- switch# clear coop internal info repo ep smorzamento chiave <bd_vnid> <mac>
Nota: se gli EP in questione si trovano ancora nella tabella degli endpoint sullo switch foglia, l'endpoint viene pubblicato nel database COOP dello switch dorso. In caso contrario, l'endpoint smorzato viene eliminato dal database COOP dello switch a dorso dopo due minuti.
Disattiva smorzamento EP COOP
In generale, questa operazione non è consigliata. Tuttavia, se il progetto di rete richiede il movimento EP in questione, l'attenuazione COOP EP può essere disattivata.
Un POST HTTP in /api/policymgr/mo/.xml con disableEpDampening="true" disabiliterà l'attenuazione dell'impatto di EP COOP.
L'attenuazione dell'EP COOP può essere riattivata con la stessa richiesta, ma impostando disableEpDampening="false".
POST api/policymgr/mo/.xml
PAYLOAD:
disableEpDampening="true">
Tramite CLI APIC
Dalla CLI di APIC, il comando url può facilitare il POST HTTP richiesto.
Disattiva smorzamento EP COOP:
apic# icurl -X POST -d '
true">
' http://localhost:7777/api/policymgr/mo/.xml
Convalida se lo smorzamento EP COOP è stato disabilitato:
apic# moquery -c infraSetPol
Total Objects shown: 1
# infra.SetPol
disableEpDampening : yes
dn : uni/infra/settings
Ulteriori dettagli
Attenuazione COOP EP - Personalizzazione del fattore di attenuazione
Nella release 5.2.4d e successive, è possibile modificare il parametro 'dampFactor' per aumentare i valori specifici associati alla funzione di smorzamento COOP EP.
La modifica del fattore di attenuazione può essere presa in considerazione per scenari in cui è previsto un certo livello di movimento EP al di fuori delle soglie predefinite e non si desidera disattivare lo smorzamento EP COOP.
Ci sono 3 valori di soglia relativi alla sanzione dell'umidità che funzionano in tandem. Tutti e tre questi valori vengono modificati quando si modifica il fattore di attenuazione.
Nome soglia |
Descrizione |
Valore predefinito |
inumiditaRiutilizzaSpessore |
Riutilizza valore di soglia quando EP torna allo stato normale da uno stato di blocco |
2500 |
bagnomariaSatThresh |
Soglia di saturazione umida. Quando un EP supera questo valore di penalità, viene impostato in uno stato di blocco |
10000 |
bagnomaria |
Soglia dello stato critico. Se il PE rimane al di sopra di esso per 10 minuti, viene messo in uno stato di "congelamento" |
4000 |
Il valore di default di DampFactor è 1. Il fattore di attenuazione può essere modificato in valori compresi tra 1 e 5.
Modifica fattore di attenuazione EP COOP
Per modificare il fattore di umidità a 4 volte il valore, è possibile utilizzare il palo sottostante su APIC-
apic# icurl -X POST -d '
dampFactor=4>
' http://localhost:7777/api/policymgr/mo/.xml
Le soglie modificate possono essere convalidate, per direttrice e per repo, verificando la classe coopRepP:
apic# moquery -c coopRepP
# coop.RepP
...
dampReuseThresh : 10000
dampSatThresh : 40000
dampThresh : 16000