Home > OEL und OVM > OVM 3.4.1 - Problem mit hängenden Xen Kommandos

OVM 3.4.1 - Problem mit hängenden Xen Kommandos

 
Unter OVM 3.4.1 kann es zu Problemen mit hängenden Xen Kommandos, z.B.
xm list, xm info etc. kommen. 
 
Dabei bleibt das jeweilige Xen Kommando bei der Kommunikation über den 
Socket /var/run/xend/xmlrpc.sock hängen und ein entsprechender
"strace" auf den hängengebliebenen Prozess liefert folgenden Output:
 
connect(3, {sa_family=AF_LOCAL, sun_path="/var/run/xend/xmlrpc.sock"}, 27)
 
oder
 
recvfrom(3, ...
 
Desweiteren finden sich in der Datei /var/log/ovs-agent.log folgende Einträge:
"Lock file /var/run/ovs-agent/vm-list.lock failed: Timeout Occurred"
 
Als Folge dieses Problems können weder mit OVM Manager noch auf der Kommandozeile
VMs gestartet, beendet oder angezeigt werden, i.e. alle weiteren xm Kommandos 
werden blockiert.
 
Falls VMs mit HA betrieben werden, kann dies relativ rasch auch zu ungewollten Migrationen 
der VMs auf andere OVM Server führen, da die OVS Agents nicht mehr feststellen können, 
ob bzw. auf welchen OVM Server die jeweiligen OVMs gerade laufen.
 
Ein SR bei Oracle bzw. unsere eigene Recherche führten zu folgenden MOS Dokument:
 
OVM 3.4.1 "Lock file /var/run/ovs-agent/vm-list.lock failed: Timeout Occurred" or 
          XEND Hangs Using 10% > CPU or 
          DomU Takes Very Long Time to Release Memory (Doc ID 2181609.1)
 
Der dort angebotene Workaround - die Installation von Xen 4.4.4-999 RPMs mit der "--nodeps" 
Option erscheint uns allerdings als etwas fragwürdig, da damit höchstwahrscheinlich 
die Möglichkeit eines Upgrades der OVM Server auf höhere Versionen zunichte gemacht wird.
 
Unsere Empfehlung wäre ein Upgrade auf OVM 3.4.2 oder höher, was dann auch im SR bestätigt wurde.