|
|
von Jens, am 14th Oktober, 2011 We see that problem on Solaris 10u9. (varies in some sections)
fctl: [ID 517869 kern.warning] WARNING: fp(0)::6ad4c0 NS failure pkt state=d reason=9, expln=1, NSCMD=0100, NSRSP=8001
Problem is seen in “dmesg” or /var/adm/messages after a “luxadm -e port”. In june oracle tell us “Works as designed”. Cant decalre it deeper, but the reason are some fc ports that are online in our SAN but not zoned. If we work as example on a M9000 domain with 6 HBAs (12 ports), 8 of them are used and 4 are free for whatever. Nobody put that 4 ports into a dummy zone. Now, if you do “luxadm -e port” by hand or with the “explorer” (SUN-Explorer does that automaticly) you get that failure in your messages. Today we found a solution -> Patch 145957-06 solved that issue. Oracle said “To resolve/filter out….”. Unfortunately you have to reboot that server, guess thats the biggest problem.
von Jens, am 28th Februar, 2011 If you run FOS and you run into “Failed to import public key.” (like me), pls check your ssh seeting from the host you try to import. There is no failure seen and i cant find a debug-switch or anything. We try to import from a solaris host, and it fails ever and ever. You have to touch your /etc/ssh/ssh_config. Try to connect from an other samplehost to your hosts from where you want to import keys to the switch. Maybe a problem of many ? It is not so helpfull if you see no failure message or anything.
von Jens, am 19th Februar, 2011 Wenn man schon dabei ist kann man auch gleich Fehler fixen. Dumm nur bei hunderten von Ports . Schaut man sich per DCFM oder portshow einen 8gbit Port an sieht man die “Fehler” nicht. Hat man aber mal SAN Probleme guckt man bekannterweise genauer hin . “portstatsshow X/Y” zeigt einem urplötzlich einen steigende Anzahl an Fehler im Feld “er_bad_os“. Nach etwas Panik was denn nun schon wieder kaputt ist stellte sich das ganze einigermaßen gemäßigt dar und trifft nur die 8GB Ports. Diese Funktion bzw die Änderung kamen offenbar mit FOS 6.2. Kurz gesagt muss man den Modus der “fillwords” ändern. Im Gegensatz zu Melihs-Blog funktioniert bei ein paar Testports bei uns nur Mode3 (den es offenbar im FOS 6.2 noch nicht gab). EMC, HP, IBM und auch SUN/Oracle empfehlen dabei auch Mode 3.
3 | -aa-then-ia Attempts hardware arbff-arbff (mode 1) first. If the attempt fails to go into activestate, this command executes software idle-arb (mode 2).
- Mode 3 is the preferable to modes 1 and 2 as it captures more cases.
Im Forum von Brocade ist dazu auch noch eine seitenlange Diskussion zu finden. Eine Änderung des Modus setzt den Port kurzzeitig offline, er geht automatisch wieder online.
If you run on Fabric OS >6.2 and you get some failures at “portstatsshow X/Y” try to change the mode of “portcfgfillword”. Problem is seen on connections to 8gbit hbas. That command are build in since FOS 6.2. In 6.2 you have only 2 modes (0 and 1), in 6.4 you get 4 modes (0/1/2/3). In some Readmes they prefer “Mode 3″. Guess you can try the modes. If you set it with “portcfgfillword x y” your port goes offline and online.
von Jens, am 10th September, 2010 Man lernt halt nicht aus. Folgende kleine Sache ist mir gestern vor die Hufe gekommen, erlebt hatte ich das so noch nie. En Reboot war nicht vorgesehen.
Ein Solaris 10 Host hat einen seiner SAN Pfade verloren. Per cfgadm -alo show_FCP_dev sah man einen Pfad als unusable. Soweit so schlecht. Die Ursache war ein Portproblem an einem Switch, also nichts was einem Bauchschmerzen machen sollte wenn alles wieder OK ist. Dennoch wollte der Hosts seinen SAN Pfad nicht wieder erkennen. fcinfo hba-port zeigte den Port als offline an. Dem gegenüber stand der Switch der den Port nicht nur erkannte und online zeigte, sondern zudem auch noch die WWN des HBA erkannte (ausgelesen per DCFM). Also, Porttausch am Switch. Nichts, der Hosts zuckt nichtmal. Keine Messages, keine Hinweise auf einen gezogenen oder gesteckten Port. fcinfo hba-port erzählte weiterhin das alles offline wäre, der Switch sagte das alles Online ist. Na Super. Next Step, ab zum Hosts und mal nachsehen. Single-Port Qlogic, alles fein – grün und gut. Da der Pfad eh tot war einmal abgezogen und auf einen anderen HBA gesteckt. Auch hier: Null Reaktion des Hostes. Der Switch erkannte die WWNs des HBAs, der Hosts zuckte nicht und de HBA hatte die grüne LED an. Alle Versuche per luxadm (forcelip) und Co schlugen fehl, fcinfo und dump_map und Co blieben still. Aufgrund dieses Verhaltens hab ich nicht erwartet das ein Reboot das Problem löst, tja…so kann man sich verschätzen.
von Jens, am 8th Juni, 2010 Wie kann man nur so viel Glück haben von 8 FC Ports genau die zwei zu erwischen die:
- eine defekte Kupplung haben und sich nicht melden. Man sieht erst spät das er nur auf 4 statt 8Gig läuft und den Bus dicht macht. cfgadm lief Amok.
- einen falschen und doppelten Portnamen haben und DCFM das nicht anzeigt
Bitte, einmal so viel Glück im Lotto.
|
|