Freesco, NND, CDN, EOS
http://forum.freesco.pl/

Wredny błąd: Kernel panic: Aiee, killing interrupt handler!
http://forum.freesco.pl/viewtopic.php?f=22&t=17175
Strona 1 z 1

Autor:  Albercik [ czwartek, 4 września 2008, 22:48 ]
Tytuł:  Wredny błąd: Kernel panic: Aiee, killing interrupt handler!

Mam problem na jednym z serwerów, mianowicie już od bardzo długiego czasu pojawia się błąd jak w temacie, po czym serwer zawiesza się. Na starym sprzęcie instalowałem ACPI i przez spory czas był spokój, niestety po jakimś czasie znów to samo. Stwierdziłem, że jest to wina sprzętu i zmieniłem wszystko, oprócz dysku - przełożyłem do zupełnie nowego sprzętu stary dysk. Jeden procek jest obciążony w szczycie w 25% drugi czasami coś pomięli do 1-2% i dalej się nudzi , więc na pewno nie ma problemu z zasobami. Komunikat błędu sugeruje kłopot z przerwaniami , ale nie sądzę, żeby to miało miejsce, ponieważ wszystko, co jest zbędne nie zabiera zasobów - wyłączone w biosie. Jakieś sugestie?

Screen z błędu (kiepska jakość - robione komórką) :
http://www.compus-net.com/~piotr/blad.jpg

Autor:  Albercik [ piątek, 5 września 2008, 07:19 ]
Tytuł: 

Zwróciłem uwagę , że za każdym razem błąd zaczyna się komunikatem:
"resolveip: Unable to find hostname for '192.168.2.8'"
i faktycznie w hosts brakowało nazwy tego hosta. Trochę dziwne, bo brzmi jak z ArchiwumX i raczej mało prawdopodobne, żeby z tego powodu zawieszał się serwer. Nawiasem mówiąc bezpośrednio przed zawieszeniem logi są czyste.

Autor:  JakubC [ piątek, 5 września 2008, 07:27 ]
Tytuł: 

Pytanie przy jakiej czynności pppoe próbował rozwiązać tę nazwę hosta. Być może to po prostu wyciek pamięci z tejże usługi?

Autor:  Albercik [ piątek, 5 września 2008, 16:09 ]
Tytuł: 

JakubC pisze:
Być może to po prostu wyciek pamięci z tejże usługi?


Możesz rozwinąć kwestię?

Autor:  Maciek [ piątek, 5 września 2008, 17:12 ]
Tytuł: 

Ja to się nie znam, ale taki ładny ekran zdarzył mi się parę razy w życiu.. dwa razy to była walnięta pamięć, a raz przegrzany celeron.

Autor:  -MW- [ piątek, 5 września 2008, 17:51 ]
Tytuł: 

ja tez sie nie znam. zdazylo mi sie taki ekran ogladac pare raz, ale nigdy to nie byl problem sprzetowy :)

tak wiec doswiadczenia mamy odmienne.
to dobrze czy zle?

Autor:  Albercik [ piątek, 5 września 2008, 22:23 ]
Tytuł: 

Maciek pisze:
Ja to się nie znam, ale taki ładny ekran zdarzył mi się parę razy w życiu.. dwa razy to była walnięta pamięć, a raz przegrzany celeron.


Sprzęt odpada - sprawdzony, przetestowany, nowy i już trzeci raz jest podmieniany i błąd regularnie się pojawia.
Zwróciłem też uwagę na to, że komunikat "resolveip: Unable to find hostname for '192.168.2.X'" dotyczy także IP znajdujących się w hosts i pojawia się dość często nie powodując zawieszenia serwera.

Autor:  MAC!EK [ niedziela, 7 września 2008, 00:51 ]
Tytuł: 

Znajdź skrypt i linię w której się wykonuje to konkretne resolveip, potem zobacz co się dzieje tuż za nią i to może być kandydat na sprawcę.

Autor:  Albercik [ niedziela, 14 września 2008, 10:42 ]
Tytuł: 

MAC!EK pisze:
Znajdź skrypt i linię w której się wykonuje to konkretne resolveip, potem zobacz co się dzieje tuż za nią i to może być kandydat na sprawcę.


Następne zawieszenie serwera, tym razem nie poprzedzone zupełnie żadnym komunikatem z błędem czegokolwiek. No ręce opadają....

Różny sprzęt, różne wersje jajka i cały czas podobny błąd.

--EDIT--

Niestety, znów się powtórzyło. Cholery z tym można dostać....

Autor:  Albercik [ sobota, 27 września 2008, 18:34 ]
Tytuł: 

Następny komunikat i ten sam efekt :
Cytuj:
Unable to handle kernel paging request at virtual address (....)
Kernel panic: Aiee, killing interrupt handler! Not syncing


Oczywiście finał to zawieszenie serwera

Nie wiem czy odnoszę dobre wrażenie, ale to chyba kłopot z dyskiem, a dokładniej stronicowaniem. Mylę się?

Autor:  -MW- [ środa, 1 października 2008, 13:02 ]
Tytuł: 

i jak sie skonczyl temat ? czy doszedles co bylo przyczyna komunkatu?

Autor:  Albercik [ środa, 1 października 2008, 13:36 ]
Tytuł: 

-MW- pisze:
i jak sie skonczyl temat ? czy doszedles co bylo przyczyna komunkatu?


Niestety nie.Teraz się nie wiesza, ale jestem w trakcie szykowania nowego dysku dla serwera na SATA. Muszę tylko przenieść dane z starego IDE na nowego SATA.

Autor:  Albercik [ sobota, 11 października 2008, 11:10 ]
Tytuł: 

Dane przeniesione na SATA - kopia całego systemu - według tego co napisałem w wątku : http://forum.freesco.pl/viewtopic.php?t=16583&start=60 i nadal to samo. Pora na postawienie świeżego systemu. Masakra z tym błędem....

--EDIT--

System nowy postawiony, przegrane tylko programy kompilowane ręcznie i całość konfiguracji. Jeszcze bez zwiechy, być może jednak diabeł tkwił w systemie.

--EDIT2--

System zdechł z podobnym komunikatem. Siedzieć i płakać.

Autor:  Albercik [ niedziela, 19 października 2008, 23:00 ]
Tytuł: 

W związku z tym, że spotkałem się z wieloma takimi samymi błędami na różnych forach i listach zauważyłem, że wiele distro linuksów ma zaimplementowany ciekawy mechanizm radzący sobie z takimi komunikatami, mianowicie następuje automatyczny reboot po pojawieniu się takiego komunikatu. Czy jest możliwe, aby takowy mechanizm stworzyć w NND?

Autor:  JakubC [ niedziela, 19 października 2008, 23:21 ]
Tytuł: 

Taki watchdog... nie wiedziałem, że kernel ma taką opcję (co więcej, nadal wydaje mi się, że to musi być połączone z czymś hardwareowym). To jednak czyste rzeźbienie czy też innymi słowy kompletny półśrodek. Jak mamy katar staramy się go pozbyć, a nie zatykamy dziurki od nosa;-)

Autor:  Albercik [ poniedziałek, 20 października 2008, 07:30 ]
Tytuł: 

JakubC pisze:
To jednak czyste rzeźbienie czy też innymi słowy kompletny półśrodek. Jak mamy katar staramy się go pozbyć, a nie zatykamy dziurki od nosa;-)


Ale najpierw używamy kropel do nosa i chusteczki, dopóki nie wyleczymy całkowicie :wink: .

Autor:  Osfald [ wtorek, 28 października 2008, 15:27 ]
Tytuł: 

ten sam problem wystepowal u mnie.... poczatkowo system wskazywal MRTG CLAMAV jako winnego.... po zatrzymaniu obu aplikacji system pracuje stabilnie....

zwiechy pojawialy sie kiedy np MRTG wykorzystywal w 100% procesor
ponadto MRTG zaczal mi nagle produkowac szpilki na wykresach predkosci przesylu danych o wartosciach kilku Mbit/s dokladnie o polnocy... czy ktos mial podobne problemy?

najgorsze jest to, ze nie moge powiazac tych klopotow z zadnym faktem, ktory moglby byc ich przyczyna.... poprostu pojawily sie od tak po 2 latach pracy serwera...

Autor:  frog [ piątek, 5 grudnia 2008, 20:17 ]
Tytuł: 

uzywasz layer7 ?? u mnie to powodowalo takie zwiechy

Autor:  -MW- [ piątek, 5 grudnia 2008, 21:33 ]
Tytuł: 

Cytuj:
ponadto MRTG zaczal mi nagle produkowac szpilki na wykresach predkosci przesylu danych o wartosciach kilku Mbit/s


tak potwierdzam zawieszanie kompa szlo w parze
ze wspomnianymi bledami mrtg.
zmienilem plyte glowna i procesor na dwurdzeniowy,
poniewaz mrtg nie umie wykorzystac tego procesora zajmuje jedynie
jeden rdzen a drugi obsluguje inne procesy i mam wreszcie spokoj.

Strona 1 z 1 Strefa czasowa UTC+2godz.
Powered by phpBB® Forum Software © phpBB Group
https://www.phpbb.com/