Freesco, NND, CDN, EOS
http://forum.freesco.pl/

Zawieszanie serwera
http://forum.freesco.pl/viewtopic.php?f=22&t=7535
Strona 1 z 1

Autor:  Albercik [ czwartek, 28 kwietnia 2005, 09:30 ]
Tytuł:  Zawieszanie serwera

Od czasu kiedy zmieniłem sprzęt na serwerze dzieją się dziwne rzeczy : serwer się wiesza a z klawiatury robi się "kolorofon" - miga regularnie. Pomaga tylko twardy reset . W logach nic nie ma . Wiem ,że wnioski nasuwają się same , ale napiszę Wam coś innego : bez względu na to co to za sprzęt - pod warunkiem ,że jest bardzo szybki i wydajny to NND na każdym z testowanych przeze mnie sprzętów ( athlony , P4 , celerony ) po prostu wiesza się i to zawsze w taki sam sposób. Ostatnio miałem zainstalowane NND na szybkim dysku 40GB/7200 i kilka dni temu dysk diabli wzięli - sprzętowo nie ma żadnych wad , programowo natomiast jest nie do naprawy . NND uruchamiało się do momentu "sprawdzam partcję czy nie jest tylko do odczytu..." ( czy jakoś tak :) ) , właczało się fsck i za każdym razem ten sam komunikat : nie można naprawić . Pokazuje się konsola logowania - można się zalogować ale każde ręczne naprawienie kończy się komunikatem , że błąd systemu jest nie do naprawy . Odpalenie fsck z dowolnymi parametrami nie pomaga. Pomogło dopiero usunięcie partycji . Oczywiście program do wykrywania sprzętowych badów nie wykazał nic. Ten dysk teraz ma WinXP zainstalowane i działa stabilnie. Podejrzewam ,że jest to efekt błędnego zapisu na dysk , ale dla czego ? Czy trzeba by dorzucić jakieś sterowniki do kontrolerów dysku ? Jestem na 90% przekonany , że prolem rozbija się o zapis na dysk. Ma ktoś jakieś sugestie ?

Autor:  adi [ czwartek, 28 kwietnia 2005, 10:14 ]
Tytuł: 

A jaką masz konfigurację, tzn - płyta przede wszystkim, czy w NND doinstalowujesz coś dodakowego, jakieś parametry dot. dysku np. ?? Zastanów się czy masz jakiś sprzęt, który zawsze jest taki sam. Może np masz tą samą obudowę - i masz problem ze stabilizacją zasilania.

Autor:  Albercik [ czwartek, 28 kwietnia 2005, 19:28 ]
Tytuł: 

adi pisze:
A jaką masz konfigurację, tzn - płyta przede wszystkim, czy w NND doinstalowujesz coś dodakowego, jakieś parametry dot. dysku np. ?? Zastanów się czy masz jakiś sprzęt, który zawsze jest taki sam. Może np masz tą samą obudowę - i masz problem ze stabilizacją zasilania.


Dokładnie wszystko ulega zmianie - każdy podzespół. NND instaluję standardowo - bez żadnych dodatków . W tej chwili mam proca P4 2Ghz , 256MB RAM DDR , płyta główna Na INTELu (Prescott) , dysk wymieniony ( nowa 40tka pokazywała błędy programowe :roll: nie do naprawienia ) teraz jest 4,3GB starej generacji i sprawuje się lepiej niż ta nowa 40tka - to mnie właśnie zadziwiło . Pracuję ze sprzętem już długo - od kilku lat nawet mam sklep komputerowy z serwisem - ale jest to dla mnie rebus. Sprzętowo nie ma żadnych konfliktów.

Autor:  Mis' [ czwartek, 28 kwietnia 2005, 19:57 ]
Tytuł: 

Albercik pisze:
Dokładnie wszystko ulega zmianie - każdy podzespół. NND instaluję standardowo - bez żadnych dodatków .


czy problem występuje bezpośrednio po instalacji, czy jakiś czas wszystko działa? Pokaż log z instalacji (jak byś jeszcze raz robił), jak wyglądają ustewienia hdparm?

Na moim laptopie chodzi od prawie roku, wszystko na tym skompilowałem, od kilku miesięcy laptopa nawet nie wyłączam. I zero problemów,
Spróbuj zainstalować tylko to co z płyty i obserwuj, jak pochodzi jakiś czas bez problemu to dodaj jeden pakiet i znów patrz co się dzieje... i tak dalej. Rzeczywiście, jeśli, jak mówisz, kolejne instalacje nie mają wspólnych elementów to musi być coś w ustawieniach lub zgoła w strukturze... I ja bym bardzo chciał to znaleźć.

Autor:  Albercik [ czwartek, 28 kwietnia 2005, 21:54 ]
Tytuł: 

Mis' pisze:
czy problem występuje bezpośrednio po instalacji, czy jakiś czas wszystko działa?


praktycznie bezpośrednio - instaluję NND , następnie niceshapera ( lub htb - nie ma to żadnego znaczenia bo i na tym i na tym sie wiesza ) , hosts , tablicę ARP no i wszystko . Od długiego czasu nie ładuję części modułów bo spowalniały internet , w firewallu wyłączyłem logowanie wirusów i innych "dodatków" aby nie zgonić na przeciążenie ( w sumie ciężko jest przeciążyć P42Ghz :wink: ) , swap jest cały czas pusty .

Cytuj:
Na moim laptopie chodzi od prawie roku, wszystko na tym skompilowałem, od kilku miesięcy laptopa nawet nie wyłączam. I zero problemów,


Moje poprzednie serwery to procesory serii PII/PIII , SDRAM i płyty Intel - najczęściej BXy lub pochodne . NIGDY nie było takiego zawieszania . Jeżeli Twój laptop to coś podobnego to raczej nie uświadczysz zawiech ( tego życzę ) .

Cytuj:
Spróbuj zainstalować tylko to co z płyty i obserwuj, jak pochodzi jakiś czas bez problemu to dodaj jeden pakiet i znów patrz co się dzieje... i tak dalej. Rzeczywiście, jeśli, jak mówisz, kolejne instalacje nie mają wspólnych elementów to musi być coś w ustawieniach lub zgoła w strukturze... I ja bym bardzo chciał to znaleźć.


Dokładnie tak robię , ale to raz stało się na zupełnie "czystym" systemie - po tym jak mi padł dysk był podmieniony nowy i szybko puściłem instalację NND a resztę chciałem zrobić już zdalnie . Wróciłem do domciu , przekopiowałem z podpiętego dysku ( dało się odzyskac dane z tego padniętego , ale za żadne skarby nie udało się odpalić z niego systemu ) i tak zostawiłem na chwilkę - wylogowałem się i klęska . Już jechałem kopnąć go w reset. Zauważyłem dwoje okoliczności ( przestudiowałem logi - linia po linii - nawet z poprzedniego dysku ) : serwer wiesza się zaraz po wylogowaniu z SSH albo podczas restaru niektórych usług , co oznaczało by ,że jest to związane z dyskiem .

Autor:  Mis' [ czwartek, 28 kwietnia 2005, 22:19 ]
Tytuł: 

jak rozumiem po instalacji nie włączyłeś obsługi dma, prawda? a o ile się na złomie wyznaję to wszystkie płyty do p4 już tylko takie kontrolery mają(*)... może spróbuj bezpośrednio po instalacji usunąć linie append="ide=nodma" z lilo.conf przeładuj lilo, zainstaluj hdparm i włącz obsługę dma.

(*)Może właśnie odkryłeś buga w obsłudze starych protokołów przez nowy hardware ;-)

Autor:  Ravel [ czwartek, 28 kwietnia 2005, 23:03 ]
Tytuł: 

ja tez mam problemy ze swoim routerkiem na dosc starym sprzecie (podpis). niestety na dzien dzisiejszy nie znam wiecej danych (tj konkretnie modeli kazdego podzespolu). bylo tak ze chodzilo ok 7-10 dni i zwis, czasami krocej i zwis. ostatnio cos mi sie sypnelo mrtg czyli router przez ten caly czas praktycznie nie korzystal z dysku (logi tylko sie zapisywaly) i sprzet wtedy chodzil ponad 16 dni tylko pradu braklo potem pochodzil kilka godzin i zwis, narazie chodzi tylko nie wiem na jak dlugo. niestety server nie stoi u mnie a cos sie przez ssh nie moge wbic, pewnie znowu sie cos wysypalo choc net jest bo qmpla widze na GG (sam nie jestem w tej sieci). kiedys przegladalem logi ale nic w nich nie bylo...
dziwi mnie to ze wczesniej (tj jakies 3-4 dni temu gdy mrtg nie dzialalo) mrtg nie chcialo dzialac bo jakiegos pliku nie moze zaladowac, a po resecie dziala dosc sprawnie (http://ravel.dyn.pl/mrtg/).
dysk jak i plyta dosc archaiczne wiec raczej dma nie ma, przy instalacji nie kombinowalem nic z dma, na routerku raczej tylko podstawowe pakiety (NS+mrtg+kilka innych). usb na pci, AT, no i tyle pamietam. obciazenia nie ma zbyt duzego bo to tylko 3 osoby. dysk raczej jest OK, bo jak byl w kompie z c466 i 300 cos ramu chodzilo nawet miesiac (wtedy na windowsie :P ). jeszcze bede sprzet spradzal ale nie bardzo wiem co moze byc nie tak. wymienie tez dysk, moze cos pomoze.

Autor:  Albercik [ czwartek, 28 kwietnia 2005, 23:12 ]
Tytuł: 

Mis' pisze:
jak rozumiem po instalacji nie włączyłeś obsługi dma, prawda? a o ile się na złomie wyznaję to wszystkie płyty do p4 już tylko takie kontrolery mają(*)... może spróbuj bezpośrednio po instalacji usunąć linie append="ide=nodma" z lilo.conf przeładuj lilo, zainstaluj hdparm i włącz obsługę dma.

(*)Może właśnie odkryłeś buga w obsłudze starych protokołów przez nowy hardware ;-)


DMA włączone w biosie , NND ustawienia standardowe - na BXach też było DMA włączone , ale nie UDMA :) więc może o to się rozchodzi .

ps. Włączyłem hdparm , ustawłem odpowiednie flagi i ...sam jestem zdziwiony ile można ze starego 4.3GB dysku wycisnąć :

przed : Timing buffered disk reads: 8 MB in 3.25 seconds = 2.46 MB/sec
po : Timing buffered disk reads: 32 MB in 3.22 seconds = 9.94 MB/sec

ps. jestem pod wrażeniem :
po przeładowaniu serwerka : Timing buffered disk reads: 38 MB in 3.09 seconds = 12.30 MB/sec
oraz : Timing buffered disk reads: 52 MB in 3.15 seconds = 16.51 MB/sec

zobaczymy , czy to coś zmieni .....

Autor:  Koriolan [ piątek, 29 kwietnia 2005, 16:56 ]
Tytuł: 

Miałem DWA podobne przypadki.
Wszystko dotyczy NN (stare NND) .
Chodziło kilkanaście dni bezawaryjnie ale któregoś dnia widzę na mrtg, że :
zmieniła się pojemność dysku (opadła z 10% linia na hdd). Przejżałem routerek - nic specjalnego nie widać, ani w logach ani w konfiguracji.
Postanowiłem go zrestartowac i wtedy zaczęły się schody podobnie jak w Albercika. Nie dały rezultaty fsck i inne próby uaktywnienia partycji. Skończyło się na partycjonowaniu i stawianiu linuksa od nowa.

IMHO jest to wina sprzętu, tzn dysk lub kontroler dyskowy traci informacje gdzie zapisać dane i pakuje je na 0,1 i kolejne sektory dysku niszcząc informacje tam zapisane. Formatowanie i partycjonowanie dysku załatwiło sprawę. Komputer bez zmian chodził jeszcze z miesiąć bez podobnych ekscesów, choć nie ciągle (restarty administracyjne) potem do rozbiórki.

Uważam, że to nie oprogramowanie bo :
- u mnie sprawa dotyczy NN a u Albercika chyba NND,
- ktoś też opisywał podobny przypadek z tym, że udało mu się odzyskać 'partycje' fsck,
- na NN inny komputer chodzi już ze 30 dni w podobnej choć trochę mniejszej konfiguracji,

Autor:  Albercik [ piątek, 29 kwietnia 2005, 20:31 ]
Tytuł: 

Po zabawie z hdparm i opcjami lilo jak na razie ( nie chcę zapeszać ) , ale nie widzę żadnych objawów choćby zająknięcia . Pożyjemy - zobaczymy 8)

Strona 1 z 1 Strefa czasowa UTC+2godz.
Powered by phpBB® Forum Software © phpBB Group
https://www.phpbb.com/