Злокозненный компонент

Сегодня (вернее уже вчера, наверное) разбирались, почему наша точка доступа в интернет последние три дня постоянно вешается с интервалом примерно каждые десять-двенадцать часов.

Первым делом корпус сервака был распотрошен, пропылесошен, на процессор намазана свежая термопаста, и… всё безрезультатно. Роутер продолжал вешаться, но теперь уже при каждой загрузке — момент, в общем-то, позитивный, поскольку процесс поиска западлянского компонента при таком раскладе в теории изрядно облегчался. Но не тут-то было. Был убран разгон с процессора, затем перепробованы комбинации со всеми тремя модулями памяти, передёрнуты видеадаптер и три сетевых карты — результат оставался прежним, сервер вешался почти сразу после загрузки.

В ходе экспериментов было выяснено, что зависания происходили при любых попытках копирования данных с софтового RAID, который был сконфигурирован на этом сервере. Из RAID-массива был извлечён особо подозреваемый IBM DeskStar серии ICL35, затем контакты банки и платы контроллера на этом винчестере были безжалостно пропаяны, после чего винчестер был установлена на прежнее место. Подключили всё по новой — результат нулевой. Зависания продолжались.

После всех мытарств решили попытаться хоть понемногу копировать данные с массива на другой накопитель, чтобы хотя бы частично восстановить функциональность роутера. Надо сказать, что основные службы на сервере были установленны именно на этот злополучный RAID-массив уровня 0 (Stripe). И только в тот момент, когда исправный винчестер был подключен к IDE-контроллеру, до нас наконец дошло, что всему виной именно этот PCI IDE-контроллер CMD-640. Злокозненный компонент был тотчас выдернут из слота, а винты повешены на встроенный IDE-контроллер. После чего всё наконец заработало как надо. И даже данные не пришлось никуда сливать.

Вывод из этой истории такой: деньги на серверных компонентах лучше не экономить. Дороже выйдет. В данном случае расплачиваться пришлось временем, затраченным на тестирование всевозможных источников глюков. Если бы этот был сервер не маленькой домашней сети, а какого-нибудь предприятия — счёт бы пошёл не на часы, а на килобаксы. Такие дела 😉

Добавить комментарий