Сообщения об ошибках оборудования из syslogd

У меня 64-ядерный сервер AMD, работающий на CEntOS, на котором я работал долго. В середине вывода я вижу эти строки. Кажется, это ошибка памяти. Насколько тяжело это и что именно это указывает?

Message from [email protected] at Nov 7 21:00:02 ... kernel:[Hardware Error]: MC4_STATUS[Over|CE|MiscV|-|AddrV|-|-|CECC]: 0xdc10410040080a13 Message from [email protected] at Nov 7 21:00:02 ... kernel:[Hardware Error]: Northbridge Error (node 4): DRAM ECC error detected on the NB. Message from [email protected] at Nov 7 21:00:02 ... kernel:[Hardware Error]: cache level: L3/GEN, mem/io: MEM, mem-tx: RD, part-proc: RES (no timeout) 

На NB

NB – Северный мост. На старых компьютерах использовалось множество фишек. В конце концов, они были интегрированы в около 3 больших общих чипов (386/486 раз), а затем в два. Один из них касался процессора, ОЗУ и других высокоскоростных устройств. Другой («Южный мост») касался медленных периферийных устройств).

Обнаружена ошибка ECAM DRAM

Динамическая память – это просто основная память (в отличие от кеша, который обычно делается из статической памяти). ECC – это память, которая предназначена для обнаружения и исправления однобитового повреждения.

Сообщение, которое вы получаете, это то, что NB попытался прочитать некоторую память, но обнаружил, что он частично поврежден.

В этом случае он может либо выключить машину (вспомните старомодную «ошибку четности: система остановлена»), либо она может ее исправить, либо она может ее игнорировать. В этом случае он, похоже, исправил его, и он бросил предупреждение.

Единственная ошибка в памяти – это не повод для паники. Это происходит. Редко, но они случаются. И с ECC вы получаете правильное предупреждение, а не необъяснимые сбои или поврежденные данные.

В чрезвычайно быстрых средах (например, в кэше с доступом к ним) они даже не такие необычные. Обычно компьютер будет повторять и исправлять себя. Если это не удастся, он выбросит MCE .

Если эти вещи продолжаются: проверьте правильность установки DIMMS. Они собирали много пыли? Они проходят мимо? И т.д.

  • Как я могу контролировать использование видеопамяти?
  • Смешать ОЗУ с различными тактовыми частотами
  • Что означает «32GB (8Gbx4DR)» в информации о сброшенном ОЗУ?
  • Как найти максимальный размер памяти?
  • Windows 10 с низкой виртуальной памятью (возможно, утечка памяти), когда компьютер остается бездействующим в течение нескольких дней
  • Как протестировать память видеокарты
  • Невидимая утечка памяти на Linux - сервер Ubuntu (а не кеш-диск / буферы)!
  • Как полностью использовать 4 ГБ оперативной памяти в моем ноутбуке под Ubuntu 9.10 - 32-бит
  • Номера номеров RAM - значение?
  • Как проверить, работает ли ОЗУ в двухканальном режиме
  • Как материнская плата и процессор влияют на выбор RAM?
  • Interesting Posts

    Перенаправление весной MVC

    Пустые диски показывают 2 ГБ, Explorer ничего не показывает

    Неразумно ли назначать базу данных MySQL каждому пользователю на моем сайте?

    Черный экран с курсором после успешного обновления Windows 10

    Перемещение GameObject с течением времени

    как сортировать данные из базы данных pandas

    Как показать консольный вывод / окно в приложении форм?

    Бесполезное использование кошки?

    Найти рекурсивное членство в группе (Active Directory) с помощью C #

    как установить языковой стандарт по умолчанию для моей JVM?

    Расширения браузера для автоматического изменения заголовков HTTP?

    Android eclipse DDMS – не удается получить доступ к данным / данным / на телефоне, чтобы вытащить файлы

    Будет ли мощность блока питания 600 Вт следующей?

    Вставляемое устройство на передний USB-компьютер * иногда * перезапускается

    Создание страницы Facebook программно через Open Graph API

    Давайте будем гением компьютера.