Журналы эксплуатации вычислительной техники

При эксплуатации ЭВМ должен производиться сбор данных о работе ЭВМ, отдельных ее устройств, о возникающих отказах и сбоях, о проведенных профилактических работах и их результатах. Стоит отметить, что такого рода журналы ведутся в разных отраслях и сферах, даже наращивание гелем не обходится без документирования.

Вопрос был рассмотрен под углом зрения автоматизации процесса накопления и обработки информации о машинных ошибках. В данной главе рассматривается ведение «аппаратурного журнала», являющегося первичной формой информации о работе ЭВМ. Эта информация, зафиксированная по определенной форме в виде сводных карточек учета неисправностей, ежеквартально высылается пользователем-владельцем ЭВМ предприятию — изготовителю машины. Текущие данные об эксплуатации ЭВМ, наработке машины и отдельных устройств, наблюдавшихся отказах и сбоях, установленных причинах отказов и сбоев, о проведенных ремонтных работах и регулировках должны тщательно фиксироваться обслуживающим персоналом машины в «аппаратурном журнале» установленной формы.

Сбор и накопление данных о поведении ЭВМ в процессе эксплуатации имеет большое значение как для организации (разработчика и предприятия) — изготовителя, так и для пользователя, эксплуатирующего машину.
Разработчики и изготовители ЭВМ на основе данных об отказах и сбоях имеют возможность определить статистические характеристики надежности и обслуживаемости ЭВМ и ее отдельных устройств, определить и соответствующим образом доработать схемы, конструкцию и технологию изготовления узлов и устройств, оказавшихся недостаточно надежными в эксплуатации, скорректировать техническую документацию, в том числе уточнить методику и программы профилактических испытаний.

Пользователь на основе данных о сбоях и отказах ЭВМ имеет возможность планировать проведение ремонтных работ, замену отдельных устройств более надежными, установку резервного оборудования. Данные о сбоях, поведении ЭВМ при профилактических испытаниях с изменением питающих напряжений позволяют прогнозировать возникновение отказов в будущем и принимать профилактически необходимые меры (замену узлов и т. п.).
Для соответствующего учета неисправностей при работе ЭВМ принципиальное значение имеет уточнение классификации возникающих при работе машины событий как сбоев или отказов.

Понятия отказа и сбоя были определены в общеупотребительном смысле. Однако практика организации учета данных о надежности ЭВМ потребовала следующих дополнительных соглашений о том, как классифицировать те или иные события при эксплуатации машины.

Следует различать сбои и отказы ЭВМ и сбои и отказы отдельных ее устройств.
Обрыв магнитной ленты или бумаги, замятие перфокарты, пробивка лишних отверстий на перфокартах и перфолентах, непропечатываиие знака классифицируются не как сбои ЭВМ, а как сбои соответствующего устройства. Однако если для устранения указанных явлений необходима регулировка или ремонт устройства, то регистрируется его отказ.

Если при отказе некоторого устройства оказалось возможным подключить к машине резервное устройство (или перейти к работе с резервным устройством) и продолжить решение задачи, то фиксируется не отказ ЭВМ, а отказ устройства. Если указанное переключение влечет за собой новую загрузку операционной системы, то регистрируется отказ ЭВМ.

Сбои ЭВМ, автоматически устраняемые программно-аппаратурными средствами, не учитываются при определении значений наработки на сбой и коэффициента использования ЭВМ. Отметим, что данные о таких сбоях, автоматически накапливаемые и обрабатываемые операционной системой машины, ориентируют пользователя относительно «слабых мест» в эксплуатируемой машине, позволяют по изменению частоты появления таких сбоев прогнозировать надежность работы машины.

Сбои ЭВМ, обнаруженные и устраненные при техническом обслуживании, не учитываются при определении характеристик надежности. Аналогичным образом поступают с отказами и сбоями, происшедшими из-за низкого качества носителей информации, отклонения параметров внешней среды за пределы, оговоренные в технической документации, а также вызванными ошибками в действиях операторов.

26 Сентябрь 2013 5:18 | admin | Просмотров 9

Оставить комментарий

Поиск по блогу