1. Законодательная база Республики Казахстан
2. Автоматизированный контроль качества радиоэлектронных средств (РЭС), в процессе производства
2.1. Основные задачи и характеристики контроля
2.2. Структура средств автоматизированного контроля
2.3. Классификация видов контроля
3. Основные методы построения алгоритмов поиска неисправностей
3.1. Метод последовательного функционального анализа
3.2. Метод половинного разбиения
3.3. Метод «время-вероятность»
3.4. Метод на основе информационного критерия
3.6. Метод на основе иерархического принципа
4. Сравнительный анализ методов диагностики РЭС
5. Искусство диагностики локальных сетей
6. Организация процесса диагностики сети
8. Измерение числа коллизий в сети
9. Измерение числа ошибок на канальном уровне сети
10. Программные средства диагностики
11. Аппаратные средства диагностики
12. Fluke Networks OptiView™ Workgroup Analyzer
12.1. Защита, регистрация и оповещение
12.2. Ограничение доступа к Internet
12.3. Совместное использование Internet
13. Диагностика третьего тысячелетия
1. Законодательная база Республики Казахстан
1.1. «О Стандартизации» от 16 июля 1999 года, № 433-I (с изменениями, внесенными Законом РК от 10 июня 2003 года № 432-II). В Законе регламентированы нормативные документы по стандартизации и требования к ним, государственные стандарты, государственные классификаторы технико-экономической информации, отраслевые стандарты, стандарты научно-технических, инженерных обществ и других общественных объединений, технические условия, применение нормативных документов, планирование работ по стандартизации и.т.д.
1.2. «Об обеспечении единства измерений» от 7 июня 2000 года №53-II. В Законе регламентированы утверждение типа средств измерений, лицензирование деятельности физических и юридических лиц по производству, проверке и ремонту средств измерений, поверка средств измерений, калибровка средств измерений, государственный метрологический надзор за выпуском, состоянием и применением средств измерений, эталонами единиц величин, соблюдением метрологических правил и норм и т. д.
1.3. Закон Республики Казахстан от 5 июля 2004 года N 567-II «О связи»
Все вышеуказанные Законы устанавливают правовые, экономические и организационные основы обеспечения единства измерений в Республике Казахстан, регулируют отношения между государственными органами управления, физическими и юридическими лицами в сфере метрологической деятельности в защиту прав и законных интересов граждан и экономики Республики Казахстан от последствий недостоверных результатов измерений.
1.4. Термины и определения, используемые в законах Республики Казахстан:
стандартизация – деятельность, направленная на достижение оптимальной степени упорядочения положений в определенной области для всеобщего многократного использования в отношении реально существующих или потенциальных задач;
стандарт – документ, разработанный на основе согласия заинтересованных сторон, в котором устанавливаются для всеобщего и многократного использования правила;
технические условия – нормативный документ по стандартизации, устанавливающий технические требования к конкретной продукции, процессам, услугам, или нескольким видам продукции;
государственная стандартизация – стандартизация, которая проводится на уровне одной страны;
межгосударственная стандартизация – стандартизация объектов, представляющих межгосударственный интерес;
государственный стандарт Республики Казахстан – стандарт, утвержденный уполномоченным органом по стандартизации, метрологии и сертификации, доступный широкому кругу потребителей;
межгосударственный стандарт – стандарт, принятый Межгосударственным Советом по стандартизации, метрологии и сертификации или межгосударственной научно-технической комиссией по стандартизации и техническому нормированию в строительстве стран Содружества Независимых Государств, и применяемый ими непосредственно;
международная стандартизация – стандартизация, участие которой открыто для соответствующих органов всех стран;
международный стандарт – стандарт, принятый международной организацией по стандартизации и доступный широкому кругу потребителей;
государственный эталон единицы величины – эталон единицы величины, признанный решением уполномоченного органа в качестве исходного на территории Республики Казахстан;
единица величины – физическая величина фиксированного размера, которой условно присвоено числовое значение, равное 1;
единство измерений – состояние измерений, при котором их результаты выражены в узаконенных единицах величин и погрешности измерений находятся в установленных границах с заданной вероятностью;
измерение – нахождение значения физической величины опытным путем с помощью специальных технических средств измерений;
испытание средств измерений – совокупность операций, проводимых для определения степени соответствия средств измерений установленным нормам с применением к объектам испытаний различных испытательных воздействий;
методика выполнения измерений – совокупность операций и правил, выполнение которых обеспечивает получение результатов измерений с точностью, установленной данной методикой выполнения измерений;
метрологический контроль – деятельность, осуществляемая метрологическими службами государственных органов управления,. физических и юридических лиц в целях проверки соблюдения метрологических правил и норм;
метрологическая служба – совокупность субъектов, деятельность которых направлена на обеспечение единства измерений;
нормативные документы по обеспечению единства измерений – государственные стандарты, применяемые в установленном порядке международные (региональные) стандарты, положения, инструкции и иные методологические документы, определяющие требования и порядок проведения работ по обеспечению единства измерений;
поверка средств измерений – совокупность операций, выполняемых государственной метрологической службой или другими уполномоченными на то органами с целью определения и подтверждения соответствия средства измерений установленным техническим требованиям;
средство измерений – техническое средство, предназначенное для измерений, имеющее нормативные метрологические характеристики;
эталон единицы величины – средство измерений, предназначенное для воспроизведения и (или) хранения единицы величины (кратных либо дольных значений единицы величины) с целью передачи ее размера другим средствам измерений данной величины, утвержденное в порядке, установленном уполномоченным органом по стандартизации, метрологии, сертификации;
радиоэлектронное средство (РЭС) - техническое средство, предназначенное для передачи и (или) приема радиоволн и состоящее из одного или нескольких передающих и (или) приемных устройств либо их комбинаций, включая вспомогательное оборудование;
высокочастотные устройства (ВЧУ) - оборудование и (или) приборы, предназначенные для генерирования и использования электромагнитной энергии в промышленных, научных, медицинских, бытовых или других целях, за исключением применения в области телекоммуникаций;
линии связи - линии передачи (кабельные, радиорелейные, спутниковые и другие), физические цепи и линейно-кабельные сооружения связи, в том числе магистральные (международные и междугородные);
средства связи - технические и программные средства, используемые для формирования, обработки, передачи или приема сообщений телекоммуникаций либо почтовых отправлений;
оконечное оборудование - технические средства для передачи или приема сигналов телекоммуникаций по линиям связи, подключенные к абонентским линиям и находящиеся в пользовании абонентов либо предназначенные для указанных целей.
электросвязь – всякая передача, излучение или прием знаков, сигналов, письменного текста, изображений и звуков или сообщений любого рода по проводной, радио, оптической или другим электромагнитным системам;
излучение – созданная радиация или создание радиопередающей станцией;
радиация – исходящий из любого источника поток энергии в форме радиоволн;
радиоволны – электромагнитные волны, частоты которых произвольно ограничены частотами ниже 3000 ГГц, распространяющиеся в пространстве без искусственного волновода;
радиосвязь – электросвязь, осуществляемая посредством радиоволн;
космическая радиосвязь – любая радиосвязь, при которой используется одна или несколько отражающих спутников, или другие объекты в космосе;
наземная радиосвязь – любая радиосвязь, за исключением космической радиосвязи или радиоастрономии;
метеорная радиосвязь – электросвязь, осуществляемая посредством радиоволн, распространяющихся из-за отражения от ионизированных следов метеоров;
радиоопределение – определение местонахождения, скорости и/ или других характеристик объекта или получение информации относительно этих параметров посредством свойств распространения радиоволн;
радиолокация – радиоопределение, используемое для целей, отличных от целей радионавигации;
радиопеленгация – радиоопределение, использующее прием радиоволн с целью определения направления, в котором находится станция или объект;
радиоастрономия – астрономия, основанная на приеме радиоволн космического происхождения;
радиовещательная служба- служба радиосвязи, передачи которой предназначены для непосредственного приема населением. Эта служба может осуществлять передачи звуков, передачи телевидения или другие виды передачи.
радиовещательная спутниковая служба – служба радиосвязи, в которой сигналы передаваемые ли транслируемые космическими станциями, предназначены для непосредственного приема населением;
станция – станция один или несколько передатчиков, или приемников, или комбинация передатчиков и приемников, включая вспомогательное оборудование, необходимые в определенном месте для осуществления службы радиосвязи или радиоастрономической службы.
наземная станция – станция, осуществляющая наземную радиосвязь;
земная станция – станция, расположенная либо на поверхности Земли, либо в основной части атмосферы Земли и предназначенная для связи:
- с одной или несколькими космическими станциями;
или
- с одной или несколькими подобными ей станциями с помощью одного или нескольких отражающих спутников или других объектов в космосе;
космическая станция – станция, расположенная на объекте, который находится либо находился за пределами основной части атмосферы Земли или предназначен для вывода за эти пределы;
фиксированная станция – станция фиксированной службы;
воздушная фиксированная станция – станция воздушной фиксированной службы;
сухопутная станция- станция подвижной службы, не предназначенная для работы во время движения;
сухопутная земная станция – земная станция фиксированной спутниковой службы или, в некоторых случаях, подвижной спутниковой службы, расположенная в определенном фиксированном пункте или в пределах определенной зоны на суше для обеспечения фидерной линии для подвижной спутниковой службы;
базовая станция – сухопутная станция сухопутной подвижной службы;
базовая земная станция – земная станция фиксированной спутниковой службы или, в некоторых случаях, сухопутной подвижной спутниковой службы, расположенная в определенном фиксированном пункте или в пределах определенной зоны на суше, для обеспечения фидерной линии для сухопутной подвижной спутниковой службы;
береговая станция – сухопутная станция морской подвижной службы;
береговая земная станция – земная станция фиксированной спутниковой службы или, в некоторых случаях, морской подвижной спутниковой службы, расположенная в определенном фиксированном пункте на суше для обеспечения фидерной линии для морской подвижной спутниковой службы;
судовая станция – подвижной морской подвижной службы, установленная на борту судна, не закрепленного постоянно на одном месте, не являющая станцией спасательного средства;
судовая земная станция – судовая земная станция морской подвижной спутниковой службы, установленная на борту судна;
стационарная станция воздушной подвижной службы – сухопутная станция воздушной подвижной службы;
станция воздушного судна – подвижная станция воздушной подвижной службы, не являющаяся станцией спасательного средства, установленная на борту воздушного судна;
земная станция воздушного судна - подвижная земная станция воздушной подвижной спутниковой службы, расположенная на борту воздушного судна;
радиовещательная станция – станция радиовещательной службы;
станция радиоопределения – станция радиовещательной службы радиоопределения;
геосинхронный спутник – спутник Земли, период обращения которого равен периоду вращения Земли вокруг своей оси;
геостационарный спутник – геосинхронный спутник, прямая и круговая орбита которого лежит в плоскости земного экватора и который, таким образом, остается неподвижным относительно Земли; в более широком смысле – спутник, который остается приблизительно неподвижным относительно Земли;
орбита геостационарных спутников – орбита геосинхронного спутника, прямая орбита которого находится в плоскости земного экватора.
Основными целями стандартизации являются:
1) установление норм, правил и характеристик (далее - требования) к продукции, процессам (работам), услугам;
2) обеспечение безопасности продукции, процессов (работ), услуг для жизни, здоровья людей, имущества, охраны окружающей среды;
3) устранение технических барьеров в торговле, обеспечение конкурентно-способности продукции на внутреннем и внешнем рынках;
4) обеспечение единства измерений.
В связи с усложнением разрабатываемой и применяемой радиоаппаратуры в настоящее время достаточно широко используется устройства и системы для контроля и диагностики радиоэлектроники.
С появлением стандартов цифровой связи третьего поколения, таких как W-CDMA, CDMA2000 и EDG, должно меняться и измерительное оборудование. Семейство ESG легко адаптируется к изменяющим технологиям связи третьего поколения за счет добавления и усовершенствования специализированных программ. Его модульная архитектура ESG упрощает модернизацию приборов и позволяет поспевать за новейшими стандартами.
2. Автоматизированный контроль качества радиоэлектронных средств (РЭС), в процессе производства
2.1. Основные задачи и характеристики контроля
Контроль качества РЭС может осуществиться в процессе:
а) разработки;
б) производства;
в) испытания;
г) эксплуатации.
В производственных условиях контроль бывает: внутрисхемный (ВСК) и функциональный (ФК).
Основные характеристики контроля: эффективность, достоверность, точность и объем.
Эффективность контроля
Э = 1-Ск /Сп , (1)
где Ск – величина затрат на контроль;
Сп – величина потерь на ошибочные решения при отсутствии контроля.
Точность контроля параметров:
X ki [ f kэ , t i ] = W [X gi (f э , t i ) ], (2)
где X k – значение параметра, установленное путем проверки;
X gi – действительное значение параметра;
f kэ , f э – входные воздействия на аппаратуру при контроле и в реальных условиях эксплуатации;
t i – время, затраченное на определение параметров;
W – модель погрешности метода контроля.
Достоверность функционального контроля (ФК) в основном зависит от точности измерения параметров ОК и полноты контроля.
Объем контроля определяет перечень параметров, подлежащих определению и достаточных для обеспечения заданной достоверности оценки технического состояния объекта контроля (ОК).
Эффективность ручного контроля составляет не более 87%, автоматизация обеспечивает 100 – процентную эффективность с высокой производительностью контрольных операций.
Применение автоматизированных методов дает следующие преимущества:
1) сокращение расходов на контроль:
2) снижение уровня квалификации и количества операторов;
3) уменьшение трудозатрат:
4) повышение надежности продукции.
В ГОСТ 8.009 установлено соотношение между допускаемой погрешностью измерения и допуском на контрольный параметр составляет 1:3 или 1:5.
В настоящее время используются следующие показатели точности контроля.
Методы определения погрешности при заданной допустимой погрешности контроля характеризуется следующими подходами:
а) если погрешность измерения не превышает 0,3 от допуска на контролируемый параметр, то погрешность контроля пренебрежимо мала;
б) между погрешностью измерения и контроля существует вполне конкретная математическая связь.
2.2. Структура средств автоматизированного контроля
Основные функции АК: а) автоматическая выдача стимулирующих сигналов; б) автоматическое восприятие и преобразование ответных реакций ОК; в) формирование образцовых значений контролируемых параметров и сравнение этих значений с контролируемыми параметрами; г) оценка состояния каждого контролируемого параметра и фиксация номера и величины параметра с визуальной фиксацией.
Рис.1 Обобщенная структурная схема средств автоматизированного контроля
Рис.2 Обобщенная схема систем внутрисхемного параметрического контроля
Устройство подключения обеспечивает электрический контакт контрольно-измерительной аппаратуры с узлами контролируемого объекта. Оно представляет собой матрицу подпружиненных контактных штырей с вакуумными присосками.
Устройство коммутации обеспечивает пошаговое подключение в процессе контроля контактов адаптерного устройства с преобразователем.
Рис.3 Обобщенная структурная схема систем ФК
Блок измерения преобразователей для измерения выходных сигналов ОК и преобразования их в цифровую форму.
Устройство управления обработки и хранения информации для выдачи управления на все приборы АК и сравнения контролируемых параметров с их номинальными значениями и допускаемой оценки.
Допусковая ошибка выводится на УВВ для визуальной индикации результатов работы и их документальной регистрации.
2.2.1. Правила обеспечения контроля пригодности РЭС:
а) все ИС ориентируется в одном направлении, что значительно уменьшает число ошибок при контроле;
б) контрольные точки располагаются на одной стороне печатной платы, что повышает производительность контроля и уменьшает количество погрешностей при проверке;
в) при проектировании используются стандартные гнезда и штыри.
2.2.2. Расчет основных параметров АК
а) Средняя продолжительность стандартной процедуры проверки технического состояния ОК.
ТСП = n* h k , (3)
где n – число проверок;
h k – среднее значение оперативной трудоёмкости одной проверки, чел. – ч;
б) Коэффициент трудоемкости контроля
КТРК= tО / (tО + tВ) , (4)
где tО – среднее время на выполнение основных операций при контроле, т. е. время на получение и переработку информации, время на принятие решения.
tВ – время на выполнение вспомогательных операций при контроле (обеспечение доступа к контрольным точкам (КТ), подсоединение контрольно-измерительной аппаратуры (КИА), демонтаж составных частей при контроле);
в) Коэффициент унификации устройств сопряжения системы и её основных частей
КУ.С. = NУ/ (NУ + NН) , (5)
где NУ - количество унифицированных УС;
NН – количество неунифицированных УС.
г) Коэффициент демонтажа при контроле
КД = МД / (МД + МН) , (6)
где МД – количество составных частей, которые необходимо демонтировать при контроле;
МН – количество составных частей, которые не требуется демонтировать при контроле.
д) Коэффициент унификации используемых сигналов
КУИС = δВ / (δВ + δ) , (7)
где δВ – количество вновь вводимых типономиналов сигналов;
δ – количество типономиналов сигналов, используемых в АК, заимствованных из аналогичных образцов.
2.3. Классификация видов контроля
а) По способу физического воздействия на РЭС:
1) визуальный;
2) электрический;
3) механический;
4) термический.
б) По использованию технических средств
1) внешний;
2) внутренний.
в) По применению на этапах жизненного цикла:
1) входной;
2) производственный;
3) эксплуатационный.
г) По информации о состоянии ОК:
1) проверочный;
2) диагностический.
д) По способу организации:
1) тестовый;
2) функциональный.
с) Информация о «годности» ОК:
1) параметрический;
2) допусковый.
2.3.1. Показатели систем технического диагностирования
Параметры радиоэлектронной аппаратуры (РАЭ) как объекта диагностирования можно условно разделить на группы, которые характеризуют:
а) потребности блока в диагностировании:
б) диагностируемость блока;
в) конструктивную приспособленность блока к диагностированию и контролю.
Показателями объектов диагностирования (ОД) первой группы являются:
а) ТД – периодичность проведения диагностирования;
б) τД – среднее время проведения диагностирования.
Под диагностируемостью РЭА понимается совокупность параметров, допусков на параметры, определяющих техническое состояние изделия.
Важнейшим показателем диагностируемости изделия является коэффициент полноты проверки работоспособности
КПП = nК / n0 , (8)
где nК – число диагностических параметров;
n0 – число параметров технического состояния изделия, использование которых обеспечивает методическую достоверность проверки.
Второй показатель диагностируемости – поиск места отказа характеризуется глубиной поиска дефекта.
Операции диагностирования по определению работоспособности изделия и поиску места отказа характеризуются глубиной поиска дефекта.
Операции диагностирования по определению работоспособности изделия и поиску места отказа характеризуются следующими показателями:
L - длина теста диагностирования, определяется числом элементарных воздействий;
РД – вероятность ошибки диагностирования, т.е. вероятность того, что работоспособный объект признается неработоспособным.
Конструктивная приспособленность РЭА к проведению диагностирования и контроля характеризуется следующими показателями:
СД – средняя оперативная стоимость диагностирования;
КУУС – коэффициент унификации устройств сопряжения со средствами диагностирования:
КУУС = NУ / N0 , (9)
где NУ – число унифицированных устройств сопряжения;
N0 – общее число устройств сопряжения.
КТД – коэффициент трудоемкости подготовки изделия к диагностированию:
КТД = W0 / WВ , (10)
где W0 – основная трудоёмкость диагностирования;
WВ – трудоёмкость подготовки к диагностированию.
КИС – коэффициент использования специальных средств диагностики
КИС = (ССД – СССД) / ССД , (11)
где ССД – объём серийных средств диагностики;
СССД – объём специальных средств диагностики.
Главной характеристикой совокупности диагностируемых параметров должна быть чувствительность к изменению объектов диагностики (ОД).
Процесс выбора совокупности диагностических параметров можно разделить на следующие этапы:
а) определение множества состояний ОД - S;
б) выбор совокупности диагностируемых параметров U(S) по заданному максимальному коэффициенту полноты проверки КППMAX и чувствительности к изменению состояния под действием i-го параметра (dU(SI) / dS ) MAX;
в) минимизация совокупности диагностируемых параметров U(S);
г) синтез рациональных алгоритмов проверки работоспособности и поиска места дефекта (отказа);
д) установление рациональных допусков на нормы технических параметров.
2.3.2. Принципы диагностирования устройств и узлов
Известные методы диагностирования можно разделить на три группы:
а) структурное диагностирование (функциональный контроль);
б) поэлементное диагностирование (внутрисхемное диагностирование);
в) комбинированное диагностирование (поэлементно – структурное).
При структурном диагностировании осуществляется тестирование ОД в целом. При этом на входы ОД подаются тестовые воздействия, а также на выходах ОД или в специальных внутрисхемных контрольных точках проверяется правильность выполнения функции, реализуемой контролируемой схемой. О годности ОД судят по разности между эталонными реакциями и выходными сигналами.
Достоинства структурного диагностирования:
а) простота подключения к ОД;
б) малое число каналов устройства связи;
в) быстрота проверки по принципу «годен – негоден».
Недостатки структурного диагностирования:
а) большая трудоёмкость поиска дефектов;
б) невозможность определения скрытых дефектов;
в) сложность и большая трудоёмкость разработки тестов.
При поэлементном диагностировании проверяется выход параметров за допустимые пределы.
При создании систем поэлементного диагностирования (СПД) решаются следующие задачи:
а) обеспечение доступа к внутренним контрольным точкам (КТ) ОД;
б) исключение влияния схемы при проверке пассивных электро -, радиоэлементов – режим разделения;
в) защита активных электро -, радиоэлементов (транзисторов, ИМС) от повреждений при тестировании;
г) автоматизация получения тестовых воздействий и измерений.
2.4. Построение функциональной модели
Контроль и диагностирование РЭА предполагает определенную её идеализацию, при которой выделяются некоторые существенные (для контроля и диагностики) характеристики и отбрасываются второстепенные, т.е. реальная РЭА заменяется моделью.
При поиске неисправностей РЭА представляют в виде функциональной модели. Функциональная модель отличается от структурной схемы выбросом функциональных элементов.
Под функциональным элементом понимают часть объекта диагностирования (узел, каскад, группу каскадов, блок, отдельный радиоэлемент), которая может находиться только в одном из двух состояний; исправна или неисправна.
Как показывает практика, диагностирование необходимо вести до отказавшего радиокомпонента. При этом наиболее рационально производить поиск последовательно на разных уровнях: блок – модуль - каскад –радиокомпонент. В соответствии с этим строят несколько функциональных моделей: для устройства в целом с глубиной поиска до каскада или отдельного радиомониторинга.
Исходными данными для построения функциональной модели являются:
а) структурная схема объекта контроля и диагностики (ОКД);
б) принципиальная схема ОКД;
в) описание процессов, протекающих в ОКД;
г) заданная глубина поиска неисправностей.
При построении функциональной модели необходимо руководствоваться следующими правилами:
а) в каждом функциональном элементе должны быть известны значения (номинальные, допуски) входных и выходных параметров, параметров, их функциональная зависимость и способ контроля;
б) при выходе из допустимых пределов хотя бы одного из выходных сигналов появляется выходной сигнал, который также выходит из допустимых пределов;
в) функциональный элемент модели ОД считается неисправным, если при всех входных сигналах, лежащих в пределах допуска, на его выходе появляется сигнал, значения которого выходят из допустимых пределов;
г) значения внешних входных сигналов всегда находятся в пределах допусков;
д) если выходной сигнал i-го функционального элемента является входным для j-го функционального элемента, то значения этих сигналов совпадают;
е) линии связи между функциональными элементами абсолютно надежны;
ж) любой функциональный элемент может иметь только один выходной сигнал при произвольном конечном числе выходных сигналов.
Функциональная модель выполняется в виде графической схемы (Рис. 4)
Рис. 4 Функциональная модель объекта контроля и диагностирования
После построения функциональной модели определяется множество возможных состояний ОД. Общее их число при его разделении на N функциональных элементов равно 2N-1. Однако в высоконадежных устройствах одновременное появление двух независимых отказов маловероятно. Тогда число возможных состояний ОД равно числу элементовN .
Число различных состояний ОД с учетом отказов одновременно одного функционального элемента сводится в таблицу или матрицу неисправностей. Последняя представляет собой таблицу, в которой число строк равно числу состояний ОД, а число столбцов – числу контрольных точек (сигналов на выходах элементов). Матрица неисправностей для вышесказанной функциональной модели (Рис. 4) представлена в табл. 2.
Табл. 2
Z1 |
Z2 |
Z3 |
Z4 |
Z5 |
Z6 |
Z7 |
Z8 |
Z9 |
|
S1 |
0 |
0 |
1 |
0 |
0 |
1 |
0 |
0 |
0 |
S2 |
1 |
0 |
1 |
0 |
0 |
1 |
0 |
0 |
0 |
S3 |
1 |
0 |
0 |
0 |
0 |
1 |
0 |
0 |
0 |
S4 |
1 |
1 |
1 |
0 |
1 |
1 |
0 |
0 |
0 |
S5 |
1 |
1 |
1 |
0 |
0 |
1 |
0 |
0 |
0 |
S6 |
1 |
1 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
S7 |
1 |
1 |
1 |
1 |
1 |
1 |
0 |
0 |
0 |
S8 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
0 |
0 |
S9 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
0 |
Матрица неисправностей заполняется на основании логического анализа функциональной модели ОД при условии, что все параметров в контрольных точках на выходах функциональных элементов контролируются. При этом предполагается, что если ОД находится в Si состоянии, то неисправен только i-й функциональный элемент. Этому событию соответствует недопустимое значение выходного параметра Zi, и тогда на пересеченииSi – иZi – столбца записывается символ 0.
Если при этом любой другой j – й функциональный элемент имеет также недопустимое значение Zj , то на пересечении Si – строки и Zj – столбца также записываются символ 0. Если значение параметра находиться в допуске, то на пересечении записывается 1.
Полученная матрица используется при разработке программы поиска неисправностей.
2.5. Выбор параметров для контроля и диагностики
Параметром называют величину, характеристику, функциональную зависимость, которые определяют техническое состояние ОД.
Контролируемые параметры описываются следующими свойствами:
а) номинальным значением и полем допусков;
б) зависимостью значений параметра от внешних условий;
в) требуемой точностью измерения;
г) функциональными зависимостями (формулы для вычисления значений параметров по результатам измерений косвенных величин).
Каждый вид ОД характеризуется определенным множеством параметров. При этом среди множества параметров имеется подмножество параметров (y1, y2, …, yn), которые определяют работоспособность ОД в целом. Такие параметры называются определяющими. Часто определяющие параметры непосредственно измерить невозможно. Поэтому для их определения измеряют вспомогательные параметры (x1, x2, … , xn) , которые связаны с ними вполне определенными зависимостями.
yk = fk (xki) (12)
где k = 1, 2, … , n; i = 1, 2, …
По степени обобщения информации о техническом состоянии ОД параметры подразделяют на первичные, вторичные и промежуточные.
Первичные параметры имеет самую никую степень обобщения и являются параметрами ОД.
Вторичные параметры имеют самую высокую степень обобщения информации о структуре и работоспособности ОД и являются параметрами выходных функций ОД. Обычно это определяющие параметры.
Промежуточные параметры позволяют осуществлять связь между вторичными и первичными параметрами.
Параметры РЭА являются случайными величинами, так как зависят от многих факторов, имеющих случайный характер, например неточностей производства,старения аппаратуры, изменения условий эксплуатации и другие.
Количество контролируемых параметров определяется задачами контроля и диагностики.
3. Основные методы построения алгоритмов поиска неисправностей
Выбор того или иного метода использования информации о техническом состоянии диагностируемой аппаратуры обусловлен структурой ОД и требуемой глубиной поиска неисправностей. Он накладывает определенные требования на принципы построения и структуру системы контроля и диагностики.
Вид алгоритма (программы) поиска неисправностей существенно влияет на эффективность процесса контроля и диагностики. При разработке алгоритма поиска обычно решают две задачи:
а) определяют наилучший набор контролируемых параметров;
б) получают наилучшую последовательность измерения контролируемых параметров;
Рассмотрим наиболее распространенные методы построения алгоритмов поиска неисправностей в РЭА.
3.1. Метод последовательного функционального анализа
Построение алгоритма поиска неисправностей методом последовательного функционального анализа, заключается в последовательном измерении параметров схемы, начиная «с конца», то есть с выхода устройства, где либо вовсе отсутствует сигнал, либо он находится вне допуска, до тех пор, пока не появится на каком – либо блоке (узле, элементе) сигнал, находящийся в поле допуска. Такой поиск можно проводить и «с начала», с входа устройства. Основные функции, характеризующие исправность ОД, например:
а) электрического питания;
б) приема и преобразования сигналов заданной частоты;
в) управления;
г) генерирования колебаний.
Рассмотрим составление алгоритма поиска неисправностей на примере канала звукового сопровождения телевизора типа УПИМЦТ (Рис. 4). Основной функцией этого канала является усиление и преобразование сигналов звукового сопровождения. Эта функция выполняется, если при входном сигнале с фиксированными параметрами на выходе будет наблюдаться вполне определенный сигнал. В процессе контроля принимается решение об исправности или неисправности канала. Последовательно контролируя сигналы на выходе каждого каскада, можно определить неисправный каскад. Получающуюся при этом схему поиска называют деревом функций (Рис. 5), а решения представляют обычно в виде матрицы:
Табл. 3
Обозначаются по схеме |
Решение |
Р0 |
Канал звука исправен |
Р1 |
Неисправен УЧЗ |
Р2 |
Неисправен РГ |
Р3 |
Неисправен фильтр |
Р4 |
Неисправна ИМС |
Р5 |
Неисправна схема РГ |
Р6 |
Неисправна ИСМ |
Р7 |
Неисправен контур 6,5 МГц |
Р8 |
Неисправен контур частного дискриминатора |
Рис. 5 Схема поиска неисправностей
Данный метод прост, нагляден, требует минимум информации от ОД, однако он не оптимален ни по времени, ни по средним затратам.
3.2. Метод половинного разбиения
Этот метод часто используется в разработке алгоритмов поиска неисправностей в РЭА с последовательно соединенными элементами. Первым для контроля выбирается параметр, делящий всю схему пополам. При положительном результате контроля (сигнал на выходе элемента находится в допуске) следующим для контроля выбирается элемент, делящий неисправную часть схемы пополам и так далее до определения неисправного элемента (блока, узла). Такой алгоритм возможен в том случае, когда вероятности состояний P(Si) одинаковы для всех элементов, стоимости контроля выходных параметров Zi также одинаковы.
В том случае, когда вероятности состояний P(Si) для функциональных элементов неодинаковы, тогда вероятности необходимо первым контролировать такой параметр Zk , который делит ОД на части, вероятности состояния которых близки к 0,5.
Неопределенность состояния ОД до контроля оценивается величиной энтропии
N
H0 = - ∑ P(Si)*log2 P(Si) = log2 N (13)
i=1
Неопределенность состояния ОД при контроле параметра Zk будет:
H(Zk) = - (Pk *log2 Pk + (1- Pk) *log2 (1- Pk)) , (14)
N
где Pk = ∑ P(Si) , i = 1, 2, 3, …
i=1
Величина H(Zk) будет максимальна, если разность (Pk – 0,5) минимальна.
После контроля параметра (Zk) ОД будет разделен на две части: первая содержит K, а вторая (N - K) элементов. При выборе очередного параметра для контроля необходимо вероятности состояний в каждой из этих частей пронормировать, пересчитать по формулам:
k
P'(Si) = P(Si)/ ∑ P(Si) , i = 1, 2, 3, … k (15)
i = 1
N
P" (Si) = P(Si)/ ∑ P(Si) , i = k + 1, k + 2, … , N (16)
i=k+1
При этом
k N
∑ P' (Si) = 1 и ∑ P" (Si) = 1. (17)
i = 1 i=k+1
Тогда вторым параметром выбирается Zll , который делит одну из частей на две, вероятности которых
l
∑P" (Si) = 0,5 (18)
i=1
Такое деление продолжается до тех пор, пока состояние ОД не будет определено с заданной глубиной.
Метод половинного разбиения применим и для случая, когда в ОД неисправно несколько элементов.
3.3. Метод «время-вероятность»
Этот способ находит применение для РЭА, в которой функциональные элементы соединены произвольно и имеют разные вероятности P(Si) состояний и различные стоимости проведения контроля параметров С(Zi). Эффективность метода оценивается средним временем поиска неисправного элемента или средним временем контроля одного параметра. Последовательность контроля параметров устанавливается в порядке уменьшения величины:
P(S1)/ t1> P(S2)/ t2> …> P(SN)/ tN (19)
Располагая в порядке уменьшения величины P(Si)/ti , получим следующую последовательность для контроля параметров:
ZN → … → ZK → … → ZM → … → ZC
3.4. Метод на основе информационного критерия
Метод построения алгоритма поиска неисправностей на основе информационного критерия позволяет выбрать минимальное количество контролируемых параметров и определить последовательность их контроля.
Исходными данными являются функциональная модель и таблица неисправностей.
Предварительно ОД разделяются на N функциональных элементов, вероятности состояний, которых принимаем одинаковыми
P(Si) = P(S1) = P(S2) = …= P(SN) =1/N (20)
Неопределенность состояний ОД до контроля определяется оценивается величиной энтропии
H0 = log2 N (21)
Результат контроля к - го параметра ОД дает некоторое количество информации о его контроле:
IK = H0 - HK (22)
где HK - средняя условная энтропия ОД при условии контроля к - го параметра.
HK = P(Z'K) НZ'K + P(Z0K) НZ0K (23)
P(Z'K) = 1/N ; P(Z0K) = (N – m)/N, (24)
где m – количество единиц в к - ой строке.
HK = log2 m + log2 (N – m) (25)
Контроль к – го параметра дает следующее количество информации:
(26)
Последовательно вычисляем значения IK (где к = 1, N) и по убыванию IK определяем значимость параметра ZK . Первым контролируется параметр ZK , дающий максимальное количество информации.
После контроля первого параметра определяют количество информации, получаемое при контроле каждого n оставшегося параметра относительно состояния, характеризующегося энтропией НZK . Условная энтропия
H(zn/zK) = P(z'n/z'K)*Hz'n/z'K + P(z0n/z0K)*Hz0n/z0K +
+P(z0n/z'K)*Hz0n/z'K + P(z'n/z0K)*Hz'n/z0K (27)
где P(z'n/z'K) = m1/N – вероятность положительного решения при контроле параметра Zn в случае положительного решения при контроле параметра ZK; m1 – количество единиц в n-ой строке таблицы состояний относительно m единиц в к-ой строке; m2 – количество единиц в n-ой строке относительно (N – m) нулей к-ой строки.
(28)
(29)
(30)
Hz'n/z'K = log2 m1 ; (31)
Hz0n/z'K = log2 (m - m1 ) ; (32)
Hz'n/z0K = log2 m2 ; (33)
Hz0n/z0K = log2 (N - m - m2 ) ; (34)
I (zn / zK) = HK – H(zn / zK) . (35)
Выражение для вычисления количества условной информации имеет вид:
(36)
По максимуму условной информации выбирается второй контролируемый параметр. По такой же схеме выбираются все остальные параметры.
После всех расчетов строим схему поиска неисправностей.
Пример 3.4.1
Рис. 6 Функциональная модель ОД
Табл. 4
Zi |
Si |
||||
S1 |
S2 |
S3 |
S4 |
S5 |
|
Z1 |
0 |
1 |
1 |
1 |
1 |
Z2 |
0 |
0 |
0 |
1 |
1 |
Z3 |
1 |
1 |
0 |
1 |
1 |
Z4 |
1 |
1 |
0 |
0 |
1 |
Z5 |
0 |
0 |
0 |
0 |
0 |
Из анализа табл. 4 находим, что контроль параметра Z5 для поиска неисправностей не дает никакой информации, поэтому его можно из дальнейшего рассмотрения исключить. Тогда энтропия (21) до контроля будет
H0 = log2 5 = 2,32
Количество информации (22) при контроле каждого параметра следующее:
I1 =
I2 =
I3 =
I4 =
Для контроля берем Z2 . После его контроля могут быть приняты два решения: значение параметра Z2 в допуске – функциональные элементы 1,2,3 исправны, а неисправность в элементе 4 или 5; (см. Рис. 6); значение параметра Z2 не в допуске - функциональные элементы 4 и 5 исправны, а не исправность в элементах 1, 2, 3 .
В соответствии с этим решением перестраиваем матрицу состояний (табл. 5)
Табл. 5
Zi |
Si |
||||
S4 |
S5 |
S1 |
S2 |
S3 |
|
Z2 |
1 |
1 |
0 |
0 |
0 |
Z1 |
1 |
1 |
0 |
1 |
1 |
Z3 |
1 |
1 |
1 |
1 |
0 |
Z4 |
0 |
1 |
1 |
1 |
0 |
Теперь вычислим количество информации (36), которое дает контроль параметров Z1 , Z3 , Z4 при условии, что Z2 проконтролирован:
Следовательно, вторым для контроля выбираем Z4 . Исключим из табл. 5 строку Z2 (табл. 6)
Табл. 6
Zi |
Si |
||||
S4 |
S5 |
S1 |
S2 |
S3 |
|
Z4 |
0 |
1 |
1 |
1 |
0 |
Z1 |
1 |
1 |
0 |
1 |
1 |
Z3 |
1 |
1 |
1 |
1 |
0 |
В результате построения алгоритма поиска неисправностей в заданном ОД получаем, что для поиска неисправностей достаточно контролировать последовательность из трех параметров (Z2 , Z4 , Z1) по определенной схеме (Рис. 7). Контроль параметра Z4 при условии, что Z2 = 1 дает два решения: если Z4=0, то неисправен элемент 4, если Z4=1, то неисправен элемент 5.
Если Z2 = 0 и Z4 = 0, то неисправен элемент 3 . Если Z2 = 0 и Z4 = 1, то надо контролировать параметр Z1 . Если Z1 = 0, то неисправен элемент 1, если Z1 = 1, то неисправен элемент 2 (Табл. 7).
Табл. 7
Zi |
Si |
||
S4 |
S5 |
S1 |
|
Z4 |
1 |
1 |
0 |
Z1 |
0 |
1 |
1 |
Z3 |
1 |
1 |
0 |
Рис.7 Схема поиска неисправностей
3.5. Инженерный метод
Этот метод построения алгоритмов диагностирования основан на вычислении функции предпочтения. При этом исходными данными являются функциональная модель ОД и таблица неисправностей.
Функция предпочтения выбирается в соответствии с решаемой задачей диагностики и исходными данными. При этом рассматриваются три случая определения перечня параметров:
а) для оценки работоспособности;
б) для поиска неисправностей;
в) для оценки работоспособности и поиска неисправностей.
Функция предпочтения при оценке работоспособности
N
W1= max Wi (Zi) = ∑ S0 (i j) , (37)
i N j=1
где S0 (i j) = 1, если состояние i j–го матричного элемента описывается нулем, и S0 (i j) = 0, если состояние i j–го матричного элемента описывается единицей.
Первым для контроля берут параметр Zi, у которого функция W1 (Zi) имеет максимальное значение. В результате контроля данного параметра матрица состояний делится на две части. В одну часть входят состояния, для которых результаты контроля выбранного параметра имеют положительные, а в другую отрицательные решения. В дальнейшем надо контролировать только первую часть, так как нужно фиксировать только факт исправности или отказа. Для нее аналогичным образом нужно вычислить значения Wi (Zi) и выбрать для контроля параметр по максимуму Wi (Zi).
Пример 3.5.2
Рис. 8 Функциональная модель ОД
Табл. 8
Zi |
Si |
Wi |
|||||
S1 |
S2 |
S3 |
S4 |
S5 |
S6 |
||
Z1 |
0 |
1 |
1 |
1 |
1 |
1 |
1 |
Z2 |
0 |
0 |
1 |
1 |
1 |
1 |
2 |
Z3 |
0 |
0 |
0 |
1 |
1 |
1 |
3 |
Z4 |
0 |
0 |
1 |
0 |
1 |
0 |
4 |
Z5 |
0 |
0 |
0 |
0 |
0 |
0 |
6 |
Z6 |
0 |
1 |
1 |
1 |
1 |
0 |
2 |
Первым для контроля выбираем Z5 по максимуму W1 (Z5). В результате контроля в строке Z5 положительное решение имеет только Z3 , следовательно следующим для контроля следует выбрать Z3 .
Если для ОД известны вероятности состояний Р(Si), то функция предпочтения
W2 = max W2 (Zi) , (38)
i N
N
W2 (Zi) = ∑ P (Si)S0 (i j) , (39)
i =1
Если для ОД известны и стоимости контроля параметров С(Zi), то функция предпочтения
(40)
Рассмотрим составление алгоритма поиска неисправностей. Максимальное количество информации дает контроль параметра, который делит все возможные состояния на две равные части. Тогда функция предпочтения
N N
W4 (Zi) = min | ∑ S0 (i j) - ∑ S1 (i j)| (41)
j =1 j =1
где S1(i j) = 1, если состояние матричного элемента описывается единицей, и S1 (i j) = 0, если состояние матричного элемента описывается нулем, S0 (i j) = 1, если состояние матричного элемента описывается нулем, S0 (i j) = 0, если состояние матричного элемента описывается единицей.
Первым для контроля выбирается параметр, для контроля которого функция предпочтения W4 минимальна. Результаты контроля Zi разделяют матрицу состояний на две части. В первую часть входят состояния, для которых результат контроля отрицателен (на пересечении Zi – SJ стоит нуль), во вторую часть входят состояния, для которых результат контроля положителен. Для полученных частей вновь вычисляют функции предпочтения. По их минимальным значениям выбирают второй контролируемый параметр (при положительном исходе контроля первого выбранного параметра) или третий контролируемый параметр (при отрицательном результате контроля первого выбранного параметра). Совокупность параметров и последовательность их контроля выбирается до тех пор, пока множество N возможных состояний ОД не будет разделено на отдельные различимые состояния с требуемой глубиной поиска.
В случае, когда заданы вероятности состояний P(Si) диагностируемой аппаратуры и стоимости контроля параметров С(Zi) функциональных элементов, функции предпочтения примут вид
N N
W5 (Zi) = min | ∑ P(Si)S0 (i j) - ∑ P(Si)S1 (i j)| (42)
j =1 j =1
N N
W6 (Zi) = min С(Zi) | ∑ P(Si)S0 (i j) - ∑ P(Si)S1 (i j)| (43)
j =1 j =1
Пример 3.5.3
Рис. 9 Функциональная модель ОД
Табл. 9
Zi |
Si |
|||||||
S1 |
S2 |
S3 |
S4 |
S5 |
S6 |
S7 |
S8 |
|
Z1 |
0 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
Z2 |
0 |
0 |
1 |
1 |
1 |
1 |
1 |
0 |
Z3 |
0 |
0 |
0 |
1 |
1 |
1 |
1 |
0 |
Z4 |
0 |
0 |
0 |
0 |
1 |
1 |
1 |
0 |
Z5 |
0 |
0 |
0 |
0 |
0 |
1 |
1 |
0 |
Z6 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
0 |
Z7 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
Z8 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
0 |
Для каждого параметра Zi табл. 9 по формуле (41) определяется значение W4 . Полученные значения записывают в табл. 10 и по минимальному значению выбирают для контроля параметр Z3 .
Табл. 10
В результате контроля параметра Z3 табл. 10 делится на две части: в первую часть входят функциональные элементы 4, 5, 6 и 7, для которых результат контроля Z3 положителен, в другую часть входят функциональные элементы 1, 2, 3 и 8, для которых результат контроля отрицателен, что означает неисправность одного из этих элементов. При поиске неисправностей контролю подлежат обе части матрицы, поэтому каждую часть из них представляем в виде табл. 11, а другую табл. 12. Для каждой из полученных таблиц определяем значения функций предпочтения W4. По минимуму W4 в табл. 11 выбираем для контроля параметр Z1 , в табл. 12 выбираем для контроля параметр Z5 . Аналогичные деления показаны в табл. 13 – 15. Схема поиска неисправностей показана на рис. 10.
Табл. 11
Табл. 12
Табл. 13
Табл. 14
Табл. 15
Рис. 10 Схема поиска неисправностей в диагностируемом устройстве
3.6. Метод на основе иерархического принципа
Построение алгоритмов диагностирования по иерархическому принципу целесообразно использовать для РЭА со встроенными устройствами контроля. При данном методе N первичных функциональных элементов ОД разбиваются к групп по N1 элементов в каждой группе. Выходные параметры первичных функциональных элементов объединяются в одной точке с измерительным устройством и индикатором неисправности. Таких индикаторов будет к штук. Последние еще разбиваются на r групп по N2 штук в каждой группе и т. д. В результате придем к одному индикатору неисправности.
В такой системе при выходе из строя функционального элемента последний индикатор покажет неисправность ОД. Для обнаружения неисправного функционального элемента просматриваются показания индикаторов первой ступени и при обнаружении индикатора, указывающего на неисправность, просматриваются индикаторы следующей ступени, соединенные только с этим индикатором. Проверки проверяются в указанной последовательности до тех пор, пока не будет обнаружен неисправный первичный элемент (рис. 11).
Поиск неисправного первичного функционального элемента по приведенной схеме позволяет значительно сократить время поиска по сравнению с поиском среди N элементов. Минимальное среднее время поиска неисправностей:
(44)
где
P(N) – вероятность пропуска неисправного элемента.
При и достигает максимума при z=4. Тогда количество ступеней иерархии
e = lnN /lnz (45)
Рис. 11 Схема поиска неисправности по иерархическому принципу
3.7. Метод ветвей и границ
Способ построения алгоритма поиска неисправностей методом ветвей и границ используется для синтеза алгоритмов поиска неисправностей в РЭА, функциональная модель, которой представляет собой произвольную структуру. Он позволяет определить наилучшую последовательность поиска среди возможных. Исходными данными являются функциональная модель ОД, таблица неисправностей с вероятностями различных состояний и стоимости контроля выходных параметров функциональных элементов. Целью данного метода является определить такую последовательность контроля параметров, которая будет обладать минимальной средней стоимостью при поиске любого неисправного элемента.
Средняя стоимость произвольной программы поиска неисправностей
или , (46)
где Ci – стоимость контроля i – параметра;
- сумма вероятностей состояний, которые рассматриваются при контроле i – параметра.
Расчет поиска начинается с любого i – параметра, который разбивает всё множество возможных состояний S на два подмножества: S0 (zi) и S1 (zi), соответствующие отрицательному и положительному результатам контроля параметра zi соответственно.
Последовательность контроля остальных параметров из приведенных подмножеств неизвестна, и определить значение средней стоимости алгоритма поиска невозможно. Поэтому значения средней стоимости заменяются их нижними границами Сн(S0) и Сн(S1) при контроле соответствующих параметров в подмножествах S0(zi) и S1(zi). Тогда нижняя граница средней стоимости всей программы поиска, которая начинается с контроля первого параметра, определяется как
(47)
Вычислив нижние границы стоимостей Сн(S0) и Сн(S1) для всех возможных алгоритмов поиска, выбирают первым такой параметр, контроль которого дает минимальную среднюю стоимость нижней границы алгоритма поиска.
Затем для подмножеств S0(zi) и S1(zi) вычисляют нижние границы стоимостей для всех возможных пар контролируемых параметров между первым и оставшимися для каждого подмножества.
Пусть для подмножества S0(zi) контролируется параметр zк , а для подмножества S1(zi) – параметр zj . Тогда нижняя граница средней стоимости программы поиска, начинающейся с контроля i – параметра, будет:
(48)
В общем виде записывается:
(49)
где (50)
(51)
где и - суммы вероятностей в подмножествах и соответственно.
Значения рассчитываются по формулам (46-48) для подмножеств
- подмножество состояний ОД, образующееся при отрицательном результате контроля параметров Ziи Zк;
- подмножество состояний ОД, образующееся при отрицательном результате контроля параметра Ziи положительном результате контроля параметра Zк;
- подмножество состояний ОД, образующееся при положительном результате контроля параметра Zк и отрицательном результате контроля параметра Zi;
- подмножество состояний ОД, образующееся при положительном результате контроля параметром Zк и Zi;
Вторым выбирается такой параметр, при контроле которого обеспечивается минимальная средняя стоимость нижней границы из всех возможностей алгоритмов поиска.
Аналогичным образом выбирают третий параметр и последующие параметры, пока получаемые пи контроле подмножества будут содержать более двух состояний ОД.
Рис. 12 Функциональная модель ОД
Матрица неисправностей и вероятности состояний
Таб.16
Si |
Zi |
Pi |
|||||
Z1 |
Z2 |
Z3 |
Z4 |
Z5 |
Z6 |
||
S1 |
0 |
0 |
1 |
0 |
0 |
0 |
0,2 |
S2 |
1 |
0 |
1 |
0 |
0 |
0 |
0,05 |
S3 |
1 |
1 |
0 |
0 |
1 |
0 |
0,24 |
S4 |
1 |
1 |
1 |
0 |
1 |
0 |
0,15 |
S5 |
1 |
1 |
1 |
1 |
0 |
0 |
0,06 |
S6 |
1 |
1 |
1 |
1 |
1 |
0 |
0,3 |
Пусть первым контролируется параметр Z1. Тогда множество возможных состояний разбивается на два подмножества S0(Z1) и S1(Z1).Для подмножества S0(Z1) последовательность состояний вероятностей будет состоять из одного состояния Р(S1) =0,2 , а подмножества S1(Z1) составим первую последовательность: Р(S2) = 0,05; Р(S5) =0,06; Р(S4) =0,15; Р(S3) =0,24; Р(S6) =0,3. Затем определим сумму двух наименьших вероятностей: Р*1 = 0,05 + 0,06 = 0,1.
Составим вторую последовательность: Р*1 = 0,1; Р(S4) = 0,15; Р(S3) =0,24; Р(S6) =0,03. Затем определим Р*2 = 0,11 + 0,15 = 0,26.
Составим третью последовательность: Р(S3) = 0,24; Р*2 = 0,26; Р(S6) =0,3. Затем определим Р*3 = 0,24 + 0,26 = 0,5.
И наконец, составим четвертую последовательность: Р(S6) =0,3; Р*3 = 0,5 и определим Р*4 = 0,3 + 0,5 = 0,8.
При этом нижняя граница средней стоимости
N 0 6-1-1
Сн(Z1) = С [ ∑ Р(Si) + ∑ Рλ + ∑ Р*ν] = C (1 +0 +1,67) = 2,67 C
i=1 λ=1 ν=1
Следует указать, что если подмножество S0(Zi) содержит одно состояние, то нижняя граница стоимости Сн(S1) = 0.
Разделение множества возможных состояний на два подмножества S0(Z1) и S1(Z1) при контроле параметра Z1 как показано в табл. 16.
При контроле параметра Z2 множество возможных состояний разбивается на два подмножества: S0(Z2) и S1(Z2) (табл. 17).
Таб.17
Si |
Zi |
Pi |
|||||
Z1 |
Z2 |
Z3 |
Z4 |
Z5 |
Z6 |
||
S1 |
0 |
0 |
1 |
0 |
0 |
0 |
S0 (Z2) |
S2 |
1 |
0 |
1 |
0 |
0 |
0 |
|
S3 |
1 |
1 |
0 |
0 |
1 |
0 |
S0 (Z2) |
S4 |
1 |
1 |
1 |
0 |
1 |
0 |
|
S5 |
1 |
1 |
1 |
1 |
0 |
0 |
|
S6 |
1 |
1 |
1 |
1 |
1 |
0 |
Для подмножества S0(Z2) последовательность двух значений вероятностей будет из двух значений: Р(S2) = 0,05 и Р(S1) = 0,2 , и тогда Р*1 = 0,05 + 0,2 = 0,25.
Для подмножества S1(Z2) первая последовательность будет иметь вид Р(S5) =0,06; Р(S4) =0,15; Р(S3) =0,24; Р(S6) = 0,3 , и тогда Р*1 = 0,21; Р*2 = 0,45; Р*3 = 0,75.
Следовательно, нижняя граница средней стоимости при контроле параметра
N 0 6-1-1
Сн(Z2) = С [ ∑ Р(Si) + ∑ Рλ + ∑ Р*ν] = C (1 +0,25 +1,41) = 2,66 C.
i=1 λ=1 ν=1
Поступая аналогичным образом при контроле параметров z3 , z4 и z5 , получим нижние границы стоимости при контроле соответствующих параметров: СН ( z3 ) = 2,59C; СН (z4) = 2,60С; СН (z5) = 2,50С.
Из результатов вычислений нижних границ средней стоимости следует, что минимальной стоимостью будет обладать алгоритм поиска, начинающийся с контроля параметра z5.
Посмотрим матрицу (табл. 18) состояний подмножества:
S0 (z5) и S1 (z5).
Анализируя табл. 18 , видим, что в случае отрицательного исхода при контроле параметра z5 следующими можно контролировать параметры z1 , z2 , z5. Параметр z3 контролировать не имеет смысла, так как подмножество S0(z5) не разбивает при его контроле на более мелкие подмножества. При положительном исходе можно контролировать параметры z3 , z4.
Таким образом, необходимо вычислить значения стоимостей нижних границ алгоритма поиска при контроле таких наборов параметров z5 , z1 , z3 , z5 , z1 , z5 , z2 , z3 , z5 , z2 , z4. Для этого воспользуемся формулой:
,
где
;
Таблица 18
S1 |
ZI |
P(S1) |
||||
Z5 |
Z1 |
Z2 |
Z3 |
Z4 |
||
S1 0 0 0 1 0 0,2 S2 0 1 0 1 0 0,05 S3 0 1 1 1 1 0,06 S4 1 1 1 0 0 0,24 S5 1 1 1 1 0 0,15 S6 1 1 1 1 1 0,3 | ||||||
,
где ∑ Р(SK) и ∑ Р(SJ) суммы вероятностей Р(S) диагностируемого объекта, которые различаются контролем параметров zK и zJ в подмножествах и соответственно.
Вычислим значения стоимостей нижних границ при контроле параметров z5 , z1 , z3 . Контроль параметров z1 позволяет различать состояния S1 , S2 , S5 , следовательно,
∑ P(SK) = Р(S1) + Р(S2) + Р(S2) = 0,2 + 0,05 + 0,06 = 0,31
Также при контроле параметра zI выделяется из подмножества S0(zК) только одно состояние S001 , тогда CН (S001) = 0 , а значения CН (S101) вычисляется аналогичным способом , как и CН (S01) :
К
CН (S101) = С ∑Р*V = С [Р (S2) + Р (S5)] = C (0,05 + 0,06) = 0,11C
При контроле параметра z3 различаются состояния S3 , S4 , S6 , следовательно:
∑ P(SJ) = Р(S3) + Р(S4) + Р(S6) = 0,24 + 0,15 + 0,3 = 0,69
Кроме того, при отрицательном исходе из множеств S1(z5) выделяется только одно состояние, а при положительном – два , следовательно:
CН (S10J) = CН (S103) = 0
К
CН (S11J) = С ∑ Р*V = С [Р (S4) + Р (S6)] = C (0,15 + 0,3) = 0,45C
V
Тогда значение стоимости нижней границы при контроле параметров z5 , z1 , z3 будет равно
CН (z5 , z1 , z3,) = С(1 + 0,31 + 0,11 + 0,69 + 0,45) = 2,56С
При контроле других последовательностей параметров вычисления осуществляются аналогично. Приведем результаты этих вычислений:
CН (z5 , z1 , z4,) = 2,5С
CН (z5 , z2 , z4,) = 2,64С
CН (z5 , z2 , z3,) = 2,7С
Анализ результатов вычислений стоимостей нижних границ показывает, что минимальной стоимостью будет обладать последовательность параметров z5 , z1 , z4.
Таблица19
Преобразуем таблицу неисправностей в соответствии с результатами контроля последовательности параметров z5 , z1 , z4 (табл. 19) .
Из таблицы видно, что при отрицательном исходе контроля параметров z5 и z1 выделяется состояние S1 , а при отрицательном исходе контроля z5 и положительном z1 необходимо следующим контролировать параметр z2 (контроль параметра z3 не позволяет разделить подмножество S01 на более мелкие).
При положительном исходе контроля параметров z5 и z4 выделяется состояние S6 , а при отрицательном исходе контроля параметров z5 и отрицательном z4 необходимо контролировать параметр z3. Поскольку других вариантов нет, на этом заканчивается построение алгоритма поиска неисправностей, обладающего минимальной средней стоимостью (Рис. 13).
Таким образом, последовательность контролируемых параметров z5 , z1, z4, z2 , z3 дает среднюю стоимость ССР = 2,5С.
Рис. 13 Схема алгоритма поиска неисправностей, построенного методом ветвей и границ
3.8. Метод диагностики на основе «белого шума»
Интегральный метод диагностики на основе «белого шума» позволяет определить отклик диагностируемой системы во время ее нормальной работы, то есть без отключения. Известно, что для «белого шума» автокорреляционная функция равна нулю при всех значениях τ, кроме точки τ = 0, где случайная функция умножается сама на себя:
(51)
где Uш1 (t) – напряжение белого шума на входе ОД.
Связь между напряжениями входа и выхода диагностируемой системы через отклик h(t) определяется уравнением
(52)
Известно, что взаимная корреляционная функция входа и выхода системы выражается через автокорреляционную функцию
(53)
После перемены аргументов τ и t получим
(54)
Если на вход системы подать стимулирующее напряжение
δ(t) = U1(t) (55)
то уравнение (52) упрощается и напряжение на выходе системы становится равным отклику диагностируемой аппаратуры:
U2 (t) = h (t) (56)
Из сравнения выражений (52), (53) и (56) следует, что при подаче на вход ОД сигнала в виде «белого шума», корреляционная функция которого является дельта-функцией R11(t) = δ(t), взаимно корреляционная функция входа и выхода будет равна отклику системы:
R12(t) = h (t) (57)
Рис. 14 Схема для определения отклика диагностируемой системы.
Равенство (7) позволяет синтезировать схему (рис.1), которая с помощью коррелятора может определить отклик системы по напряжению «белого шума» на ее входе.
Если на вход подать напряжение Uс1 (t), то на ее выходе получим суммарный сигнал
U2 (t) = Uш2 (t) + Uс2 (t) (58)
где Uс2 (t) – напряжение, которое появляется на выходе контролируемой аппаратуры после прохождения через нее сигнала Uс1 (t), Uш2 (t) – напряжение на выходе аппаратуры.
3.9. Метод диагностики на основе ортогонального анализа отклика системы по базису гармонических функций
Известно, что динамические свойства любой радиотехнической системы можно описать её откликом h(t). Если отклик системы разложить в ряд Фурье и установить аналитическую связь между коэффициентами ряда Фурье для отклика и параметрами диагностируемой системы, то на этой основе можно проводить диагностирование. Отклик любой системы
< (59)
где М и С0 – постоянные положительные действительные числа:
h(t) = 0 при t < 0 и h(t) 0 при t > 0.
Для отклика системы, удовлетворяющего условию (59) можно применить преобразование Лапласа:
(60)
где функция h(t) является оригиналом, а функция Н(р) является изображением функции по Лапласу.
Учитывая условие (59) в формулах (60) можно положить С = 0 и р = jω.
Тогда получим преобразование Фурье:
(61)
Разложение функции h(t) в ряде Фурье в комплексной форме имеет вид:
(62)
где t0 – для отклика h(t);
Сn – комплексные коэффициенты.
(63)
Из сравнения (60) и (63) получаем формулы для определения коэффициентов Фурье:
, при (64)
, при (65)
Используя преобразование Лапласа, можно получить изображение выходного сигнала и передаточной функции.
S2 (P) = S1 (P)*K(p) (66)
Зная параметры элементов системы, можно вычислить её передаточную функцию К(р). Если параметры входного сигнала S1(P) будут неизменными, то любые отклонения параметров системы за допустимые пределы будут отражаться в спектре выходного сигнала.
Связь между параметрами системы и коэффициентами ряда Фурье разложения передаточной функции можно продемонстрировать на примере.
Пример 3.9.5 Передаточная функция видеосигнала.
(67)
где {х} = К, Т1, Т2 – диагностируемые параметры (вторичные).
Решение. Определить вещественную и мнимую часть передаточной функции:
;
;
;
ω = n*ω0 , где n – номер гармоники;
ω0 – частота основной гармоники.
Для определения текущих значений диагностируемых параметров, составим систему уравнений, используя действительную часть передаточной функции:
;
(68)
.
Используя мнимую часть передаточной функции, получим другую систему уравнений:
;
(69)
.
В дальнейшем для упрощения вычислений используем относительные коэффициенты разложения:
В1 = b1/a1 ; B2 = b2/a2 ; …; Bn = bn/a2 . (70)
Используя текущие значения в относительных коэффициентов, составим систему уравнений:
(71)
Систему уравнений приведем к виду:
(72)
Решая систему уравнений (71) и (72) относительно Т1 и Т2 , получим выражения для параметров диагностируемой системы:
(73)
Для определения коэффициента усиления К видеоусилителя воспользуемся уравнением:
. (74)
Отсюда:
. (75)
Полученные значения параметров сравниваются с их номинальными значениями. Параметр, вышедший из допуска, и определяет место неисправности.
4. Сравнительный анализ методов диагностики РЭС
Наиболее простым, но эффективным является инженерный метод, требующий предварительной подготовки разработки функциональной модели, таблицы неисправностей и схемы поиска неисправностей.
Ещё более эффективным, дающим более оптимальный метод диагностик, является метод на основе информационного критерия, так как он дает количественную оценку информации об объекте, получаемую после контроля очередного параметра.
Метод ветвей и границ более оптимален по времени, количеству и последовательному контролю параметров, так как учитывает вероятность отказа отдельных блоков или узлов, но требует довольно значительных вычислений, которые возможно выполнить для сложных устройств только с применением вычислительной техники.
Спектральный метод позволяет определить место отказа по изменению спектра выходного сигнала, но требует значительной подготовительной работы.
5. Искусство диагностики локальных сетей
При диагностировании локальных сетей более длительным и трудоемким является процесс выявления скрытых дефектов оборудования и программного обеспечения (далее - ПО), а также оценка качества архитектурного решения сети.
Скрытые дефекты - это такие дефекты, которые проявляются нерегулярно. Они имеют особенность проявляться в самые неподходящие моменты. Пока сеть невелика, скрытые дефекты проявляются редко и на них не обращают особого внимания. При расширении сети и увеличении ее загруженности вероятность проявления скрытых дефектов растет.
Существуют два основных подхода к выявлению скрытых дефектов и оценке качества архитектуры локальной сети: пассивная диагностика и стрессовое тестирование.
Метод пассивной диагностики состоит в постоянном наблюдении за состоянием сети и регистрации изменений в ее поведении. Он основан на использовании специальных средств пассивного наблюдения за работой сети: анализаторов протоколов или программ на основе протокола SNMP. Этот метод получил очень широкое распространение, и сегодня уже существуют диагностические средства, содержащие встроенную экспертную систему, которая упрощает процесс диагностики.
Метод стрессового тестирования состоит в создании в сети большой нагрузки и проверке ее работоспособности в этих экстремальных условиях. Метод стрессового тестирования дополняет метод пассивной диагностики. Он позволяет проверить сеть в экстремальных условиях эксплуатации и построить "систему координат", облегчающую интерпретацию данных, полученных в результате пассивной диагностики. Обычно метод стрессового тестирования используется на этапе пуско-наладки сети и после существенных модификаций ее архитектуры или топологии. Метод пассивной диагностики целесообразно использовать в процессе эксплуатации сети после уже проведенного стрессового тестирования.
Одной из наиболее распространенных причин плохой работы локальной сети является стихийное развитие ее кабельного хозяйства из-за отсутствия стратегии ее расширения. Часто локальная сеть создается в условиях жесткой экономии средств, что сказывается на принимаемых технических решениях.
Пользователи переезжают из одного помещения в другое, и локальная сеть охватывает все большее число помещений. При некотором критическом числе станций в сети появляются сбои. Техническое решение, которое было приемлемо для малой сети, становится тормозом ее развития или причиной сбоев.
Очень многих проблем в сети можно избежать, если качественно провести тестирование сети на этапе ее приемки у системного интегратора. Прежде всего, это относится к сертификации кабельного хозяйства на соответствие стандартам и тестированию сетевого оборудования на наличие скрытых дефектов.
Лучше всего проводить тестирование "стрессовым" методом. На практике тестирование сети на этапе приемки проводится очень редко. В результате пользователь может получить сеть со скрытыми дефектами. Скрытые дефекты редко проявляются сразу после начала эксплуатации сети, так как на начальных этапах нагрузка в сети мала. Дефект может проявиться значительно позже, создав у пользователя впечатление, что он явился следствием каких-то модификаций в сети.
Очень много проблем в локальных сетях связано с плохим качеством кабельной системы питания компьютеров и сетевого оборудования. Особенно сильно качество кабельной системы питания сказывается на работе сетей, построенных на коаксиальных кабелях. Наиболее типичными дефектами кабельной системы электропитания являются: отсутствие общего единого контура заземления, отсутствие выделенной системы электроснабжения для компьютеров, подключенных к локальной сети, "решетчатая", а не радиальная топология проводов заземления (т. е. наличие множества точек заземления) и другие.
6. Организация процесса диагностики сети
На качество работы сети значительное влияние оказывает состояние активного оборудования (сетевых плат, концентраторов, коммутаторов), качество оборудования сервера и настройки сетевой операционной системы. Кроме того, функционирование сети существенно зависит от алгоритмов работы эксплуатируемого в ней прикладного ПО (далее – ППО).
Именно качество работы ППО в сети оказывается определяющим, с точки зрения пользователей. Все прочие критерии, такие как число ошибок передачи данных, степень загруженности сетевых ресурсов, производительность оборудования и т. п., являются вторичными.
Основных причин неудовлетворительной работы ППО в сети может быть несколько: повреждения кабельной системы, дефекты активного оборудования, перегруженность сетевых ресурсов (канала связи и сервера), ошибки самого ППО.
Часто одни дефекты сети маскируют другие. Таким образом, чтобы достоверно определить, в чем причина неудовлетворительной работы прикладного ПО, локальную сеть требуется подвергнуть комплексной диагностике.
Комплексная диагностика предполагает выполнение следующих этапов (работ):
1) выявление дефектов физического уровня сети: кабельной системы, системы электропитания активного оборудования; наличия шума от внешних источников;
2) измерение текущей загруженности канала связи сети и определение влияния величины загрузки канала связи на время реакции прикладного ПО;
3) измерение числа коллизий в сети и выяснение причин их возникновения;
4) измерение числа ошибок передачи данных на уровне канала связи и выяснение причин их возникновения;
5) выявление дефектов архитектуры сети;
6) измерение текущей загруженности сервера и определение влияния степени его загрузки на время реакции ППО;
7) выявление дефектов ППО, следствием которых является неэффективное использование пропускной способности сервера и сети.
Рассмотрим первые четыре этапа комплексной диагностики локальной сети связи, а именно: диагностику канального уровня сети. Несмотря на важность этой проблемы, ее решение тривиально и однозначно: полноценно кабельная система может быть протестирована только специальным прибором - кабельным сканером. Другого способа не существует. Нет смысла заниматься трудоемкой процедурой выявления дефектов сети, если их можно локализовать одним нажатием клавиши AUTOTEST на кабельном сканере. При этом прибор выполнит полный комплекс тестов на соответствие кабельной системы сети выбранному стандарту.
Режим AUTOTEST не позволяет проверить уровень шума создаваемого внешним источником в кабеле. Это может быть шум от люминесцентной лампы, силовой электропроводки, сотового телефона, мощного копировального аппарата и др. Для определения уровня шума кабельные сканеры имеют, как правило, специальную функцию. Поскольку кабельная система сети полностью проверяется только на этапе ее инсталляции, а шум в кабеле может возникать непредсказуемо, нет полной гарантии того, что шум проявится именно в период полномасштабной проверки сети на этапе ее инсталляции.
При проверке сети кабельным сканером вместо активного оборудования к кабелю подключаются с одного конца - сканер, с другого - инжектор. После проверки кабеля сканер и инжектор отключаются, и подключается активное оборудование: сетевые платы, концентраторы, коммутаторы.
Если сеть имеет архитектуру с компактной магистралью и в качестве магистрали используется коммутатор, то анализатор необходимо подключать к тем портам коммутатора, через которые проходит анализируемый трафик. Некоторые программы имеют специальные агенты или зонды, устанавливаемые на компьютерах, подключенных к удаленным портам коммутатора. Обычно агенты представляют собой сервис или задачу, работающую в фоновом режиме на компьютере пользователя. Как правило, агенты потребляют мало вычислительных ресурсов и не мешают работе пользователей, на компьютерах которых они установлены. Анализаторы и агенты могут быть подключены к коммутатору двумя способами. При первом способе (Рис. 15) анализатор подключается к специальному порту (порту мониторинга или зеркальному порту) коммутатора, если таковой имеется, и на него по очереди направляется трафик со всех интересующих портов коммутатора.
Рис.15 Зеркальный трафик со всех портов коммутатора по очереди направляется на порт коммутатора, к которому подключен анализатор протоколов.
Если в коммутаторе специальный порт отсутствует, то анализатор (или агент) следует подключать к портам интересующих доменов сети в максимальной близости к наиболее подозрительным станциям или серверу. Иногда это может потребовать использования дополнительного концентратора. Обычно данный способ предпочтительнее первого. Исключение составляет случай, когда один из портов коммутатора работает в полнодуплексном режиме. Если это так, то порт предварительно необходимо перевести в полудуплексный режим.
Иногда для диагностики домена сервера используется дополнительный концентратор (Рис. 16).
В этом случае:
1) анализатор протоколов должен иметь встроенную функцию генерации трафика;
2) анализатор протоколов должен уметь "прореживать" принимаемые кадры, т. е. принимать не все кадры подряд, а, например, каждый пятый или каждый десятый с обязательной последующей аппроксимацией полученных результатов. Если эта функция отсутствует, то при сильной загруженности сети, какой бы производительностью ни обладал компьютер, на котором установлен анализатор, последний будет "зависать" и/или терять кадры.
Рис.16 Анализатор протоколов и удаленные агенты контролируют основные домены сети.
7. Измерение утилизации сети и установление корреляции между замедлением работы сети и перегрузкой канала связи
Утилизация канала связи сети - это процент времени, в течение которого канал связи передает сигналы, или иначе - доля пропускной способности канала связи, занимаемой кадрами, коллизиями и помехами.
Параметр "Утилизация канала связи" характеризует величину загруженности сети.
Канал связи сети является общим сетевым ресурсом, поэтому его загруженность влияет на время реакции ППО. Первоочередная задача состоит в определении наличия взаимозависимости между плохой работой ППО и утилизацией канала связи сети.
Чтобы определить, какова же максимально допустимая утилизация канала связи в данном конкретном случае, рекомендуется следовать приведенным ниже правилам:
Правило 7.1 Если в сети Ethernet в любой момент времени обмен данными происходит не более чем между двумя компьютерами, то любая сколь угодно высокая утилизация сети является допустимой.
Сеть Ethernet устроена таким образом, что если два компьютера одновременно конкурируют друг с другом за захват канала связи, то через некоторое время они синхронизируются друг с другом и начинают выходить в канал связи строго по очереди. В таком случае коллизий между ними практически не возникает.
Если рабочая станция и сервер обладают высокой производительностью, и между ними идет обмен большими порциями данных, то утилизация в канале связи может достигать 80-90% (особенно в пакетном режиме - burst mode). Это абсолютно не замедляет работу сети, а наоборот, свидетельствует об эффективном использовании ее ресурсов ППО.
Таким образом, если в сети утилизация канала связи высока, необходимо определить, сколько компьютеров одновременно ведут обмен данными. Это можно сделать, например, собрав и декодировав пакеты в интересующем канале в период его высокой утилизации.
Правило 7.2 Высокая утилизация канала связи сети только в том случае замедляет работу конкретного ППО, когда именно канал связи является "узким местом" для работы данного конкретного ПО.
Кроме канала связи узкие места в системе могут возникнуть из-за недостаточной производительности или неправильных параметров настройки сервера, низкой производительности рабочих станций, неэффективных алгоритмов работы самого ППО.
Правило 7.3 Максимально допустимая утилизация канала связи зависит от протяженности сети.
При увеличении протяженности домена сети допустимая утилизация уменьшается. Чем больше протяженность домена сети, тем позже будут обнаруживаться коллизии.
Если протяженность домена сети мала, то коллизии будут выявлены станциями еще в начале кадра, в момент передачи преамбулы. Если протяженность сети велика, то коллизии будут обнаружены позже - в момент передачи самого кадра. В результате накладные расходы на передачу пакета (IP или IPX) возрастают.
Чем позже выявлена коллизия, тем больше величина накладных расходов и большее время тратится на передачу пакета. В результате время реакции ППО, хотя и незначительно, но увеличивается.
Выводы. Если в результате проведения диагностики сети выявлена, что причина медленной работы ППО - в перегруженности канала связи, то архитектуру сети необходимо изменить. Число станций в перегруженных доменах сети следует уменьшить, а станции, создающие наибольшую нагрузку на сеть, подключить к выделенным портам коммутатора.
8. Измерение числа коллизий в сети
Если две станции домена сети одновременно ведут передачу данных, то в домене возникает коллизия. Коллизии бывают трех типов: местные, удаленные, поздние.
Местная коллизия (local collision) - это коллизия, фиксируемая в домене, где подключено измерительное устройство, в пределах передачи преамбулы или первых 64 байт кадра, когда источник передачи находится в домене. Алгоритмы обнаружения местной коллизии для сети на основе витой пары (10BaseT) и коаксиального кабеля (10Base2) отличны друг от друга.
В сети 10Base2 передающая кадр станция определяет, что произошла локальная коллизия по изменению уровня напряжения в канале связи (по его удвоению). Обнаружив коллизию, передающая станция посылает в канал связи серию сигналов о заторе (jam), чтобы все остальные станции домена узнали, что произошла коллизия. Результатом этой серии сигналов оказывается появление в сети коротких, неправильно оформленных кадров длиной менее 64 байт с неверной контрольной последовательностью CRC. Такие кадры называются фрагментами (collision fragment или runt).
В сети 10BaseT станция определяет, что произошла локальная коллизия, если во время передачи кадра она обнаруживает активность на приемной паре (Rx). Удаленная коллизия (remote collision) - это коллизия, которая возникает в другом физическом сегменте сети (т. е. за повторителем). Станция узнает, что произошла удаленная коллизия, если она получает неправильно оформленный короткий кадр с неверной контрольной последовательностью CRC, и при этом уровень напряжения в канале связи остается в установленных пределах (для сетей 10Base2).
Для сетей 10BaseT/100BaseT показателем является отсутствие одновременной активности на приемной и передающей парах (Tx и Rx).
Поздняя коллизия (late collision) - это местная коллизия, которая фиксируется уже после того, как станция передала в канал связи первые 64 байт кадра.
В сетях 10BaseT поздние коллизии часто фиксируются измерительными устройствами как ошибки CRC. Если выявление локальных и удаленных коллизий, как правило, еще не свидетельствует о наличии в сети дефектов, то обнаружение поздних коллизий - это явное подтверждение наличия дефекта в домене. Чаще всего это связано с чрезмерной длиной линий связи или некачественным сетевым оборудованием.
Помимо высокого уровня утилизации канала связи коллизии в сети Ethernet могут быть вызваны дефектами кабельной системы и активного оборудования, а также наличием шумов. Даже если канал связи не является узким местом системы, коллизии несущественно, но замедляют работу ППО. Причем основное замедление вызывается не столько самим фактом необходимости повторной передачи кадра, сколько тем, что каждый компьютер сети после возникновения коллизии должен выполнять алгоритм отката (backoff algorithm): до следующей попытки выхода в канал связи ему придется ждать случайный промежуток времени, пропорциональный числу предыдущих неудачных попыток. В этой связи важно выяснить, какова причина коллизий - высокая утилизация сети или "скрытые" дефекты сети. Чтобы это определить, рекомендуется придерживаться следующих правил.
Правило 8.1 Не все измерительные приборы правильно определяют общее число коллизий в сети.
Практически все чисто программные анализаторы протоколов фиксируют наличие коллизии только в том случае, если они обнаруживают в сети фрагмент, т. е. результат коллизии. При этом наиболее распространенный тип коллизий - происходящие в момент передачи преамбулы кадра (т. е. до начального ограничителя кадра (SFD)) - программные измерительные средства не обнаруживают, так уж устроен набор микросхем сетевых плат Ethernet. Наиболее точно коллизии обнаруживают аппаратные измерительные приборы, например LANMeter компании Fluke.
Правило 8.2 Высокая утилизация канала связи не всегда сопровождается высоким уровнем коллизий.
Уровень коллизий будет низким, если в сети одновременно работает не более двух станций или если небольшое число станций одновременно ведут обмен длинными кадрами (что особенно характерно для пакетного режима). В этом случае до начала передачи кадра станции "видят" несущую в канале связи, и коллизии редки.
Правило 8.3 Признаком наличия дефекта в сети служит такая ситуация, когда невысокая утилизация канала (менее 30%) сопровождается высоким уровнем коллизий (более 5%).
Если кабельная система предварительно была протестирована сканером, то наиболее вероятной причиной повышенного уровня коллизий является шум в линии связи, вызванный внешним источником, или дефектная сетевая плата, неправильно реализующая алгоритм доступа к среде передачи (CSMA/CD).
Правило 8.4 При диагностике сети 10BaseT все коллизии должны фиксироваться как удаленные, если анализатор протоколов не создает трафика.
Если пассивно (без генерации трафика) наблюдать за сетью 10BaseT и физический сегмент в месте подключения анализатора (измерительного прибора) исправен, то все коллизии должны фиксироваться как удаленные.
Если тем не менее вы видите именно локальные коллизии, то это может означать одно из трех: физический сегмент сети, куда подключен измерительный прибор, неисправен; порт концентратора или коммутатора, куда подключен измерительный прибор, имеет дефект, или измерительный прибор не умеет различать локальные и удаленные коллизии.
Правило 8.5 Коллизии в сети могут быть следствием перегруженности входных буферов коммутатора.
Следует помнить, что коммутаторы при перегруженности входных буферов эмулируют коллизии, дабы "притормозить" рабочие станции сети. Этот механизм называется "управление потоком" (flow control).
Правило 8.6 Причиной большого числа коллизий (и ошибок) в сети может быть неправильная организация заземления компьютеров, включенных в локальную сеть.
Если компьютеры, включенные в сеть не имеют общей точки заземления (зануления), то между корпусами компьютеров может возникать разность потенциалов. В персональных компьютерах "защитная" земля объединена с "информационной" землей. Поскольку компьютеры объединены каналом связи локальной сети, разность потенциалов между ними приводит к возникновению тока по каналу связи. Этот ток вызывает искажение информации и является причиной коллизий и ошибок в сети. Такой эффект получил название ground loop или inter ground noise.
Аналогичный эффект возникает в случае, когда сегмент коаксиального кабеля заземлен более чем в одной точке. Это часто случается, если Т-соединитель сетевой платы соприкасается с корпусом компьютера.
9. Измерение числа ошибок на канальном уровне сети
В сетях Ethernet наиболее распространенными являются следующие типы ошибок.
Короткий кадр - кадр длиной менее 64 байт (после 8-байтной преамбулы) с правильной контрольной последовательностью.
Наиболее вероятная причина появления коротких кадров - неисправная сетевая плата или неправильно сконфигурированный или испорченный сетевой драйвер.
Длинный кадр (long frame) - кадр длиннее 1518 байт.
Длинный кадр может иметь правильную или неправильную контрольную последовательность. В последнем случае такие кадры обычно называют jabber. Фиксация длинных кадров с правильной контрольной последовательностью указывает чаще всего на некорректность работы сетевого драйвера; фиксация ошибок типа jabber - на неисправность активного оборудования или наличие внешних помех.
Ошибки контрольной последовательности (CRC error) - правильно оформленный кадр допустимой длины (от 64 до 1518 байт), но с неверной контрольной последовательностью (ошибка в поле CRC).
Ошибка выравнивания (alignment error) - кадр, содержащий число бит, не кратное числу байт.
Впервые данный термин был введен компанией Fluke с целью дифференциации различий между удаленными коллизиями и шумами в канале связи.
В соответствии с общепринятым стандартом дефакто число ошибок канального уровня не должно превышать 1% от общего числа переданных по сети кадров. Как показывает опыт, эта величина перекрывается только при наличии явных дефектов кабельной системы сети. При этом многие серьезные дефекты активного оборудования, вызывающие многочисленные сбои в работе сети, не проявляются на канальном уровне сети.
Правило 9.1 Прежде чем анализировать ошибки в сети, необходимо выяснить, какие типы ошибок могут быть определены сетевой платой и драйвером платы на компьютере, где работает программный анализатор протоколов.
Работа любого анализатора протоколов основана на том, что сетевая плата и драйвер переводятся в режим приема всех кадров сети (promiscuous mode). В этом режиме сетевая плата принимает все проходящие по сети кадры, а не только широковещательные и адресованные непосредственно к ней, как в обычном режиме. Анализатор протоколов всю информацию о событиях в сети получает именно от драйвера сетевой платы, работающей в режиме приема всех кадров.
Не все сетевые платы и сетевые драйверы предоставляют анализатору протоколов идентичную и полную информацию об ошибках в сети. Сетевые платы 3Com вообще никакой информации об ошибках не выдают. Если установить анализатор протоколов на такую плату, то значения на всех счетчиках ошибок будут нулевыми.
EtherExpress Pro компании Intel сообщают только об ошибках CRC и выравнивания.
Сетевые платы компании SMC предоставляют информацию только о коротких кадрах.
Сетевые карты D-Link (например, DFE-500TX) и Kingstone (например, KNE 100TX) сообщают полную, а при наличии специального драйвера - даже расширенную, информацию об ошибках и коллизиях в сети.
Ряд разработчиков анализаторов протоколов предлагают свои драйверы для наиболее популярных сетевых плат.
Правило 9.2 В пределах одного домена сети (collision domain) тип и число ошибок, фиксируемых анализатором протоколов, зависят от места подключения измерительного прибора.
Другими словами, в пределах сегмента коаксиального кабеля, концентратора или стека концентраторов картина статистики по каналу может зависеть от места подключения измерительного прибора.
Одна и та же помеха может вызвать фиксацию ошибки CRC, блика, удаленной коллизии или вообще не обнаруживаться в зависимости от взаимного расположения источника помех и измерительного прибора
Одна и та же коллизия может фиксироваться как удаленная или поздняя в зависимости от взаимного расположения конфликтующих станций и измерительного прибора. Кадр, содержащий ошибку CRC на одном концентраторе стека, может быть не зафиксирован на другом концентраторе того же самого стека.
Правило 9.3 Для выявления ошибок на канальном уровне сети измерения необходимо проводить на фоне генерации анализатором протоколов собственного трафика.
Генерация трафика позволяет обострить имеющиеся проблемы и создает условия для их проявления. Трафик должен иметь невысокую интенсивность (не более 100 кадров/с) и способствовать образованию коллизий в сети, т. е. содержать короткие (<100 байт) кадры.
При выборе анализатора протоколов или другого диагностического средства внимание следует обратить прежде всего на то, чтобы выбранный инструмент имел встроенную функцию генерации трафика задаваемой интенсивности. Эта функция имеется, в частности, в анализаторах Observer компании Network Instruments и NetXray компании Cinco (ныне Network Associates).
Правило 9.4 Если наблюдаемая статистика зависит от места подключения измерительного прибора, то источник ошибок, скорее всего, находится на физическом уровне данного домена сети (причина - дефекты кабельной системы или шум внешнего источника).
В противном случае источник ошибок расположен на канальном уровне (или выше) или в другом, смежном, домене сети.
Правило 9.5 Если доля ошибок CRC в общем числе ошибок велика, то следует определить длину кадров, содержащих данный тип ошибок.
При большой доле ошибок CRC в общем числе ошибок целесообразно выяснить причину их появления. Для этого ошибочные кадры из серии надо сравнить с аналогичными хорошими кадрами из той же серии. Если ошибочные кадры будут существенно короче хороших, то это, скорее всего, результаты коллизий. Если ошибочные кадры будут практически такой же длины, то причиной искажения, вероятнее всего, является внешняя помеха. Если же испорченные кадры длиннее хороших, то причина кроется, вероятнее всего, в дефектном порту концентратора или коммутатора, которые добавляют в конец кадра "пустые" байты.
Сравнить длину ошибочных и правильных кадров проще всего посредством сбора в буфер анализатора серии кадров с ошибкой CRC.
Правило 9.6 Если сеть диагностируется впервые и в ней наблюдаются проблемы, то не следует ожидать, что в сети дефектен только один компонент.
Наиболее надежным способом локализации дефектов является поочередное отключение подозрительных станций, концентраторов и кабельных трасс, тщательная проверка топологии линий заземления компьютеров (особенно для сетей 10Base2).
Если сбои в сети происходят в непредсказуемые моменты времени, не связанные с активностью пользователей, проверьте уровень шума в кабеле с помощью кабельного сканера. При отсутствии сканера визуально убедитесь, что кабель не проходит вблизи сильных источников электромагнитного излучения: высоковольтных или сильноточных кабелей, люминесцентных ламп, электродвигателей, копировальной техники и т. п.
Правило 9.7 Отсутствие ошибок на канальном уровне еще не гарантирует того, что информация в сети не искажается.
Следствием ошибок нижнего уровня является повторная передача кадров. Благодаря высокой скорости сети Ethernet (особенно Fast Ethernet) и высокой производительности современных компьютеров, ошибки нижнего уровня не оказывает существенного влияния на время реакции ППО. На самом деле, очень редко встречаются случаи, когда ликвидация только ошибок нижних (канального и физического) уровней сети позволяла существенно улучшить время реакции ППО. В основном проблемы были связаны с серьезными дефектами кабельной системы сети.
Значительно большее влияние на работу ППО в сети оказывают такие ошибки, как бесследное исчезновение или искажение информации в сетевых платах, маршрутизаторах или коммутаторах при полном отсутствии информации об ошибках нижних уровней. Здесь употребляется слово "информация", так как в момент искажения данные еще не оформлены в виде кадра. Причина таких дефектов в следующем. Информация искажается (или исчезает) "в недрах" активного оборудования - сетевой платы, маршрутизатора или коммутатора. При этом приемо-передающий блок этого оборудования вычисляет правильную контрольную последовательность (CRC) уже искаженной ранее информации, и корректно оформленный кадр передается по сети. Ошибок в этом случае, естественно, не фиксируется.
Иногда кроме искажения наблюдается исчезновение информации. Чаще всего оно происходит на дешевых сетевых платах или на коммутаторах Ethernet-FDDI. Механизм исчезновения информации в последнем случае понятен В ряде коммутаторов Ethernet-FDDI обратная связь быстрого порта с медленным (или наоборот) отсутствует, в результате другой порт не получает информации о перегруженности входных/выходных буферов быстрого (медленного) порта. В этом случае при интенсивном трафике информация на одном из портов может пропасть.
Если же защита не установлена, то поведение ППО может быть непредсказуемым.
Помимо замены (отключения) подозрительного оборудования выявить такие дефекты можно двумя способами:
1) первый способ заключается в захвате, декодировании и анализе кадров от подозрительной станции, маршрутизатора или коммутатора. Признаком описанного дефекта служит повторная передача пакета IP или IPX, которой не предшествует ошибка нижнего уровня сети. Некоторые анализаторы протоколов и экспертные системы упрощают задачу, выполняя анализ трассы или самостоятельно вычисляя контрольную сумму пакетов.
2) Вторым способом является метод стрессового тестирования сети.
Выводы. Основная задача диагностики канального уровня сети - выявить наличие повышенного числа коллизий и ошибок в сети и найти взаимосвязь между числом ошибок, степенью загруженности канала связи, топологией сети и местом подключения измерительного прибора. Все измерения следует проводить на фоне генерации анализатором протоколов собственного трафика.
Если установлено, что повышенное число ошибок и коллизий не является следствием перегруженности канала связи, то сетевое оборудование, при работе которого наблюдается повышенное число ошибок, следует заменить.
Если не удается выявить взаимосвязи между работой конкретного оборудования и появлением ошибок, то необходимо провести комплексное тестирование кабельной системы, проверьте уровень шума в кабеле, топологию линий заземления компьютеров, качество питающего напряжения.
10. Программные средства диагностики
10.1. Команда NET DIAGS
Используется для интерактивной загрузки утилиты диагностики сети.
NET DIAGS
Утилита диагностики Personal NetWare (Network Diagnostics utility) позволяет отслеживать операции сети. Эта информация представляет в основном интерес для тех пользователей, которые хорошо понимают функции сети.
В частности, она позволяет просматривать и отслеживать другие группы в сети, сравнивать трафик клиентов и серверов, сравнивать использование серверов, информацию о диске клиента, просматривать информацию о конфигурации, статистику по серверам и клиентам, а также тестировать подключения сервера и клиента.
Утилита сетевой диагностики имеет версии для DOS и MS Windows, которые имеют аналогичные функции, однако некоторые средства уникальны и имеются только в версии для DOS.
По умолчанию диагностика сети разрешается при ее инсталляции. Чтобы запретить или вновь разрешить ее после запрещения, используйте утилиту SETUP. Эта утилита автоматически добавляет в файл NET.CFG вашего компьютера команду VLM=NMR.VLM. При включении этой команды при запуске операционной системы автоматически запускается модуль Network Management Responder.
В Windows утилита сетевой диагностики имеет графический интерфейс. Для доступа к ней откройте в Program Manager группу Personal NetWare и выберите пиктограмму Network Diagnostics. Выводится окно NetWork Diagnostics.
Версия для DOS имеет все диагностические средства, включенные в версию для Windows, а также некоторые дополнительные средства. Для доступа к ним наберите в ответ на системную подсказку команду:
PNWDIAGS или NET DIAGS
Выводится основное меню. Здесь дополнительное средство Select Data позволяет просмотреть другую рабочую группу сети и управлять именами сетевых файлов не выходя из своей рабочей группы. Save LANalyzer Name File позволяет сохранять файлы, созданные с помощью Associate Network Names, как файлы, доступные для просмотра в LANalyzer for Windows.
Для просмотра активности другой рабочей группы выберите в основном меню Select a Workgroup и в выводимом списке рабочих групп задайте нужную. В списке могут выводиться не все рабочие группы. Для поиска нужной группы используйте команду NET WGFIND.
Для просмотра доступны все сегменты сети. Каждая сеть идентифицируется уникальным шестнадцатеричным номером. Для просмотра другой сети выберите в основном меню Select Data и в меню Data Selection Items пункт Select a Network. Выводится список доступных сетевых номеров. Выберите в нем нужную сеть, вернитесь в основное меню и выберите View Configuration. В этом случае все компьютеры (узлы) сети, включая клиентов и серверы показывают только имена узлов. Associate Network Names option позволяет вывести их имена.
Для получения сетевых имен выберите в основном меню Select Data, а в меню Data Selection Items - Select a Network. Выберите сеть и Associate Network Names в меню Data Selection Items. Затем выберите в меню Network Names пункт Find Diagnostics User Names. Для просмотра имен, связанных с каждым узлом, необходимо вернуться в основное меню и выберите View Configuration.
Информация о сетевом трафике позволяет вам выявить причины возникших проблем или перегрузки конкретного компьютера. Эту информацию вы можете получить с помощью Compare Data и Select Nodes. В меню Compare Options выберать Traffic. Для выхода нажать Esc.
Просматривая информацию об использовании сервера Server utilization, видно отношение обрабатываемых компьютером локальных запросов к удаленным и фактическое число обработанных сервером пакетов. Это помогает распределять системные ресурсы. Кроме этого видно информация о подключении, число открытых файлов и активность сервера. Для получения этой информации в меню Compare Options выбрать Local/Remote Utilization или Server Utilization. F1 выводит справочный экран.
Выбор в меню Compare Options пунктов Resource Distribution или Resource Efficiency позволяет получить данные об использова- нии дисков. С помощью Select View Statistics вы можете выбрать нужные узлы сети и просмотреть статистику по ним, а Choose Test Connections выводит меню Connection Tests и дает возможность про- верить связь между выбранными компьютерами сети (пункт Point to point) или все связи между всеми компьютерами.
10.2. ScanLink
Программа ScanLink предназначена для обработки информации, накопленной прибором в процессе тестирования кабельных сетей. Оно легко устанавливается на любую рабочую станцию. Передача данных из прибора осуществляется через последовательный порт, для чего он комплектуется соответствующим шнуром. Выбором пункта "Upload" данные загружаются в компьютер и сортируются согласно дате проведения тестов. После этого можно удалить информацию из прибора. Программа способна печатать на принтер табличные отчеты, и отчеты для сертификации сетей. Дополнительно ScanLink имеет возможность сохранять данные в стандарте CSV, для обработки информации в таких программах, как Exel, Access и Word, и создавать произвольные для них шаблоны.
11. Аппаратные средства диагностики
11.1. MICROSCANNER (8200)
Когда производится новая инсталяция кабеля типа "Витая пара", необходимо работать быстро и рационально, чтобы выполнить работу качественно и в срок.
MICROSCANNER - всецелевой, доступный, миниатюрный кабельный тестер, позволяющий проверять целостность кабеля.
Компания Microtest разработала данный тестер для решения проблемы быстрого и комплексного тестирования кабеля типа "Витая пара". Использование данного прибора позволяет экономить деньги и время, за счет сверхбыстрого теста на целостность и структуру кабеля. Разводка кабеля позволяет определить правильно ли проложена трасса 10BASE-T, Token Ring и другие системы на основе кабеля типа "Витая пара". При тестировании прибор выдает информацию об открытых парах, разрывах, замыканиях.
Помимо этого тестер способен определять длину исследуемого кабеля и расстояние до разрыва или замыкания. На дисплее отображается информация по длине каждой пары в кабеле, а также сообщается, если кабель подключен к хабу. Вы можете быть абсолютно спокойны за точность предоставляемой вам информации, поскольку прибор использует технологию Time Domain Reflectometry (TDR) и может быть откалиброван для определенной скорости распространения сигнала в кабеле.
MICROSCANNER - уникальный кабельный тестер в своем классе, использующий TDR, за счет чего получает большую точность измерения длин.
MICROSCANNER' позволяет прозванивать кабель в стенах офиса, а также идентифицировать линки с помощью прилагающихся так называемых офисных заглушек.
Прибор обладает высочайшей точностью, в нем сконцентрирован все знания и опыт компании Microtest по тестированию и сертифицированию кабельных систем. Сканер позволяет выполнять следующие измерения:
Тестирование всех комбинаций пар кабеля на 100 МГц.
Измерение параметра NEXT (Near-End Crosstalk).
Измерение параметра затухания.
Вычисление параметра ACR (Attenuation-to-Crosstalk Radio).
Кроме того прибор позволяет графический мониторинг трафика сети.
Пересылать информацию о результатах тестирования.
Программировать запас качества по тестируемым параметрам Программировать процедуру автотестирования.
Хранить до 500 результатов автотестирования Модернизировать ПЗУ.
Прибор оснащен сменными аккумуляторами, жидкокристалическим графическим дисплеем с подсветкой и встроенной системой online-help.
Сканер позволяет производить упрощенное быстрое тестирование (Smallest) на соответствие 5-ой категории.
Существуют два варианта сканера. Имея PentaScanner+ с SuperInjector+ вы сможете быстро и точно производить измерения в одну сторону. Однако если вы собираетесь легко и удобно тестировать такие параметры как NEXT и ACR с обоих концов линка одновременно, вам скорее всего необходим PentaScanner+ с 2-Way Injector+ 3.CertiFiber(8250-00)
CertiFiber - первый в мире тестер многомодового оптического кабеля, представленный компанией Microtest, законодателем мод на рынке тестирующего оборудования. Необходимо только выбрать стандарт волокна и нажать на клавишу автотестирования. Получим результаты теста, основанные на длине волокна, задержке распространения и измерении оптических потерь в обоих направлениях (по двум волокнам сразу). Тестер способен сохранять до 1000 результатов тестирования, которые могут быть непосредственно распечатаны на профессиональных сертификатах для ваших клиентов. Никогда тестирование оптического кабеля не было столь легким и быстрым.
Экономия времени за счет процедуры автотестирования CertiFiber экономит 75% вашего времени, по сравнению с ручным тестированием. Прибор анализирует оптоволоконный линк буквально за секунду! Вам необходимо выбрать стандарт волокна, такой как TIA568A или ISO 11801 и нажать клавишу автотестирования. Затем ввести количество сплайсов и коннекторов. CertiFiber автоматически вычисляет длину волокна, задержку распространения и измеряет оптические потери в обоих направлениях (по двум волокнам сразу) для 850 нм и 1300 нм.
11.2. Тестирование на соответствие стандартам
Кроме автотестирования на соответствие требованиям TIA 568A и ISO 11801, CertiFiber также проверяет линки на соответствие специализированным сетевым решениям, таким как 10BASE-FB, 10base-fl, 100BASE-F, 1000BASE-SX, 1000base-lx, ATM155, AT M155 sw l , FDDI и Fiber Channel. Прибор отображает запас, недостаток качества линка, вследствие чего при достаточном запасе качества можно быть увереным в том, что система будет соответствовать всем необходимым требованиям даже в случае некоторого ухудшения ее состояния.
Профессиональное документирование тестов до появления тестера CertiFiber, документирование тестов многомодового волокна производилось вручную, что зачастую порождало ошибки. Предлагаемый прибор способен сохранять в себе до 1000 результатов, маркируя их датой, временем, уникальными идентификаторами и предопределенными названиями проектов. Информация может быть передана на ПК с помощью пакета ScanLink™ и использована совместно MT Crimp™. Таким образом можно легко сопровождать проекты тестовой документацией.
12. Fluke Networks OptiView™ Workgroup Analyzer
Диагностический прибор, многоуровневый анализатор протоколов (2-7 уровень модели OSI) Fluke Networks' OptiView™ Workgroup Analyzer (WGA) это принципиально новый подход к анализу коммутируемых сетей: статистика и информация по всем семи уровням сетевой модели OSI; любая скорость сети от 10 Мб до Gigabit Ethernet;
Любое исполнение: медь или волокно, т.е. способен удовлетворить любые запросы.
Прибор позволяет осуществлять мониторинг и анализ локальной вычислительной сети, не вставая с рабочего места. Он может быть размещен как в локальном, так и удаленном сегменте, что позволяет создавать эффект Вашего присутствия для анализа и устранения неисправностей в любом месте вашей распределенной сети. Анализатор поддерживает до восьми независимых удаленных клиентов.
OptiView™ WGA объединяет возможности зонда RMON2, анализатора протоколов, кабельного тестера и прибора для мониторинга за функционированием сети в одном приборе. Анализатор может работать как независимо, так и совместно с новым семейством продуктов OptiView™ Network Analysis Solution. Это решение является объединением последних версий программного обеспечения для мониторинга сетей OptiView IC, программного анализатора протоколов OptiView PE, а также высокоуровневого анализатора OptiView Link Analyzer (LA) и естественно OptiView WGA. Каждый из этих компонентов может функционировать как отдельно, так и совместно, представляя собой масштабированное решение, которое позволит решать большой круг задач по диагностике коммутируемых сетей и виртуальных сетей VLAN.
Функция Network Discovery в анализаторе OptiView™ WGA позволит провести «инвентаризацию» всех подключенных к сети устройств, в также представит статистику по портам интересующего оператору коммутатора в локальном и удаленном сегментах.
Функция Trace SwitchRoute™ разработанная компанией Fluke Networks' показывает, как пакеты циркулируют между двумя устройствами, предоставляя информацию о скорости и адресах портов коммутаторов через которые проходят пакеты и позволит выявить узкие места и проблемы в работе сети.
Рис. 17 Com OfficeConnect® Internet Firewall
Экономичный способ защиты сети от атак из Internet Брандмауэры OfficeConnect® Internet Firewall (Рис. 17) представляют собой эффективный и в то же время недорогой способ защиты сетей для небольших предприятий.
Сегодня можно обеспечить эффективную защиту сети, затратив гораздо меньше средств и времени. Брандмауэры OfficeConnect® просты в установке и настройке. Они не пропускают в сеть хакеров и позволяют контролировать доступ пользователей локальной сети (далее – ЛС) к Internet (можно запретить доступ к нежелательным материалам, регистрировать наиболее посещаемые сайты и анализировать интенсивность Internet-трафика).
Существенно сократить расходы помогает и то, что все сотрудники компании могут пользоваться общим IP-адресом, предоставленным Internet-провайдером. Брандмауэры OfficeConnect® являются составной частью семейства OfficeConnect, обеспечивающего малые предприятия средствами коллективного использования информации, связи с удаленными филиалами и доступа к Internet.
Продукты OfficeConnect позволяют малым предприятиям реализовать преимущества работы в сети, упрощают бизнес-процессы, улучшают связь между подразделениями компании, а также помогают эффективно управлять дорогостоящими ресурсами.
Два брандмауэра OfficeConnect® обеспечивают экономичный способ Internet-защиты ЛС. С их помощью можно не только предотвратить несанкционированный доступ и воспрепятствовать атакам хакеров, но и запретить нежелательный доступ из ЛС к определенным сайтам или к документам, содержащим заданные ключевые слова.
Служба Web Site Filter расширяет эту возможность, наделяя брандмауэры способностью автоматически обновлять список, в который в соответствии с заранее указанными категориями, такими как, например, компьютерные игры, включены тысячи отслеживаемых сайтов.
OfficeConnect® Internet Firewall 25 обеспечивает безопасный доступ к Internet 25 пользователей ЛС.
OfficeConnect® Internet Firewall DMZ обеспечивает безопасный доступ к Internet 100 пользователей ЛС. У этого брандмауэра есть дополнительный порт De-Militarized Zone (DMZ) для подключения общедоступных серверов, таких как Web-сервер.
Порт DMZ защищен от атак хакеров (которые могут спровоцировать отказ от обслуживания), но в то же время доступен для других пользователей Internet. Он разрешает посещать сайт компании вашим заказчикам, причем внутренняя сеть не подвергается риску несанкционированного доступа.
OfficeConnect Web Site Filter наделяет брандмауэр расширенными возможностями контроля за доступом к Internet.
12.1. Защита, регистрация и оповещение
В брандмауэрах используется интеллектуальная технология контроля пакетов, позволяющая предотвращать попытки несанкционированного доступа к ЛС из Internet и атаки хакеров, провоцирующие отказ от обслуживания (в том числе Ping of Death, SYN Flood, LAND Attack, IP Spoofing, Teardrop и Bonk). Для атаки на сеть хакеры могут попытаться воспользоваться технологиями Java, ActiveX и Cookie, поэтому брандмауэр либо блокирует приложения, в которых применяются эти технологии, либо разрешает работать с такими приложениями только на проверенных сайтах. Контроль за удаленным доступом пользователей к ЛС осуществляется по имени и паролю. Все события могут регистрироваться, а при серьезных попытках нарушения защиты немедленно посылаются автоматические сообщения электронной почты.
Кроме того, брандмауэры оснащены индикаторами, сигнализирующими об атаках хакеров или попытках доступа к заблокированным сайтам.
12.2. Ограничение доступа к Internet
Доступ к Web-сайтам можно контролировать или ограничить определенными адресами. Брандмауэры позволяют наблюдать за 25 наиболее посещаемыми сайтами и 25 наиболее активными пользователями. Кроме того, они могут регистрировать или блокировать доступ к документам с определенными ключевыми словами в URL. Служба Web Site Filter расширяет эти возможности, автоматически управляя доступом к тысячам Web-сайтов заданных категорий.
12.3. Совместное использование Internet
Функция трансляции сетевых адресов (Network Address Translation, NAT) позволяет нескольким пользователям ЛС работать с одним IP-адресом, предоставляемым ISP.
12.4. Простая установка и настройка
Так как данное оборудование предназначено для небольших организаций, в которых специалиста по информационным технологиям может не быть в штате, 3Com сделала все возможное, чтобы упростить его установку и настройку.
С помощью стандартных Ethernet-кабелей брандмауэры включаются между концентратором или коммутатором Ethernet с одной стороны и модемом или маршрутизатором - с другой. Устройства поставляются уже настроенными и могут быть перенастроены при помощи простого Web-интерфейса из обычного браузера.
На рис. 18 показан типичный пример подключения брандмауэра OfficeConnect® Internet Firewall DMZ. Internet Firewall 25 подключается так же, но без порта DMZ.
Рис.18 Типичный пример подключения OfficeConnect® Internet Firewall DMZ
На рис. 19 показан OfficeConnect Web Site Filter, предоставляемый на условиях годовой подписки и контролирующий доступ к тысячам Web-сайтов определенных категорий. Автоматическое еженедельное обновление служит гарантией постоянной актуальности фильтра в непрерывно меняющейся среде Internet.
Рис.19 Типичная конфигурация фильтра Web-сайтов OfficeConnect
12.5. Сертификация ICSA
Брандмауэры OfficeConnect Internet Firewall сертифицированы независимой международной организацией ICSA. Служба 3Com OfficeConnect Web Site Filter использует список CyberNOT™ OfficeConnect Internet Firewall 25 OfficeConnect Internet Firewall DMZ Габариты и вес: Ширина: 220 мм; высота: 54,6 мм; глубина: 185,4 мм. Вес: 870 г. Поддерживаемые протоколы TCР/IР; DHCP; Network address translator (RFC1631) TCР/IР. Разъемы: OfficeConnect Internet Firewall 25: Два порта 10BASE-T, RJ45. Порт ЛС допускает выбор режима Uplink/Normal. OfficeConnect Internet Firewall DMZ: Три порта 10BASE-T, RJ45. Порты ЛС и DMZ допускают выбор режима Uplink/Normal. Световые индикаторы: "Питание", "Предупредительный сигнал", "Связь" (по каждому порту), "Передача" (по каждому порту), "Прием" (по каждому порту). Потребляемая мощность: 11 ВА.
12.6. Соответствие стандартам
Функционирование: ISO 8802/3; IЕЕЕ 802.3. Защита от электромагнитных помех: ЕN55022 Class B*; ЕN50082-1; FCC Рart 15 Class B; ICЕS-003 Class B; VCCI Class B; AS/NZS 3548 Class B; CISPR 22 Class B. Защита окружающей среды: ЕN 60068 (IЕC 68). Безопасность: UL 1950; ЕN 60950; CSA 22.2950; IЕC 950. Комплект поставки: OfficeConnect Internet Firewall 25 или Internet Firewall DMZ. Руководство пользователя. Блок питания, одноэлементная система крепления и резиновые ножки. CD-ROM с ПО для брандмауэров. OfficeConnect Web Site Filter Обеспечивает фильтрацию содержимого определенных Web-сайтов. OfficeConnect Web Site Filter может использоваться только с брандмауэрами OfficeConnect Internet Firewall 25 или Internet Firewall DMZ.
12.7. Требования к системе
Устройство доступа к Internet - модем или маршрутизатор с нтерфейсом Ethernet 10BASЕ-T или 10/100BASЕ-TX. Например: 3Com OfficeConnect ISDN LAN Modem, OfficeConnect 56K Dual LAN Modem, OfficeConnect Remote 511 и 531, OfficeConnect Cable Modem, OfficeConnect Remote 840 SDSL Router.
Подключение к Internet через ISP.
Кабель "витая пара" категории 3 или 5 (длиной до 100 м) для подсоединения WAN-порта к устройству доступа к Internet, LAN-порта - к концентратору или коммутатору Ethernet 10 или 100 Мбит/с и порта DMZ - к концентратору или коммутатору Ethernet 10 или 100 Мбит/с.
Сетевая операционная система TCP/IP. Брандмауэры OfficeConnect защищают сети на основе любой операционной системы TCP/IP, включая Windows 95, Windows 98, Windows NT, UNIX и Mac OS (7.5.3 и выше).
12.8. Гарантия
Брандмауэры OfficeConnect Internet Firewall 25 и Internet Firewall DMZ сопровождаются бессрочной гарантией, которая распространяется и на блок питания. Гарантия действительна только при наличии регистрационной карты.
OfficeConnect Internet Firewall 25 и Internet Firewall DMZ обеспечиваются бесплатной поддержкой по телефону в течение 90 дней с момента приобретения (из Европейского технического центра).
13. Диагностика третьего тысячелетия
Современные сети стали надежнее, но им еще предстоит пройти немалый путь до самовосстанавливающихся систем, появление которых предсказывают производители.
Несмотря на множество приемов и инструментов обнаружения и устранения неполадок в корпоративных сетях, почва под ногами сетевых администраторов все еще остается достаточно зыбкой. Корпоративные сети все чаще включают волоконно-оптические и беспроводные компоненты, наличие которых делает бессмысленным применение традиционных технологий и инструментов, предназначенных для обычных медных кабелей. Вдобавок к нему при скоростях свыше 100 Мбит/с традиционные подходы к диагностике зачастую перестают работать, даже если средой передачи является обычный медный кабель. Однако, возможно, наиболее серьезным изменением в корпоративных сетевых технологиях, с которым пришлось столкнуться администраторам, стал постепенный, но неизбежный переход от сетей Ethernet с разделяемой средой передачи к коммутируемым сетям, в которых в качестве коммутируемых сегментов часто выступают отдельные серверы или рабочие станции.
По мере осуществления технологических преобразований некоторые старые проблемы решились сами собой. Коаксиальный кабель, в котором выявить электротехнические неисправности всегда было труднее, чем в случае витой пары, становится редкостью в корпоративных средах. Сети Token Ring, главной проблемой которых была их несхожесть с Ethernet (а вовсе не слабость в техническом отношении), постепенно заменяются коммутируемыми сетями Ethernet. Некоторые из порождающих многочисленные сообщения об ошибках протоколов сетевого уровня, таких, как SNA, DECnet и AppleTalk, замещаются протоколом IP. Сам же стек протоколов IP стал более стабильным и простым для поддержки, что доказывают миллионы клиентов и миллиарды страниц Web в Internet. Даже закоренелым противникам Microsoft приходится признать, что подключение нового клиента Windows к Internet существенно проще и надежнее установки применявшихся ранее стеков TCP/IP сторонних поставщиков и отдельного программного обеспечения коммутируемого доступа, а модемы стали вполне надежными устройствами.
Как бы многочисленные современные технологии ни затрудняли выявление неполадок и управление производительностью сетей, ситуация могла бы оказаться еще тяжелее, если бы технология АТМ получила широкое распространение на уровне ПК. Свою положительную роль сыграло и то, что в конце 90-х, не успев получить признание, были отвергнуты и некоторые другие высокоскоростные технологии обмена данными, включая Token Ring с пропускной способностью 100 Мбит/с, 100VG-AnyLAN и усовершенствованные сети ARCnet. Наконец, в США был отклонен очень сложный стек протоколов OSI (который, правда, узаконен рядом правительств европейских стран).
13.1. Борьба с коммутаторами
Иерархическая топология корпоративных сетей с магистральными каналами Gigabit Ethernet и выделенными портами коммутаторов на 10 или даже 100 Мбит/с для отдельных клиентских систем (см. Рисунки 20 и 21), позволила увеличить максимальную пропускную способность, потенциально доступную пользователям, как минимум в 10—20 раз. Конечно, в большинстве корпоративных сетей существуют узкие места на уровне серверов или маршрутизаторов доступа, поскольку приходящаяся на отдельного пользователя пропускная способность существенно меньше 10 Мбит/с. В связи с этим замена порта концентратора с пропускной способностью 10 Мбит/с на выделенный порт коммутатора на 100 Мбит/с для конечного узла отнюдь не всегда приводит к значительному увеличению скорости. Однако если учесть, что стоимость коммутаторов понизилась до немыслимых ранее величин, а на большинстве предприятий проложен кабель Категории 5, поддерживающий технологию Ethernet на 100 Мбит/с, и установлены сетевые карты, способные работать на скорости 100 Мбит/с сразу после перезагрузки системы, то становится ясно, почему так нелегко сопротивляться искушению модернизации.
Рис. 20 В традиционной локальной сети с разделяемой средой передачи анализатор протоколов или монитор может исследовать весь трафик данного сегмента сети.
Хотя преимущество коммутируемой сети в производительности иногда почти не заметно, распространение коммутируемых архитектур имело катастрофические последствия для традиционных средств диагностики. В сильно сегментированной сети анализаторы протоколов способны видеть только одноадресный трафик на отдельном порту коммутатора, в отличие от сети прежней топологии, где они могли тщательно исследовать любой пакет в домене коллизий. В таких условиях традиционные инструменты мониторинга не могут собрать статистику по всем «диалогам», потому что каждая «переговаривающаяся» пара оконечных точек пользуется, в сущности, своей собственной сетью.
Рис. 21 В коммутируемой сети анализатор протоколов в одной точке может «видеть» только единственный сегмент, если коммутатор не способен зеркально отображать несколько портов одновременно.
Для сохранения контроля над сильно сегментированными сетями производители коммутаторов предлагают разнообразные средства для восстановления полной «видимости» сети, однако на этом пути остается немало трудностей. В поставляемых сейчас коммутаторах обычно поддерживается «зеркальное отображение» портов, когда трафик одного из них дублируется на ранее незадействованный порт, к которому подключается монитор или анализатор. Специалист по диагностике сетей может получить доступ к трафику и другим способом. Для этого подведенный к порту коммутатора кабель следует отключить, и в образовавшийся «разрыв» поместить концентратор с такой же пропускной способностью, как и у анализируемого порта. После этого к концентратору, подсоединенному одним портом к порту коммутатора, а другим — к прежнему соединению, можно подключать анализатор трафика.
Отметим некоторые проблемы зеркального отображения портов:
1) в каждый момент времени виден только один порт, поэтому выявить неполадки, затрагивающие сразу несколько портов, очень непросто.
2) зеркальное отражение может привести к снижению производительности коммутатора.
3) на зеркальном порту обычно не воспроизводятся сбои физического уровня, а иногда даже теряются обозначения виртуальных локальных сетей. Наконец, во многих случаях не могут в полной мере зеркально отображаться полнодуплексные каналы Ethernet.
Одним из вариантов технологии зеркального отображения портов является копирование только «диалогов» между определенными входным и выходным портами коммутатора.
Другой вариант предполагает отображение нескольких портов на единый порт мониторинга. При благоприятных обстоятельствах данный метод упрощает исследование трафика, но чаще всего при его применении возникают значительные трудности. Во-первых, только порт с более высокой пропускной способностью может принимать данные от нескольких портов с более низкой скоростью без искажения трафика. В большинстве конфигураций высокоскоростные порты коммутатора уже заняты, поэтому если один из них отвести для мониторинга, то это нанесет ущерб функциональности сети. И даже если найдется свободный гигабитный порт на коммутаторе Fast Ethernet или свободный порт Fast Ethernet на коммутаторе 10BaseT, то на порт мониторинга без потенциального превышения его пропускной способности могут отображаться только 10 портов.
Частичным решением при анализе агрегированных параметров трафика является использование возможностей мониторинга агентов mini-RMON, тем более что они встроены в каждый порт большинства коммутаторов Ethernet. Хотя агенты mini-RMON не поддерживают группу объектов Capture из спецификации RMON II, обеспечивающих полнофункциональный анализ протоколов, они тем не менее позволяют оценить уровень использования ресурсов, количество ошибок и объем многоадресной рассылки.
Некоторые недостатки технологии зеркального отображения портов могут быть преодолены установкой «пассивных ответвителей», производимых, например, компанией Shomiti. Эти устройства представляют собой заранее устанавливаемые Y-коннекторы и позволяют отслеживать с помощью анализаторов протокола или другого устройства не регенерированный, а реальный сигнал. Кроме того, подключение анализатора не требует разрыва соединения. Компания Shomiti поставляет однопортовые и 12-портовые устройства Century Taps для портов 10BaseT и 100BaseTX, обеспечивающие доступ к полнодуплексным каналам с получением данных об электрических проблемах низкого уровня. Shomiti выпускает также однопортовый пассивный разветвитель Fiber Tap для оптических портов Gigabit Ethernet и Ethernet на 10 и 100 Мбит/с. Компания Sniffer Technologies предлагает устройства Fast Ethernet Full Duplex Pod, с помощью которых анализаторы протоколов этой компании могут перехватывать полнодуплексный трафик в реальном режиме времени. Они подключаются либо в качестве оконечных устройств к порту монитора, либо передают сигналы от одного порта к другому.
13.2. Особенности оптики
Администраторы корпоративных сетей обычно используют специализированное оборудование диагностики оптических сетей только для решения проблем с оптическими кабелями. Обычное стандартное программное обеспечение управления устройствами на базе SNMP или интерфейса командной строки способно выявить проблемы на коммутаторах и маршрутизаторах с оптическими интерфейсами. И только немногие сетевые администраторы сталкиваются с необходимостью проводить диагностику устройств SONET.
Что касается волоконно-оптических кабелей, то причин для возникновения возможных неисправностей в них существенно меньше, чем в случае медного кабеля. Оптические сигналы не вызывают перекрестных помех, появляющихся от того, что сигнал одного проводника индуцирует сигнал на другом — этот фактор наиболее усложняет диагностическое оборудование для медного кабеля. Оптические кабели невосприимчивы к электромагнитным шумам и индуцированным сигналам, поэтому их не требуется располагать подальше от электромоторов лифтов и ламп дневного света, т. е. из сценария диагностики все эти переменные можно исключить.
Сила сигнала, или оптическая мощность, в данной точке на самом деле является единственной переменной, которую требуется измерить при поиске неисправностей в оптических сетях. Если вы можете определить потери сигнала на всем протяжении оптического канала, то сможете идентифицировать практически любую проблему. Недорогие дополнительные модули для тестеров медного кабеля позволяют проводить оптические измерения.
Предприятиям, развернувшим крупную оптическую инфраструктуру и самостоятельно ее обслуживающим, может понадобиться приобрести оптический временный рефлектометр (Optical Time Domain Reflecto-meter, OTDR), выполняющего те же функции для оптического волокна, что и рефлектометр для медного кабеля (Time Domain Reflectometer, TDR). Прибор действует подобно радару: он посылает импульсные сигналы по кабелю и анализирует их отражения, на основании которых он выявляет повреждения в проводнике или какую-либо другую аномалию, и затем сообщает пользователю, в каком месте кабеля следует искать источник проблемы.
Хотя различные поставщики кабельных соединителей и разъемов упростили процессы терминирования и разветвления оптического волокна, для этого по-прежнему требуется некоторый уровень специальных навыков, и при разумной политике предприятие с развитой оптической инфраструктурой вынуждено будет обучать своих сотрудников. Как бы хорошо ни была проложена кабельная сеть, всегда существует возможность физического повреждения кабеля в результате какого-либо неожиданного происшествия.
13.3. Проблемы беспроводных сетей
Диагностика беспроводных локальных сетей стандарта 802.11b столь же проста, как и в случае сетей Ethernet на базе концентраторов, так как беспроводная среда передачи информации разделяется между всеми обладателями клиентских радиоустройств. Компания Sniffer Technologies первой предложила решение для анализа протоколов таких сетей с пропускной способностью до 11 Мбит/с, и впоследствии большинство лидирующих поставщиков анализаторов представили аналогичные системы.
В отличие от концентратора Ethe-rnet с проводными соединениями, качество беспроводных клиентских соединений далеко от стабильного. Микроволновые радиосигналы, используемые во всех вариантах локальной передачи, слабы и порой непредсказуемы. Даже небольшие изменения положения антенны могут серьезно сказаться на качестве соединений. Точки доступа беспроводной локальной сети снабжаются консолью управления устройствами, и это часто более действенный метод диагностики, чем посещение клиентов беспроводной сети и наблюдение за пропускной способностью и условиями возникновения ошибок с помощью портативного анализатора. Бережливым покупателям следует внимательно присмотреться к возможностям мониторинга соединений в точках доступа.
Хотя проблемы синхронизации данных и установки устройств, возникающие у пользователей персональных цифровых секретарей (PDA), более естественно соответствуют задачам группы технической поддержки, а не обязанностям сетевого администратора, нетрудно предвидеть, что в недалеком будущем многие такие устройства превратятся из отдельных вспомогательных средств, дополняющих ПК, в полноправных сетевых клиентов.
Как правило, операторы корпоративных беспроводных сетей будут (или должны) препятствовать развертыванию чрезмерно открытых систем, в которых любой пользователь, находящийся в зоне действия сети и обладающий совместимой интерфейсной картой, получает доступ к каждому информационному кадру системы. Протокол безопасности беспроводных сетей WEP (Wired Equivalent Privacy) обеспечивает аутентификацию пользователей, гарантию целостности и шифрование данных, однако, как это обычно случается, совершенная система безопасности осложняет анализ причин сетевых неполадок. В защищенных сетях с поддержкой WEP специалисты по диагностике должны знать ключи или пароли, защищающие информационные ресурсы и контролирующие доступ в систему. При доступе в режиме приема всех пакетов анализатор протоколов сможет видеть все заголовки кадров, но содержащаяся в них информация без наличия ключей будет бессмысленной.
13.4. Диагностика туннелей
При диагностировании туннелированных каналов, которые многие производители называют виртуальными частными сетями с удаленным доступом, возникающие проблемы аналогичны имеющим место при анализе беспроводных сетей с шифрованием. Если трафик не проходит через туннелированный канал, то причину неисправности определить нелегко. Это может быть ошибка аутентификации, поломка на одной из оконечных точек или затор в общедоступной зоне Internet. Попытка использования анализатора протоколов для выявления высокоуровневых ошибок в туннелированном трафике будет пустой тратой сил, потому что содержание данных, а также заголовки прикладного, транспортного и сетевого уровней зашифрованы. Вообще, меры, принимаемые в целях повышения уровня безопасности корпоративных сетей, обычно затрудняют выявление неисправностей и проблем производительности. Межсетевые экраны, proxy-серверы и системы выявления вторжений могут дополнительно осложнить локализацию неполадок.
В конечном счете диагностирование неисправностей является задачей управления. Для большинства критически важных корпоративных систем, проведение продолжительных восстановительных работ не допустимо, поэтому единственным решением будет использование резервных устройств и процессов, способных взять на себя необходимые функции немедленно после возникновения сбоев. На некоторых предприятиях сети всегда имеют дополнительный резервный компонент на случай сбоя основного, т. е. n х 2 компонентов, где n — количество основных компонентов, необходимое для обеспечения приемлемой производительности. Если среднее время восстановления (Mean Time To Repair, MTTR) достаточно велико, то может понадобиться еще большая избыточность. Дело в том, что время устранения неисправности предсказать нелегко, а значительные затраты в течение непредсказуемого периода восстановления являются признаком плохого управления.
Для менее важных систем резервирование может оказаться экономически неоправданным, и в этом случае будет целесообразно вкладывать средства в наиболее эффективные инструменты (и в обучение персонала), чтобы максимально ускорить процесс диагностики и устранения неисправностей на предприятии. Кроме того, поддержку определенных систем можно доверить сторонним специалистам, либо привлекая их на предприятие по контракту, либо пользуясь возможностями внешних центров обработки данных, либо обращаясь к провайдерам услуг по сопровождению приложений (Application Service Providers, ASP) или провайдерам услуг управления. Помимо затрат наиболее значительным фактором, влияющим на решение об обращении к услугам сторонних организаций, можно считать уровень компетентности собственного персонала. Сетевые администраторы должны решить, не является ли некоторая конкретная функция настолько тесно связанной со специфическими задачами предприятия, что от стороннего специалиста нельзя будет ожидать более качественного выполнения работы, чем это будет сделано силами служащих компании.
Почти сразу после того, как были развернуты первые корпоративные сети, надежность которых оставляла желать лучшего, производители и разработчики выдвинули концепцию «самовосстанавливающихся сетей». Современные сети, безусловно, надежнее, чем они были в 90-х гг., но не потому, что неполадки стали самоустраняться. Ликвидация сбоев программного обеспечения и аппаратных средств современных сетей все еще требуют вмешательства человека, и в ближайшей перспективе в таком положении дел не предвидится никаких принципиальных изменений. Методы и инструменты диагностики вполне соответствуют современной практике и технологиям, но они еще не достигли такого уровня, который позволил бы значительно сэкономить время сетевых администраторов в их борьбе с неполадками сетей и дефицитом производительности.
13.5. Наиболее полезные инструменты диагностики
Ключевой функцией инструмента диагностики является обеспечение визуального представления реального состояния сети. Традиционно поставляемые производителями инструменты визуализации приблизительно соответствуют уровням модели OSI.
Для разрешения проблем на физическом уровне, а также в электрических или оптических средах передачи данных предназначены кабельные тестеры и такие специализированные инструменты, как временн`ые рефлектометры (Time Domain Reflectometers, TDRs). За более чем 15 лет интенсивного развития корпоративных локальных сетей в ответ на потребности профессиональных сетевых интеграторов в кабельных тестерах реализовано множество функций, например выполнение автоматизированных тестовых последовательностей с возможностью печати сертификационных документов на основании результатов тестирования. Хотя сети Ethernet с пропускной способностью 10 Мбит/с допускают некоторые вольности в отношении качества их прокладки, технологии 100BaseT и Gigabit Ethernet с медным кабелем намного капризнее. Как следствие, современные кабельные тестеры достаточно сложны.
В число лидирующих поставщиков кабельных тестеров входят компании Fluke Networks, Microtest, Agilent, Acterna (прежнее название WWG) и Datacom Textron.
Традиционным инструментом решения проблем канального, сетевого и транспортного уровней является анализатор протоколов. Недорогие анализаторы обычно создаются на основе серийно выпускаемых портативных ПК с использованием стандартных сетевых карт с поддержкой режима приема всех пакетов. В результате некоторые виды неполадок на канальном уровне для таких систем остаются невидимыми. Кроме того, они не позволяют выявить проблемы физического уровня в электрических или оптических кабелях. Вместе с тем, со временем в анализаторах протоколов появилась возможность исследования неполадок прикладного уровня, включая транзакции баз данных.
В число лидирующих поставщиков анализаторов протоколов локальных сетей входят Network Associates/Sniffer Technologies, Shomiti, Acterna (прежнее название WWG), Agilent, GN Nettest, WildPackets и Network Instruments.
Третьим основным диагностическим инструментом наряду с кабельными тестерами и анализаторами протоколов является зонд или монитор. Эти устройства обычно подключаются к сети на постоянной основе, а не только в случае возникновения проблемы и функционируют в соответствии со спецификациями удаленного мониторинга RMON и RMON II. Протокол RMON описывает метод сбора статистической информации об интенсивности трафика, ошибках, а также об основных источниках и потребителях трафика. Данные RMON относятся в первую очередь к канальному уровню, тогда как в стандарте RMON II добавлена поддержка уровней с третьего по седьмой. В протоколе RMON II предусмотрена возможность сбора пакетов или кадров с сохранением их в буфер — функция, используемая на первом этапе анализа протоколов. С другой стороны, практически любой современный анализатор протоколов собирает больше статистической информации, чем зонд RMON.
Между функциями анализаторов протоколов и зондами RMON нельзя провести четкую границу. Производители анализаторов обычно рекомендуют устанавливать агенты мониторинга и сбора данных по всей большой сети, пользователи же стремятся к тому, чтобы эти распределенные агенты были совместимы с международным стандартом RMON, а не с собственным форматом анализатора. До настоящего времени поставщики зондов RMON по-прежнему продолжают разрабатывать свои собственные протоколы для программного обеспечения декодирования и экспертного анализа, однако инструменты мониторинга и сбора данных, по всей вероятности, будут объединяться. С другой стороны поставщики анализаторов протоколов считают, что их программное обеспечение не предназначено для решения специфических задач RMON, таких, как анализ трафика и составление отчетов о производительности приложений.
Лидирующими поставщиками устройств RMON являются NetScout, Agilent, 3Com и Nortel. Кроме того, производители коммутаторов Ethernet встраивают поддержку основных функций RMON в каждый порт. Можно ожидать, что в современных условиях наиболее эффективным средством мониторинга коммутируемой сети будет использование имеющихся на каждом порте встроенных агентов mini-RMON и дополнение их возможностей системой с полной реализацией функций RMON II или анализатором протоколов с экспертным анализом.
Производители диагностического оборудования объединили функции всех перечисленных традиционных инструментов в портативных устройствах для обнаружения распространенных неисправностей на нескольких уровнях OSI. Например, некоторые из этих устройств осуществляют проверку основных параметров кабеля, отслеживают количество ошибок на уровне Ethernet, обнаруживают дублированные IP-адреса, осуществляют поиск и подключение к серверам Novell NetWare, а также отображают распределение в сегменте протоколов третьего уровня.
В число лидирующих поставщиков интегрированных диагностических инструментов входят Fluke Networks, Datacom Textron, Agilent и Microtest. Компания Fluke недавно представила продукт OptiView Pro, в котором все компоненты для полномасштабной семиуровневой диагностики объединены в едином портативном устройстве. Фактически Optiview Pro представляет собой ПК под управлением ОС Windows с разъемами под платы расширения, где в дополнение к встроенному анализатору протоколов собственной разработки компании можно установить другой анализатор.
Корпоративные сети обретают новые возможности благодаря таким продуктам, как устройства балансировки нагрузки, шлюзы VPN, proxy-серверы, кэширующие серверы, серверы потоковых данных и устройства управления пропускной способностью, поэтому непрерывно появляются новые задачи диагностики. Успех решения этих проблем в большой степени будет зависеть от качества реализованной в данных продуктах системы управления. Механизм управления через Web позволил производителям упростить процесс разработки, но поддержка многоплатформенных клиентов (т. е. браузеров) — это всего лишь небольшая часть общей проблемы управления устройствами, с которой сталкиваются сетевые администраторы. Фактически применение интерфейсов браузеров привело только к еще большей путанице за счет введения лишних меню, форм и кнопок у предлагаемого управляющего программного обеспечения.
Список литературы
1. Г.Г. Раннев, А. П, Тарасенко «Методы и средства измерений» Учебник, Москва, ACADEMA, 2004 г.
2. Бакланов И. Г. « Тестирование и диагностика систем связи», Москва, Изд. ЭКО-Трезд., 2001 г.
3. А. Ю. Гребешков «Стандарты и технологии управления сетями связи», Москва, Изд. ЭКО-Трезд., 1998 г.
4. Бакланов И. Г. «ISDN и FRAME RELAY. Технология и практика измерений», Москва, Изд. ЭКО-Трезд., 1998 г.
5. Бакланов И. Г. « Технологии измерений в первичной сети E1, DH, SDH» Изд. ЭКО-Трезв., 1999 г.
6. Леонов А. И. «Основы технической эксплуатации бытовой и радиоэлектронной аппаратуры». Москва, Легпромбытиздат, 1987 г.
7. Бакланов И. Г. «Технология измерений в современных телекоммутациях», Москва, Изд. ЭКО. Трезд., 1998 г.
8. Байда И. П. «Микропроцессорные системы поэлементного диагностирования радиоэлектронной аппаратуры», Москва, Изд. Радио и связь, 1987 г.
9. «Регламент радиосвязи», Женева,1998 г.
10. Черязданов Е. А. «Контроль работоспособности и диагностика радиоэлектронных средств», Алматы, А Э И С, 1999 г.
11. «Регламент радиосвязи», Женева,1998 г.