Тренинги и семинары | Проекты | Статьи | Фотографии | Услуги | Контакты | IEEE | О центре |
ФАКТОРНЫЙ АНАЛИЗ
Идея факторного анализа
Установлено, что выделение и последующее наблюдение за уровнем общих факторов даёт возможность обнаруживать предотказные состояния объекта на очень ранних стадиях развития дефекта. Факторный анализ позволяет отслеживать стабильность корреляционных связей между отдельными параметрами. Именно корреляционные связи между параметрами, а также между параметрами и общими факторами содержат основную диагностическую информацию о процессах. Применение инструментария пакета Statistica при выполнении факторного анализа исключает необходимость использования дополнительных вычислительных средств и делает анализ наглядным и понятным для пользователя. Матрица Y[1:р';1:n] содержит ненаблюдаемые факторы, которые по существу являются гиперпараметрами, характеризующими наиболее общие свойства анализируемого объекта. Общие факторы чаще всего выбирают статистически независимыми, что облегчает их физическую интерпретацию. Вектор наблюдаемых признаков Х[1:р] имеет смысл следствия изменения этих гиперпараметров. Модель факторного анализа похожа на модели многомерного регрессионного и дисперсионного анализа. Принципиальное отличие модели факторного анализа в том, что вектор Y[1:p'] – это ненаблюдаемые факторы, а в регрессионном анализе – это регистрируемые параметры. В правой части уравнения (8.1) неизвестными являются матрица факторных нагрузок Q[1:р, 1:р'] и матрица значений общих факторов Y[1:р']. Для нахождения матрицы факторных нагрузок используют уравнениеQQт=S–V,
где Qт – транспонированная матрица Q, V – матрица ковариаций остаточных факторов U[1:p?], т.е. . Уравнение решается путем итераций при задании некоторого нулевого приближения ковариационной матрицы V(0).
После нахождения матрицы факторных нагрузок Q[1:р, 1:р'] вычисляются общие факторы (гиперпараметры) по уравнению На первом этапе необходимо отобрать переменные для проведения факторного анализа. Используя корреляционный анализ, исследователь пытается выявить взаимосвязь исследуемых признаков, что, в свою очередь, даёт ему возможность выделить полный и безызбыточный набор признаков путём объединения сильно коррелирующих признаков. Для того чтобы понять, какие показатели следует исключить, построим по имеющимся данным матрицу коэффициентов корреляции в Statistica: Statistics/ Basic Statistics/ Correlation Matrices/ Ok. В стартовом окне этой процедуры Product-Moment and Partial Correlations (рис. 4.3) для расчёта квадратной матрицы используется кнопка One variable list. Выбираем все переменные (select all), Ok, Summary. Получаем корреляционную матрицу. Если коэффициент корреляции изменяется в пределах от 0,7 до 1, то это означает сильную корреляцию показателей. В этом случае можно исключить одну переменную с сильной корреляцией. И наоборот, если коэффициент корреляции мал, можно исключить переменную из-за того, что она ничего не добавит к общей сумме. В нашем случае сильной корреляции между какими-либо переменными не наблюдается, и факторный анализ будем проводить для полного набора переменных. Для запуска факторного анализа необходимо вызвать модуль Statistics/ Multivariate Exploratory Techniques (многомерные исследовательские методы)/ Factor Analysis (факторный анализ). На экране появится окно модуля Factor Analysis.
В разделе MD deletion задаётся способ обработки пропущенных значений: Выберем способ обработки пропущенных значений Casewise. Statistica обработает пропущенные значения тем способом, который указан, вычислит корреляционную матрицу и предложит на выбор несколько методов факторного анализа. После нажатия кнопки Ok появляется окно Define Method of Factor Extraction (определить метод выделения факторов).
Во вкладке Descriptives (описательные статистики) имеются две кнопки: Нажимаем Ok, и Statistica быстро произвёдет вычисления. На экране появляется окно Factor Analysis Results (результаты факторного анализа). Как говорилось ранее, результаты факторного анализа выражаются набором факторных нагрузок. Поэтому далее будем работать с вкладкой Loadings. Верхняя часть окна – информационная: Из всех предлагаемых методов, мы сначала посмотрим результат анализа без вращения системы координат – Unrotated. Если полученный результат окажется интерпретируемым и будет нас устраивать, то на этом можно остановиться. Если нет, можно вращать оси и посмотреть другие решения. Щёлкаем по кнопке "Factor Loading" и смотрим факторные нагрузки численно.
Значение факторной нагрузки, большее 0,7 показывает, что данный признак или переменная тесно связан с рассматриваемым фактором. Чем теснее связь данного признака с рассматриваемым фактором, тем выше значение факторной нагрузки. Положительный знак факторной нагрузки указывает на прямую (а отрицательный знак ? на обратную) связь данного признака с фактором. Посмотрим результат факторного анализа графически, нажав на кнопку Plot of loadings, 2D.
Здесь мы также видим две группы факторов – ОСБ и остальное множество переменных, из которых выделяется ЖСР – желание сменить работу. Видимо, имеет смысл исследовать это желание более основательно на основе сбора дополнительных данных. Выбор и уточнение количества факторов Как только получена информация о том, сколько дисперсии выделил каждый фактор, можно возвратиться к вопросу о том, сколько факторов следует оставить. По своей природе это решение произвольно. Но имеются некоторые общеупотребительные рекомендации, и на практике следование им даёт наилучшие результаты. Количество общих факторов (гиперпараметров) определяется путём вычисления собственных чисел (рис. 8.7) матрицы Х[1:p, 1:n] в модуле факторного анализа. Для этого во вкладке Explained variance (рис. 8.4) необходимо нажать кнопку Scree plot. Максимальное число общих факторов может быть равно количеству собственных чисел матрицы параметров. Но с увеличением числа факторов существенно возрастают трудности их физической интерпретации. Сначала можно отобрать только факторы, с собственными значениями, большими 1. По существу, это означает, что если фактор не выделяет дисперсию, эквивалентную, по крайней мере, дисперсии одной переменной, то он опускается. Этот критерий используется наиболее широко. В приведённом выше примере на основе этого критерия следует сохранить только 2 фактора (две главные компоненты). Рекомендации по применению факторного анализа Факторный анализ параметров позволяет выявить на ранней стадии нарушение рабочего процесса (возникновение дефекта) в различных объектах, которое часто невозможно заметить путём непосредственного наблюдения за параметрами. Это объясняется тем, что нарушение корреляционных связей между параметрами возникает значительно раньше, чем изменение одного параметра. Такое искажение корреляционных связей позволяет своевременно обнаружить факторный анализ параметров. Для этого достаточно иметь массивы зарегистрированных параметров. Критерий Кайзера иногда сохраняет слишком много факторов, в то время как критерий каменистой осыпи иногда сохраняет слишком мало факторов. Однако оба критерия вполне хороши при нормальных условиях, когда имеется относительно небольшое число факторов и много переменных. На практике более важен вопрос о том, когда полученное решение может быть интерпретировано. Поэтому обычно исследуется несколько решений с большим или меньшим числом факторов, и затем выбирается одно наиболее осмысленное.
Если в наборе исходных данных имеются избыточные переменные и не проведено их исключение корреляционным анализом, то нельзя вычислить обратную матрицу (8.3). Например, если переменная является суммой двух других переменных, отобранных для этого анализа, то корреляционная матрица для такого набора переменных не может быть обращена, и факторный анализ принципиально не может быть выполнен. На практике это происходит, когда пытаются применить факторный анализ к множеству сильно зависимых переменных, что иногда случается, например, в обработке вопросников. Тогда можно искусственно понизить все корреляции в матрице путём добавления малой константы к диагональным элементам матрицы, и затем стандартизировать её. Эта процедура обычно приводит к матрице, которая может быть обращена, и поэтому к ней применим факторный анализ. Более того, эта процедура не влияет на набор факторов, но оценки оказываются менее точными. Системой с переменными состояниями (СПС) называется система, отклик которой зависит не только от входного воздействия, но и от обобщенного постоянного во времени параметра, определяющего состояние. Регулируемый усилитель или аттенюатор ? это пример простейшей СПС, в котором коэффициент передачи может дискретно или плавно изменяться по какому-либо закону. Исследование СПС обычно проводится для линеаризованных моделей, в которых переходный процесс, связанный с изменением параметра состояния, считается завершённым. Аттенюаторы, выполненные на основе Г-, Т- и П-образного соединения последовательно и параллельно включённых диодов получили наибольшее распространение. Сопротивление диодов под воздействием управляющего тока может меняться в широких пределах, что позволяет изменять АЧХ и затухание в тракте. Независимость фазового сдвига при регулировании затухания в таких аттенюаторах достигается с помощью реактивных цепей, включенных в базовую структуру. Очевидно, что при разном соотношении сопротивлений параллельных и последовательных диодов может быть получен один и тот же уровень вносимого ослабления. Но изменение фазового сдвига будет различным. Исследуем возможность упрощения автоматизированного проектирования аттенюаторов, исключающего двойную оптимизацию корректирующих цепей и параметров управляемых элементов. В качестве исследуемой СПС будем использовать электрически управляемый аттенюатор, схема замещения которого приведена на рис. 8.8. Минимальный уровень затухания обеспечивается в случае малого сопротивления элемента Rs и большого сопротивления элемента Rp. По мере увеличения сопротивления элемента Rs и уменьшения сопротивления элемента Rp вносимое ослабление увеличивается. Линии передачи l1, l2, l3 обеспечивают фазовую инвариантность отклика относительно входного воздействия. Распределенные индуктивность и ёмкость линий комбинируются с паразитными параметрами L, C управляемых элементов, например, диодов, и компенсируют изменение фазового сдвига при регулировке ослабления. Для компьютерного моделирования была использована схема замещения диода со следующими параметрами: ёмкость перехода C=0,02 пФ, индуктивность выводов L=0,16 нГн, сопротивление растекания не учитывалось ввиду его малости. Заметим, что паразитные реактивные параметры управляемых элементов являются основной причиной, ограничивающей полосу рабочих частот. Объёмные сопротивления Rs и Rp изменялись от 3 до 200 Ом. Сопротивления генератора и нагрузки, а также резистора R равны 50 Ом. В результате оптимизации по критерию минимума фазового сдвига были найдены параметры коррекции – длины линий передачи l и их волновые сопротивления: l1=3 мм, l2=1,1 см, l3=2 мм, p1=70 Ом, p2=75 Ом, p3=40 Ом. Рассчитывались вносимое затухание A(w) в зависимости от круговой частоты (величина, обратная АЧХ) и изменение фазового сдвига f(w), то есть разность фаз при начальном (A0) и выбранном уровне ослабления (Ai). Зависимости изменения фазового сдвига от частоты и затухания для схемы без коррекции и с коррекцией приведены на рис. 8.9 и 8.10 соответственно. В корректированном аттенюаторе в диапазоне ослаблений 1,3-7,7 дБ и полосе частот 0,01?4,0 ГГц достигнуто изменение фазового сдвига не более 0,2°. В аттенюаторе без коррекции изменение фазового сдвига в той же полосе частот и диапазоне ослаблений достигает 3°. Таким образом, фазовый сдвиг уменьшен за счет коррекции почти в 15 раз. Будем считать параметры коррекции и управления независимыми переменными или факторами, влияющими на затухание и изменение фазового сдвига. Это даёт возможность с помощью системы Statistica провести факторный и регрессионный анализ СПС с целью установления физических закономерностей между параметрами цепи и отдельными характеристиками, а также упрощения поиска оптимальных параметров схемы. Исходные данные формировались следующим образом. Для параметров коррекции и сопротивлений управления, отличающихся от оптимальных в большую и меньшую стороны на сетке частот 0,01?4 ГГц, были вычислены вносимое ослабление и изменение фазового сдвига. График факторных нагрузок, построенный для двух факторов, показывает, что параметры коррекции и параметры управления чётко разделены в своем влиянии на характеристики аттенюатора. Факторные модели для изменения фазового сдвига и вносимого затухания были построены с помощью модуля "общие регрессионные модели – факторная регрессия". В результате моделирования найдены коэффициенты факторной регрессии, которые представлены в виде столбчатых диаграмм на рис. По величине коэффициентов факторной регрессии можно судить о влиянии того или иного параметра на соответствующую характеристику устройства. Построенные факторные модели не учитывают влияния паразитных параметров управляемых элементов и их линейных комбинаций с остальными элементами и частотой. Тем не менее, усложнять модель нецелесообразно, так как целью моделирования не являлся поиск параметров, для которых изменение фазового сдвига минимально, а требовалось только оценить влияние каждого элемента на характеристики устройства. По результатам анализа можно сделать выводы о влиянии параметров коррекции и управления на изменение фазового сдвига и затухания, а также подтвердить физические предположения о работе схемы. 1. На изменение фазового сдвига в первую очередь влияют параметры управления (см. рис. 8.12, наибольшие коэффициенты для Rp и Rs). Этот вывод не очевиден, так как, например, ранее считалось, что основной вклад в изменение фазового сдвига вносят паразитные параметры управляемых элементов. Методы статистического моделирования, в частности, факторный и регрессионный анализ, которые раньше не использовались для проектирования дискретных устройств с переменными состояниями, позволяют выявить физические закономерности работы элементов системы. Это способствует созданию структуры устройства исходя из заданного критерия оптимальности. В частности, в данном разделе рассматривался фазоинвариантный аттенюатор как типичный пример системы с переменными состояниями. Выявление и интерпретация факторных нагрузок, влияющих на различные исследуемые характеристики, позволяет изменить традиционную методологию и существенно упростить поиск параметров коррекции и параметров регулирования. Установлено, что использование статистического подхода к проектированию подобных устройств оправдано как для оценки физики их работы, так и для обоснования принципиальных схем. Статистическое моделирование позволяет существенно сократить объём экспериментальных исследований.
|
Система статистических методов управления –
|
||||||||
Для выявления факторов, определяющих измеряемые признаки объектов, используются методы факторного анализа |
|||||||||
Факторы вы не наблюдаете, они скрыты и неизмеряемы |
|||||||||
Факторный анализ является мощным методом мониторинга процессов |
|||||||||
Содержательный смысл фактора выявляется на основе признаков, имеющих высокие (значимые) факторные нагрузки
|
|||||||||
Преобразование практически значимо, когда новое факторное пространство имеет ясный физический смысл. |
|||||||||
Гиперпараметр – ненаблюдаемый фактор |
|||||||||
Основные результаты факторного анализа выражаются в наборах факторных нагрузок |
|||||||||
Вычисление корреляционной матрицы, если она не задаётся сразу – это первый этап факторного анализа |
|||||||||
Конечно, всё это можно сделать рассмотренными ранее способами |
|||||||||
Factor loadings – факторные нагрузки |
|||||||||
Выбирая способ вращения, добиваются того, чтобы факторные нагрузки для определённой группы переменных на один из общих факторов были максимальными при минимальных их значениях на другой фактор |
|||||||||
Характерно, что все вопросы качества трудовой жизни предприятия составляют один фактор, а ощущение социального благополучия не связано с ним: это второй (политический) фактор
|
|||||||||
Количество факторов выбирает пользователь |
|||||||||
Разумно отобрать только факторы, с собственными значениями, большими 1 (критерий Кайзера) |
|||||||||
«Осыпь» – геологический термин, обозначающий обломки горных пород, скапливающиеся в нижней части скалистого склона |
|||||||||
Практическая полезность сбора статистических данных неоднократно доказывалась ранее |
|||||||||
Факторный анализ всегда требует нескольких решений и отбора наилучшего |
|||||||||
Возникает деление на нуль, расчёты прерываются, а пользователю выдаётся сообщение об ошибке |
|||||||||
«Необходимость настоящего исследования была обусловлена внутренней логикой развития качественной теории дифференциальных уравнений и попыткой внести свою лепту в развитие математики, дабы поддержать процесс познания без замедления» |
|||||||||
Я изъездил эту страну вдоль и поперёк, общался с умнейшими людьми и я могу вам ручаться в том, что обработка данных является лишь причудой, мода на которую продержится не более года редактор издательства Prentice Hall, 1957 г. |
|||||||||
Система статистических методов управления – |
|||||||||
Желаете участвовать в семинаре? Хотите написать? Электронная почта - tomsk@ieee.org (Стукач Олег Владимирович) |