Теремко Соціологія (2001)

Методи багатовимірної статистики: факторний і кластер ний аналіз

Якщо аналіз даних передбачає використання великої кількості взаємопов'язаних ознак, доцільно застосувати спеціальні методи та алгоритми багатовимірної статистики. Ці методи потребують значних обчислень, для ефективного застосування яких необхідно мати обчислювальну техніку та спеціальне програмне забезпечення. Серед методів багатовимірної статистики найуживанішими є методи факторного та кластерного аналізу.

Суть факторного аналізу полягає в тому, що групу сильно скорельованих ознак можна пояснити та описати невеликою кількістю прихованих (латентних) факторів, які безпосередньо не спостерігаються, але визначають значення ознак цієї групи. Наприклад, за такими ознаками, як «Кількість прочитаних книг», «Кількість книг у домашній бібліотеці», «Кількість відвідувань театрів та музеїв», приховано фактор, який можна було б назвати «Рівень культурного розвитку особистості». Факторний аналіз дає змогу виявити ці латентні фактори, описати залежність між факторами та первинними ознаками, обчислити значення всіх побудованих таким чином факторів для кожного об'єкта. В результаті виникає можливість без значних втрат інформації перейти від аналізу в термінах великої кількості первинних ознак до аналізу в термінах порівняно невеликої кількості факторів.

Алгоритми кластерного аналізу дають змогу поділити сукупність об'єктів на однорідні за певним формальним критерієм подібності групи (кластери). Основною властивістю цих груп є те, що об'єкти, які належать одному кластеру, більш подібні між собою, ніж об'єкти з різних кластерів. Таку класифікацію можна виконувати одночасно за досить великою кількістю ознак.

Відомо, наприклад, чимало статистичних показників, що характеризують рівень соціально-економічного розвитку адміністративних районів країни: кількість населення, кількість безробітних, протяжність шосейних доріг, кількість квадратних метрів житла на одну людину тощо. Для організації опитування необхідно згрупувати райони в більші утворення (регіони), але необхідно зробити це так, щоб в кожному такому регіоні були райони, близькі за своїм соціально-економічним розвитком. Це дасть змогу вибрати в такому регіоні один типовий район і результати опитування в цьому районі узагальнити щодо всього регіону. Таке групування може бути ефективно проведене методом кластерного аналізу, оскільки при такому групуванні враховується і узагальнюється велика кількість показників.

Отже, для активного та ефективного використання на практиці математичних методів статистичного аналізу соціологічних даних необхідно мати ґрунтовну загальноматематичну підготовку. Для одержання справді надійних результатів математичні методи слід застосовувати не тільки коректно, а й комплексно. Результати, одержані одним методом, слід намагатися підтвердити використанням іншого методу.


← prev content next →