Який розмір вибірки необхідний для множинного регресійного аналізу?

Наприклад, Наннеллі (1978) рекомендував, щоб навіть при помірній кількості предикторних змінних розмір вибірки Від 300 до 400 часто необхідні при множинній регресії. Ця рекомендація різко контрастує із загальноприйнятим правилом, згідно з яким співвідношення суб’єктів і предикторів має бути принаймні 10:1.

Хоча існують і більш складні формули, загальне емпіричне правило таке не менше 50 учасників для кореляції або регресії з числом, що збільшується з більшою кількістю незалежних змінних (IV). Грін (1991) надає вичерпний огляд процедур, які використовуються для визначення розмірів регресійної вибірки.

Наприклад, у регресійному аналізі багато дослідників кажуть, що повинно бути принаймні 10 спостережень за змінною. Якщо ми використовуємо три незалежні змінні, то чітким правилом буде мінімальний розмір вибірки 30. Деякі дослідники дотримуються статистичної формули для розрахунку розміру вибірки.

Наведена вище формула включає міру розміру ефекту Коена (1988) у множинній регресії, 𝑓𝑓2. Коен (1988) дав визначення цінностей близько 0,02 як малий, близько 0,15 як середній і вище 0,35 як великий.

Для багатовимірного аналізу даних (наприклад, регресійного аналізу) розмір вибірки має бути у 10 разів більше, ніж кількість змінних (Роско, 1975).

Резюме: Основне правило: Розмір вибірки має бути таким, щоб було принаймні 5 спостережень на оцінюваний параметр у факторному аналізі та інших аналізах коваріаційної структури. Ядро істини: ця надто спрощена настанова здається доречною за наявності багатовимірної нормальності.