Варіантність - це вимірювання розкиду між числами в наборі даних. Дисперсія вимірює, наскільки кожне число в наборі знаходиться від середнього значення.
За допомогою діаграми набору даних ми можемо спостерігати, що таке лінійна залежність різних точок даних чи чисел. Ми робимо це шляхом нанесення лінії регресії, яка намагається мінімізувати відстань будь-якої окремої точки даних від самої лінії. На графіку нижче дані точки - сині точки, помаранчева лінія - лінія регресії, а червоні стрілки - відстань від спостережуваних даних та регресійної лінії.
Зображення Джулі Банг © Інвестопедія 2020
Коли ми обчислюємо дисперсію, ми запитуємо, враховуючи співвідношення всіх цих точок даних, скільки відстані ми очікуємо до наступної точки даних? Ця "відстань" називається терміном помилки, і це те, яку дисперсію вимірює.
Сама по собі дисперсія не часто корисна, оскільки не має одиниці, що ускладнює їх вимірювання та порівняння. Однак квадратний дисперсійний корінь - це стандартне відхилення, і це одночасно як вимірювання.
Розрахунок варіації в Excel
Розрахувати дисперсію в Excel легко, якщо у вас вже введений набір даних у програмне забезпечення. У наведеному нижче прикладі ми обчислимо дисперсію в 20-денний щоденний прибуток у дуже популярному фондово обмінюваному фонді (ETF) під назвою SPY, який інвестує в S&P 500.
- Формула = VAR.S (виберіть дані)
Причина, яку ви хочете використовувати VAR.S, а не VAR.P (що є іншою запропонованою формулою), полягає в тому, що часто ви не маєте для вимірювання всієї сукупності даних. Наприклад, якби в нашій таблиці були всі прибутки в історії SPY ETF, ми могли б використовувати вимірювання чисельності населення VAR.P, але оскільки ми вимірюємо лише останні 20 днів для ілюстрації концепції, ми будемо використовувати VAR.S.
Як бачимо, обчислене значення дисперсії.000018674 мало говорить про набір даних сам по собі. Якби ми перейшли до квадратного кореня, що має значення, щоб отримати стандартне відхилення прибутку, це було б корисніше.
