Формула нормального розподілу базується на двох простих параметрах - середньому та стандартному відхиленнях, які кількісно оцінюють характеристики даного набору даних. У той час як середнє значення вказує на "центральне" або середнє значення всього набору даних, стандартне відхилення вказує на "розкид" або зміну точок даних навколо цього середнього значення.
Розглянемо наступні 2 набори даних:
Набір даних 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}
Набір даних 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}
Для набору даних1 середнє = 10 і стандартне відхилення (stddev) = 0
Для Dataset2 середнє = 10 і стандартне відхилення (stddev) = 2, 83
Давайте побудуємо наступні значення для DataSet1:
Аналогічно для DataSet2:
Червона горизонтальна лінія в обох вищезазначених графіках вказує "середнє" або середнє значення кожного набору даних (10 в обох випадках). Рожеві стрілки у другому графіку вказують на поширення чи зміну значень даних від середнього значення. Це представлено значенням стандартного відхилення 2, 83 у випадку DataSet2. Оскільки у DataSet1 всі значення однакові (по 10 у кожному) і без змін, значення stddev дорівнює нулю, а отже, жодні рожеві стрілки не застосовуються.
Значення stddev має кілька значущих і корисних характеристик, які надзвичайно корисні при аналізі даних. Для нормального розподілу значення даних симетрично розподіляються по обидва боки від середнього. Для будь-якого нормально розподіленого набору даних, графік графіку зі stddev на горизонтальній осі та ні. значень даних по вертикальній осі, отримується наступний графік.
Властивості нормального розподілу
- Нормальна крива симетрична щодо середнього; Середнє значення знаходиться в середині та ділить площу на дві половини; Загальна площа під кривою дорівнює 1 для середнього = 0 і stdev = 1; Розподіл повністю описано середнім значенням і stddev
Як видно з наведеного графіку, stddev являє собою наступне:
- 68, 3% значень даних знаходяться в межах 1 стандартного відхилення середнього значення (від -1 до +1) 95, 4% значень даних знаходяться в межах 2 стандартних відхилень середнього значення (від -2 до +2) 99, 7% значень даних знаходяться в межах 3 стандартних відхилень середнього значення (від -3 до +3)
Площа під кривою дзвіноподібної форми, коли вимірюється, вказує бажану ймовірність заданого діапазону:
- менше Х: - наприклад, ймовірність значень даних менше 70 перевищує Х - наприклад, ймовірність значень даних перевищує 95 між X 1 і X 2 - наприклад, ймовірність значень даних між 65 і 85
де X - значення інтересу (приклади нижче).
Складання графіків та обчислення площі не завжди зручно, оскільки різні набори даних матимуть різні середні та stddev значення. Для полегшення єдиного стандартного методу для легких обчислень та застосовності до проблем реального світу було введено стандартне перетворення на Z-значення, які складають частину Таблиці нормального розподілу.
Z = (X - середнє значення) / stddev, де X - випадкова величина.
В основному, це перетворення змушує середнє значення і stddev стандартизувати до 0 і 1 відповідно, що дозволяє використовувати легкий обчислення стандартного визначеного набору значень Z (з таблиці нормального розподілу). Знімок стандартної таблиці z-значення, що містить значення ймовірності, полягає в наступному:
z |
0, 00 |
0, 01 |
0, 02 |
0, 03 |
0, 04 |
0, 05 |
0, 06 |
0, 0 |
0, 00000 |
0, 00399 |
0, 00798 |
0, 01197 |
0, 01595 |
0, 01994 |
… |
0, 1 |
0, 0398 |
0, 04380 |
0, 04776 |
0, 05172 |
0, 0567 |
0.05966 |
… |
0, 2 |
0, 0793 |
0, 08317 |
0, 08706 |
0, 09095 |
0, 048483 |
0.09871 |
… |
0, 3 |
0.11791 |
0, 12172 |
0, 12552 |
0.12930 |
0, 13307 |
0, 13683 |
… |
0, 4 |
0, 15542 |
0, 15910 |
0, 16276 |
0, 16640 |
0, 17003 |
0, 17364 |
… |
0, 5 |
0, 19146 |
0, 19497 |
0, 19847 |
0.20194 |
0, 20540 |
0, 20884 |
… |
0, 6 |
0, 22575 |
0, 22907 |
0, 23237 |
0, 23565 |
0, 23891 |
0, 24215 |
… |
0, 7 |
0, 25804 |
0, 26115 |
0, 26424 |
0, 26730 |
0, 27035 |
0, 27337 |
… |
… |
… |
… |
… |
… |
… |
… |
… |
Щоб знайти ймовірність, пов’язану з z-значенням 0, 239865, спочатку закруглете її до 2 знаків після коми (тобто 0, 24). Потім перевірте перші 2 значущі цифри (0, 2) у рядках та найменш значну цифру (що залишилася 0, 04) у стовпці. Це призведе до значення 0, 09483.
Повна нормальна таблиця розподілу з точністю до 5 знаків після значень ймовірності (включаючи негативні значення) можна знайти тут.
Подивимось приклади реального життя. Зріст особин у великій групі відповідає нормальній схемі розподілу. Припустимо, що у нас є набір із 100 особин, висота яких зафіксована, а середня величина та stddev обчислюються відповідно до 66 та 6 дюймів.
Ось кілька прикладних питань, на які можна легко відповісти, використовуючи таблицю z-значення:
- Яка ймовірність того, що людина в групі становить 70 дюймів або менше?
Питання полягає в тому, щоб знайти сукупне значення P (X <= 70), тобто у всьому наборі даних 100, скільки значень буде від 0 до 70.
Давайте спочатку перетворимо X-значення 70 в еквівалентне Z-значення.
Z = (X - середнє значення) / stddev = (70-66) / 6 = 4/6 = 0, 66667 = 0, 67 (круглі до 2 знаків після коми)
Тепер нам потрібно знайти P (Z <= 0, 67) = 0. 24857 (із z-таблиці вище)
тобто існує 24, 857% ймовірність того, що людина в групі буде менше або дорівнює 70 дюймам.
Але повісьте - вищесказане є неповним. Пам'ятайте, ми шукаємо ймовірність усіх можливих висот до 70, тобто від 0 до 70. Вище наведене дає вам частину від середнього до бажаного значення (тобто 66 до 70). Нам потрібно включити другу половину - від 0 до 66 - щоб дійти до правильної відповіді.
Оскільки від 0 до 66 являє собою половину частини (тобто середнє значення середнього крайнього та середнього), її ймовірність становить просто 0, 5.
Звідси правильна ймовірність того, що людина складе 70 дюймів або менше = 0, 24857 + 0, 5 = 0. 74857 = 74, 857%
Графічно (обчисливши площу), це дві підсумовані області, що представляють рішення:
- Яка ймовірність того, що людина має 75 дюймів і вище?
тобто Знайдіть додатковий кумулятивний P (X> = 75).
Z = (X - середнє значення) / stddev = (75-66) / 6 = 9/6 = 1, 5
P (Z> = 1, 5) = 1- P (Z <= 1, 5) = 1 - (0, 5 + 0, 43319) = 0, 06681 = 6, 668%
- Яка ймовірність того, що людина перебуває між 52 і 67 дюймами?
Знайдіть Р (52 <= X <= 67).
P (52 <= X <= 67) = P = P (-2, 33 <= Z <= 0, 17)
= P (Z <= 0, 17) –P (Z <= -0, 233) = (0, 5 + 0, 56749) - (.40905) =
Ця нормальна таблиця розподілу (і z-значень) зазвичай знаходить застосування для будь-яких розрахунків ймовірності очікуваних змін цін на фондовому ринку для акцій та індексів. Вони використовуються в торгівлі на основі діапазону, ідентифікуючи тенденцію до зростання або низхідний тренд, рівні підтримки чи опору та інші технічні показники, засновані на нормальних концепціях розподілу середнього та стандартного відхилень.
Порівняйте інвестиційні рахунки × Пропозиції, що відображаються в цій таблиці, є партнерствами, від яких Інвестопедія отримує компенсацію. Опис постачальникаПов'язані статті
Торгівля базовою освітою
Тестування гіпотези з фінансів: концепція та приклади
Управління ризиками
Оптимізуйте свій портфель за допомогою звичайного розподілу
Технічний аналіз Основна освіта
Лінійна регресія часу і ціни
Управління ризиками
Використання та межі енергонезалежності
Фінансовий аналіз
Як розрахувати значення ризику (VaR) в Excel
Інструменти фундаментального аналізу
Розуміння вимірювань мінливості
Посилання партнераПов'язані умови
Визначення інтервалу довіри Інтервал довіри в статистиці позначає ймовірність того, що параметр популяції потрапить між двома встановленими значеннями. детальніше Управління ризиками у фінансах У фінансовому світі управління ризиками - це процес виявлення, аналізу та прийняття чи зменшення невизначеності інвестиційних рішень. Управління ризиками відбувається в будь-який час, коли інвестор чи менеджер фонду аналізує та намагається кількісно оцінити потенційні збитки від інвестицій. докладніше Розуміння кризису спотової казначейської кризи Крива казначейської ставки спот визначається як крива прибутковості, побудована з використанням казначейських спотових ставок, а не прибутковості. Крива спотової ставки Казначейства може використовуватися як орієнтир для облігацій цін. детальніше Визначення індексу Джині Індекс Джині - це статистичний показник розподілу, який часто використовується як показник економічної нерівності. більше Модель ціноутворення капітальних активів (CAPM) Модель ціноутворення капітальних активів - це модель, яка описує залежність між ризиком та очікуваною віддачею. докладніше Розуміння гармонійного середнього значення Гармонічне середнє значення - це середнє значення, яке використовується у фінансах до середнього кратного, наприклад, співвідношення ціни та заробітку. більше