Предмет:
Тип роботи:
Курс лекцій
К-сть сторінок:
105
Мова:
Українська
style="text-align: justify;">5.2.Будуємо гістограму і розробляємо припущення про закон розподілу у.
5.3.Накладаємо відповідну диференціальну криву розподілу і візуально визначаємо ступінь близькості гістограми до гіпотетичної теоретичної кривої.
5.4.Перевіряємо наявність передбачуваного закону розподілу за допомогою деякого статистичного критерію згоди.
Таблиця 3.3 - Розподіл досліджених значень у
ІнтервалиСереднє значення інтервалучастотаВідносна частотаУмовні варіаціїРозрахунок середнього значенняРозрахунок дисперсіїЗначення у в стандартизованномумасштабіЗначення диференційованої функціїЕмпіричні частотиОрдинати теоретичного розподілуРозрахункові частоти
yk-1-ykycp.mimi/ny1cp/mi y1cp.Mi y12cp.(y1cp/- )2 miФормулаформулаформулаформулаформула
71-737220,055-4-83241,4962,5020,01750,0270,00640,461
73-757440,111-3-123650,5521,7760,0840,0560,0312,232
75-777660,167-2-122439,1681,0490,2310,0830,0846,048
77-797870,194-1-7716,9260,3230,3790,0970,13769,907
79-818070,1940002,1560,4030,3630,090,1319,489
Продовження табл. 3.3
81-838231330,5941,1290,2120,0420,07725,544
83-858450,1392102010,4401,8560,0720,0690,026211,886
85-878620,055361811,9562,5830,0140,0270,005100,367
361-201401173.83J35.924
Для побудови гістограми обчислюємо висоти прямокутників
.(3.38)
Розрахунки наведені в табл.3.3. Гістограма і полігон нагадують нормальний розподіл (рис.3.1).
Рис.3.1 - Гістограма і полігон
(3.39)
Порівнюється відношення Х2 табл при п'яти ступенях свободи з розрахунковим Х2розр.:
.(3.40)
Таким чином, Х2стат. 5%>Х2расч.,.тобто статистичне значення Х2 потрапляє в допустиму область при 95% рівні значущості. Гіпотеза наявності нормального закону розподілу собівартості пасажироперевезень затверджується.
6. Відкидаємо окремі значення, різко відмінні від основної маси спостережень. Якщо значення у розподілене нормально, найбільші випадкові відхилення від середнього за абсолютною величиною не перевищують 3 з достовірною вірогідністю 99,7%.
У даній статистичній сукупності =78,89 і σy =2,753. Отже, в масив для подальшої обробки слід включати всі значення у, що не виходять за межі 78,89-3.2,753=70,631 і 78,89+3.2,753=87,149.
У прикладі, що розглядаємо, уmin=72,11 і уmax=85,98, отже, всі значення включаються для подальшої обробки.
7.Перевіряємо достатність кількості спостережень за умови, що відхилення середнього вибіркового виб. від середнього генерального ген. не перевершує певну величину ε з гарантійною вірогідністю Р=95%.
У даному прикладі σy2=7,580, тоді маємо 2Ф(t)=0,95 t=1,96;
.(3.41)
Отже, вибірка в 36 спостережень задовольняє поставленій вимозі.
8. Складаємо рівняння регресії у собівартості пасажироперевезень по Х (середньодобовому перебуванню рухомого складу на лінії).
8.1. За дослідженими даними будуємо кореляційне поле в декартовій системі координат (рис.3.2). Для наближеного співвідношення сторін графіка у по Х використовуємо відносний варіаційний розмах
.(3.42)
Рис. 3.2 - Кореляційне поле, емпірична і теоретична лінії регресії
8.2. Складаємо кореляційну таблицю (табл. 3.4.), обчислюємо інтервальні середні I і будуємо емпіричну лінію регресії по Х.
8.3. Складаємо рівняння собівартості пасажироперевезень за середньодобовим перебуванням рухомого складу на лінії. Розрахунки всіх потрібних сум в умовних варіантах наведені в табл. 3.4, =кх+b:
(3.43)
σх2= σх1 2.(3.44)
∆Х2=2,559*0,12=0,0256;(3.45)
σх=0,160;(3.46)
b= +к ; b=79,12-(-19,843)*11,753=312,24.(3.47)
Отже, рівняння регресії має вигляд:
=312,24-19,843 Х.(3.48)
8.4. Визначаємо емпіричне кореляційне відношення ηу/х, коефіцієнт кореляції ry/x і його середнє квадратичне відхилення σ2.
Коефіцієнт кореляції рівний
(3.49)
Коефіцієнт кореляції достатньо великий і суттєвий при високій гарантійній ймовірності:
(3.50)
Кореляційне відношення
(3.51)
Лінійність кореляційної залежності гарантується при високому рівні значущості. Дійсно, кореляційне співвідношення ηу/х знаходиться в довірчому інтервалі для ry/x:
(3.52)
при 5% рівні значущості t=1,96.
.(3.53)
0,854 ≤ 0,965 ≤ 0,967(3.54)
Теоретична лінія регресії представлена на рис.3.2.
Парні рівняння регресії xj=d(xj) описують залежність функціональної ознаки від кожного окремо взятого чинника - аргументу без урахування його взаємозв'язку з іншими. Це може спотворювати дійсне положення, призводити до невиправданих висновків і пропозицій. Треба виявити відособлений "приватний вплив" кожного окремого чинника, які в досліджуваному процесі виступають у взаємозв'язку.
Проблема відшукання такого рівняння, яке показало б ізольований вплив на показник кожного окремого чинника, що вивчається, розв'язується за допомогою рівняння множинної регресії.
Ставиться завдання визначення такої функції F(X1,X2...Xp), яка математично описувала б зміну середнього значення ознаки у, що вивчається, залежно від аргументу Х1, Х2..Хр з урахуванням особливостей процесу і близьким охопленням вихідних даних:
х1, х2, ....хр=F(Х1, Х2...Хр).(3.55)
Поставлене завдання розв'язується на основі знання сутності процесу і попереднього виявлення одновимірної залежності
хj=dj (Xj), де j=1,2...P.(3.56)
При об'єднанні парних рівнянь в єдине множинне необхідно чітко розрізняти дві ситуації:
- при виборі рівнянь парної регресії хj= d (Xj) (1) змінна у не піддавалася функціональним перетворенням;
- при виборі рівнянь парної регресії хj1= d (Xj) (2) величина у піддавалася функціональним перетворенням виду , ℓg y, y2 та ін.
У першій ситуації будь-яка парна залежність може бути з'єднана в множинне рівняння, яке можна отримати підсумовуванням виразів типу (1):
х1, х2..хр=F(X1, X2...Xp)= 1(x1) + 2(x2)+ .+ p(xp) (3),
де j=d(xj) – функція типу ij (xj) з невизначеними коефіцієнтами, обчисленими за способом найменших квадратів. Так, рівняння прямої =А1Х1+В1 і гіперболи об'єднуються в рівняння множинної регресії в якому параметри а, b і с визначаються методом найменших квадратів з системи нормальних рівнянь:
(3.57)
У другій ситуації парні рівняння (1) об'єднуються в єдине множинне при будь-якому виді функції (2), але тільки