Предмет:
Тип роботи:
Курс лекцій
К-сть сторінок:
105
Мова:
Українська
єдиної нормально розподіленої генеральної сукупності для будь-яких двох вибірок i-ої і j-ої маємо ймовірність
де σi2, σj2 – вибіркові дисперсії;
Наявні різниці відносяться до відповідної стандартної помилки. Як критерій перевірки приймають нормовану різницю, яку обчислюють на основі співвідношення: ,
що порівнюється з табличним значенням ţα, де 2Φ(ţα)=1-α.
Гіпотеза однорідності вибіркових даних затверджується при Р=2Φ(ţα)=0,95 і менше, тобто α=0,05 і більше. Це означає, що при всіх значеннях tij вся сукупність вихідних даних вважається приблизно однорідною і обробка може вестися по всьому масиву.
Приклад. По двох об'єктах зібрана інформація з наступними кількісними характеристиками: n1=54; n2=56; 1=16,13; 2=13,5; σy12=65,3; σy22=57,9.
Вирішення. Визначаємо tij(max) для y1 і y2:
Звідси Р=2Φ(1,76)=0,92 або 92%.
Гіпотеза про однорідність сукупності вибіркових даних затверджується з рівнем значущості α =0,08 або 8%.
Необхідність знання закону розподілу в кореляційному аналізі зумовлена насамперед обґрунтовуванням форми зв'язку між змінними.
Нормальний закон реалізується для випадкових величин, які формуються під сумарною дією багатьох відносно незалежних між собою причин, дія кожної з яких незначна в порівнянні із загальним результатом.
Результати спостережень обробляють в такій послідовності:
- Вихідні дані розбиваються на інтервали і складають ряд розподілу функціональної ознаки yi, визначають абсолютні й відносні частоти і будують гістограма розподілу;
- Розраховують параметри закону розподілу і σy. Для спрощення рахункової роботи вводиться безрозмірна величина
де - деяке інтервальне значення функції;
Сy – інтервальне значення Y icp , прийняте за центр угрупування;
∆y – інтервал зміни випадкової величини.
Дійсне значення и σy обчислюють на основі співвідношень , и .
3.Знаходять середнє інтервальне значення Yicp в стандартизованому масштабі, відповідне центрам інтервалів. За допомогою диференціальної функції Лапласа для кожного ti знаходять значення f(t);
Визначають ординати теоретичної кривої розподілу і за знайденими точками будують теоретичну криву:
Оцінюють ступінь згоди теоретичної кривої з дослідженими даними. Оцінку ступеня згоди частіш за все проводять за допомогою критерію χ2 – «хі-квадрат» Пірсона, який є спеціально підібраною випадковою величиною, що визначається за формулою
де k – число інтервалів угрупування змінної;
емпіричні й теоретичні частоти.
Задаючись довірчим рівнянням значущості α=5%, за допомогою таблиці χ’2 – розподілу за числом ступенів свободи
де K –число інтервалів;
S – ступінь свободи
(для нормального розподілу S=2( ,σy), оскільки необхідно скласти 2 рівняння для знаходження теоретичного розподілу і σy)
Встановлюють критичне значення χ’2, з якими порівнюють розрахункове значення.
Якщо обчислене значення χ’2 за дослідженими даними менше табличного, тобто воно потрапляє в область прийняття гіпотези Н0, то теоретична крива розподілу узгоджується з емпіричним розподілом. Якщо чисельне значення χ’2 перевершує табличне або рівне йому, тобто воно потрапляє в критичну область, дана гіпотеза Н0 про форму кривої розподіл відкидається.
Приклад. Визначити закон розподілу витрат часу проходження рухомим складом маршруту між двома зупинками (хвил) при n=180 спостережень і ymin=0,70, ymax1,57 хв. .
Рис.2.4 - Гістограма розподілу
Рис. 2.5 - Гістограма і полігон розподілу
Таким чином, теоретична крива розподілу зіставляється з емпіричним розподілом, що свідчить про наявність нормального розподілу.
Інтервал ∆yСереднє значення інтервалуЧастотаВідносна частотаУмовні варіанти
Розрахунок середнього значенняРозрахунок дисперсіїЗначення в стандартизованному масштабіЗначення диференціальної функціїЕмпіричні розрахункиОрдинати теоретичного розподілуРозрахункові частоти
Таблиця 2.4 – Розрахунок показників нормального закону розподілу
Тема 3. Метод кореляції і регресії
3.1. Загальні відомості й теоретичні положення
Велику роль в пізнанні навколишньої дійсності, постійному уточненні й поглибленні знань людини про все більш нові її сторони і властивості відіграє кількісний аналіз, що базується на приматі якісного дослідження причинно-наслідкових зв'язків між явищами.
Розрізняють два види залежності між економічними явищами і процесами:
- функціональні, коли зміна однієї змінної Х (аргументу, чинника) на одиницю свого вимірювання зумовлює зростання або зменшення іншої змінної У (функції) на певну величину, тобто для кожного можливого (допустимого) значення Х відповідає цілком певне значення У;
- стохастичні (вірогідність), при яких зміна однієї випадкової величини Х викликає зміну ряду розподілу (середнього значення) іншої У, тобто кожному функціональному значенню аргументу відповідає статистичний розподіл функції і навпаки.
Функціональну (жорсткі, однозначні) залежність не слід змішувати з формулами, що використовуються для обчислення різних статистичних показників, оскільки перші характеризують одну з багатоманітних (об'єктивних) форм зв'язку між явищами і процесами в природі і суспільстві, а другі – формальний (арифметичний) підхід до оцінки отриманих результатів, часто у вигляді ланцюга співмножників.
В економіці доводиться досліджувати явища, які грають імовірнісний характер; витрати часу на одиницю роботи; простій устаткування (рухомого складу) за певний відрізок часу; собівартість продукції (послуг) та ін.
Стохастична залежність може бути суттєвою, тобто обумовлена внутрішньо властивими даному явищу причинами, і несуттєвими, які викликані дією зовнішніх (випадкових) причин (середовищем); безпосередніми і опосередніми, стійкими і нестійкими, сильними і слабкими, простими (між двома змінними) і складними (між залежною змінною У і декількома чинниками-аргументами х1,х2,…,хn).
До розділу математико-статистичного моделювання, заснованого на логіці масових явищ, відноситься регресійний і кореляційний