Садржај
У статистици се Гауссова, или нормална, дистрибуција користи за карактеризацију сложених система са многим факторима. Као што је описано у Историји статистике Степхена Стиглера, Абрахам Де Моивре је изумио дистрибуцију која носи име Карла Фредрицка Гауса. Гаусов допринос лежи у његовој примјени дистрибуције на приступ најмање квадрата како би се минимизирала грешка у прилагођавању података са линијом која најбоље одговара. Тако је учинио најважнију дистрибуцију грешака у статистици.
Мотивација
Каква је дистрибуција узорка података? Шта ако не знате основну дистрибуцију података? Постоји ли начин да се тестирају хипотезе о подацима без познавања основне дистрибуције? Захваљујући теореми о средишњој граници, одговор је да.
Изјава теорема
Каже да је вриједност узорка из бесконачне популације приближно нормална, или гаусова, са средњом вриједности једнаком основној популацији и варијанци једнаком варијанцији популације подијељеној са величином узорка. Приближавање се побољшава како величина узорка постаје већа.
Изјава апроксимације се понекад погрешно наводи као закључак о конвергенцији у нормалну дистрибуцију. Пошто се приближна нормална дистрибуција мења како се величина узорка повећава, таква изјава је погрешна.
Теорему је развио Пиерре Симон Лаплаце.
Зашто је свуда
Нормалне дистрибуције су свеприсутне. Разлог долази из теорема о централном лимиту. Често, када се мери вредност, то је збирни ефекат многих независних променљивих. Према томе, сама вредност која се мери има квалитет узорка. На пример, дистрибуција перформанси спортиста може имати облик звона, као резултат разлика у начину исхране, тренинга, генетике, тренирања и психологије. Чак и мушке висине имају нормалну дистрибуцију, што је функција многих биолошких фактора.
Гауссиан Цопулас
Оно што се назива „функција копуле“ са Гауссовом дистрибуцијом било је у вестима 2009. године због његове употребе у процени ризика од улагања у колатерализоване обвезнице. Злоупотреба функције била је пресудна у финансијској кризи 2008-2009. Иако је било много узрока кризе, уназад Гауссова дистрибуција вјероватно није требала бити кориштена. Функција са дебљим репом доделила би већу вероватноћу штетним догађајима.
Деривација
Теорем централног ограничења може се доказати у многим линијама анализом функције генерисања момента (мгф) (просечна вредност узорка - просечна популација) /? (Варијанца популације / величина узорка) као функција мгф основне популације. Приближни део теореме уведен је ширењем мгф основне популације као серије снаге, а затим је приказано да је већина термина безначајна јер величина узорка постаје велика.
То се може доказати у далеко мање редова употребом Таилорове експанзије на карактеристичној једначини исте функције и увећањем величине узорка.
Рачунарска погодност
Неки статистички модели претпостављају да су грешке Гауссове. То омогућава да се дистрибуције функција нормалних променљивих, попут хи-квадратне и Ф-дистрибуције, користе у тестирању хипотеза. Конкретно, у Ф-тесту Ф статистика је састављена од односа хи-квадратних дистрибуција, које су саме функције параметра нормалне варијанце. Однос ове две изазива одступање од варијанце, омогућавајући тестирање хипотеза без сазнања о варијантама, осим њихове нормалности и сталности.