Недостаци линеарне регресије

Posted on
Аутор: Peter Berry
Датум Стварања: 19 Август 2021
Ажурирати Датум: 1 Може 2024
Anonim
Primijenjena statistika PV11 13 F test, t test, regresije
Видео: Primijenjena statistika PV11 13 F test, t test, regresije

Садржај

Линеарна регресија је статистичка метода за испитивање односа између зависне променљиве, која је означена са и, и једна или више независних променљивих, означених као Икс. Зависна варијабла мора бити континуирана, тако да може попримити било коју вриједност, или барем близу континуиране. Независне променљиве могу бити било које врсте. Иако линеарна регресија не може сама по себи да узрокује узрочне узроке, на зависну варијаблу обично утичу независне променљиве.

Линеарна регресија ограничена је на линеарне односе

Линеарна регресија по својој природи гледа само на линеарне односе између зависних и независних променљивих. Односно, претпоставља се да постоји праволинијски однос између њих. Понекад је то нетачно. На пример, однос између прихода и старости је закривљен, тј. Приход обично расте у раним деловима одрасле доби, изравнава се у каснијој одраслој доби и опада након што се људи повуку. Можете ли знати да ли је то проблем гледајући графичке приказе односа.

Линеарна регресија гледа само на средину зависне променљиве

Линеарна регресија гледа однос између средње вредности зависне променљиве и независних променљивих. На пример, ако погледате однос између тежине рођења новорођенчади и карактеристика мајке као што су старосна доб, линеарна регресија ће сагледати просечну тежину беба рођених мајкама различитог узраста. Међутим, понекад требате сагледати крајности зависне променљиве, нпр. Бебе су у ризику када им је тежина мала, па бисте желели да погледате крајности у овом примеру.

Баш као што средња вредност није потпун опис једне променљиве, линеарна регресија није потпуни опис односа међу променљивим. Овај проблем можете решити користећи кванттилну регресију.

Линеарна регресија је осетљива на старије особе

Подаци о одласку су изненађујући. Нападачи могу бити униваријатни (засновани на једној варијабли) или мултиваријантни. Ако посматрате старост и приход, универзалан трошак ће бити ствари попут особе која има 118 година или оне која је прошле године зарадила 12 милиона долара. Мултиваријантни странац би био 18-годишњак који је зарадио 200.000 долара. У овом случају, ни старост ни приход нису екстремни, али врло мало људи од 18 година зарађује толико новца.

Одморници могу имати огромне ефекте на регресију. Овај проблем можете решити тако што ћете тражити статистику утицаја од свог статистичког софтвера.

Подаци морају бити независни

Линеарна регресија претпоставља да су подаци независни. То значи да оцене једног предмета (као што је особа) немају никакве везе са оценама другог. То је често, али не увек, разумно. Два уобичајена случаја у којима нема смисла су групирање у простору и времену.

Класичан пример окупљања у простор су резултати тестова ученика када имате ученике из различитих разреда, разреда, школа и школских округа. Ученици у истом разреду имају тенденцију да су на више начина слични, тј. Често долазе из истих насеља, имају исте учитеље итд. Дакле, они нису самостални.

Примери групирања у времену су било које студије у којима мерите исте предмете више пута. На пример, у студији исхране и тежине, можете измерити сваку особу више пута. Ови подаци нису независни, јер оно што особа једном тежи је повезано са оним које тежи у другим приликама. Један од начина да се то реши је модел са више нивоа.