Variancia (az MI-ben)

1. Fogalom magyarul: variancia (az MI-ben)

2. Fogalom angolul: variance

3. Meghatározás:

A variancia egy statisztikai mérőszám, amely azt mutatja meg, hogy egy adathalmaz mennyire szóródik vagy terjed szét az átlagérték körül. A variancia kiszámítása során az egyes adatpontok és az átlag négyzetes eltéréseit átlagoljuk. A gépi tanulásban a variancia szerepe kiemelt a modell teljesítményének értékelésében. Egy gépi tanulási modell varianciájának az eltérő – de ugyanabból az eloszlásból vett – adathalmazokon mért torzítási értékek által mutatott varianciát tekintjük. Ennek értelmében a magas modell variancia jellemzően a túltanulás jelenségével hozható párhuzamba, amikor a modell túlzottan jól illeszkedik a tanító adatokhoz (azaz alacsony a torzítása), de gyengén teljesít új, nem látott adatokon (azaz magas a torzítása). Az ilyen modellek fokozottan érzékenyek a zajra és a kiugró értékekre, ezért is fontos a torzítás és variancia közötti megfelelő kompromisszum megtalálása a gépi tanuló modellek illesztése során.

4. Hivatkozások:

  • Hastie, Trevor, Robert Tibshirani, and Jerome Friedman. "The Elements of Statistical Learning." Springer, 2009. 
  • Bishop, Christopher M. "Pattern Recognition and Machine Learning." Springer, 2006.

5. Megjegyzések:

6. Kulcsszavak:

mesterséges intelligencia, gépi tanulás

2366 Megtekintés
Átlagos (0 Szavazatok)