Variancia (az MI-ben)
1. Fogalom magyarul: variancia (az MI-ben)
2. Fogalom angolul: variance
3. Meghatározás:
A variancia egy statisztikai mérőszám, amely azt mutatja meg, hogy egy adathalmaz mennyire szóródik vagy terjed szét az átlagérték körül. A variancia kiszámítása során az egyes adatpontok és az átlag négyzetes eltéréseit átlagoljuk. A gépi tanulásban a variancia szerepe kiemelt a modell teljesítményének értékelésében. Egy gépi tanulási modell varianciájának az eltérő – de ugyanabból az eloszlásból vett – adathalmazokon mért torzítási értékek által mutatott varianciát tekintjük. Ennek értelmében a magas modell variancia jellemzően a túltanulás jelenségével hozható párhuzamba, amikor a modell túlzottan jól illeszkedik a tanító adatokhoz (azaz alacsony a torzítása), de gyengén teljesít új, nem látott adatokon (azaz magas a torzítása). Az ilyen modellek fokozottan érzékenyek a zajra és a kiugró értékekre, ezért is fontos a torzítás és variancia közötti megfelelő kompromisszum megtalálása a gépi tanuló modellek illesztése során.
4. Hivatkozások:
- Hastie, Trevor, Robert Tibshirani, and Jerome Friedman. "The Elements of Statistical Learning." Springer, 2009.
- Bishop, Christopher M. "Pattern Recognition and Machine Learning." Springer, 2006.
5. Megjegyzések:
6. Kulcsszavak:
mesterséges intelligencia, gépi tanulás