MSE:

# Code Comparison # true: Array of true target variable # pred: Array of predictions def calculateMAE ( true, pred ): return np. sum (np. abs (true - pred)) def calculateMSE ( true, pred ): return np. sum ((true - pred)** 2 )





MAE y MSE con diferentes modelos





Podemos mirar estos ejemplos para comparar modelos. Sin embargo, puede que no tenga sentido comparar m茅tricas en diferentes modelos en este momento:

Bono: Regularizaci贸n L1 y L2

Regularizaci贸n : es una t茅cnica utilizada para reducir la complejidad del modelo. Lo hace penalizando la funci贸n de p茅rdida.

L1 o Norma Manhattan:

Un tipo de regularizaci贸n que penaliza pesos en proporci贸n a la suma de los valores absolutos de los pesos . En los modelos que se basan en caracter铆sticas escasas, la regularizaci贸n L1 ayuda a llevar el peso de las caracter铆sticas irrelevantes o apenas relevantes a exactamente 0, lo que elimina esas caracter铆sticas del modelo. La p茅rdida L1 es menos sensible a los valores at铆picos que la p茅rdida L2.

L2 o Norma Euclidiana:

Un tipo de regularizaci贸n que penaliza los pesos en proporci贸n a la suma de los cuadrados de los pesos . La regularizaci贸n L2 ayuda a acercar los pesos at铆picos (aquellos con valores positivos altos o negativos bajos) a 0 pero no tanto. La regularizaci贸n L2 siempre mejora la generalizaci贸n en modelos lineales.

L2 y L1 penalizan los pesos de manera diferente:

L2 penaliza peso2.L1 penaliza |peso|.









Laboratorio de experimentos 鈿楋笍馃И馃尅馃搳馃搲馃搱馃攳

Veamos c贸mo funcionan las m茅tricas en datos at铆picos y no at铆picos.

# Import part. import numpy as np import pandas as pd from sklearn.metrics import mean_absolute_error from sklearn.metrics import mean_squared_error import statsmodels.api as sm

Generar茅 datos sint茅ticos en un cierto rango con numpy.

Produje datos previos sin ejecutar un modelo, porque no quiero centrarme en la creaci贸n de modelos. Quiero ver c贸mo cambian las m茅tricas en diferentes datos.

# First actual values. actual = np.random.randint(low= 50 , high= 101 , size=( 50 )) # Seconda my random pred data. pred = np.random.randint(low= 50 , high= 101 , size=( 50 )) print ( "Actual data (Random):" , actual) print ( "Pred data (Random):" , pred)

Out[]: Actual data (Random): [ 53 95 63 78 88 59 96 86 52 71 78 89 77 60 97 79 71 87 55 92 69 76 80 66 80 88 89 68 69 98 100 57 83 72 82 72 52 78 94 76 69 59 73 70 99 97 100 63 73 94 ] Pred data (Random): [ 66 69 65 75 99 100 88 92 83 77 80 58 85 91 78 80 63 100 55 84 64 85 67 87 79 83 59 81 76 85 96 86 87 99 91 84 81 50 96 98 76 99 55 63 67 74 51 100 55 75 ]

import matplotlib.pyplot as plt # create scatter plot plt.plot(actual, pred, 'o' ) # m = slope, b=intercept m, b = np.polyfit(actual, pred, 1 ) plt.plot(actual, m*actual + b)

Out[]:





mae = mean_absolute_error(actual, pred) print ( "MAE without outliers:" , mae) mse = mean_squared_error(actual, pred) print ( "MSE without outliers:" , mse)

Out[]: MAE without outliers: 16.02 MSE without outliers: 408.1

Agregu茅 algunos valores at铆picos a los valores de pred.

pred[[ 4 , 8 , 15 , 45 ]] = pred[[ 4 , 8 , 15 , 45 ]] + 50

# create scatter plot plt.plot(actual, pred, 'o' ) # m = slope, b=intercept m, b = np.polyfit(actual, pred, 1 ) plt.plot(actual, m*actual + b)

Out[]:





mae = mean_absolute_error(actual, pred) print ( "MAE with outliers:" , mae) mse = mean_squared_error(actual, pred) print ( "MSE with outliers:" , mse)

Out[]: MAE with outliers: 19.1 MSE with outliers: 648.1

El aumento observado en MAE fue de aproximadamente 3. Sin embargo, el RMSE aument贸 en aproximadamente 200. Esto significa que si tenemos datos at铆picos, MSE producir谩 un resultado m谩s sensible. MAE no tuvo en cuenta los valores at铆picos.





隆Prima! Si queremos comparar MAE y RMSE

RMSE: Representa la desviaci贸n est谩ndar muestral de las diferencias entre los valores predichos y los valores observados (llamados residuales).





Caso 1: valores reales = [2,4,6,8], valores previstos = [4,6,8,10]

MAE para el caso 1 = 2,0, RMSE para el caso 1 = 2,0

Caso 2: valores reales = [2,4,6,8], valores previstos = [4,6,8,12]

MAE para el caso 2 = 2,5, RMSE para el caso 2 = 2,65





En el ejemplo anterior, podemos ver que RMSE penaliza la predicci贸n del 煤ltimo valor m谩s que MAE.

