Los modelos entrenados en un pequeño número de observaciones tienden a sobreajustarse y producir resultados inexactos. Aprenda a evitar el sobreajuste y obtenga predicciones precisas incluso si los datos disponibles son escasos. Eliminar el impacto de los valores atípicos de los datos es esencial para obtener un modelo sensato con un conjunto de datos pequeño. Las 7 formas efectivas de lidiar con un conjunto de datos pequeño incluyen: elegir modelos simples, seleccionar características relevantes, combinar varios modelos, combinar diferentes modelos y usar técnicas de regularización para mantener un modelo más conservador. Por ejemplo, la regresión logística es un modelo lineal simple con un número limitado de pesos.