¿Qué es el overfitting y por qué destruye tus estrategias?

Creas una estrategia en StrategyQuant. El backtest es impecable: curva de equity suave, Sharpe alto, drawdown controlado. La llevas a demo y en dos semanas está en pérdidas. ¿Qué ha pasado? Casi con total seguridad: overfitting.

Es el error más común en trading algorítmico y también el más costoso. Y lo peor es que no se ve a simple vista — un backtest con overfitting parece mejor que uno sin él.

Qué es exactamente el overfitting

El overfitting (sobreajuste) ocurre cuando una estrategia se ha "memorizado" los datos históricos en lugar de aprender un patrón real del mercado. La estrategia no está describiendo cómo funciona el mercado — está describiendo el ruido específico de ese período concreto de datos.

Imagina que entrenas a alguien para superar un examen dándole las respuestas exactas de ese examen. Aprobará ese examen pero fallará cualquier otro similar. Eso es exactamente lo que hace el overfitting con una estrategia de trading.

El problema: cuantos más parámetros ajustas, más fácil es que la estrategia aprenda el ruido del pasado. Un sistema con muchos filtros y condiciones tiene más probabilidades de estar sobreajustado, aunque su backtest sea perfecto.

Señales de que una estrategia tiene overfitting

Backtest excelente, demo desastrosa. La señal más obvia. Si hay una diferencia muy grande entre los resultados históricos y los reales, el sistema memorizó el pasado.
Funciona solo en un rango de fechas. Si la estrategia solo funciona entre 2019 y 2022 pero falla en 2023, no has encontrado un patrón — has encontrado un accidente histórico.
Demasiadas condiciones de entrada. Cada filtro extra que añades aumenta el riesgo de sobreajuste. Si necesitas 8 condiciones para que el sistema funcione, probablemente está memorizando.
Rendimiento muy sensible a los parámetros. Si cambiar un parámetro en 1 punto cambia radicalmente los resultados, la estrategia es frágil.

Por qué el backtesting clásico no es suficiente

El problema de hacer un backtest sobre todos tus datos históricos es que estás midiendo la estrategia en los mismos datos en los que la construiste. Es como hacer el examen con el libro delante: por supuesto que sacas un 10.

La solución es separar los datos en dos bloques: uno para construir la estrategia y otro para probarla, sin que el sistema haya "visto" ese segundo bloque durante su creación. A ese segundo bloque se le llama fuera de muestra (OOS, Out-of-Sample).

Regla básica: si una estrategia no funciona en datos fuera de muestra, no funcionará en el mercado real. El fuera de muestra es el mínimo indispensable para publicar cualquier resultado honesto.

Las pruebas de robustez: la solución real

El fuera de muestra es necesario pero no suficiente. Una estrategia puede pasar el OOS por casualidad. Para tener mayor confianza, se aplican pruebas de robustez adicionales que estresan el sistema de diferentes formas:

Monte Carlo

Simula el comportamiento de la estrategia con variaciones aleatorias en las condiciones de entrada: orden aleatorio de los trades, parámetros ligeramente modificados, datos con pequeñas perturbaciones. Si la estrategia sigue siendo rentable en el 95% de las simulaciones, tiene base real.

Pruebas en temporalidades cruzadas

Si una estrategia funciona en H1, debería comportarse de forma coherente en M30 y H4. No tiene por qué ser igual de rentable, pero no debería romperse por completo. Si falla totalmente en temporalidades adyacentes, la lógica probablemente está ajustada al timeframe específico.

Walk Forward Matrix

La prueba más completa: entrena y valida la estrategia en múltiples ventanas temporales distintas, generando una matriz de resultados. Una estrategia robusta muestra consistencia en la mayor parte de la matriz, no un pico aislado.

Cuántas estrategias superan todo esto

La realidad es dura: de cada 1.000 estrategias que genera StrategyQuant, solo una pequeña fracción supera todas las pruebas de robustez. Eso no significa que el proceso no funcione — significa que el proceso está haciendo exactamente su trabajo: filtrar el ruido.

Cada estrategia que descartamos es una estrategia que no pierde dinero en demo ni en real. El tiempo que "pierdes" filtrando es tiempo que ganas no perdiendo capital.

Aprende a filtrar estrategias con criterio

En el curso de Primeras Estrategias aplicamos 8 pruebas de robustez en cadena. Solo una de cada 1.000 estrategias llega al final. Las que llegan, funcionan.

Ver el curso — 50 €