Série Algo Trading — Partie 3 sur 12

Alpha Factors & Signal Research

Construction de 50+ alpha factors (momentum, value, quality, volatility, sentiment), processus de recherche systématique, analyse du decay, feature importance, et combinaison optimale. Le cœur intellectuel du système.

50+ Facteurs Research Process Alpha Decay
Algo Trading — De 100K au Million3/12
TaxonomieMomentumValue & QualitySentiment & AltResearch ProcessCombinaison
Taxonomie des alpha factors

Les 6 familles de facteurs alpha

Un alpha factor est une variable prédictive qui capture une anomalie de marché exploitable. La recherche académique et industrielle a identifié des centaines de facteurs, mais seuls ~50 restent profitables après coûts de transaction et ajustement pour le data mining bias.

FamilleNombre de facteursHorizon optimalSharpe typique (seul)Decay
Momentum12 facteurs1-12 mois0.4-0.8Lent (mois)
Value8 facteurs6-24 mois0.2-0.5Très lent (années)
Quality6 facteurs12-36 mois0.3-0.6Très lent
Volatility/Risk8 facteurs1-4 semaines0.3-0.7Rapide (jours)
Sentiment/Flow10 facteurs1-5 jours0.2-0.5Très rapide (heures)
Technical/Pattern8 facteurs1-10 jours0.1-0.4Rapide
Facteurs Momentum — Les plus puissants

12 facteurs Momentum

Le momentum est l'anomalie de marché la plus robuste et la plus documentée (Jegadeesh & Titman, 1993). Les actions qui ont bien performé continuent de bien performer sur 1-12 mois. C'est le pilier central de notre système.

#FacteurCalculLookbackIC moyenTurnover
1MOM_12_1Return 12 mois excluant le dernier mois252-21 jours0.04-0.06~30%/mois
2MOM_6_1Return 6 mois excluant le dernier mois126-21 jours0.03-0.05~40%/mois
3MOM_3_1Return 3 mois excluant le dernier mois63-21 jours0.02-0.04~50%/mois
4ACCEL_MOMMOM_6_1 - MOM_12_7 (accélération du momentum)126 jours0.03-0.05~35%/mois
5RSI_MOMENTUMRSI(14) normalisé cross-section14 jours0.02-0.03~60%/mois
6MACD_SIGNALMACD(12,26,9) cross-section Z-score26 jours0.01-0.03~55%/mois
7PRICE_52WPrix / 52-week high252 jours0.03-0.05~25%/mois
8VOL_MOMReturn × (Volume / Volume_avg_20)21 jours0.02-0.04~45%/mois
9EARNINGS_MOMSUE (Standardized Unexpected Earnings) Z-scoreTrimestriel0.04-0.07~20%/trimestre
10REVISION_MOMVariation consensus EPS 1 mois21 jours0.03-0.06~30%/mois
11INDUSTRY_MOMMomentum du secteur/industrie (peer group)63 jours0.02-0.04~25%/mois
12IDIO_MOMResidual momentum (après Fama-French 5 facteurs)126 jours0.03-0.05~35%/mois
# Prompt Claude Code : Implémentation des facteurs momentum
claude -p "Implémente les 12 facteurs momentum dans un module Python:
- Classe MomentumFactors(BaseFactorFamily)
- Input: DataFrame avec colonnes [date, symbol, close, volume, high, low]
- Output: DataFrame [date, symbol, MOM_12_1, MOM_6_1, ..., IDIO_MOM]
- Chaque facteur est Z-scored cross-section par date
- Gestion des NaN: forward-fill 5 jours max, puis exclusion
- Winsorize à 3 sigma pour éviter les outliers
- Unit tests avec données synthétiques
- Performance: doit traiter 3000 symboles × 2520 jours en < 10 secondes (Polars)"
Facteurs Value & Quality

Value — Acheter la décote

#FacteurCalculICNotes
13E/P1 / Forward P/E0.02-0.04Inverse du P/E pour que « plus haut = moins cher »
14B/PBook Value / Market Cap0.01-0.03Classique Fama-French. Moins fiable depuis 2010
15FCF_YIELDFree Cash Flow / Enterprise Value0.03-0.05Le meilleur facteur value pour les actions modernes
16EBITDA_EVEBITDA / Enterprise Value0.02-0.04Plus stable que E/P car exclut les charges non-cash
17DIV_YIELDDividende annualisé / Prix0.01-0.02Faible IC mais réduit la volatilité du portefeuille

Quality — Acheter l'excellence

#FacteurCalculICNotes
18ROENet Income / Equity0.02-0.04Profitabilité des capitaux propres
19GROSS_MARGINGross Profit / Revenue0.02-0.03Pricing power et avantage compétitif
20ACCRUALS(NI - CFO) / Total Assets0.02-0.04Négatif = meilleure qualité des earnings (Sloan, 1996)
21DEBT_EQUITYTotal Debt / Equity (inversé)0.01-0.03Faible dette = résilience aux crises
22PIOTROSKI_FF-Score (9 critères binaires)0.03-0.05Score composite de qualité fondamentale
23EARNINGS_STABILITY1 / σ(EPS growth 8Q)0.02-0.03Stabilité des bénéfices = prévisibilité
Facteurs Sentiment & Alternatifs

Sentiment, Flow & Données Alternatives

#FacteurCalculSourceIC
24SOCIAL_MOMENTUMVariation 7j du volume de mentions positivesStockTwits API0.01-0.03
25SHORT_INTEREST_CHGVariation du SI% sur 14 joursFintel / FINRA0.02-0.04
26INSIDER_BUYAchats insiders net / Market Cap (30 jours)SEC Form 40.03-0.06
27ANALYST_REVISIONNet upgrades - downgrades / Total analystsYahoo Finance0.02-0.04
28OPTIONS_SKEWIV Put 25Δ / IV Call 25ΔIBKR / CBOE0.02-0.04
29FLOW_IMBALANCENet institutional flow (13F quarterly)SEC EDGAR 13F0.02-0.03
30NEWS_SENTIMENTNLP score des news 7 derniers jours (FinBERT)News API + FinBERT0.01-0.03
Processus de recherche systématique

Le Research Process — Comment ne PAS overfitter

Le danger #1 du quant : l'overfitting

Avec 50+ facteurs et 20 ans de données, il est trivial de trouver une combinaison qui backtest à 200%+ de CAGR. Mais cette combinaison ne survivra pas en production. Le processus de recherche doit être conçu pour minimiser l'overfitting à chaque étape.

1. Economic Prior

Chaque facteur DOIT avoir une justification économique AVANT de regarder les données. « Pourquoi ce facteur devrait-il prédire les rendements futurs ? » Si la réponse est vague → rejeter

2. Univers Disjoint

Tester sur un univers DIFFÉRENT de celui de la production. Ex: recherche sur US mid-cap, production sur US+EU+APAC all-cap. Si le facteur marche dans les deux → robuste

3. Walk-Forward OOS

JAMAIS de backtest in-sample uniquement. Walk-forward avec train/test splits disjoints. CPCV (Combinatorial Purged Cross-Validation) pour le scoring final

4. Deflated Sharpe

Utiliser le Deflated Sharpe Ratio (Bailey & López de Prado) pour corriger le Sharpe pour le nombre de tests effectués. Un Sharpe de 1.0 qui a été trouvé après 1000 tests vaut zéro

# Prompt Claude Code : Walk-Forward Research Pipeline
claude -p "Crée un pipeline de recherche de facteurs:
1. FactorResearchPipeline class
2. Pour chaque facteur candidat:
   a. Calculer l'IC (Information Coefficient) sur 10 ans de données
   b. Calculer l'IC Decay (IC à t+1, t+2, ..., t+20 jours)
   c. Walk-forward backtest: 756j train, 252j test, 8 folds
   d. Calculer le Deflated Sharpe Ratio
   e. Calculer le turnover et les coûts de transaction implicites
3. Filtrer: IC > 0.02, Deflated Sharpe > 0.5, Turnover < 60%/mois
4. Ranking: score composite = 0.4×IC + 0.3×Sharpe + 0.3×(1-Turnover)
5. Générer un rapport HTML avec:
   - Heatmap des corrélations inter-facteurs
   - IC Decay curves par facteur
   - Walk-forward equity curves
   - Feature importance (SHAP values si XGBoost est utilisé)
Utilise Polars pour la performance, vectorbt pour le backtest."
Combinaison optimale des facteurs

Alpha Combination — Le multiplier d'IC

La magie de la combinaison de facteurs : si chaque facteur a un IC de 0.03 et qu'ils sont peu corrélés entre eux, la combinaison de N facteurs augmente l'IC composite proportionnellement à √N. Avec 10 facteurs indépendants, l'IC passe de 0.03 à ~0.095.

Méthode de combinaisonComplexitéIC boostRisk d'overfitRecommandation
Equal WeightTrivial×√NZéro✅ Baseline, toujours tester en premier
IC-WeightedFaible×√N × (IC_i/IC_avg)Faible✅ Améliore légèrement l'equal-weight
Ridge RegressionModéréOptimal linéaireModéré✅ Bon compromis performance/robustesse
XGBoostÉlevéNon-linéaire, potentiellement ×2-3Élevé⚠️ Uniquement avec CPCV strict et >10 ans de données
Neural NetworkTrès élevéVariableTrès élevé❌ Pas recommandé pour notre taille de portefeuille

Points clés

  • 50+ alpha factors organisés en 6 familles : Momentum (le plus puissant), Value, Quality, Volatility, Sentiment, Technical
  • Chaque facteur doit avoir un economic prior AVANT l'analyse de données
  • Le processus de recherche anti-overfit : Prior économique → Univers disjoint → Walk-Forward → Deflated Sharpe
  • L'IC composite augmente en √N avec la combinaison de facteurs indépendants
  • Equal-weight est le baseline ; Ridge Regression le sweet spot ; XGBoost uniquement avec CPCV
  • Claude Code accélère la recherche ×10 : génération des facteurs, backtest, rapports automatiques
Partie suivante
Portfolio Construction & Optimisation →
Algo Trading — De 100K au Million3/12