Analyse statistique et modélisation prédictive

Scipy

  • modules pour l'optimisation, l'algèbre linéaire, les statistiques, le traitement du signal, le support de matrices creuses, etc.

  • soin apporté aux performances et méthodes éprouvées.

  • API facilement compréhensible, proche de NumPy et de la philosophie Python de manière générale.

Scikit-learn

  • un outil de modélisation prédictive (notamment developpé dans le cadre de travaux à l'INRIA).
  • documentation est très riche (aussi bien dans l'explication des concepts qui sont mobilisés que dans la description de l'API).
  • de nombreuses fonctionnalités pour préparer les données (standardisation, normalisation, extraction des échantillons, "vectorisation" de corpus de texte, etc.).
  • l'API de l'ensemble des modèles suit strictement la même logique : simplicité d'utilisation (pas forcément de préparation spécifique des données pour les adapter à un autre modèle par exemple).
  • soin apporté aux performances lors de l'ajout de fonctionnalités.

Statsmodels

Statsmodels est une bibliothèque qui va permettre d'estimer des modèles statistiques et d'effectuer des tests statistiques.