Régression Logistique avec Python scikitlearn Sélection de variables RFE
>> YOUR LINK HERE: ___ http://youtube.com/watch?v=ecre14FY5ZM
Régression logistique binaire. Machine learning. Utilisation des outils de préparation, de modélisation, d'évaluation et de sélection de variables de scikit-learn . Partition des données en échantillons d'apprentissage et de test (train_test_split). Modélisation avec LogisticRegression. Mesure des performances avec la classe metrics . Sélection de variables avec le principe RFE (recursive feature elimination). Evaluation des scénarios de solutions en validation-croisée (RFECV). Identification de la solution optimale (variables sélectionnées) et déploiement du modèle associé sur l'échantillon test. Données et notebook Python : http://tutoriels-data-mining.blogspot... • 00:00 Présentation de la vidéo - Sélection de variables (RFE - RFECV) • 10:09 La base Vote au Congrès • 12:25 Démarrage du notebook (Jupyter) • 13:21 Importation des données • 16:28 Subdivision en échantillons d'apprentissage et de test • 21:21 Entraînement du modèle sur l'éch. d'apprentissage • 23:27 Inspection des résultats - Lecture des coefficients • 25:41 Mesurer l'importance des variables à partir des coefs. • 32:57 Prédiction et évaluation sur l'échantillon test • 36:24 Sélection de variables avec RFECV • 40:34 Performances mesurées en validation croisée (.grid_scores_) • 42:50 Nombre de variables sélectionnées (.n_features_) • 43:50 Identification des variables sélectionnées (.support_) • 45:07 Solutions alternatives (.ranking_) • 48:20 Performances en test du modèle optimisé
#############################
