Comment utiliser des variables indicatrices dans excel régression

Programme Excel populaire de Microsoft a des capacités d'analyse de données qui comprennent effectuant l'analyse de régression avec des variables muettes. Les variables muettes sont variables catégorielles numériquement exprimés en 1 ou 0 pour indiquer la présence ou l'absence d'une qualité ou une caractéristique particulière. Excel ne nécessite pas de fonctions spéciales quand un modèle de régression comprend une variable fictive entre les variables indépendantes. Cependant, les modèles de régression avec des variables muettes dépendantes nécessitent add-ins supplémentaires, des programmes qui élargissent les options et fonctionnalités d'Excel.


Sommaire

Régression Avec l'aide de variables muettes Excel

  1. Chargez l'outil d'analyse de données à partir des add-ins Excel, inclus dans toutes les versions d'Excel. Vous devez le faire pour effectuer une régression ou de tout autre type d'analyse de données. Clic "Outils" ouvre un menu déroulant. Sélectionner "Add-ins" et dans le menu qui apparaît, vérifiez "Utilitaire d'analyse" et cliquez sur "D'ACCORD." "Analyse des données" devrait apparaître dans votre menu Outils.

  2. Entrez les données que vous allez utiliser pour votre régression dans une feuille de calcul Excel, le codage des variables muettes avec la valeur 1 ou 0, selon que le sujet a la caractéristique en question. Le genre est un exemple d'une variable fictive, puisque les sujets d'une étude ne peuvent être que masculin ou féminin. Une étude de l'entrée au collège examen scores qui incluaient le sexe des sujets, par exemple, pourrait coder étudiantes avec un 1. Utilisation de variables muettes parmi vos variables indépendantes ne nécessite pas de fonctions spéciales dans Excel. Rappelez-vous que si une variable fictive a que deux catégories (telles que mâle ou femelle), une seule variable est nécessaire pour représenter les deux catégories.

  3. Code de variables catégoriques avec plus de deux catégories que plusieurs variables muettes, assurant que le nombre de variables est un de moins que le nombre de catégories (n-1, en termes statistiques). Par exemple, la catégorie ethnique exprimée en cinq niveaux (blanc, noir, hispanique, asiatique, amérindienne) exigerait quatre variables nominales distinctes. Par exemple, si vous étiez étudiant collégial notes d'examen d'entrée, vous pouvez créer les variables nominales suivantes: noir, hispaniques, asiatiques et américains indienne, codant chacun un 1 si l'élève en question correspond à cette catégorie ethnique.

  4. Développer la capacité d'Excel pour la régression avec des variables muettes avec un add-in qui permettra au programme de procéder à des régressions avec variables muettes dépendantes. Un tel programme est XLStat, disponible à l'achat et le téléchargement de la machine, Addinsoft. Des programmes tels que ce vous permettent d'effectuer des régressions où la variable dépendante prend les valeurs ou soit 1 ou 0.




Conseils & Avertissements








  • Une erreur courante chez les débutants est d'utiliser autant de variables muettes qu'il ya de catégories (tels que, par exemple, deux variables muettes pour hommes et femmes). Une telle approche créerait multicolinéarité, dans laquelle deux variables indépendantes sont fortement corrélés, ce qui rend presque impossible de déterminer leurs effets distincts sur la variable dépendante. Rappelez-vous que le nombre de variables muettes devriez toujours un de moins que le nombre de catégories.
» » » » Comment utiliser des variables indicatrices dans excel régression