+ - 0:00:00
Notes for current slide
Notes for next slide

R para el análisis de datos

Kevin Carrasco

Sociología - UAH

1er Sem 2024

R-data-analisis.netlify.com


Sesión 7: Regresión lineal

1 / 28

Sesión 7


Repaso sesión anterior

Regresión lineal

R2

Inferencia





2 / 28

Asociación: covarianza / correlación

¿Se relaciona la variación de una variable, con la variación de otra variable?

3 / 28

Correlación

  • Medida de co-variación lineal estandarizada
4 / 28

Correlación

  • Medida de co-variación lineal estandarizada



¿En qué rango varía una correlación?

4 / 28

Correlación

  • Medida de co-variación lineal estandarizada



¿En qué rango varía una correlación?

  • Varía entre -1 y +1
4 / 28

Correlación

  • Medida de co-variación lineal estandarizada



¿En qué rango varía una correlación?

  • Varía entre -1 y +1

  • Gráficamente se expresa en nubes de puntos

4 / 28

5 / 28
  • Pero ojo, correlación no implica causalidad

6 / 28

Sesión 7


Repaso sesión anterior

Regresión lineal

R2

Inferencia





7 / 28

¿Qué es la regresión lineal?

8 / 28

¿Qué es la regresión lineal?

  • Es un modelo estadístico
8 / 28

¿Qué es la regresión lineal?

  • Es un modelo estadístico
  • Se usa para:

    • Conocer: La relación de una variable dependiente de acuerdo a una/otras independiente(s)
    • Predecir: Estimar el valor de una variable dependiente de acuerdo al valor de otras
    • Inferir: si estas relaciones son estadísticamente significativas
8 / 28

¿Qué es la regresión lineal?

  • Dos tipos de regresión:
    • Regresión lineal simple (una variable independiente)
    • Regresión lineal múltimple (más de una variable independiente)
9 / 28

¿Qué es la regresión lineal

Terminología:

10 / 28

Ejemplo

## Educacion Ingreso
## 1 1 250
## 2 2 200
## 3 3 250
## 4 4 300
## 5 5 400
## 6 6 350
## 7 7 400
## 8 8 350
11 / 28

Ejemplo

12 / 28

Ejemplo

13 / 28

La recta de regresión

Y^=b0+b1X

Donde

  • Y^ es el valor estimado de Y

  • b0 es el intercepto de la recta (el valor de Y cuando X es 0)

  • b1 es el coeficiente de regresión, que nos dice cuánto aumenta Y por cada punto que aumenta X

14 / 28

Estimación de los coeficientes de la ecuación:

b1=Cov(XY)VarX

b1=i=1n(xix¯)(yiy¯)n1i=1n(xix¯)(xix¯)n1

Y simplificando

b1=i=1n(xix¯)(yiy¯)i=1n(xix¯)(xix¯)

15 / 28

Pero este es un curso de R, así que:

##
## Call:
## lm(formula = Ingreso ~ Educacion, data = data)
##
## Coefficients:
## (Intercept) Educacion
## 200 25
16 / 28

Estimación de los coeficientes de la ecuación:

Y¯=b0+b1X¯ Reemplazando:

Y¯=b0+25X¯

Despejando el valor de b0

b0=2000X¯

17 / 28

Ejemplo

Por cada unidad que aumenta educación, ingreso aumenta en 25 unidades

18 / 28

Sesión 7


Repaso sesión anterior

Regresión lineal

R2

Inferencia





19 / 28

Varianza explicada

  • ¿Qué porcentaje de la varianza de Y logramos explicar con X?
20 / 28

Varianza explicada

  • ¿Qué porcentaje de la varianza de Y logramos explicar con X?
  • R2 = Porcentaje de la variación de Y puede ser asociado a la variación de X
20 / 28

Ejemplo

El ajuste del modelo a los datos se relaciona con la proporción de residuos generados por el modelo respecto de la varianza total de Y (R2)

21 / 28

Sesión 7


Repaso sesión anterior

Regresión lineal

R2

Inferencia





22 / 28

Inferencia estadística

  • ¿Cómo sabemos si b1 es estadísticamente significativo?
23 / 28

Inferencia estadística

  • ¿Cómo sabemos si b1 es estadísticamente significativo?

  • ¿Nuestros datos se pueden extrapolar a la población?

23 / 28

Inferencia estadística

  • Según criterios muestrales:

    • Distribución normal
    • Desviación estándar
  • Error estándar

24 / 28
  Model 1
(Intercept) 200.00**
  (35.57)
Educacion 25.00*
  (7.04)
R2 0.68
Adj. R2 0.62
Num. obs. 8
***p < 0.001; **p < 0.01; *p < 0.05
25 / 28
  Model 1
(Intercept) 106.12*
  (33.92)
Educacion 7.07
  (6.57)
edad 5.48*
  (1.56)
R2 0.91
Adj. R2 0.87
Num. obs. 8
***p < 0.001; **p < 0.01; *p < 0.05
26 / 28

Parcialización

27 / 28

R para el análisis de datos

Kevin Carrasco

Sociología - UAH

1er Sem 2024

R-data-analisis.netlify.com


Sesión 6: Índices y escalas

28 / 28

Sesión 7


Repaso sesión anterior

Regresión lineal

R2

Inferencia





2 / 28
Paused

Help

Keyboard shortcuts

, , Pg Up, k Go to previous slide
, , Pg Dn, Space, j Go to next slide
Home Go to first slide
End Go to last slide
Number + Return Go to specific slide
b / m / f Toggle blackout / mirrored / fullscreen mode
c Clone slideshow
p Toggle presenter mode
t Restart the presentation timer
?, h Toggle this help
Esc Back to slideshow