Articulos Nuevos
recent

Tarea T2



Unos investigadores desarrollan un nuevo entorno virtual de aprendizaje basado en Google Apps. Para evaluar la incidencia de la utilización de este nuevo entorno en las calificaciones de los estudiantes, durante dos años se realiza un estudio de caso con dos grupos de estudiantes: un grupo de control que utiliza Moodle y un grupo experimental que utiliza Google Apps.

Primero descargué en una carpeta los ficheros de datos, que son archivos csv, con los que voy a trabajar: 




Análisis del año 1

Abro la interfaz R Studio, que esta previamente instalada en mi computador, y cargo el fichero de datos del año 1 desde la cuadricula superior derecha: Import Dataset, luego seleccionamos From text file.



Aparece una ventana en la que se muestra el contenido del fichero de texto y la estructura de datos que se cargará en R. El fichero incluye una cabecera, el tipo de separador que utiliza entre variables es el punto y coma (;), el carácter utilizado para separar la parte entera de la parte decimal de los números es el punto (.). Para que la estructura de datos se cree sin problemas.



La estructura de datos aparece representado en una cuadricula que está compuesto a su vez de 4 cuadriculas: una en la parte superior derecha donde se observa el dato cargado y se visualiza las variables de trabajo; en la superior izquierda, se visualiza el contenido de las variables; en la inferior izquierda, se introduce los comandos para procesar y analizar los datos; y en la inferior derecha, se visualizará la gráfica.



El paso siguiente es el filtrado de los datos del año 1. Para esto, filtré los sujetos por tipo de entorno utilizando los siguientes comandos:

> tm1 <- subset(Notas.2grupos.v1, grupo=="Moodle")
> tg1 <- subset(Notas.2grupos.v1, grupo=="Google Apps")

Al ejecutar estos dos comandos en la consola se crearon dos nuevas variables: Moodle (tm1) y Google Apps (tg1).



Para hacer la representación gráfica de los entornos por sexo definí primero los ejes X, Y cuya longitud abarcando el rango de valores de las variables (grupo y nota) e introduje el siguiente comando en la consola:

> plot(Notas.2grupos.v1$grupo,Notas.2grupos.v1$nota,xlab="Grupos", ylab="Notas", type="n")



Para hacer el análisis de diferencias entre grupos mediante t-student calculé las medias para hacerme una idea de la medida en que dichos indicadores varían de uno a otro grupo. Para esto, escribí en la consola el comando siguiente:

with(Notas.2grupos.v1, tapply(nota,list(grupo), mean))

La media de calificación de cada grupo es:

with(Notas.2grupos.v1, tapply(nota,list(grupo), mean))
 Google Apps           Moodle 
      7.25                       6.25 

Por lo tanto, un estudiante que utilizó el entorno Google Apps obtuvo, de media, 1 punto más (sobre 100) que un estudiante que utilizó el entorno Moodle. No parece una diferencia significativa.



Al margen de esta percepción acerca de la diferencia basada en la media, ahora lo que me interesa saber es en qué medida la diferencia observada entre grupos se deben o no al azar, porque ello me permitirá saber si el entorno de aprendizaje es un entorno diferenciador a la hora de que los estudiantes obtengan mejores calificaciones. 

Para el análisis diferencia estadísticamente significativa entre las calificaciones ejecuto el siguiente comando en la consola:

 > t.test(tm1$nota, tg1$nota) 

Y obtengo los siguientes resultados del análisis:

> t.test(tm1$nota, tg1$nota) 
 Welch Two Sample t-test
data: tm1$nota and tg1$nota
t = -2.8284, df = 38, p-value = 0.007427
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-1.7157314 -0.2842686
sample estimates:
mean of x        mean of y 
    6.25                   7.25 

¿Qué me indica los resultados?

La media de la variable x (tm1$nota) es de 6.25, mientras que la variable y (tg1$nota) tiene una media de 7.25. Por tanto, la diferencia entre ambos grupos no parece significativa porque es de tan sólo 1 punto sobre 100. ¿Es esta diferencia es estadísticamente significativa? Es decir, ¿La diferencia se debe al factor diferencial entre ambos grupos o se debe al azar? Para responder estas preguntas sólo debo de fijarme en el p-value, la cual indica si el riesgo a equivocarnos al afirmar “Si, existe una diferencia estadísticamente significativa entre ambos grupos debida al factor diferencial entre dichos grupos”, cuando en realidad dicha diferencia no se debe al factor diferencial entre grupos, sino al azar. En este caso, p-value = 0.007427 = 0.7427%

Como se puede observar, en lo que se respecta a la calificación final, el riesgo que se corre al afirmar “Si, existe una diferencia estadísticamente significativa entre ambos grupos determinada por la plataforma utilizada en cada grupo” es pequeño. Pero, teniendo en cuenta que el umbral de riesgo es 0.05 --> 5%

Si p-value < 0.05 --> el riesgo a equivocarnos es pequeño.
Si p-value < 0.05 --> el riesgo a equivocarnos es grande.

Por consiguiente, en lo que respecta a la calificación final concluyo que:

· En este estudio concreto no se percibe una diferencia significativa entre los valores de las medias de cada grupo.

· La diferencia entre las calificaciones de los estudiantes de uno y otro grupo no es estadísticamente significativa.


Análisis del año 2

Como descargué el fichero de datos del año 2 en el análisis anterior, proseguimos con los paso s que siguen.

Abro la interfaz R Studio, que esta previamente instalada en mi computador, y cargo el fichero de datos del año 2 desde la cuadricula superior derecha: Import Dataset, luego seleccionamos From text file.

Aparece una ventana en la que se muestra el contenido del fichero de texto y la estructura de datos que se cargará en R. El fichero incluye una cabecera, el tipo de separador que utiliza entre variables es el símbolo de número (#), el carácter utilizado para separar la parte entera de la parte decimal de los números es el espacio en blanco (whitespace). 



Para que la estructura de datos se cree sin problemas, observé que el símbolo de número no está disponible entre las opciones en el Import Dataset, resolvemos este problema con los siguientes pasos:

1. Voy a la Consola que está en la cuadricula inferior izquierda.
2. Hago clic debajo del comando de color azul.
3. Presiono la flecha hacia arriba de la tecla de dirección.
4. Coloco el símbolo de número (#) entre las comillas de sep=” ”, que está en el comando de color         azul.
5. Luego, ejecuto la tecla de Enter.


Aparece una tabla con los datos cargados y organizados en la cuadricula superior izquierda.


El paso siguiente es el filtrado de los datos del año 2. Para esto, filtré los sujetos por tipo de entorno utilizando los siguientes comandos:

> tm2 <- subset(Notas.2grupos.v2, grupo=="Moodle")
> tg2 <- subset(Notas.2grupos.v2, grupo=="Google Apps")

Al ejecutar estos dos comandos en la consola se crearon dos nuevas variables: Moodle (tm2) y Google Apps (tg2).


Para hacer la representación gráfica de los entornos por sexo definí primero los ejes X, Y cuya longitud abarcando el rango de valores de las variables (grupo y nota) e introduje el siguiente comando en la consola:

> plot(Notas.2grupos.v2$grupo,Notas.2grupos.v2$nota,xlab="Grupos", ylab="Notas", type="n")




Para hacer el análisis de diferencias entre grupos mediante t-student calculé las medias para hacerme una idea de la medida en que dichos indicadores varían de uno a otro grupo. Para esto, escribí en la consola el comando siguiente:

with(Notas.2grupos.v2, tapply(nota,list(grupo), mean))

La media de calificación de cada grupo es: 

> with(Notas.2grupos.v2, tapply(nota,list(grupo), mean)) 
Google Apps      Moodle 
     7.25                 6.55 

Por lo tanto, un estudiante que utilizó el entorno Google Apps obtuvo, de media, 0.7 punto más (sobre 100) que un estudiante que utilizó el entorno Moodle. No parece una diferencia significativa.




Ahora me interesa saber en qué medida la diferencia observada entre grupos se deben o no al azar, porque ello me permitirá saber si el entorno de aprendizaje es un entorno diferenciador a la hora de que los estudiantes obtengan mejores calificaciones. 

Para el análisis diferencia estadísticamente significativa entre las calificaciones ejecuto el siguiente comando en la consola:

 > t.test(tm2$nota, tg2$nota) 

Y consigo los siguientes resultados del análisis:

> t.test(tm2$nota, tg2$nota) 
Welch Two Sample t-test 
data: tm2$nota and tg2$nota 
t = -1.7514, df = 36.284, p-value = 0.08832 
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval: 
-1.5103499  0.1103499 
sample estimates: 
mean of x       mean of y 
     6.55               7.25 



¿Qué nos indica los resultados?

La media de la variable x (tm2$nota) es de 6.55, mientras que la variable y (tg2$nota) tiene una media de 7.25. Por tanto, la diferencia entre ambos grupos no parece significativa porque es de tan sólo 0.7 punto sobre 100. ¿Es esta diferencia es estadísticamente significativa? Para responder esta pregunta sólo debo de fijarme en el p-value. En este caso, p-value = 0.08832 = 8.832%

Como se puede observar, en lo que se respecta a la calificación final, el riesgo que se corre al afirmar “Si, existe una diferencia estadísticamente significativa entre ambos grupos determinada por la plataforma utilizada en cada grupo” es grande, debido a que 8.832% > 5%.

Por tanto, en lo que respecta a la calificación final concluyo que:

· En este estudio concreto no se percibe una diferencia significativa entre los valores de las medias de cada grupo.

· La diferencia entre las calificaciones de los estudiantes de uno y otro grupo no es estadísticamente significativa.



pitgom

pitgom

No hay comentarios.:

Publicar un comentario

Con tecnología de Blogger.