ANÁLISIS DE DISEÑOS EXPERIMENTALES BÁSICOS

 

La observación y la experimentación son la base en que se apoya el investigador para el estudio de fenómenos de su interés, presentes en la naturaleza. Mediante la observación describe el fenómeno con todas las circunstancias que lo rodean, no pudiendo atribuir sus efectos a una causa específica. Con la ayuda de la experimentación estudia dichos fenómenos en forma más controlada, aislando aquellos factores que pudieran enmascarar el efecto que ocasiona la causa de su interés sobre dicho fenómeno.

 

En el estudio experimental de un fenómeno se plantea una hipótesis, para cuya prueba diseña un procedimiento de ejecución, que denomina diseño del experimento. Esta hipótesis, al ser probada requiere  generalizarla a un espectro más amplio que aquel de su experimento, asociándole una medida de probabilidad o confiabilidad. Este es el caso de los diseños experimentales, cuya metodología es ampliamente usada en la investigación agropecuaria para la comparación de efectos de diferentes factores o tratamientos.

 

Un diseño experimental debe adecuarse al material experimental con que se cuenta y a la clase de preguntas que desea contestarse el investigador. Sus resultados se resumen en un cuadro de Análisis de Varianza y en una tabla de comparación de medias de tratamientos que indica las diferencias entre dichas medidas. El análisis de varianza proporciona la variación de la variable de interés en fuentes explicables por algunos factores o tratamientos y en aquella para la cual el investigador no tiene control, no puede medir y no le es posible explicar o atribuir a algún factor en particular, constituyendo el error experimental.  Por ejemplo: si se realiza un experimento en el cual se estudie el uso de los aminoácidos en raciones para pollos en crecimiento y se mide la ganancia de peso, la variación de dicha ganancia puede descomponerse en fuentes de variación conocidas, atribuibles al distinto nivel de aminoácidos usando las raciones y las fuentes de variación desconocidas o error. Esta partición de la varianza se hace al través de la suma de cuadrados asociados a sus respectivos grados de libertad (número de comparaciones linealmente independientes). La realización de un Análisis de la varianza presupone la aditividad de los errores, la homogeneidad de  varianza de las poblaciones de tratamientos y  la independencia y distribución normal de los errores. 

 

 

 

DISEÑO COMPLETAMENTE AL AZAR (DCA)

Este diseño consiste en la asignación de los tratamientos en forma completamente aleatoria a las unidades experimentales (individuos, grupos, parcelas, jaulas, animales, insectos, etc.). Debido a su aleatorización irrestricta, es conveniente que se utilicen unidades experimentales de lo más homogéneas posibles: animales de la misma edad, del mismo peso, similar estado fisiológico; parcelas de igual tamaño, etc., de manera de disminuir la magnitud del error experimental, ocasionado por la variación intrínseca de las unidades experimentales.  Este diseño es apropiado para experimentos de laboratorio, invernadero, animales de bioterio, aves, conejos, cerdos, etc., es decir, situaciones experimentales como de las condiciones ambientales que rodean el experimento.

 

Este diseño es el mas utilizado en la experimentación con animales, asociándole la técnica del análisis de covarianza y arreglos de tratamiento de tipo factorial.

 

Aleatorización

Para ejemplificar el proceso de aleatorización irrestricta de los tratamientos a las unidades experimentales, considérese la prueba de cuatro tratamientos, cada uno de ellos con cinco repeticiones. El proceso mencionado podría realizarse formando cuatro grupos de tarjetas, representando cada uno de ellos a un tratamiento en particular, digamos T1, repetido cinco veces, y así T2, T3 y T4.  Posteriormente mézclense las tarjetas en una urna y extraiga una tarjeta al azar, asignando el tratamiento correspondiente a un animal, terreno, maceta, jaula o grupo de animales en que consista cada unidad experimental. Repítase el procedimiento sin reemplazo hasta terminar su asignación.

 

 

 

Modelo estadístico asociado al diseño:

 

         i = 1,2,3,..., t

                                   j = 1,2,3,..., n

 

donde:

=  Variable respuesta en la j-ésima repetición del i-ésimo tratamiento

 =  Media general

 = Efecto del tratamiento i.

= Error aleatorio, donde ~

 

Análisis de la Varianza para el modelo  

Ho:

Ha: al menos un efecto de un tratamiento es diferente de los demás.

 

 

Fuentes de Variación (F.V.)

Grados de Libertad (G.L.)

Suma de Cuadrados (S.C.)

Cuadrados Medios (C.M.)

F0

Tratamientos

t-1

Error

 

Total

 

 

 

Ejemplo:

Se realizó un experimento para probar el efecto de cinco fuentes de energía utilizadas en dietas para engorda de toretes (T1. Testigo, T2. Melaza, T3. Cebo,  T4.Maíz, T5. Sorgo) en las cuales se midió la ganancia de peso (GP) durante el período de engorda. Se consideraron 5 repeticiones por tratamientos (25 animales) y se planteó la hipótesis de igualdad de medias de tratamientos.

 

 

 

 

 

Trat 1

Trat 2

Trat 3

Trat 4

Trat 5

Repetición 1

980

1200

1300

1400

1350

Repetición 2

1050

1230

1180

1350

1420

Repetición 3

1100

1150

1200

1380

1550

Repetición 4

1000

1390

1170

1420

1600

Repetición 5

1120

1250

1050

1500

1490

 

 

 

 

 

 

Trat 1

Trat 2

Trat 3

Trat 4

Trat 5

 

Repetición 1

980

1200

1300

1400

1350

 

Repetición 2

1050

1230

1180

1350

1420

 

Repetición 3

1100

1150

1200

1380

1550

 

Repetición 4

1000

1390

1170

1420

1600

 

Repetición 5

1120

1250

1050

1500

1490

 

5

5

5

5

5

=25

5250

6220

5900

7050

7410

31830

1050

1244

1180

1410

1482

 

5512500

7737680

6962000

9940500

10981620

=41134300

5527300

7770000

6993800

9953300

11021500

=41265900

-

14800

32320

31800

12800

39880

=131600

3700

8080

7950

3200

9970

 

 

 

 

 

En primer lugar se calculará el factor de corrección:

 

= 40525956

 

 

S.C. TRAT = - F.C. = 41134300 – 40525956 = 608344

 

S.C. TOTAL =  - F.C. =  41265900 – 40525956 =  739944

 

S.C.TOTAL = S.C. TRAT + S.C. ERROR

 

Al despejar de la ecuación anterior S.C. ERROR queda como:

 

S.C. ERROR = S.C.TOTAL – S.C. TRAT = 739944 – 608344 = 131600

 

C.M  TRAT =   = (608344 / 4) =  152086

 

C.M. ERROR =   = ( 131600 / 20) =  6580

 

Fo= = (152086 / 6580) = 23.11

 

 

 

Fuentes de Variación (F.V.)

Grados de Libertad (G.L.)

Suma de Cuadrados (S.C.)

Cuadrados Medios (C.M.)

F0

Tratamientos

4

608344

152086

23.11

Error

20

131600

6580

 

Total

24

739944

 

 

 

 

Para probar que  Ho:  en oposición a Ha: al menos un tratamiento diferente de los demas con un a=0.05 , obtenemos = 2.866 de la tabla correspondiente y puesto que Fo>2.866 se rechaza Ho con un a=0.05 y se concluye que al menos  un tratamiento es diferente.

 

Programa en SAS para calcular los resultados del problema anterior:

 

 

Data s;

Input  trat rep gp;

Cards;

1 1 980

1 2 1050

1 3 1100

1 4 1000

1 5 1120

2 1 1200

2 2 1230

2 3 1150

2 4 1390

2 5 1250

3 1 1300

3 2 1180

3 3 1200

3 4 1170

3 5 1050

4 1 1400

4 2 1350

4 3 1380

4 4 1420

4 5 1500

5 1 1350

5 2 1420

5 3 1550

5 4 1600

5 5 1490

proc print;

proc anova;

      class trat;

      model gp=trat;

run;

 

 

                                The SAS System                               1

 

                          OBS    TRAT    REP     GP

 

                            1      1      1      980

                            2      1      2     1050

                            3      1      3     1100

                            4      1      4     1000

                            5      1      5     1120

                            6      2      1     1200

                            7      2      2     1230

                            8      2      3     1150

                            9      2      4     1390

                           10      2      5     1250

                           11      3      1     1300

                           12      3      2     1180

                           13      3      3     1200

                           14      3      4     1170

                           15      3      5     1050

                           16      4      1     1400

                           17      4      2     1350

                           18      4      3     1380

                           19      4      4     1420

                           20      4      5     1500

                           21      5      1     1350

                           22      5      2     1420

                           23      5      3     1550

                           24      5      4     1600

                           25      5      5     1490

 

 

 

                        Analysis of Variance Procedure

                           Class Level Information

 

                         Class    Levels    Values

 

                         TRAT          5    1 2 3 4 5

 

 

                   Number of observations in data set = 25

 

 

                        Analysis of Variance Procedure

 

Dependent Variable: GP

                                    Sum of           Mean

Source                  DF         Squares         Square   F Value     Pr > F

 

Model                    4     608344.0000    152086.0000     23.11     0.0001

 

Error                   20     131600.0000      6580.0000

 

Corrected Total         24     739944.0000

 

                  R-Square            C.V.       Root MSE              GP Mean

 

                  0.822149        6.371128       81.11720             1273.200

 

 

Dependent Variable: GP

 

Source                  DF        Anova SS    Mean Square   F Value     Pr > F

 

TRAT                     4     608344.0000    152086.0000     23.11     0.0001

 

 

Puede observarse en los resultados del SAS que la Suma de Cuadrados del  Modelo es igual a la  Suma de Cuadrados de Tratamientos, debido a que existe una sola fuente de variación (excluyendo al error). El SAS, empleando el PROC GLM en lugar del PROC ANOVA proporciona dos tipos de Sumas de Cuadrados, la Suma de Cuadrados Secuencial (Type I SS) y la Suma de Cuadrados Parcial (Type III SS), las cuales se diferencian por la forma en que son incluidos los efectos en el modelo, esta última usada para probar los efectos que nos interesan (Tratamientos). Así mismo el SAS proporciona información acerca de los siguientes parámetros: Coeficiente de determinación (R-Square), Coeficiente de Variación (C.V.), Raíz cuadrada del cuadrado medio del error (Root MSE) y la media de la variable respuesta (GP Mean).  En el ejemplo anterior se ve una columna que indica Pr>F con un valor de 0.0001 esto indica que los tratamientos a base de fuentes energéticas en la engorda de becerros producen diferencias altamente significativas (P<.01, en este caso a=.0001), es decir tienen ganancias de peso de los animales, diferentes. 

 

Como se detecto que al menos un tratamiento era diferente del resto se procede a realizar una prueba de comparación de sus valores medios.  Para hacer esto es necesario agregar en el programa de SAS las siguientes instrucciones:

 

Data s;

Input  trat rep gp;

Cards;

1 1 980

1 2 1050

. . .

5 5 1490

proc print;

proc anova;

      class trat;

      model gp=trat;

      means trat/tukey;

run;

 

Al ejecutar el programa en SAS después del análisis de la varianza aparece la siguiente tabla:

 

 

                        Analysis of Variance Procedure

 

            Tukey's Studentized Range (HSD) Test for variable: GP

 

         NOTE: This test controls the type I experimentwise error rate, but

               generally has a higher type II error rate than REGWQ.

 

                        Alpha= 0.05  df= 20  MSE= 6580

                  Critical Value of Studentized Range= 4.232

                    Minimum Significant Difference= 153.52

 

         Means with the same letter are not significantly different.

 

                Tukey Grouping              Mean      N  TRAT

 

                             A           1482.00      5  5

                             A

                             A           1410.00      5  4

 

                             B           1244.00      5  2

                             B

                     C       B           1180.00      5  3

                     C

                     C                   1050.00      5  1

 

 

Note que en la salida de SAS Alpha=0.05, se encuentran diferencias entre las medias, es decir los tratamientos a base de Sorgo(T5) y Maíz (T4) son superiores al Testigo (T1) y a los de melaza y cebo (T2 y T3), además la melaza fue superior al testigo. En la salida de SAS se señala que las medidas que tengan la misma letra en columna no son significativamente diferentes. 

 

Tukey no es la única prueba que puede usar para comparación de medias, de acuerdo al interés de su investigación puede usar pruebas mas o menos estrictas para encontrar diferencias entre medias de tratamientos, otras pruebas son: DUNCAN, SCHEFFE, DMS, SND, DUNNET, entre otras.

 

Para efectuar otras pruebas cambie tukey por la prueba deseada:

proc anova;

      class trat;

      model gp=trat;

      means trat/duncan;

run;

 

 

También SAS puede hacer varias pruebas al mismo tiempo:

proc anova;

      class trat;

      model gp=trat;

      means trat/tukey Duncan scheffe dms snk dunnet;

run;