CURSO DE ESTADÍSTICA GENERAL

PRIMER CUATRIMESTRE 2012

Trabajos Prácticos

- Gustavo Sznaider. Lunes, 14 a 17 hs. Aula 17
- Teresa Boca. Martes, 9 a 12 hs. Aula 30.
- Marcos Texeira. Martes, 10 a 13 hs. Aula 27.
- Deborah Rondanini. Martes, 14 a 17 hs. Aula 45.
- Mariano Oyarzábal. Miércoles, 9 a 12 hs. Aula 7.

Clases Teóricas

- William Batista, Jueves, 10 a 12 hs. Aula Grande de Zootecnia.
- Susana Perelman / William Batista. Jueves, 15 a 17 hs. Aula 42.

CASO 4

El agua como recurso limitante para el crecimiento de la vegetación

Análisis de Regresión Lineal Simple

Sala et al. 1988. Ecology 69(1):40-45

Tanto la producción agropecuaria como los servicios naturales que proveen los ecosistemas terrestres dependen, en última instancia, del crecimiento de las plantas. Este crecimiento es el resultado del balance entre la tasa de fotosíntesis, el proceso por el cual las plantas ganan biomasa (peso), y la tasa de respiración, el proceso por el cual la pierden. A grandes rasgos, las plantas ganan biomasa porque sus hojas toman dióxido de carbono del aire y, utilizando energía solar, asimilan el carbono que éste contiene transformándolo en azúcares. El ritmo con que ésto ocurre varía según la cantidad de luz que interceptan las hojas, según la temperatura, según la concentración de las enzimas necesarias en las células del mesófilo (esto depende de la cantidad de nitrógeno disponible) y según la cantidad de dióxido de carbono que llega dichas células. El dióxido de carbono entra a las hojas a través de pequeños poros llamados estomas que pueden mantenerse abiertos solamente si las plantas están bien hidratadas. Sin embargo, cuando los estomas están abiertos, las plantas pierden continuamente humedad a través de ellos (transpiran) y por eso sólo pueden mantenerlos abiertos si continuamente reponen el agua transpirada con agua absorbida por las raíces. Por tal motivo, la llegada de dióxido de carbono a las células del mesófilo requiere que las plantas consuman agua.

Este principio determina que el agua sea un recurso limitante para el crecimiento de las plantas y explica por qué, a menos que se riegue, la productividad agrícola es más baja en las regiones áridas que en las regiones húmedas. Una serie de estudios ha mostrado que, en los pastizales, la tasa de acumulación de biomasa vegetal [g/m².año], denominada productividad primaria neta, guarda aproximadamente una relación lineal con la cantidad de lluvia anual [mm]. Por ejemplo, Sala et al. (1988, Ecology 69(1):40-45) estimaron que para los pastizales del centro de los Estados Unidos, la relación es aproximadamente:

E[PPN] = -34 + 0,6 x PA

donde E[PPN] es la productividad primaria neta esperada [g/m²/año] y PA: precipitación anual [mm]

Para evaluar la asociación entre la lluvia y la productividad de los pastizales, los autores de dicho estudio utilizaron una técnica de análisis estadístico que lleva el nombre de análisis de regresión lineal simple. Mediante esta técnica produjeron estimadores puntuales de los dos coeficientes que describen la asociación lineal entre la productividad esperada y la lluvia, la ordenada al origen (-34) y la pendiente de la recta (+0,6), y pusieron a prueba la hipótesis nula H0 de que la pendiente de la recta es igual a cero.

Esta técnica es ampliamente usada para caracterizar y evaluar la asociación lineal entre una variable aleatoria de interés y otra variable con la cual se sospecha que está relacionada. El análisis de regresión es la técnica estadística usada para evaluar cuestiones tales como la respuesta del rendimiento de un cultivo a diferentes dosis de fertilizante, entre el área basal y la altura de los árboles de una plantación, entre la densidad de siembra y el rendimiento de un cultivo, entre las cantidades de fertilizante aplicado en las cuencas y los nivel de contaminación de los ríos y un sinnúmero de cuestiones de interés para profesionales de las ciencias agropecuarias y ambientales.

Preparación para el Trabajo Práctico

En este trabajo práctico exploraremos los principios y ejercitaremos la ejecución del análisis de regresión lineal simple. Para prepararse, los estudiantes deberán estudiar el capítulo 5 del texto hasta la página 101 poniendo especial atención para identificar:

Además, deberán resolver de antemano la primera parte del siguiente problema y todo lo que puedan de la segunda parte.

Problema

En una extensa región de pastizales se ubicaron 4 grandes áreas con diferentes valores de lluvia anual conocidos de antemano (respectivamente 300 mm,600 mm, 900 mm y 1200 mm). Dentro de cada área se decidió elegir al azar 4 parcelas de 100 m² cada una y en cada parcela medir la productividad primaria neta del pastizal (PPN). Una vez realizado este procecimiento, se obtuvieron los datos que figuran en la tabla:

Lluvia anual
[mm]
ppn
[g/m²/año]
300 80
300 150
300 125
300 170
600 390
600 470
600 225
600 350
900 560
900 590
900 400
900 380
1200 790
1200 610
1200 640
1200 680

Primera Parte

  1. Construir un diagrama de dispersión utilizando los datos de la tabla. Identificar la variable independiente y la variable respuesta.
  2. Sobre el diagrama identificar a cuál unidad muestral, a cuál muestra y a cuál población corresponde cada punto.
  3. Observar el gráfico y discutir si concuerda o no con la idea de que la productividad primaria aumenta con las precipitaciones.
  4. Trazar a mano alzada la línea recta que aparentemente se ajuste mejor a los datos e identificar su ordenada al origen y su pendiente.
  5. Identificar la variable aleatoria involucrada en este estudio.
  6. Formular un MODELO DE REGRESIÓN LINEAL SIMPLE para este problema.
  7. Obtener los estimadores puntuales de la ordenada al origen y de la pendiente por el método de mínimos cuadrados.
  8. Dibujar la recta correspondiente sobre el diagrama de dispersión.

Segunda Parte

  1. Calcular los residuales. ¿Para cuál valor de lluvia anual tienen mayores valores absolutos en este conjunto de datos? ¿Cuánto suman los residuales?
  2. Obtener una estimación puntual de la varianza de la variable respuesta (Se²).
  3. Construir intervalos del 95% de confianza para la ordenada al origen y para la pendiente.
  4. Poner a prueba la hipótesis nula H0: La pendiente es igual a cero.
  5. Calcular y dibujar una banda del 95% de confianza para la recta de regresión.
  6. Calcular e interpretar el coeficiente de determinación