MODELO DE REGRESIÓN LOGÍSTICA

 

MODELO DE REGRESIÓN LOGÍSTICA PARA EL ANÁLISIS DEL RIESGO AGRÍCOLA EN LA ZONA SUD DEL DEPARTAMENTO DE POTOSÍ

 

 

 

Contenido

 

I.       Introducción. 2

I.1 Antecedentes económicos respecto al riesgo agrícola. 4

I.2 Aspectos legales que abordan el análisis del riesgo agrícola. 6

I.3 Riesgo y riesgo agrícola. 7

I.4 Amenazas en la zona sud del departamento de Potosí. 7

II.     El Modelo logístico: análisis teórico de resultados del modelo logístico, 9

II.1 Regresión logística simple. 10

II.1.1  Interpretación de los coeficientes del modelo estimado. 13

II.1.2  Bondad de ajuste en la regresión logística. 13

II.2 Operacionalización de las variables del estudio. 14

II.3 Generación del modelo de Regresión logística. 14

II.3.1 Pseudo Estadísticas R2 19

II.3.2 Bondad de ajuste. 20

II.3.3 Curva  ROC.. 28

II.4 Conclusiones. 32

III. Referencias bibliográficas. 34

IV Anexos. 38

 

 

 

 

 

 

 

 

MODELO DE REGRESIÓN LOGÍSTICA PARA EL ANÁLISIS DEL RIESGO AGRÍCOLA EN LA ZONA SUD DEL DEPARTAMENTO DE POTOSÍ

                                

I.              Introducción

Se tiene entre las principales políticas públicas de Bolivia, la puesta en marcha de un Sistema de Alerta Temprana en todo el territorio, para mitigar los efectos adversos en la población y la economía nacional.  Sin embargo, no se aplican usualmente métodos estadísticos que en términos probabilísticos modelen el riesgo agrícola de manera específica y sistemática, por tanto, surge la inquietud científica de usar la regresión logística binaria en la determinación del riesgo agrícola en la zona sud del departamento de Potosí.

 

Bolivia con su variedad de climas, relieves topográficos y extenso territorio se ubica en el centro de América del Sur con una superficie de 1.098.581 kilómetros cuadrados y no tiene acceso a costa marítima alguna.  Su territorio cuenta con una extraordinaria diversidad de ecosistemas que concentran entre el 35% y 45% de la diversidad biológica del planeta.

 

De acuerdo a datos difundidos en el Boletín meteorológico del departamento de Potosí, se conoce que en los años 2013 – 2014 las inundaciones afectaron a 220.000 personas, representando esta afectación el 1,5 % del Producto Interno Bruto del país.

 

Siendo extenso el territorio del departamento de Potosí, resulta una labor difícil generalizar y predecir los sucesos climáticos en la región y alertar acerca de la presencia de eventos climáticos que dañen y afecten los cultivos y la vida cotidiana de los pobladores de las provincias Nor Chichas, Sud Chichas y Modesto Omiste, no existe información específica al respecto y menos se conoce acerca de pronósticos para enfrentar las situaciones adveras por factor clima en la zona.

 

Caracteriza a la zona sud del departamento de Potosí, un rango de alturas entre 2400 y 4000 msnm, comprendidas entre 8oC y 19oC, cuenta con una superficie de 19.765 km2 que representa el 16.7% del departamento, gran parte de esta zona está dominada por una fisiografía montañosa a colinosa, con valles estrechos templados, sobre áreas pendientes y terrazas aluviales; solo en determinados sectores como Parinolque, Berque y Mojo, presentan llanuras.

 

En cuanto a su vocación productiva, la zona sud de Potosí destaca por los cereales, hortalizas, tubérculos y frutales de tipo mediterráneo, ofreciendo también, potencialidad para la producción de ovinos y caprinos.

 

Su sistema hidrográfico pertenece a la cuenca del Plata, cuyos afluyentes al río Pilcomayo son: Río Tumusla, San Juan del Oro, Vitichi, Toropalca, Cotagaita, Blanco, Quechisla, Mochará, Tupiza, Etc. (Boletín Meteorológico Del Departamento de Potosí, 2003)

 

De una población de estudio de 450 comunidades pertenecientes a la zona Sud, se seleccionaron 68 comunidades, las cuales tienen las variables de interés para el estudio, dicha muestra representa el 15% de la zona sur del departamento de Potosí.

 

TABLA: COMUNIDADES INVESTIGADAS, 2013 al 2017.

 

Provincia

N° de comunidades

Porcentaje

Modesto Omiste

7

10%

Nor Chichas

49

72%

Sud Chichas

12

18%

Total

68

100%

                                                                Fuente: Elaboración propia, 2019

 

Se cuenta con datos: Sociodemográficos, de eventos climáticos y datos agrícolas, por tanto, se analiza el riesgo agrícola en función de estos 3 factores, cuyos datos se recolectaron en base a registros administrativos de fuente oficial.

 

 

 

 

 

 

 

 

 

 

TABLA 3.4 : PRINCIPALES EMERGENCIAS CLIMÁTICAS REPORTADAS EN BOLIVIA, 2002 – 2008

Tipo de evento

2002

2003

2004

2005

2006

2007

2008(p)

Inundación

353

810

448

278

868

1.191

1.085

Sequía

351

43

451

151

16

651

151

Helada

66

5

153

132

121

1.259

451

Granizada

311

67

261

74

194

695

413

Deslizamiento, mazamorra

20

24

23

11

36

31

84

Viento hurcanado

46

4

56

30

8

52

13

Incendio

39

15

44

105

33

30

24

Plaga

1.186

968

1.436

781

1.276

3.909

2.230

Sub total por emergencias climáticas

1.186

968

1.436

781

1.276

3.909

2.230

Otras emergencias

 

 

8

2

2

4

15

Total

1.186

968

1.444

783

1.278

3.913

2.245

Fuente: VIDECI. INE, 2010 (P) preliminar

 

Se observa que el año 2002 y 2007 Potosí es el segundo departamento que registra más eventos climáticos adversos, el 2003, 2005, 2006 y 2008 es el tercer departamento con mayor registro de eventos climáticos adversos, y el año 2004 es el departamento con el mayor reporte de eventos climáticos adversos.

 

I.1 Antecedentes económicos respecto al riesgo agrícola

 

Las proyecciones sobre el crecimiento del PIB per cápita del estudio muestran que la tasa de crecimiento aumentará 2% por año al principio del periodo de proyección hasta 3% al final. El hecho que esta tasa tienda a aumentar a través del tiempo se debe también al comportamiento proyectado de la población, la cual tiende a crecer a tasas decrecientes, e incluso negativas.

 

Con esas tasas de crecimiento proyectadas, el PIB per cápita para el año 2100 ascendería a 12.000 dólares por habitante, un nivel que supera nueve veces al observado en 2010, que fue de sólo de 1.394 dólares, de acuerdo con la cotización vigente en 2007. Las tasas de crecimiento del PIB per cápita proyectadas son el resultado de las tasas de crecimiento del PIB que resultan de la simulación que hizo el estudio y de las tasas de crecimiento de la población previstas por la Comisión Económica para América Latina y el Caribe (CEPAL).

 

Cabe señalar que la tasa de crecimiento de la población presenta una tendencia decreciente hasta el año 2071 y negativa hasta el año 2100 por tanto, para esa gestión se prevé una población de no más de 17 millones de habitantes, la mayoría viviendo en ciudades. Es este comportamiento de la población el que incide fuertemente en el aumento de la tasa de crecimiento del PIB per cápita a través del tiempo.

 

Esas tendencias demográficas y de crecimiento tienden a producir cambios en la estructura del empleo. Las proyecciones apuntan a que el empleo en las actividades agropecuarias, incluyendo agricultura, ganadería y silvicultura, se reducirá de 31,2% en 2010 a 19,4% en 2100, mientras que el empleo en el sector de servicios, incluyendo energía eléctrica, agua, transporte, y otros servicios, aumentará de 44,6% del empleo total en 2010 a 54,7% en 2100.

 

En total, el impacto directo de eventos climáticos extremos sobre el sector agropecuario se estima en 0,55% del PIB para el año 2100.  Actualmente la producción agrícola en Bolivia está marcada por un dualismo; la producción tradicional es realizada para el mercado local y para el consumo de subsistencia, y la producción industrial está organizada en superficies grandes de territorio, parcialmente mecanizada y modernizada, y con la pretensión de exportación continua.

 

Aunque el porcentaje de la población que se dedica a agricultura y ganadería decrece en el tiempo, se proyecta que la importancia del sector agropecuario dentro del PIB se mantendrá relativamente estable, decreciendo de 9,2% del PIB en 2000 hasta 8,3% del PIB en 2100; con el supuesto de que la abundancia de tierra en Bolivia brinda ventajas comparativas al sector.

 

Se entiende al Sistema de Alerta Temprana (SAT) como “…al conjunto de capacidades necesarias para generar y difundir información de alerta que sea oportuna y significativa, con el fin de permitir que las personas, las comunidades y las organizaciones amenazadas se preparen y actúen de forma apropiada …” (EIRD, 2009)

 

El propósito de un SAT es crear condiciones para que una comunidad, una ciudad, una población, actúe con suficiente tiempo y de manera oportuna ante un peligro y se reduzca la pérdida de vidas humanas, es una herramienta técnica que soporta la reducción de riesgos y la preparación ante desastres.

 

 

I.2 Aspectos legales que abordan el análisis del riesgo agrícola

Ley 602 y reglamento D.S. 2342 instaura una cultura de prevención, cuya acción esté sustentada por el conocimiento científico y técnico, dando protección financiera en gestión del riesgo de desastre.  Bajo la premisa de contar con un país más resiliente que logre reducir los desastres como se manifiesta en el “Acuerdo Marco para la reducción de desastre 2015 – 2030” de Sendai.

 

Destaca también dentro de esta Ley, la obligatoriedad que se exige a las instituciones públicas para incorporar la evaluación de riesgo en proyectos de inversión pública de acuerdo a lineamientos e instrumentos establecidos en el ente rector, por tanto, se logra incorporar la gestión de riesgos en los instrumentos de evaluación y control de la calidad ambiental.

 

En su Art. 19 de la Ley 602 se evidencia el derecho de las personas de recibir información oportuna y efectiva sobre la probabilidad de ocurrencia de desastres de origen natural entre otras, además avizora el empleo de los medios adecuados de prevención, mitigación, preparación, alerta, respuesta, rehabilitación y recuperación, este deber del Estado, exige por tanto el empleo de métodos estadísticos que faciliten el cumplimiento de este designio que prevé el bien común.

 

Recibir del Estado atención oportuna ante la presencia de un fenómeno adverso permitirá salvar vidas y disminuir pérdidas.  Por su parte el Art. 23 sobre los saberes y prácticas ancestrales manifiesta la necesidad de identificarlos, evaluar, sistematizar, revalorizar y aplicar los saberes y prácticas ancestrales en la gestión de riesgos, debiendo para ello dentro de este trabajo investigativo, darle una explicación científica que ayude a explicar las amenazas meteorológicas y climatológicas.

 

La Ley 144 Revolución productiva en su Artículo 24 indica que se abordará aspectos relacionados a desastres asociados a fenómenos naturales, intervenciones antrópicas, plagas, enfermedades, siniestros climáticos y riesgos del mercado que puedan afectar la soberanía alimentaria, mediante:

1. El monitoreo y alerta temprana para contar con información oportuna y permanente sobre la posibilidad de ocurrencia de eventos adversos que afecten a la producción de alimentos.

2. La prevención, atención y mitigación de emergencias alimentarias, así como la rehabilitación y reconstrucción de infraestructura, y recuperación de las capacidades productivas.

3. El fomento al desarrollo de capacidades de las comunidades para la gestión de riesgos.

 

I.3 Riesgo y riesgo agrícola

Riesgo es la probabilidad de ocurrencia de uno o varios eventos adversos que pudiesen ocasionar lesiones o pérdida de vidas, afectación a propiedades, a la producción de alimentos y el medio ambiente, y la detención de la actividad económica en un lugar y periodo de exposición determinado.

 

La Organización para la Cooperación y el Desarrollo Económico (OCDE) y el Departamento de Agricultura de Estados Unidos (USDA) advierten sobre los riesgos en la agricultura en sus respectivas páginas web. La preocupación está justificada. Como apuntan desde la oficina norteamericana, “el riesgo es un aspecto importante del negocio de la agricultura”, pues incertidumbres referentes a las condiciones meteorológicas, los rendimientos, los precios, las políticas gubernamentales, los mercados globales y otros factores pueden provocar fallas en los ingresos agrícolas. Para el USDA, “la gestión del riesgo consiste en elegir entre alternativas que reducen los efectos financieros que pueden derivarse de tales incertidumbres”. Organización para la Cooperación y el Desarrollo Económicos (OCDE) y el Departamento de Agricultura de Estados Unidos (USDA), (Website: www.ceigram.upm.es, consultado 2019)

 

I.4 Amenazas en la zona sud del departamento de Potosí.

 

De una población de estudio de 450 comunidades pertenecientes a la zona Sud, se seleccionaron 68 comunidades, las cuales tienen las variables de interés para el estudio, dicha muestra representa el 15%  de la zona sur del departamento de Potosí.

TABLA: COMUNIDADES INVESTIGADAS, 2013 al 2017.

 

Provincia

N° de comunidades

Porcentaje

Modesto Omiste

7

10%

Nor Chichas

49

72%

Sud Chichas

12

18%

Total

68

100%

                                                                Fuente: Elaboración propia, 2019

 

Se cuenta con datos: Sociodemográficos, de eventos climáticos y datos agrícolas, por tanto, se analiza el riesgo agrícola en función de estos 3 factores, cuyos datos se recolectaron en base a registros administrativos de fuente oficial.

 

TABLA 1:EVENTOS CLIMÁTICOS QUE SE PRESENTAN EN LA ZONA SUD

 

Evento climático

En

Feb.

Mar

Abr

May

Jun

Jul

Ago

Sep

Oct

Nov

Dic

Heladas

En

Feb.

Mar

Abr

May

Jun

Jul

Ago

Sep

Oct

Nov

Dic

Sequía

En

Feb.

Mar

Abr

May

Jun

Jul

Ago

Sep

Oct

Nov

Dic

Granizadas *

En

Feb.

Mar

Abr

May

Jun

Jul

Ago

Sep

Oct

Nov

Dic

Riadas *

En

Feb.

Mar

Abr

May

Jun

Jul

Ago

Sep

Oct

Nov

Dic

*Sin datos           Elaboración propia: en base a entrevista a expertos, 2019

 

Las amenazas de heladas en la zona sud, están presentes en los meses de mayo a noviembre, pero es mayor aún en junio a julio con una probabilidad superior al 80%, siendo los cultivos de maíz, frutales y hortalizas los de mayor importancia económica en la zona.

En cuanto a las amenazas de sequía, cabe aclarar que se aborda la sequía meteorológica, considerando que la mayor producción agrícola es a secano. La sequía se hace presente en la zona sud, en los meses de mayo a agosto.

 

Acerca de la amenaza de granizada, no se contaba hasta el año 2009 con registros sobre la ocurrencia de este fenómeno, por tanto, los datos del presente estudio permitirán un análisis probabilístico.

 

Por otra parte, las riadas han afectado significativamente en las gestiones 2007 y 2008 la región centro,  siendo afectadas 76 comunidades, 3290 familias e impactando 1400 Has de cultivos, entre estos cultivos estaban la papa, maíz, trigo, haba hortalizas y frutales, sin embargo en base a estudios previos se conoce que la afectación por riada es más sentida en el ámbito ganadero en la zona sud del departamento de Potosí, siendo los ríos Tumusla, Cotagaita, Pilcomayo y el San Pedro, los ríos que por lo general se desbordan.

 

“…Bolivia corre el riesgo de perder un 8% de su  Producto Interno Bruto (PIB) durante el siglo XXI, debido a las consecuencias del cambio climático …” (Andersen L., y Jemio L.C.,2014, p.2)

El documento del INESAD, que se perfila como  uno de los más completos  en materia de proyección de la economía boliviana bajo la influencia del cambio climático, especula sobre el futuro del país hasta  2100, a partir de dos escenarios climáticos que fueron preparados por el Special Report on Emissions Scenarios (SRES), el estudio  demuestra que el cambio climático, sobre todo las variaciones en los patrones de precipitación, puede  tener impactos económicos muy importantes para Bolivia.

 

Por su parte, Sun Tzu, señala que la vulnerabilidad del enemigo depende de él y que nuestra propia invulnerabilidad depende de nosotros mismos. El mayor peligro paradójicamente, tan riesgoso como el cambio climático, comparable con la mayor de las sequías, con la peor de las inundaciones, los fríos más extremos o los calores más perjudiciales, es la profunda decadencia que afecta a la provisión de estos bienes básicos. Pero la corrupción y la desidia son las verdaderas catástrofes climáticas. 

 

“La capacidad de un sistema, comunidad o sociedad expuestos a una amenaza para resistir, absorber, adaptarse y recuperarse de sus efectos de manera oportuna y eficaz, lo que incluye la preservación y la restauración de sus estructuras y funciones básicas. Resiliencia significa la capacidad de “resistir a” o de “resurgir de” un choque. La resiliencia de una comunidad con respecto a los posibles eventos que resulten de una amenaza se determinan por el grado al que esa comunidad cuenta con los recursos necesarios y es capaz de organizarse tanto antes como en los momentos apremiantes” (EIRD, 2009)

 

II.            El Modelo logístico: análisis teórico de resultados del modelo logístico,

Según Pla, L.E. (1986): “El análisis multivariante es la rama de la estadística que estudia las relaciones entre conjuntos de variables dependientes y los individuos para los cuales se han medido dichas variables.  Sus métodos analizan conjuntamente p variables, medidas sobre un conjunto de n individuos u objetos”. (p.8).

Los métodos estadísticos multivariantes, son cada día más utilizados en diferentes ramas de la ciencia. Los métodos exploratorios y los confirmatorios que en la mayoría de las ocasiones se utilizan de forma combinada, requieren de un conocimiento previo del problema a estudiar y de la información apropiada.

 

Para Dallas E. J.  (2000): “la regresión logística es semejante a la regresión múltiple; la diferencia principal es que, en la regresión logística, la variable dependiente suele ser binaria (es decir, toma sólo dos valores posibles, en tanto que, en la múltiple, esa variable dependiente es continua” (p.287).

 

El interés es que, por medio de probabilidades, se llega a predecir a cualquier grupo de la variable respuesta, entonces, interesa determinar la probabilidad de que a alguien le ocurra un determinado suceso; además se puede determinar qué variables pesan más en el estudio.

 

La variable dependiente o respuesta no es continua si no discreta, generalmente toma valores de 1, 0. Las variables explicativas pueden ser cuantitativas o cualitativas y la ecuación del modelo no es una función lineal de partida, si no exponencial; si bien por sencilla transformación logarítmica, puede finalmente presentarse como una función lineal.

 

Los coeficientes de regresión logística pueden utilizarse, para estimar la razón de las ventajas (ODDS ratio) de cada variable independiente en el modelo.

 

II.1 Regresión logística simple

 

Este modelo tiene la forma de:

De esto se deduce que:

 

Por tanto   no pude tener distribución normal debido a que toma valores discretos, el modelo de regresión lineal simple, no es aplicable para el caso de variables respuesta de tipo dicotómico. En el análisis de regresión logística, por tanto, se debe usar otros gráficos que suavicen los valores de la variable respuesta, representando después los valores de la variable respuesta versus la regresora

 Sea:

Que presenta la media condicional de y=1 dado x donde ,0 y 1 dado que x  representa la probabilidad de que ocurra y=1, ciertamente tenga relación lineal dentro el rango de la variable regresora.

De la relación y x para valores intermedios de x, se espera una relación curvilínea. Para cualquier valor grande de x,       tomará valores cercanos a 1 y para valores cercanos de x,     tomara valores cercanos a cero.                         

Curva en forma de S o signoide que tiene las propiedades requeridas para   y que tiene las propiedades de una función de distribución de probabilidades acumuladas.

Para esta probabilidad se usa la función de distribución acumulada de la distribución logística dado por:

                                           

Tiene, cuando         y cuando       además este modelo toma valores en el intervalo [0, 1].

Cuando P [Y = 1] = 0.5   el valor de x es:       que brinda información muy útil.

Una transformación de   que es lo central del estudio de la regresión logística es la transformación Logit, transformación que se define en términos        como:

                                                             

Para la variable respuesta dicotómica la expresamos como:

Veamos que ocurre con este modelo.

Entonces  tiene una distribución binomial con media cero y varianza .Por tanto la distribución condicional de la variable respuesta tiene distribución de probabilidades binomial con media .

El lado izquierdo se llama también logaritmo de ODDS ratio o razón de ventaja a favor de éxito o también razón de probabilidad de y =1 contra y = 0 específicamente.

Denotamos en el modelo logístico como (ODDS) a la ocurrencia de eventos, esta razón se define como el cociente de la probabilidad de que el evento ocurra a la probabilidad de que el evento no ocurra.

GRÁFICA 2.1: GRÁFICA DE LA REGRESIÓN LOGÍSTICA

De acuerdo a Rojo, J. M, (1999) En general, la gráfica de una función de distribución es, una función de distribución es una función real de variable real: (p.5)

Para Dallas, E.J. (2000) “El modelo de regresión logística se ajusta a través del uso de los métodos de máxima verosimilitud, en tanto que los modelos de regresión suelen ajustarse a través de los mínimos cuadrados” (p.288).

 

 

II.1.1 Interpretación de los coeficientes del modelo estimado

Entonces, a nivel de coeficientes estimados exponencialmente, la interpretación es muy similar y la diferencia estriba en que en estos casos no se trata del cambio (incremento o disminución) de la probabilidad de la variable dependiente por cada unidad de cambio en las independientes, sino del incremento o disminución que se produce en el cociente entre   ,  expresado por :

Más aun expresados en logaritmos por lo que sería necesario transformarlos tomando los valores de antilogaritmos, de tal manera que se evalúe más fácilmente su efecto sobre la probabilidad.

Utilizar este procedimiento no cambia en modo alguno la forma de interpretar el signo del coeficiente. Un coeficiente positivo aumenta la probabilidad mientras que un valor negativo disminuye la probabilidad. Por tanto, si es positivo su transformación será mayor a uno y el ODDS aumentará, este aumento se produce cuando la probabilidad prevista de ocurrencia de un suceso aumenta y la probabilidad prevista de su no ocurrencia disminuye. Por lo tanto, el modelo tiene una elevada probabilidad de ocurrencia. De la misma forma si es negativo, el antilogaritmo es menor a 1 y el ODDS ratio disminuye. Un valor de cero equivalente a un valor de 1, lo que no produce cambio en el ODDS.

II.1.2  Bondad de ajuste en la regresión logística

Para saber que tan cerca se ajustan los datos observados a la distribución binomial que plantea la regresión logística, se puede analizar la bondad de ajuste del modelo logístico y para ello estudiosos proponen hacer uso de, por ejemplo: El Ratio de Lik, R2 de Macfadden, R2 Cox y Snell, R2 de Nagelkerke, el test de Hosmer y Lemeshow, Tabla de clasificación y la curva de ROC.

 

 

 

 

 

II.2 Operacionalización de las variables del estudio

 

TABLA 2.1: OPERACIONALIZACIÓN DE LAS VARIABLES

Factores

Variable

Tipo

Aclaración

Escala de medición

Categorías

 

Variable dependiente

 

Riesgo 

agrícola

Cualitativa

Existe riesgo solo si las variables presentan recurrencia

Nominal

0: No existe

1: Existe

 

Factores sociodemográficos

% Perdido

Aproxim.

Cualitativa

Registra el porcentaje estimado de pérdida de la capacidad productiva en la comunidad estudiada

Nominal

0: ocurrió 1 vez

 

Población

Cualitativa

Se registra la población en las comunidades

Nominal

1: ocurrió más de 1 vez

 

Ingreso

familiar

Cualitativa

Se registra el ingreso de la población en las comunidades

Nominal

0: ocurrió 1 vez

 

Factores Climáticos

Helada

Cualitativa

Evidencia el número de denuncias de heladas (DGR)

Nominal

0: ocurrió 1 vez

1: ocurrió más de 1 vez

 

Sequia

Cualitativa

Evidencia el número de denuncias de (DGR)

Nominal

0: ocurrió 1 vez

1: ocurrió más de 1 vez

 

Factores  

productivos

Haba

Cualitativa

Señala la afectación  en el cultivo de haba

Nominal

0: ocurrió 1 vez

1: ocurrió más de 1 vez

 

Papa

Cualitativa

Señala la afectación  en el cultivo de papa

Nominal

0: ocurrió 1 vez

1: ocurrió más de 1 vez

 

Maiz

Cualitativa

Señala la afectación  en el cultivo de maíz en las comunidades estudiadas

Nominal

0: ocurrió 1 vez

1: ocurrió más de 1 vez

 

Frutales

Cualitativa

Señala la afectación  en el cultivo de frutales

Nominal

0: ocurrió 1 vez

1: ocurrió más de 1 vez

 

Hortalizas

Cualitativa

Señala la afectación  en el cultivo de haba

Nominal

0: ocurrió 1 vez

1: ocurrió más de 1 vez

 

Fuente: Elaboración propia, 2019

 

 

II.3 Generación del modelo de Regresión logística.

El método de selección de variables fue  Avanzar por paso (Wald), el cual permite visualizar modelos añadiendo las variables más significativas estadísticamente hablando.

 

 

TABLA 4.1 RESUMEN DE PROCESAMIENTO DE CASOS

Casos sin ponderara

N

Porcentaje

Casos seleccionados

Incluido en el análisis

68

100,0

Casos perdidos

0

,0

Total

68

100,0

Casos no seleccionados

0

,0

Total

68

100,0

 

 

La tabla muestra que son 68 las comunidades analizadas, la variable dependiente refiere a 0 como la ausencia de la característica que interesa al estudio o llamado también control y se denota con 1 a la característica presente que interesa analizar, vale decir el riesgo agrícola.

 

TABLA 4.3 CODIFICACIONES DE VARIABLES CATEGÓRICAS

 

Frecuencia

Codificación de parámetro

(1)

% Perdido superficie aproximado

menor al valor promedio

25

1,000

mayor al valor promedio

43

,000

Ingreso Familiar (Bs.)

menor al valor promedio

48

1,000

> al valor promedio

20

,000

Helada

ocurrente

34

1,000

recurrente

34

,000

Sequía

ocurrente

62

1,000

recurrente

6

,000

Haba

ocurrente

63

1,000

recurrente

5

,000

Papa

ocurrente

44

1,000

recurrente

24

,000

Hortalizas

ocurrente

65

1,000

recurrente

3

,000

Frutales

ocurrente

51

1,000

recurrente

17

,000

Maíz

ocurrente

21

1,000

recurrente

47

,000

Población (hab)

menor al valor promedio

49

1,000

> al valor promedio

19

,000

Se puede ver en esta tabla la frecuencia absoluta de cada valor, siendo dicotómica la característica estudiada para cada variable referida a algún factor que incide en el riesgo agrícola en la zona sud del departamento de Potosí. Por ejemplo, se verifica que 25 observaciones han perdido en porcentaje aproximado de superficie cultivada, menos del valor promedio calculado, en cambio son 43 comunidades las que no han perdido en porcentaje igual o mayor al valor promedio de dicha variable.

 

El ingreso familiar promedio menor a su media aritmética es de 48 comunidades y en cambio son 20 las comunidades que registran un ingreso familiar que en promedio es igual o mayor a la media aritmética.

 

En cuanto al registro de heladas se verifica que se han distribuido en exactamente a la mitad cada caso, siendo 34 las comunidades que han reportado heladas y otras 34 comunidades de la zona sud que reporta heladas, pero de manera recurrente.

 

Existen 62 comunidades que presentaron sequía, pero han sido 6 las comunidades que han tenido este evento climático de manera recurrente.

 

El reporte de daño a su producción de haba por una sola vez representa a 63 comunidades, en cambio han sido 5 las comunidades que de manera reiterativa o recurrente han reportada la afectación a este cultivo.

 

Son 44 comunidades que reportan daño en la papa por una sola vez en este periodo estudiado, sin embargo 24 comunidades señalaron que la afectación a la papa ha sido reiterativa.

 

En cuanto a las hortalizas el daño registrado por una única vez ha sido establecido en 65 comunidades, sin embargo 3 comunidades reportan recurrente la afectación en su producción de hortalizas.

 

Acerca de los frutales se observa que el hecho fue denunciado por 51 comunidades, pero solo 17 comunidades tienen este problema de manera recurrente.

 

El reporte de daño a la producción de maíz se dio en 21 comunidades, pero fueron 47 las comunidades que tuvieron este problema de manera recurrente.

 

En cuanto a la población, la tabla muestra que 49 comunidades tienen en promedio una población inferior al promedio establecido para la zona sud del departamento de Potosí.

 

Bloque 0: Bloque de inicio

 

Tabla 4.4 Historial de iteracionesa,b,c

Iteración

Logaritmo de la verosimilitud -2

Coeficientes

Constante

Paso 0

1

78,684

,941

2

78,597

1,020

3

78,597

1,022

4

78,597

1,022

 

a. La constante se incluye en el modelo.

b. Logaritmo de la verosimilitud -2 inicial: 78,597

c. La estimación ha terminado en el número de iteración 4 porque las estimaciones de parámetro han cambiado en menos de ,001.

Se observan 4 iteraciones hasta obtener el modelo ajustado, aclarando que en el bloque 0 incluye únicamente a la constante en el modelo.

 

TABLA 4.5 TABLA DE CLASIFICACIÓNA,B

 

Observado

Pronosticado

RIESGO AGRÍCOLA

Corrección de porcentaje

Control

Riesgo Agrícola

Paso 0

RIESGO

 AGRÍCOLA

Control

0

18

,0

Riesgo Agrícola

0

50

100,0

Porcentaje global

 

 

73,5

 

a. La constante se incluye en el modelo.

b. El valor de corte es ,500

 

La tabla evidencia mediante la diagonal principal que el modelo clasifica de forma correcta a 50 comunidades con presencia de riesgo agrícola, en cambio, ninguna comunidad fue clasificada correctamente con la variable de control. Sin embargo, de manera conjunta el 73,5% de las variables independientes explican al modelo.

 

TABLA 4.7 VARIABLES EN LA ECUACIÓN

 

B

Error estándar

Wald

gl

Sig.

Exp(B)

Paso 0

Constante

1,022

,275

13,815

1

,000

2,778

 

En esta tabla se observa que el estadístico de Wald es superior a 4, por tanto, el modelo del bloque 0 resulta ser significativo, esto se corrobora además con un

nivel de significancia menor al 0,05.  El error estándar señala el error que se puede cometer al replicar el modelo con otros datos, es decir el error es 0,275.

 

TABLA 4.8 LAS VARIABLES NO ESTÁN EN LA ECUACIÓN

 

Puntuación

gl

Sig.

Paso 0

Variables

población(1)

,398

1

,528

ingreso_fam_mes(1)

,031

1

,859

reporte_helada(1)

14,809

1

,000

reporte_sequía(1)

5,463

1

,019

Daño_haba(1)

,116

1

,733

Daño_papa(1)

,139

1

,710

Daño_maíz(1)

,111

1

,740

Daño_frutales(1)

12,190

1

,000

daño_hortaliz(1)

1,130

1

,288

porcentaje_perdido(1)

,850

1

,356

Estadísticos globales

26,773

10

,003

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

II.3.1 Pseudo Estadísticas R2

 

TABLA 4.11 RESUMEN DEL MODELO

Escalón

Logaritmo de la verosimilitud -2

R cuadrado de Cox y Snell

R cuadrado de Nagelkerke

1

47,025a

,371

,542

2

50,648b

,337

,492

3

50,833b

,335

,489

4

51,378b

,330

,481

5

51,462b

,329

,480

6

52,438b

,319

,466

7

53,554b

,308

,450

8

56,604c

,276

,403

9

57,524c

,266

,389

 

a. La estimación ha terminado en el número de iteración 20 porque se ha alcanzado el máximo de iteraciones. La solución final no se puede encontrar.

b. La estimación ha terminado en el número de iteración 6 porque las estimaciones de parámetro han cambiado en menos de ,001.

c. La estimación ha terminado en el número de iteración 5 porque las estimaciones de parámetro han cambiado en menos de ,001.

 

En la tabla que antecede, se muestran dos medidas de bondad de ajuste del modelo resultante, R2 de Cox y de Snell es un coeficiente de determinación generalizado, estima la proporción de varianza de la variable dependiente explicada por las variables independientes y su valor está comprendido entre 0 y 1 como observamos en los datos, pero siempre tiene un valor máximo inferior a 1, incluso en un modelo perfecto.

 

El R2 de Negelkerke es una versión corregida del R2 de Cox y de Snell y corrige la escala del estadístico para cubrir el intervalo completo de 0 a 1.

Para el modelo 2 según el cuadro, se evidencia un valor de  R2 de Cox y de Snell = 0,266 que indica que el 26,6% de la variación del riesgo agrícola es explicada por las variables incluidas en el modelo, siendo estas variables independientes el Reporte de la helada y daño en frutales.

El R2 de Negelkerke = 0, 389, lo que indica que el 38,9% de la variación del riesgo agrícola es explicado por las variables incluidas en el modelo.

 

Por tanto, cuanto más alto es  R2 más explicativo es el modelo, es decir, las variables independientes explican la variable dependiente.

 

II.3.2 Bondad de ajuste

Ho: No existen diferencias entre los valores observados y predichos

H1: Existen diferencias entre los valores observados y predichos

 

Tabla 4.12 Prueba de Hosmer y Lemeshow

Escalón

Chi-cuadrado

gl

Sig.

1

4,072

8

,851

2

7,534

8

,480

3

5,372

8

,717

4

3,877

7

,794

5

2,787

7

,904

6

6,287

7

,507

7

1,495

5

,914

8

2,443

4

,655

9

,786

2

,675

Se muestra un valor de Chi- Cuadrado de 0,786 un p-valor de 0,675, lo que indica en este caso, es que en la medida que el valor sea más alto, es decir no sea significativa la prueba, se entiende que no existe razón para creer que la ecuación sea diferente a la del interés, es decir que sea diferente a una distribución logarítmica.

 

Tabla 4.13 Tabla de contingencia para la prueba de Hosmer y Lemeshow

 

RIESGO AGRÍCOLA = Control

RIESGO AGRÍCOLA = Riesgo Agrícola

Total

Observado

Esperado

Observado

Esperado

Paso 1

1

5

5,265

1

,735

6

2

5

4,503

2

2,497

7

3

4

3,432

3

3,568

7

4

1

2,349

6

4,651

7

5

2

1,333

5

5,667

7

6

0

,556

7

6,444

7

7

1

,355

6

6,645

7

8

0

,135

8

7,865

8

9

0

,069

8

7,931

8

10

0

,003

4

3,997

4

Paso 2

1

7

6,549

1

1,451

8

2

3

3,670

4

3,330

7

3

5

3,537

3

4,463

8

4

0

2,207

7

4,793

7

5

2

,901

5

6,099

7

6

1

,486

6

6,514

7

7

0

,333

6

5,667

6

8

0

,202

7

6,798

7

9

0

,088

6

5,912

6

10

0

,026

5

4,974

5

Paso 3

1

7

6,530

1

1,470

8

2

3

3,758

4

3,242

7

3

4

3,185

3

3,815

7

4

1

2,449

7

5,551

8

5

2

,813

4

5,187

6

6

1

,525

6

6,475

7

7

0

,371

6

5,629

6

8

0

,227

7

6,773

7

9

0

,113

7

6,887

7

10

0

,028

5

4,972

5

Paso 4

1

6

5,803

1

1,197

7

2

4

4,448

4

3,552

8

3

4

3,154

3

3,846

7

4

1

2,538

7

5,462

8

5

2

1,090

9

9,910

11

6

1

,479

6

6,521

7

7

0

,325

8

7,675

8

8

0

,133

7

6,867

7

9

0

,029

5

4,971

5

Paso 5

1

6

6,465

2

1,535

8

2

3

2,181

1

1,819

4

3

4

3,487

3

3,513

7

4

2

2,923

6

5,077

8

5

1

1,440

6

5,560

7

6

1

,952

12

12,048

13

7

1

,391

8

8,609

9

8

0

,139

8

7,861

8

9

0

,021

4

3,979

4

Paso 6

1

4

3,401

0

,599

4

2

5

5,319

3

2,681

8

3

1

1,879

3

2,121

4

4

5

3,972

4

5,028

9

5

1

1,779

7

6,221

8

6

0

,110

1

,890

1

7

1

1,280

19

18,720

20

8

1

,191

4

4,809

5

9

0

,070

9

8,930

9

Paso 7

1

3

2,453

0

,547

3

2

6

6,359

3

2,641

9

3

1

1,547

2

1,453

3

4

5

4,732

8

8,268

13

5

2

1,531

7

7,469

9

6

1

1,287

21

20,713

22

7

0

,091

9

8,909

9

Paso 8

1

3

2,456

0

,544

3

2

6

7,019

5

3,981

11

3

1

1,544

2

1,456

3

4

6

4,981

11

12,019

17

5

1

,526

2

2,474

3

6

1

1,474

30

29,526

31

Paso 9

1

9

9,470

5

4,530

14

2

7

6,530

13

13,470

20

3

1

,530

2

2,470

3

4

1

1,470

30

29,530

31

 

La prueba de Hosmer y Lemeshow advierte que tan bien pronostica el modelo, por tanto, la bondad de ajuste del modelo queda probada siempre que los valores observados no disten en exceso de los valores esperados.

 

TABLA 4.14 TABLA DE CLASIFICACIÓNA

 

Observado

Pronosticado

RIESGO AGRÍCOLA

Corrección de porcentaje

Control

Riesgo Agrícola

Paso 1

RIESGO AGRÍCOLA

Control

11

7

61,1

Riesgo Agrícola

3

47

94,0

Porcentaje global

 

 

85,3

Paso 2

RIESGO AGRÍCOLA

Control

7

11

38,9

Riesgo Agrícola

2

48

96,0

Porcentaje global

 

 

80,9

Paso 3

RIESGO AGRÍCOLA

Control

10

8

55,6

Riesgo Agrícola

5

45

90,0

Porcentaje global

 

 

80,9

Paso 4

RIESGO AGRÍCOLA

Control

11

7

61,1

Riesgo Agrícola

5

45

90,0

Porcentaje global

 

 

82,4

Paso 5

RIESGO AGRÍCOLA

Control

9

9

50,0

Riesgo Agrícola

3

47

94,0

Porcentaje global

 

 

82,4

Paso 6

RIESGO AGRÍCOLA

Control

9

9

50,0

Riesgo Agrícola

3

47

94,0

Porcentaje global

 

 

82,4

Paso 7

RIESGO AGRÍCOLA

Control

10

8

55,6

Riesgo Agrícola

5

45

90,0

Porcentaje global

 

 

80,9

Paso 8

RIESGO AGRÍCOLA

Control

10

8

55,6

Riesgo Agrícola

7

43

86,0

Porcentaje global

 

 

77,9

Paso 9

RIESGO AGRÍCOLA

Control

9

9

50,0

Riesgo Agrícola

5

45

90,0

Porcentaje global

 

 

79,4

 

a. El valor de corte es ,500

Aquellas comunidades que evidencia riesgo agrícola en la zona sud del departamento de Potosí se estimaron con una precisión de 90% (sensibilidad) y aquellas comunidades que no evidencian recurrencia en el riesgo agrícola se estimaron con una precisión del 50% (especificidad).

 

Para evaluar que tan bueno es un modelo en su capacidad predictiva, se observa que el modelo es bueno para predecir el riesgo agrícola, quedando las comunidades en su totalidad clasificadas correctamente por el modelo en un 79,4%

 

Cuanto mejor clasifica el modelo, es decir coincide el valor pronosticado con el observado, mejor es el modelo, más explicativo, por tanto, las variables independientes son buenas predictoras de la variable dependiente. 

 

Como el modelo clasifica correctamente más del 50% de los casos, el modelo se acepta.

 

El método multivariado de la Regresión logística ha permitido explorar y pronosticar para la población estudiada, además de caracterizar el comportamiento del riesgo agrícola en la zona sud del departamento de Potosí, se logró conocer como respuesta científica la probabilidad del riesgo agrícola

Un uso importante del modelo es clasificar en forma global a las comunidades de las provincias Nor Chichas, Sud Chichas y Modesto Omiste en una de las 2 alternativas: tiene riesgo agrícola versus no tienen riesgo agrícola. Esto se obtiene sustituyendo los valores de las variables independientes en el modelo ajustado, lo que produce la probabilidad estimada, para predecir si la comunidad está en la alternativa  0 ó 1, el software SPSS v.22 automáticamente emplea un punto de corte de 0,5.  Esto significa que la comunidad con probabilidad estimada < 0,5 se clasifica como (ocurrencia, - ausencia)  = 0 (Control) en cambio se clasifica  > 0,5  si la probabilidad estimada señala (recurrencia – presencia) = 1(riesgo agrícola) en la zona sud del departamento de Potosí, que es la que comprende este estudio.

En resumen, el modelo final ha sido clasificado correctamente 90% de las comunidades con riesgo agrícola y un 50 % de las comunidades que no evidencian riesgo agrícola. El porcentaje global de las comunidades clasificados correctamente es de 79,4 %

TABLA 4.15 VARIABLES EN LA ECUACIÓN

 

B

Error estándar

Wald

gl

Sig.

Exp(B)

95% C.I. para EXP(B)

Inferior

Superior

Paso 1a

población(1)

-1,362

1,909

,509

1

,476

,256

,006

10,811

ingreso_fam_mes(1)

1,563

1,869

,700

1

,403

4,775

,122

186,206

reporte_helada(1)

-2,898

,982

8,702

1

,003

,055

,008

,378

reporte_sequía(1)

2,014

1,651

1,488

1

,223

7,490

,295

190,328

Daño_haba(1)

1,615

1,497

1,163

1

,281

5,027

,267

94,583

Daño_papa(1)

-,444

,946

,220

1

,639

,642

,100

4,097

Daño_maíz(1)

1,042

1,227

,722

1

,396

2,836

,256

31,413

Daño_frutales(1)

1,721

,942

3,337

1

,068

5,592

,882

35,452

daño_hortaliz(1)

-21,764

22185,787

,000

1

,999

,000

,000

.

porcentaje_perdido(1)

1,338

,892

2,252

1

,133

3,813

,664

21,901

Constante

19,596

22185,787

,000

1

,999

323878047,115

 

 

Paso 2a

población(1)

-1,461

1,835

,635

1

,426

,232

,006

8,452

ingreso_fam_mes(1)

1,349

1,780

,575

1

,448

3,855

,118

126,152

reporte_helada(1)

-2,574

,937

7,552

1

,006

,076

,012

,478

reporte_sequía(1)

2,155

1,632

1,744

1

,187

8,629

,352

211,321

Daño_haba(1)

,600

1,358

,195

1

,659

1,822

,127

26,097

Daño_papa(1)

-,956

,967

,978

1

,323

,384

,058

2,557

Daño_maíz(1)

1,578

1,270

1,545

1

,214

4,846

,402

58,378

Daño_frutales(1)

1,870

,934

4,008

1

,045

6,485

1,040

40,443

porcentaje_perdido(1)

,913

,823

1,229

1

,268

2,491

,496

12,507

Constante

-,970

2,583

,141

1

,707

,379

 

 

Paso 3a

población(1)

-1,421

1,818

,611

1

,434

,242

,007

8,520

ingreso_fam_mes(1)

1,292

1,763

,537

1

,464

3,641

,115

115,297

reporte_helada(1)

-2,562

,935

7,509

1

,006

,077

,012

,482

reporte_sequía(1)

2,124

1,618

1,723

1

,189

8,364

,351

199,344

Daño_papa(1)

-,896

,955

,881

1

,348

,408

,063

2,652

Daño_maíz(1)

1,610

1,264

1,621

1

,203

5,001

,420

59,569

Daño_frutales(1)

1,766

,890

3,932

1

,047

5,845

1,021

33,469

porcentaje_perdido(1)

,879

,812

1,172

1

,279

2,409

,490

11,832

Constante

-,352

2,162

,027

1

,870

,703

 

 

Paso 4a

población(1)

-,243

,840

,084

1

,773

,784

,151

4,069

reporte_helada(1)

-2,515

,919

7,481

1

,006

,081

,013

,490

reporte_sequía(1)

2,139

1,613

1,760

1

,185

8,493

,360

200,292

Daño_papa(1)

-,831

,944

,774

1

,379

,436

,068

2,774

Daño_maíz(1)

1,723

1,258

1,875

1

,171

5,600

,476

65,912

Daño_frutales(1)

1,790

,884

4,101

1

,043

5,989

1,059

33,861

porcentaje_perdido(1)

,793

,794

,999

1

,318

2,210

,467

10,468

Constante

-,419

2,140

,038

1

,845

,658

 

 

Paso 5a

reporte_helada(1)

-2,530

,918

7,603

1

,006

,080

,013

,481

reporte_sequía(1)

2,133

1,612

1,750

1

,186

8,437

,358

198,887

Daño_papa(1)

-,900

,915

,968

1

,325

,407

,068

2,442

Daño_maíz(1)

1,672

1,247

1,797

1

,180

5,322

,462

61,311

Daño_frutales(1)

1,847

,864

4,573

1

,032

6,340

1,167

34,452

porcentaje_perdido(1)

,758

,783

,936

1

,333

2,134

,460

9,906

Constante

-,542

2,087

,067

1

,795

,582

 

 

Paso 6a

reporte_helada(1)

-2,447

,907

7,281

1

,007

,087

,015

,512

reporte_sequía(1)

2,000

1,555

1,655

1

,198

7,392

,351

155,713

Daño_papa(1)

-,941

,920

1,045

1

,307

,390

,064

2,371

Daño_maíz(1)

1,852

1,258

2,167

1

,141

6,370

,541

74,965

Daño_frutales(1)

1,862

,852

4,776

1

,029

6,434

1,212

34,166

Constante

-,238

2,010

,014

1

,906

,788

 

 

Paso 7a

reporte_helada(1)

-2,220

,867

6,554

1

,010

,109

,020

,594

reporte_sequía(1)

2,429

1,446

2,823

1

,093

11,352

,667

193,081

Daño_maíz(1)

1,808

1,188

2,316

1

,128

6,099

,594

62,606

Daño_frutales(1)

1,437

,711

4,080

1

,043

4,208

1,044

16,968

Constante

-1,088

1,774

,376

1

,540

,337

 

 

Paso 8a

reporte_helada(1)

-2,116

,852

6,176

1

,013

,120

,023

,639

reporte_sequía(1)

,940

1,001

,881

1

,348

2,559

,360

18,221

Daño_frutales(1)

1,448

,692

4,373

1

,037

4,253

1,095

16,521

Constante

,609

1,364

,200

1

,655

1,839

 

 

Paso 9a

reporte_helada(1)

-2,276

,832

7,482

1

,006

,103

,020

,525

Daño_frutales(1)

1,461

,684

4,568

1

,033

4,312

1,129

16,471

Constante

1,539

,903

2,901

1

,089

4,659

 

 

 

 

De acuerdo a la tabla anterior, se puede observar que las variables que resultaron ser significativas, vale aclarar (p-valor < 0.05). Son: Reporte de la helada, y Daño en frutales, por lo cual están incluidas en el modelo bajo el método retroceder por paso de (WALD), siendo que influyen en el riesgo agrícola de la zona sud del departamento de Potosí con una confianza del 95%

 

El “Reporte de la helada”, tiene una relación negativa con la variable dependiente (-2,276): x1,

El “Daño en frutales”, esta variable tiene una relación positiva (1,461): x2 Por tanto, un coeficiente positivo aumenta la probabilidad de pertenecer al grupo de interés.

Entonces el modelo de regresión logística ajustado será:

 

 

 

P(Estado = riesgo agrícola) =

 

 

Una expresión más simple del modelo:

 

Z = 1,539 – 2,2676 Reporte de helada + 1,461 Daño en frutales

 

 

De las 10 variables independientes, consideradas inicialmente para el modelo de regresión logística, se obtuvo el modelo ajustado luego del tratamiento bajo el método de Wald, quedando para el modelo solo los coeficientes que pasaron la prueba de significancia de sus coeficientes individuales con un nivel de confianza del 95%.

TABLA 4.16  VARIABLES EN LA ECUACIÓN

 

Exp(B)

95% C.I. para EXP(B)

Inferior

Superior

Paso 8

reporte_helada(1)

,070

,014

,341

Constante

16,000

 

 

Paso 9

Daño_frutales(1)

4,312

1,129

16,471

reporte_helada(1)

,103

,020

,525

Constante

4,659

 

 

 

De todas las variables seleccionadas, aquella que tiene mayor fortaleza para explicar la probabilidad del riesgo agrícola es el daño a frutales ya que su EXP(B) es el más alejado de 1.

 

Se puede afirmar en base a los datos analizados que el perfil del riesgo agrícola en la zona sud del departamento de Potosí está influido en gran manera por los reportes de daño a frutales y por el reporte de heladas, estas serían las causas del riesgo agrícola y por tanto en ello podemos intervenir o incidir en la realidad agrícola.

 

La tabla señala que los coeficientes calculados cuentan con un 5% de significancia y tienen por tanto un 95% de nivel de confianza.

 

El Exponencial de B, u ODDS RATIO, indica la fortaleza de la relación. Cuanto más alejada de 1 está, más fuerte es la relación.  Para comparar los exponenciales de B entre sí, aquellos que son menores a 1 deben transformarse en su inverso recíproco, es decir, debemos dividir 1 entre el exponencial de B, aclarando que esto opera sólo cuando sean menores a 1. En la tabla arriba presentada, el reporte de helada tiene un EXP(B) = 0,103. Para comparar este EXP(B) con el resto, se calcula la inversa (1/0,103=9,708) quedando identificada la variable reporte de heladas como la que mejor explica el modelo de ello resulta que:

·         La comunidad es 9,708 veces más probable de presentar riesgo agrícola, entre las comunidades que presentan de forma recurrente reportes de heladas que entre las comunidades que declararon solo una vez (de forma ocurrente) una helada en el periodo estudiado.

·         La comunidad es 4,312 veces más probable de tener riego agrícola entre las comunidades que sí reportan daño en frutales más de una vez.

·         De todas las variables seleccionadas, aquella que tiene mayor fortaleza para explicar la probabilidad del riesgo agrícola es el daño a frutales ya que su EXP(B) es el más alejado de 1.

·         Se puede afirmar en base a los datos analizados que el perfil del riesgo agrícola en la zona sud del departamento de Potosí está influido en gran manera por los reportes de daño a frutales  y por el reporte de heladas, estas serían las causas del riesgo agrícola.

 

II.3.3 Curva  ROC

TABLA 4.18 RESUMEN DE PROCESAMIENTO DE CASOS

RIESGO AGRÍCOLA

N válido (por lista)

Positivoa

50

Negativo

18

 

Los valores más grandes de la(s) variable(s) de resultado de prueba indican una prueba mayor para un estado real positivo.

a. El estado real positivo es Riesgo Agrícola.

GRÁFICO 4.2: CURVA ROC  - HELADA

TABLA 4.19: ÁREA BAJO LA CURVA, HELADA

Área

Error estándara

Significación asintóticab

95% de intervalo de confianza asintótico

Límite inferior

Límite superior

,764

,062

,001

,643

,886

 

La(s) variable(s) de resultado de prueba: Helada tiene, como mínimo, un empate entre el grupo de estado real positivo y el grupo de estado real negativo. Las estadísticas podrían estar sesgadas.

a. Bajo el supuesto no paramétrico

b. Hipótesis nula: área verdadera = 0,5

 

La curva ROC evidencia una clasificación de 0.764 para la variable independiente de Helada, ello permite dar una descripción completa de la capacidad de discriminación del test, al acercarse de manera aceptable a la esquina superior izquierda vemos el poder clasificatorio del modelo.

 

GRÁFICO 4.3: CURVA ROC  - DAÑO EN FRUTALES

 

TABLA 4.20: ÁREA BAJO LA CURVA,  DAÑO EN FRUTALES

Área

Error estándara

Significación asintóticab

95% de intervalo de confianza asintótico

Límite inferior

Límite superior

,708

,078

,009

,556

,860

 

La(s) variable(s) de resultado de prueba: Frutales tiene, como mínimo, un empate entre el grupo de estado real positivo y el grupo de estado real negativo. Las estadísticas podrían estar sesgadas.

 

 

La curva ROC evidencia una clasificación de 0.708 para la variable independiente de Daño en frutales, ello permite dar una descripción completa de la capacidad de discriminación del test, al acercarse de manera aceptable a la esquina superior izquierda vemos el poder clasificatorio del modelo.

De la tabla construida con la predicción para el riesgo agrícola, se puede señalar que en sus casos extremos: la comunidad de Esquina Grande perteneciente al municipio de Villazón de la provincia Modesto Omiste, tiene una probabilidad de sufrir riesgo agrícola en un 32 %. Dicha comunidad tiene un promedio de ingresos mensuales por familia de 28,5 Bs.-, con una población de 114 personas.

 

La comunidad de La Torre perteneciente al municipio de Tupiza de la provincia Sud Chichas tiene una probabilidad de sufrir riesgo agrícola en un 95%. Dicha comunidad tiene un promedio de ingresos mensuales por familia de 39 Bs.-, con una población de 156 personas.

 

II.4 Conclusiones

           

·         El tratamiento de datos estadísticos de riesgo agrícola es esencial para contribuir en la construcción del Sistema de Alerta Temprana.

·         El método de regresión logística permitió el conocimiento en términos probabilísticos del riesgo agrícola en la zona sud del departamento de Potosí.

·         Con los resultados de la regresión logística, mediante el estadístico de Wald para el riesgo agrícola, se determinó que las variables más influyentes son: “Reporte de heladas” y “Daño a los frutales”, teniendo estas variables un p-valor asociado al estadístico de Wald menor al 5%.

·         Las variables con poca influencia en el modelo son:  la población, el ingreso familiar por mes, los reportes de sequía, el daño al haba, el daño a la papa, el daño al maíz y el daño a las hortalizas, así como el porcentaje de daño en la superficie cultivada.

·         Los datos son altamente orientadores y favorecen las medidas de  resiliencia y nos preparan para la construcción de un sistema de alerta temprana.

·         En estudios futuros de la zona geográfica se deberá tomar especial interés a los eventos climáticos de la helada y considerar que el producto agrícola importante en este modelo  son los frutales.

·         Se reconoce en base al diagnóstico, la aún insipiente cultura y difusión de información estadística en los municipios

·         Los resultados de este trabajo ayudan a que las entidades gubernamentales observen qué se puede hacer para que las comunidades se anticipen al riesgo agrícola considerando su vulnerabilidad en diferentes factores como en su ingreso familiar, población de cada comunidad, etc.

·         Es evidente que son diversos y complejas las variables que influyen en el riesgo agrícola por lo que este trabajo es el inicio de un abordaje más profundo en el ámbito del análisis multivariado que sin duda aportar a conocer más y mejor el aporte del sector agrícola al PIB y sus efectos negativos en caso de presencia del riesgo agrícola.

·         Con la regresión logística se ha logrado determinare el riesgo agrícola en la zona sud del departamento de Potosí por tanto proporciona a las instancias del gobierno un instrumento técnico estadístico para que mejoren las capacidades de resiliencia agrícola y por tanto las condiciones de vida de la población.                                                                                  

·         La recolección de información de las estaciones meteorológicas debe ser completa, para poder ofrecer herramientas estadísticas con mayor precisión, ya que el tema climático demanda abundante información y un registro riguroso.

·         Se debería realizar este análisis para las 4 zonas del departamento de Potosí.

·         Se aconseja realizar un modelo logístico  en el campo pecuario, ya que la afectación a este sector productivo repercute de manera importante en el PIB del país.

·         Es necesario hacer un análisis complementario en el ámbito económico, que de manera exhaustiva valore la afectación que causa el riesgo agrícola en las zonas y en el departamento de Potosí.

·         Se recomienda un trabajo intensivo e interinstitucional en pro de una cultura de la información, para alentar y favorecer la ciencia y la tecnología para un estado real cada vez mejor en la sociedad.

 

 

 

 

 

III. Referencias bibliográficas 

 

1.         EIRD, Terminología sobre reducción del riesgo de desastres, Estrategia Internacional para la Reducción de Desastres, Naciones Unidas, 2009

 

2.         Pla, L.E. (1986). Análisis multivariado método de componentes principales, Secretaría General de la OEA. Programa Regional de Desarrollo Científico y Tecnológico, Washington, DC,  USA.

 

3.         Cuadras, M. (2014), Introducción al Análisis Multivariante, recuperado de  campus.com, Estadística <http://www.campus.com/leccion/anamul> [fecha de consulta 4 de abril de 2019]

 

4.         Dallas E. Jhonson, (2000). Métodos multivariados aplicados al análisis de datos, México, Thomson Editores,

5.         Rojo A, J.M. Regresión con variable dependiente cualitativa, Instituto de Economía y Geografía, II- 2007, Madrid

 

6.         Dallas E. Jhonson,(2000) Métodos multivariados aplicados al análisis de datos, México, Thomson Editores.

 

7.         Boletín Meteorológico Del Departamento De Potosí, 2003

 

8.         Rojo A, J.M. (II- 2007) Regresión con variable dependiente cualitativa, Instituto de Economía y Geografía, Madrid.

 

9.         Organización para la Cooperación y el Desarrollo Económicos (OCDE) y el Departamento de Agricultura de Estados Unidos (USDA), (2019) recuperado de Website: www.ceigram.upm.es.

 

10.       Ley 602 de Gestión de Riesgos, 2014

11.       --------------- Gestión de Riesgos, 2014

 

12.       EIRD, Terminología sobre reducción del riesgo de desastres, Estrategia Internacional para la Reducción de Desastres, Naciones Unidas, 2009.

 

13.       Instituto de Estudios Avanzados en Desarrollo (Inesad), (s.f.) “La dinámica del cambio climático en Bolivia”, realizado por los investigadores  Lykke Andersen y Luis Carlos Jemio, del en colaboración con la  Universidad  Privada Boliviana (UPB).

 

14.       EIRD, Terminología sobre reducción del riesgo de desastres, Estrategia Internacional para la Reducción de Desastres, Naciones Unidas, 2009

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

BIBLIOGRAFÍA

Agresti A. (1990) Categorical Data Analysis, Editorial Wiley.

Andersen L., Jemio L.C. La dinámica del cambio climático en Bolivia, Instituto de Estudios.

Avanzados en Desarrollo (Inesad), en colaboración con la Universidad  Privada Boliviana (UPB).

Boletín Meteorológico del Departamento de Potosí, 2003

Bonilla, G. Métodos multivariados I, Ed. Trillas, México, 1997

Cuadras, M. (2014), Introducción al Análisis Multivariante, campus.com, Estadística <http://www.campus.com/leccion/anamul> [fecha de consulta 4 de abril de 2019]

Censo Agropecuario 2013, INE, Bolivia, 2013

Censo Nacional de población y vivienda 2012, INE, Bolivia, 2012

Colque, P. (2009) Filosofía de las Ciencias, proceso del método científico,1ra edición,    Cochabamba – Bolivia.

Cruz A. D. J. (2012) Un análisis parcial en las preparatorias de BUAP en la materia de Matemáticas en el 2010, (Tesis de grado). Recuperado de https://1library.co/document/9yn7v9lz-analisis-parcial-preparatorias-buap-materias-matematicas.html#pdf-content

Dallas E. Jhonson, (2000). Métodos multivariados aplicados al análisis de datos, México, Thomson Editores

Downie, M. N. (1988). Métodos Estadísticos Aplicados, México, Ed, Harla, 1988

EIRD, Terminología sobre reducción del riesgo de desastres, Estrategia Internacional para la Reducción de Desastres, Naciones Unidas, 2009.

Glass G.V. y Stanley J.C. (1974). Métodos Estadísticos Aplicados a las Ciencias Sociales, México, Prentice Hall

Hair, J.F., Anderson, R.E., Tatham, R.L. y Black, W.C. (1999). Análisis Multivariante, 5° ed. Prentice Hall, IBERIA, Madrid, España.

Hosmer D. W. y Lemeshow S. (2000). Applied logist Resgression, 2da Edición, Editorial Jhon Wiley Sons.

Jambu, M. (1990). Exploratory and Multivariate Data Analysis [Análisis Exploratorio y Multivariado de Datos]. California, EE.UU.: Academic Press.

Jimenez, E. U. (2005) Análisis Multivariante Aplicado, Madrid España, Thomson.

La gestión de los riesgos en la agricultura. Panorama Socioeconómico [en linea] 2008, 26 (enero-junio) : [Fecha de consulta: 19 de mayo de 2019] Disponible en:<http://www.redalyc.org/articulo.oa?id=39903601> ISSN 0716-1921Ley 602 de Gestión de Riesgos, noviembre 2014

Ley 144 Revolución Productiva, de junio 2011

López-Calleja Hiort-Lorenzen, C., Tablas de Contingencia y Modelos de Regresión Logística aplicados a cuatro rutas migratorias a partir del medio rural en Cuba, Población y Salud en Mesoamérica, vol. 12, núm. 1, julio-diciembre, 2014, Universidad de Costa Rica, San José, Costa Rica.

Manual de Organización y Funcionamiento de la Unidad de Gestión de Riesgo Municipal. Gobierno municipal de Vitichi, Equipo  Técnico DIPECHO IX, Care Internacional, La Paz - Bolivia

Material para el módulo redacción científica aplicada a proyectos formativos por competencias, material compilado por Acuña, Juan Alfredo, UPDS, 2018

Organización para la Cooperación y el Desarrollo Económicos (OCDE) y el Departamento de Agricultura de Estados Unidos (USDA), Recuperado de http://www.ceigram.upm.es, consultado 2019)

Pla, L.E.(1986) Análisis multivariado método de componentes principales, Secretaría General de la OEA. Programa Regional de Desarrollo Científico y Tecnológico, Washington, DC.

PREDECAN, Agenda Estratégica para el fortalecimiento de la gestión de riesgo, Bolivia

Publicación de Dossier de Economistas sin Fronteras con apoyo del CEIGRAM: «El futuro de la alimentación en el mundo», C/ Senda del Rey 13 Campus Sur de prácticas E.T.S. de Ingeniería Agronómica, Alimentaria y de Biosistemas Madrid 28040 España. Recuperado de  http://www.ceigram.upm.es.

Rojo A, J.M. (2007). Regresión con variable dependiente cualitativa, Instituto de Economía y Geografía, , Madrid

Sierra B. R. (1991) Diccionario práctico de estadística, Madrid-España, Paraninfo.

Sistema de Gestión del Riesgo Agropecuario de Potosí – SGRA, Ministerio De Desarrollo Rural Y Tierras, Viceministerio De Defensa Civil, Prefectura del Departamento De Potosí, FAO,  INVENTA Publicidad E Impresos, La Paz – Bolivia, 2009

Soto, Mario. (2007). Estadística Aplicada I. Editorial Gratec, Segunda Edición,

Suárez, M. G. (1999). Análisis multivariante, Madrid, Pearson Educación S.A.

Wooldridge, Jeffrey M. (2010). Introducción A La Econometría Un Enfoque Moderno, 4ta Edición, Cengage Learning Editores S.A., México-DF.

 

 

 

 

 

 

IV Anexos

Anexo A

UBICACIÓN GEOGRÁFICA DE LA ZONA SUD EN EL DEPARTAMENTO DE POTOSÍ

 

Tabla 3.1: POBLACIÓN REGIÓN ZONA SUD

 

Provincia

Habitantes por provincia

Sud Chichas

44814

Nor Chichas

42447

Modesto Omiste

44906

Total

132167

 

Elaboración propia, 2019

 

No contempla datos del municipio de Atocha por estar exento del estudio por ausencia de datos

 

 

 

 

TABLA 3.2 BOLIVIA: EVENTOS ADVERSOS DE ORIGEN NATURAL REPORTADOS,

 SEGÚN TIPO DE EVENTO (EN NÚMERO DE REPORTES)

Descripción

2002 – 2013 *

%

Inundación

5.444

42%

Sequía

2.212

17%

Helada

2.249

17%

Granizada

2.211

17%

Deslizamiento, mazamorra

278

2%

Viento huracanado

246

2%

Incendio

321

2%

Sismo

25

0%

Plaga

15

0%

Tormenta eléctrica

1

0%

Contaminación

1

0%

Total

13.003

100%

            Fuente: Viceministerio de Defensa Civil – INE   *2013: Preliminar

 

TABLA 3.3: PRINCIPALES EMERGENCIAS CLIMÁTICAS REPORTADAS EN BOLIVIA,

2002 – 2008

 

Tipo de evento

2002

2003

2004

2005

2006

2007

2008(p)

Inundación

353

810

448

278

868

1.191

1.085

Sequía

351

43

451

151

16

651

151

Helada

66

5

153

132

121

1.259

451

Granizada

311

67

261

74

194

695

413

Deslizamiento, mazamorra

20

24

23

11

36

31

84

Viento hurcanado

46

4

56

30

8

52

13

Incendio

39

15

44

105

33

30

24

Plaga

1.186

968

1.436

781

1.276

3.909

2.230

Sub total por emergencias climáticas

1.186

968

1.436

781

1.276

3.909

2.230

Otras emergencias

 

 

8

2

2

4

15

Total

1.186

968

1.444

783

1.278

3.913

2.245

Fuente: VIDECI. INE, 2010 (P) preliminar

Comentarios

Entradas populares de este blog

Programas básicos y Python

Estudio de caso 3: Cuál es el perfil de los estudiantes de ingeniería comercial y cuál es el perfil que se espera de un ingeniero comercial en la U.A.T.F.