Arbitraje de Oferta Final. Determinación del pago óptimo en un conflicto ambiental

Final Offer Arbitration. Determination of Optimal Payment in an Environmental Dispute

Alejandro Sánchez Peralta*

 

PDF EPUB Edición: Vol. 8 Núm. 3, septiembre-diciembre 2017

PDF EPUB

rde_23_art02

 

Cuando un agente regulado ha incumplido las políticasde regulación ambiental puede ser sancionado con un pago monetario, el cual se fija una vez que se cuantifica el daño, aunado a los gastos de monitoreo ex ante y ex post para cubrir el costo económico y social del deterioro ocasionado; sin embargo, la falta de acuerdo para determinar el monto de la sanción puede requerir de un árbitro para que realice esa tarea. Usando el proceso Arbitraje de Oferta Final se argumenta, desde un punto de vista teórico, sobre el pago que debe hacer un agentecontaminador cuando la cantidad monetaria que establece el árbitro se distribuye normalmente.

Palabras clave: economía ecológica; regulación mbiental; equilibrio de Nash; Arbitraje de Oferta Final.

When a regulated agent has been charged with breaching environmental regulation policies, he or she may be liable for an economic compensation. The amount of which may be determined once the damage is quantified plus monitoring expenses (both ex-ante and ex-post) in order to cover economic and social costs caused by the environmental deterioration. However, a lack of agreement when trying to establish the penalty amount may require a referee to undertake the task. By using the Final Offer Arbitration process, I will comment from a theoretical perspective on the payment that must be imposed to the pollutant agent once the established penalty will result in a normal economic distribution.

Key words: ecological economics; environment regulation; Nash equilibrium; final offer arbitration.

Código JEL: A12, C30 y C720.

Recibido: 4 de junio de 2016
Aceptado: 27 de marzo de 2017

* Instituto Nacional de Estadística y Geografía, alejandro.peralta@inegi.org.mx

 

Introducción

La economía ecológica emplea una gran variedad de términos del lenguaje común para designar situaciones relacionadas con el medio ambiente, por ejemplo: gestión, impacto, contingencia, valoración y regulación ambiental. En este sentido, el concepto de medio ambiente es amplio y cambiante, ya que incluye elementos sociales y económicos en varios niveles. De igual manera, los estudios deimpacto ambiental, además de centrarse en las implicaciones ecológicas de la actividad humana, también prestan atención a diversas áreas de estudio debido a las consecuencias sociales, políticas, económicas y culturales derivadas de dicha actividad.

Uno de los principales problemas del impacto ambiental es la contaminación, tema que en varias latitudes del planeta forma par te de la agenda política y el debate público. Para mencionar un caso, la Organización de las Naciones Unidas (ONU) presta especial atención a los temas sobre el cambio climático, el uso de combustibles siles y la emisión de gases de efecto invernadero emitiendo recomendaciones y normas regulatorias de interés mundial, tal como se establece en el Informe de la Conferencia de las Naciones Unidas sobre el Medio Humano (1973) y en el Protocolo de Kioto de la Convención Marco de las Naciones Unidas sobre el Cambio Climático (1998). De acuerdo con Holdgate (1979), “…la contaminación es la introducción por el hombre en el medio ambiente de sustancias o energía que puedan poner en peligro la salud humana, perjudicar a los recursos vivos y sistemas ecológicos, dañar estructuras o interferir en los usos legítimos del medio ambiente…”.

Bajo esta premisa, la actividad humana debería ser regulada a través de mecanismos desarrollados de manera conjunta por científicos y políticos para evitar —o, en su defecto, disminuir— la contaminación y sus efectos en los ecosistemas a mediano y largo plazos. Si bien es cierto que a finales del siglo XX se incorporaron modelos formales para realizar este análisis, varios expertos sobre cambio climático se han negado a tomar en consideración las recomendaciones derivadas de éstos, orillando a los políticos a llevar sus propios juicios de valor para tomar decisiones acerca de esta problemática (Schneider, 2002).

Por lo general —aunque no en todos los casos—, el daño ambiental puede ser reparado a través de intervenciones en el medio físico, es decir, medidas de mejoramiento de las condiciones del suelo, de la calidad del aire, del agua, reforestación, así como el manejo de otros elementos bióticos. Para esto, es necesario contar con recursos que pueden ser proporcionados por los gobiernos, o bien, obtenidos mediante algún fideicomiso diseñado especialmente para este fin; sin embargo, cuando el daño ambiental es ocasionado de manera culposa o con dolo, y entre otras cosas ha dado lugar a un conflicto, es necesaria la aplicación de las leyes que sancionan estos hechos.1

El Programa de las Naciones Unidas para el Medio Ambiente (PNUMA), a lo largo de sus diferentes ediciones, ha dado como fruto varios documentos de política ambiental que, no obstante la intención, han sido el output ante las demandas de organismos o instituciones internacionales y no necesariamente ponen de manifiesto las prioridades reales ni el grado de compromiso de los gobiernos para la implementación de dichas políticas en beneficio del medio ambiente (prevención, conservación y recuperación). Tales normativas, surgidas en parte de las obligaciones adquiridas mediante tratados internacionales, carecen de instrumentos para exigir su implementación, ya que la ley misma ha previsto pocos medios para que se pueda asegurar su puesta en marcha (RodríguezBecerra, 2002).

El incumplimiento de las normas ambientales implica el pago de una multa y la aplicación de instrumentos regulatorios, como los de responsabilidad ambiental. Este tipo de leyes sancionan los daños ocasionados al ambiente y garantizan la reparación y compensación de éstos, verificando el principio de quien contamina paga. Hay, también, una variante con mayor alcance denominada responsabilidad ambiental estricta, la cual establece que el responsable del deterioro ambiental pague de forma íntegra por el posible daño ambiental causado en el presente y en el futuro, independientemente de la existencia de negligencia o incumplimientos regulatorios en su actuación.2

De acuerdo con Coase (1960), el costo social de un daño ambiental se restringe a una cuestión de negociación privada entre las partes en disputa cuando se han establecido los derechos de propiedad de un determinado bien natural, argumentando que lo importante es la eficiencia de la solución y no necesariamente la justicia, esto es, que las negociaciones de esta índole asumen la propiedad de los recursos naturales por parte de la persona o institución que recibe el pago por el daño que afectó al bien natural.

Es sabido que en la práctica no todos los agentes contaminadores cumplen con las normas de manejo y procesamiento de contaminantes debido, en parte, a condiciones relacionadas con las mismas autoridades, como la corrupción y las dificultades para llevar a cabo los trámites de permisos y licencias. Tal situación induce, además, conflictos en diversos ámbitos, lo que ha llevado a las agencias reguladoras —como la Secretaría de Medio Ambiente y Recursos Naturales (SEMARNAT) o la US Enviromental Protection Agency (EPA)— a incorporar medidas adicionales para la aplicación de sus políticas y la solución de conflictos. Así, dentro de las estrategias para la aplicación de la política ambiental, se incluyen mecanismos para obtener información que identifique a los operadores de contaminantes y residuos que cumplan o no la normatividad. Dichas estrategias contribuyen, en cierta medida, a establecer cantidades monetarias que sirvan de canon para los encargados de fijar las multas, junto con otro tipo de sanciones, por ejemplo, la cancelación de permisos, las sanciones penales, etc., como puede verse en la sección de leyes y normas de la EPA. Por todo lo anterior, la tarea de fijar los montos económicos que se deben cubrir cuando se han afectado el agua, el suelo, las especies animales y vegetales y su hábitat es un problema de amplia relevancia.

Planteamiento del problema

Desde la óptica de la economía ecológica se identifican los distintos tipos de conflictos ecológico distributivos según la etapa de la cadena de activos (commodity chain) donde se presentan. De acuerdo con Martínez Alier (2004) son:

1. En la etapa de extracción de materiales y energía. Están relacionados con la minería metalífera, la industria petrolera, la extracción de cantera, la degradación y erosión de las tierras, con las plantaciones, la biopiratería, la defensa de los manglares contra la industria camaronera de exportación, el agua y la sobrepesca.

2. En la etapa de transporte. Éstos se vinculan con el aumento mundial en el movimiento de materiales y energía, así como sus impactos. Se contemplan derrames petroleros, accidentes en oleoductos o gasoductos, conflictos en vías marítimas, aquéllos vinculados con la ampliación de puertos y aeropuertos y la creación de nuevas autopistas.

3. Por la generación y tratamiento de los residuos. Están vinculados con la lucha contra la contaminación, la seguridad de los consumidores y ciudadanos en relación con la incidencia y distribución de los riesgos inciertos de las tecnologías (p. ej., el uso de asbestos o introducción de organismos genéticamente modificados), la exportación de residuos tóxicos, la contaminación transfronteriza y los sumideros de carbono.

Tales conflictos se expresan a través de diversos caracteres de valoración. Estas disputas se han gestado también en torno a nociones como las deudas ecológica y de carbono, la soberanía alimentaria, la justicia ambiental y la salud. En esta dirección, los conflictos socioambientales —inducidos por el ambiente o sencillamente de mención ambiental— son algunas identificaciones para los diversos enfoques y puntos de vista que hay alrededor de este tema. Así, mientras algunos analistas nutren el pensamiento de que el crecimiento de las economías resulta en una mejora de las condiciones ambientales, otros le atribuyen el origen de los procesos conflictivos.

Por lo tanto, si se considera que ocurre un evento contaminante que deriva en un conflicto ambiental, la sanción para la reparación del daño puede requerir de un pago monetario en metálico no contemplado de forma previa. De este modo, mientras el agente contaminador quisiera minimizar el monto del pago para resarcir el daño, el contaminado3 quisiera maximizarlo, pero sin poder convenir un acuerdo. Esta situación requerirá de la participación de un árbitro, quien debe fijar la sanción monetaria a través de algún criterio objetivo. Tal idea acepta la posibilidad de participación del Estado, pero solo para llegar a un acuerdo cuando los costos de transacción fuesen muy elevados. Este proceso de negociación, estudiado por Farber (1980) para tratar el conflicto entre empleadores y sindicatos es conocido como el de Arbitraje de Oferta Final (AOF) y es, según algunos expertos, preferible al sistema de arbitraje convencional debido a los atributos de las ofertas de los negociantes que incluye. Para diferenciar entre ambos tipos de arbitraje, Robert J. Aumann4 (2009) propone una diferenciación según los incentivos generados en cada caso:

“Digamos que los empleadores y los sindicatos están en desacuerdo respecto del monto de los salarios que los trabajadores deberían percibir. (…) El sindicato podría ir a la huelga, pero quizás el arbitraje sea un mejor medio. Ustedes firman un acuerdo estableciendo que un árbitro decidirá el monto de los salarios. Cada parte presenta su caso. El empleador quiere pagar relativamente poco. El sindicato presenta su caso; quiere un monto relativamente grande. Y luego el árbitro adopta su decisión. Presumiblemente, establecerá un punto medio (he will compromise). El punto medio hace que el mundo gire.

Así, el árbitro adopta una posición entre la oferta del empleador y la demanda del sindicato. ¿Qué incentivos crea eso? Los incentivos que ese sistema crea son que el sindicato exagere
su demanda y que el empleador ofrezca menos que lo que está dispuesto a otorgar, porque sabe que el árbitro establecerá un punto medio. Ambas partes ofrecerán una posición de negociación; y ellos intentarán justificarla, por lo que no darán información precisa al árbitro. (…) En el ‘arbitraje de oferta final’ el sistema es el mismo, cada parte presenta su caso, pero cada parte es alentada a presentar su demanda mínima. Los trabajadores son alentados a decir qué es lo menos que esperan, y el empleador es alentado a decir qué es lo máximo que está dispuesto a otorgar. (…) ¿Cuál es la diferencia? El árbitro no está autorizado para establecer un punto medio (…) debe escoger una de las dos ofertas. (…) ¿Cuáles son los incentivos que esto crea? Los incentivos son exactamente opuestos a los que fueron antes. Ahora es valioso para cada parte el ser lo más razonable posible, para generar una impresión muy razonable en el árbitro. (…) La idea es que así las posiciones estarán más cerca una de la otra, e incluso pueden encontrarse. (…) Así, has incentivado a las partes a ser razonables y a proporcionar información precisa al árbitro, y el procedimiento arbitral trabaja mucho mejor…”.

Esta cita aclarativa no permite establecer cuál sería el pago óptimo, dadas las demandas de cada una de las partes involucradas, por lo que abordaremos el problema de la negociación ambiental —mencionado con anterioridad— desde un punto de vista teórico para mostrar la manera en la que se puede establecer dicho pago. Empleando el proceso de AOF y usando algunos elementos básicos de la teoría de juegos, se establece el pago de equilibrio de Nash (Nash, 1950) que debe cubrir el contaminador bajo la hipótesis de que se conocen las ofertas monetarias de ambas partes y que se ha llegado a la instancia de la negociación arbitrada. Estos pagos de equilibrio no necesariamente coinciden con las ofertas iniciales planteadas por los negociantes. Además, el resultado nos ayudará a comprender cómo interpretar la disputa entre un agente contaminador y uno contaminado a través de la incertidumbre generada cuando sus respectivas ofertas de pago son más o menos agresivas, teniendo presente si el laudo les favorecerá o no.

En este esquema de negociación, cada una de las partes involucradas presenta su oferta, pero cada una de ellas es exhortada a presentar aquella que represente la mínima cota superior para el empleado y la máxima cota inferior para el empleador, de manera que cada uno pueda sustentar sus demandas, esto es, los empleadores son alentados a indicar cuánto es lo máximo que están dispuestos a otorgar y los empleados, a manifestar cuánto es lo mínimo que esperan recibir. La parte importante es que, en este proceso, el árbitro debe elegir alguna de las ofertas sin aludir en ningún momento al punto medio entre ellas.

Por otro lado, la incertidumbre generada por parte de los agentes de la negociación se deriva por dos causas: 1) las partes no tienen competencia alguna para saber cómo se genera el laudo y 2) cada una entiende que este laudo no solo depende de la moderación de su propia oferta, sino también del concepto mismo que aplica el árbitro en su determinación, así como del nivel de moderación de la oferta de su contraparte, que tampoco puede conocerse de antemano.

Para determinar las ofertas monetarias de los participantes de la disputa, pueden emplearse los siguientes métodos:

• Del precio líquido. El valor de un recurso natural se obtiene por el precio spot del recurso, multiplicado por las unidades físicas que se quiera calcular.

• De costos de recuperación. El valor de un recurso natural es fijado por los gastos necesarios para recuperar sus capacidades productivas o por los costos de la tecnología necesaria para restituir las bondades del bien natural degradado.5

En cuanto a la importancia económica del uso del arbitraje, Robert Gibbons (1988) señala: “Entender el arbitraje es importante por diferentes razones. Primero, el arbitraje juega un importante rol en la asignación de recursos, especialmente en controversias salariales…”

Si bien para nuestros efectos la controversia salarial a la que se refiere este autor es remplazada por la negociación de un pago debido a una multa o sanción, la estructura misma del problema permite llevar a cabo este análisis con la metodología que se presenta más abajo. En este proceso se ponen en práctica varias herramientas de la teoría microeconómica y se aprecia su relación con la teoría de juegos usada en el estudio contemporáneo de los procesos de negociación. Esto permitirá analizar diferentes escenarios de negociación, dadas las expectativas de incertidumbre que puedan tener los involucrados en la disputa ante lo que ellos consideren su mejor elección estratégica de pago. En este contexto, como se mencionó previamente, el árbitro no elige ninguna de las dos propuestas de pago de los contendientes, sino que establece el monto que él considera más cercano a su determinación de laudo, desconocido por ambas partes en la negociación.

Obtención del pago óptimo

Derivado de que en el contexto del proceso de AOF las ofertas por parte de los involucrados son conocidas y teniendo en mente que ambos negociantes conocen la oferta del otro, se establece que las ofertas monetarias de equilibrio de Nash son:

RDE_23_art02_f01y

RDE_23_art02_f02

donde w1* es el pago que el contaminador está dispuesto a realizar y w2* , el que el agente contaminado está dispuesto a aceptar. Ambas ofertas de equilibrio dependen de los parámetros de la función de distribución normal asociada con la cantidad impuesta por el árbitro.6 En este caso, la media μ está dada como el promedio de las ofertas de los litigantes y la desviación estándar σ es un parámetro que puede determinarse una vez establecidas las estrategias de pago por parte de alguno de los negociantes.

Consideremos, por ejemplo, una situación en la que el agente contaminado reclama un pago de 700 mil pesos, cuando en realidad requiere 600 mil, y que el contaminador ofrece 400 mil, cuando realmente puede pagar 550 mil. En este caso, el promedio es 550 mil, cantidad que coincide con la capacidad de pago del agente contaminador. Si adoptamos el pago real requerido por el agente contaminado, la incertidumbre está dada por la cantidad de 39 894.23 pesos. Con estos parámetros, el contaminador tendría que pagar, en el equilibrio de Nash, 500 132.21 pesos, cifra que es menor que su capacidad de pago. Podemos ver que, en esta situación, el pago de equilibrio favorece al contaminador que ha de pagar casi 9.1% menos de lo que su capacidad permite. En contraste, el agente contaminado ha de asumir esta pérdida, puesto que la cantidad requerida real era de 600 mil pesos.

Esto último deja ver el rol central que desempeña la incertidumbre de los negociantes al no saber la manera en la que se realiza el laudo; sin embargo, también permite explorar diferentes escenarios anticipando posibles movimientos ya sea en contra o en favor de cada uno de los negociantes.

Implicaciones de las soluciones de Nash en el proceso de negociación

La desviación estándar σ que aparece en las soluciones de equilibrio de Nash indica qué tanto se acerca o aleja la oferta de equilibrio por parte de cada uno de los participantes del valor promedio, que no necesariamente es elegido por el árbitro; en otras palabras, este parámetro indica el rango en el que se encuentra el laudo alrededor de la media.

Si el agente contaminado P2 decide cobrar una cantidad muy elevada manteniendo fijo el parámetro μ, entonces se tiene que la desviación estándar σ también debería ser grande; esto quiere decir que, optando por una estrategia agresiva, el riesgo es grande también y, así, la elección del árbitro en favor de esta cantidad es poco plausible. Si el agente contaminador P1 elige pagar muy poco, entonces el factor de riesgo estaría acotado inferiormente por la cantidad:

que aparece en el peor escenario, es decir, cuando no se paga ninguna cantidad. Es claro que, en este caso, el árbitro no elegirá dicha opción estratégica pues la negociación involucra el pago de una cifra monetaria.

Por lo general, ante la ocurrencia de un conflicto en el que se debe cubrir una cantidad económica, es de esperarse un alza en el valor total del pago por parte del cobrador, digamos, con la intenció de cubrir lo más que se pueda del perjuicio que ha sufrido. Para el caso de un daño ambiental, esto consideraría, entre otras cosas, la capacidad de solventar los gastos de recuperación ambiental y manejo de los biomas de forma adecuada. En este sentido, la cantidad demandada por el agente contaminado es mayor que la que está dispuesto a pagar el contaminador. De esta manera, tal condición se transforma en una hipótesis para este modelo a través de la relación w1 < w2.

La magnitud de la diferencia entre las estrategias de los participantes se cuantifica usando la relación:

donde se verifica que la estrategia del agente contaminado es más grande que la del contaminador. También, puede verse que la diferencia depende del riesgo asociado con la cantidad fijada por el árbitro. Si los litigantes observan expectativas no optimistas acerca del comportamiento del árbitro, entonces es más probable que lleguen a un acuerdo ya que, en este caso, σ sería muy cercana a cero. En contraste, al considerar una incertidumbre alta por parte del árbitro, se tiene que las estrategias de equilibrio de Nash para los litigantes son bastante diferentes. Esto nos conduce a que la estrategia del agente contaminado P2 cobraría una suma de dinero elevada, mientras que el infractor P1 optaría por una estrategia agresiva y decidiría pagar menos. Por otro lado, si la incertidumbre es baja, la estrategia de P2 sería muy similar a la de P1.

Conclusión

En las ciencias económicas, la teoría de juegos ha cobrado gran auge prácticamente desde sus inicios. En este caso, la aplicación del proceso de AOF a un problema de política ambiental, en el cual se negocia la suma monetaria que debe pagarse ante una sanción por un conflicto ambiental, permite establecer, al menos teóricamente, el pago óptimo en el sentido de Nash para el agente contaminador con base en la información subyacente de la distribución de probabilidad asociada a la multa que impone el árbitro y que contempla las ofertas explícitas de los negociantes, de tal forma que sea consistente con los intereses de una instancia reguladora (persona dueña de un bien natural que fue contaminado).

En la práctica, las soluciones de equilibrio de Nash son importantes gracias a las implicaciones que éstas conllevan en una negociación. En este caso, como ya hemos mencionado, las soluciones de equilibrio obtenidas de forma previa permiten explorar de manera objetiva diversos escenarios de negociación de acuerdo con las expectativas y necesidades de los involucrados en el conflicto ambiental. Entre otras cosas, las ofertas de equilibrio de Nash servirán de apoyo a los negociantes para establecer propuestas moderadas para el pago que se debe realizar, procurando el laudo pero atendiendo a solventar el pago de la retribución que concluya el conflicto de manera favorable para ambas partes.

Apéndice

A1. Teoría de juegos. Equilibrio de Nash

Esta teoría es considerada una rama de la economía moderna que se encarga de estudiar las decisiones en las que para que un individuo (un jugador) tenga éxito en determinada situación, debe tener en consideración las decisiones tomadas por los individuos restantes (los otros jugadores). Como rama de las matemáticas, no se ha aplicado solo en la economía, sino en áreas diversas, como la biología, la gestión de negocios, la estrategia militar y la psicología.

Si bien han existido trabajos previos sobre teoría de juegos, por ejemplo, el duopolio de Cournot,7 fue John von Neumann quien realizó las primeras contribuciones a la mencionada teoría de manera formal junto con Oskar Morgenstern en Theory of Games and Economic Behavior (1944). Posteriormente, John Forbes Nash (1928-2015) llevó a cabo sus estudios sobre los procesos de negociación en 1955. Cabe mencionar que este último es —posiblemente— más conocido por el público en general gracias a la película llamada A beautiful mind del 2001, en la cual se representa parte de su vida como estudiante en Princeton y la esquizofrenia que sufrió en aquellos años, o tal vez porque recibió el Premio Nobel de Economía en 1994.8 En su tesis doctoral abordó el tema de los juegos no cooperativos y es de donde se desprende el término equilibrio de Nash.

Si ceteris paribus, teniendo conocimiento de las estrategias de los demás jugadores, ningún jugador puede mejorar su utilidad cambiando su elección estratégica, se dice que tal conjunto de estrategias es un equilibrio de Nash. Por el contrario, si alguno conoce las estrategias de los otros y puede incrementar su utilidad al modificar la suya de forma unilateral, entonces no existe un equilibrio de Nash. Obsérvese que en este juego cada participante elige su mejor estrategia y que, además, cada participante conoce las de los demás.

Un juego en su forma normal especifica el conjunto de jugadores, las estrategias de las que dispone cada jugador y los payoffs para cada posible combinación de estrategias seleccionadas. Para un juego con dos jugadores, la forma normal puede plantearse de la siguiente manera: sean X el conjunto de estrategias del primer jugador, denotado como P1, y Y el conjunto de estrategias para el segundo jugador al que denotaremos por P2. El payoff recibido asigna a cada pareja de estrategias (a,b) un número real. En este caso, cada jugador dispone de un payoff. Si los conjuntos de estrategias son finitos, estos payoffs se representan simultáneamente mediante una matriz llamada bimatriz de pagos, M: A×B→Rn x n, de tal manera que las filas son las estrategias de P1 y las columnas, las de P2; por ejemplo, veamos enseguida la matriz M:

RDE_23_art02_f05

Aquí, aij con i, j = 1 ,…, n, es el pago que recibe el primer jugador si opta por su estrategia i-ésima y el segundo jugador, por la j-ésima; bij es el pago que recibe el segundo jugador si eligen ambos esas mismas estrategias.

Uno de los ejemplos más representativos para el caso de juegos no cooperativos con información completa es el llamado Dilema de los prisioneros. En este caso, dos delincuentes son detenidos y encerrados en celdas diferentes de tal forma que no pueden comunicarse entre ellos. La policía sospecha que han participado en un delito cuya pena es de 10 años de cárcel, pero no se tienen pruebas de ello, solo cuentan con evidencias para culparles de un delito menor cuyo castigo es de dos años. La policía le asegura a cada uno de los delincuentes que reducirá su condena a la mitad si proporciona las pruebas para culpar al otro por el delito mayor.

Las alternativas para cada prisionero pueden representarse a través de dos estrategias: la de lealtad, que consiste en permanecer en silencio y no proporcionar pruebas para acusar al compañero, y la de traición, en la cual proporciona elementos para inculpar al cómplice. Las posibles combinaciones de estrategias se presentan en la matriz de pagos, que vienen dadas por los años en la cárcel que pasaría cada prisionero al elegir cada una de las estrategias mencionadas. En ella, cada pareja ordenada incluye el resultado de delatar o no al otro prisionero, puesto en términos de los años de cárcel que debe pagar cada uno de ellos:

rde_23_art02_matriz

Notemos que la menor condena para ambos se obtiene cuando los dos prisioneros eligen la estrategia de lealtad. En tal caso, ambos serán condenados a dos años de cárcel, por lo que ésta sería la mejor elección estratégica para ambos. Por otro lado, una condena por la mitad de años para el delito grave se tiene cuando deciden delatarse mutuamente. Al no conocer la decisión del otro preso, la estrategia más segura es la de la traición, lo que conduce a una estrategia subóptima de cinco años de cárcel para cada uno de los prisioneros. Éste es un equilibrio de Nash estable, pero ineficiente, ya que en el juego existen otras estrategias que mejoran el beneficio de los prisioneros mientras su contraparte mantenga su posición.

Las aplicaciones de este ejemplo son relevantes en las empresas y la economía, además de que permiten diferenciar de manera clara los juegos cooperativos y los no cooperativos.

En este contexto, el concepto de solución para un juego dependerá de si existe o no cooperación; sin embargo, ésta ha de ser una combinación de estrategias tal que represente el comportamiento racional de los jugadores. Para el caso de un juego no cooperativo con información completa, el concepto de solución se denomina equilibrio de Nash. Este viene dado por aquella combinación de estrategias para la cual ningún jugador tiene interés en cambiar su elección estratégica de forma unilateral.

Otro ejemplo en el ámbito que aquí nos concierne es el juego La tragedia de los bienes comunes, de G. Hardin (1968); en éste hay n jugadores que usan un bien común, digamos un bosque, donde todos los participantes tienen la libre elección de cuidarlo o no y, aunque algunos decidan no hacerlo, siempre podrán hacer uso de él. Éste es un juego no cooperativo en el que los jugadores deberán decidir entre seguir una estrategia egoísta o, en cambio, una altruista en la cual procuren el cuidado del bosque. Existen n equilibrios de Nash que se alcanzan si el total de los agentes económicos eligen la estrategia egoísta, dado que el ser solidarios aminora su utilidad.

Tal como ocurre con algunos bienes corrientes, existe un problema de conservación de bienes asociados con el medio ambiente que, partiendo de una situación en la que no se ha de contaminar, las personas casi siempre tenderemos a ser egoístas y a valorar más nuestra comodidad; por ejemplo, utilizando el automóvil antes que proteger la atmósfera de gases contaminantes abordando algún medio de transporte colectivo. En consecuencia, para modificar dicho equilibrio de Nash, los gobiernos y los encargados de la administración pública introducen retribuciones adicionales en el juego (por ejemplo, las multas), que pueden modificar el comportamiento de los individuos para tratar de forzar un equilibrio social en el que todos son solidarios.

Así, en el caso de la negociación que nos atañe, consideraremos un juego no cooperativo en el que participan el agente contaminado y el contaminador. Tal como comentamos previamente, la idea básica detrás de este enfoque es que cada uno de los negociantes obtiene la mejor recompensa asumiendo que su contraparte ha podido elegir, también, su mejor estrategia para pagar y que la mantiene a lo largo de la negociación.

A2. Definición formal de equilibrio de Nash

Denotaremos como Si al conjunto de estrategias de las que dispone el jugador i-ésimo. De esta forma, el vector (s1 ,…,sn) ∈ Rn, es una combinación de estrategias para el conjunto de jugadores. Si ui es el payoff para el i-ésimo jugador, entonces ui (s1 ,…,sn ) es la ganancia de éste dada la combinación de estrategias (s1 ,…,sn) . Por otra parte, como ocurre en los procesos de negociación, cada participante buscará obtener el máximo beneficio de acuerdo con su elección estratégica; esto es a lo que llamaremos juego no cooperativo, el cual, en términos prácticos, es aquél donde cada uno de los jugadores lleva a cabo decisiones de manera independiente para su propio beneficio. Denotaremos este juego como:

En un juego normal con n participantes G={S1 ,…,Sn ; u1,…,un } , el vector de estrategiases un equilibrio de Nash para el i-ésimo jugador si:

para toda si Si.

De esta manera, si el perfil de pago del i-ésimo participante del juego es una función de la forma ui:Rn→R , entonces podemos reescribir la definición de equilibrio de Nash como el problema de maximización:

para cada i = 1,…,n. Se puede demostrar que bajo estas condiciones ningún otro participante tiene incentivos para modificar su elección estratégica.

A3. Obtención de los pagos óptimos

Consideremos el modelo de Arbitraje de Oferta Final (Farber, 1980; Gibbons, 1992) para el caso de dos litigantes, los agentes contaminador y contaminado, denotados por P1 y P2, respectivamente. Supongamos que la propuesta de pago del contaminador es w1 y que la cantidad monetaria que el agente contaminado está dispuesto a aceptar es w2. El árbitro debe elegir así, a través de cierto mecanismo, la cantidad que considere adecuada para que sea cubierta por P1 y que sea acorde con los requerimientos de P2 tal como comentan Kalaiy Rosenthal (1976): “El árbitro busca asignar un resultado justo (en algún sentido) al juego (…) En nuestra perspectiva, el problema del árbitro es el de diseñar un nuevo juego no cooperativo para los jugadores y una función de los resultados en este juego no cooperativo para los resultados del juego original.”

En esta dirección, los litigantes darán a conocer solo información tal que les favorezca el laudo asumiendo una postura, digamos egoísta. Así, el criterio para la decisión arbitral está dado por a: R3→R, una función de decisión de la forma:
RDE_23_art02_f09

donde x es el valor que el árbitro quiere imponer. Dicho valor, conocido por el árbitro, representa su laudo y es desconocido por las par tes que están en la negociación. Con el planteamiento de la función de decisión, los involucrados entenderán que el laudo está asumiendo un criterio objetivo en el que sus demandas han sido estudiadas para su construcción. Observemos que, dada la decisión del árbitro y las ofertas de cada uno de los participantes, el valor promedio de éstas nos permite obtener la igualdad w1 + w2 = 2x . Éste es un criterio habitual para el caso del arbitraje convencional.

Para nuestro caso, el árbitro no asigna los pesos relativos para las ofertas de los negociantes de acuerdo con un estándar, sino a través de una función de distribución de probabilidad. Puesto que la función de distribución permite obtener la probabilidad de que la variable aleatoria X alcance cierto valor x, si X y Y son variables aleatorias con distribución normal, entonces se satisface la condición:

RDE_23_art02_f10

(1)

Por lo tanto, para la estrategia del contaminador el peso está dado como:

RDE_23_art02_f11

y usando la ecuación (1) obtenemos que:
RDE_23_art02_f12

es el peso asignado a la estrategia del agente contaminado.

La variable aleatoria X puede tomar valores en el conjunto de los números reales mayores que cero, y puesto que representa el pago que se espera imponga el árbitro, se define la función de pago como:

RDE_23_art02_f13

(2)

Dada la postura estratégica de ambas par tes, tenemos que el agente contaminador P1 está interesado en minimizar la función de pago, mientras que el contaminado P2 quiere maximizar la, dando lugar a los problemas de optimización siguientes:

RDE_23_art02_f14
(3)

y

RDE_23_art02_f15
(4)

donde w1* y w2* representan las estrategias óptimas para cada una de las par tes litigantes. El símbolo asterisco (*) indica que el participante de la negociación ha elegido su mejor estrategia para el acuerdo. Por otro lado, dado que la función para el problema de minimización es convexa, podemos escribir ambos problemas como:

RDE_23_art02_f16

para el que

RDE_23_art02_f17

y

RDE_23_art02_f18

Obsérvese la simetría de las funciones de pago. Esto es consecuencia de que el pago del contaminador es lo que recibe el agente contaminado como retribución. Calculando el gradiente de la función de pago tenemos que:

RDE_23_art02_f19

donde φ es la función de densidad normal y Φ, la correspondiente función de distribución. Empleando las condiciones de primer orden para el sistema homogéneo ∆S (w1 , w2 ) = 0, junto con el hecho de que w2*-w1*= σ √2π , se llega a que las ofertas monetarias de equilibrio de Nash son:


RDE_23_art02_f01

y
RDE_23_art02_f02

Notemos que las estrategias estrictamente dominadas quedan excluidas, pues ambos participantes han llevado a cabo su mejor elección estratégica. Esto implica que, en efecto, existe un equilibrio de Nash.

________

1 En el caso de México, se trata de la Ley Federal de Responsabilidad Ambiental.

2 Comisión Europea. Directiva sobre responsabilidad medioambiental.

3 Para efectos de este trabajo entenderemos como agente contaminado a una organización o dependencia encargada de salvaguardar la integridad de los bienes naturales de una región o al propietario de un determinado bien natural. Dichas instituciones también pueden llamarse agentes reguladores.

4 Premio Nobel de Economía 2005.

5 Existe otro método denominado de costos preventivos, el cual se estima a través de lo que se pagaría para proteger determinado bien natural contra posibles degradaciones; sin embargo, no es tema de discusión en este caso, ya que se supone que el suceso contaminante ha ocurrido.

6 Ver apéndice.

7 Varian, 2006, p. 490.

8 Junto con Reinhard Selten y John Harsanyi.

 

______

Fuentes

Acuatella J. Aplicación de instrumentos económicos en la gestión ambiental en América Latina y El Caribe. Desafíos y factores condicionantes. CEPAL, 2001.

Aumann, Robert J. Game Engineering. Center for the Study of Rationality, The Hebrew University of Jerusalem. Discussion Paper No. 518, Israel, 2009, p. 10. Consultado en http://www.ratio.huji.ac.il/dp.php

Coase R. H. “The problem of social cost”, en: Journal of Law and Economics. Vol. 3, 1960, pp. 1-44.

Farber, H. S. “An Analysis of Final-Offer Arbitration”, en: Journal of Conflict Resolution. 24(4), 1980, pp. 683-705.

Freund J. E. Mathematical Statistics with Applications. 8th Ed. Pearson, 1992.

Gago, A., X. Lavandeira & F. Picos. La imposición ambiental autonómica. 2004. Consultado en http://labandeira.eu/publicacions/wp142013.pdf el 11/03/2016.

Gibbons, R. Game Theory for Applied Economists. Princeton NY, Princeton University Press, 1992.

_______ “Learning in Equilibrium Models of Arbitration”, en: The American Economic Review. Vol. 78, No. 5. USA, 1988, pp. 896-912.

Hardin G. “The Tragedy of the commons”, en: Science. Vol. 162, Issue 3859, 1968, pp. 1243-1248.

Holgate M. W. A perspective of enviromental pollution. Cambridge University Press, 1979.

Kalai E. y R. W. Rosenthal. Arbitration of Two-Party Disputes under Ignorance. 1976. Consultado en http://www.kellogg.northwestern.edu/research/math/papers/215.pdf el 12/07/2016.

Kreps D. Game Theory and Economic Modelling. Oxford University Press, 1990. Nash, J. “Equilibrium points in n-person games”, en: Proceedings of the National Academy of Sciences of the United States of America. 36, 1950, 48-49.

Martínez Alier, J. “Los conflictos ecológico-distributivos y los indicadores de sustentabilidad”, en: Revista Iberoamericana de Economía Ecológica. Vol. 1, 2004, 21-30.

ONU. Declaración de Río de Janeiro sobre el medio ambiente y el desarrollo. 1992. Consultado en http://www.un.org/spanish/esa/sustdev/documents/declaracionrio.htm el 22/01/2016.

_______ Informe de la Conferencia de las Naciones Unidas sobre el Medio Humano. Estocolmo, 5 al 16 de junio de 1972. Nueva York, 1973. Consultado en http://www.dipublico.org/conferencias/mediohumano/A-CONF.48-14REV.1.pdf el 20/04/2017.

_______ Protocolo de Kyoto de la Convención Marco de las Naciones Unidas sobre el Cambio Climático. 1992. Consultado en https://unfccc.int/resource/docs/convkp/kpspan.pdf el 20/04/2017.

Pigou, A. The Economics of Welfare. 4.a ed. Mc Millan and Co., 1920. Rodríguez-Becerra M. y G. Espinoza. Gestión ambiental en América Latina y el Caribe. Evolución, tendencias y principales prácticas. Banco Interamericano de Desarrollo, Departamento de Desarrollo Sostenible, División de Medio Ambiente, 2002.

Schneider, S. H. “Misleading Math about the Earth: Science defends itself against The Skeptical Environmentalist”, en: Sci. Am. 2002. Varian, Hal R. Intermediate microeconomics: a modern approach. 7th ed. W. W. Norton & Company, 2006, p. 490. Von Neumann, J. y O. Morgenstern. Theory of Games and Economic Behavior. Princeton University Press, 1944.


Fuentes electrónicas

https://es.wikipedia.org/wiki/John_Forbes_Nash, consultado el 30/03/2016.
https://www.epa.gov/laws-regulations, consultado el 17/07/2016.
http://www.unep.org/disastersandconflicts/, consultado el 17/07/2016.
http://ec.europa.eu/environment/legal/liability/pdf/Summary%20ELD.pdf,
consultado el 24/03/2017.

Alejandro Sánchez Peralta

Autor

De nacionalidad mexicana, es egresado de la Maestría en Ciencias Matemáticas Aplicadas e Industriales de la Universidad Autónoma Metropolitana (UAM)Iztapalapa. Ha sido profesor en la Academia de Matemáticas de la Escuela de Ciencias Económicas y Empresariales de la Universidad Panamericana, campus México, y en el Departamento de Matemáticas de la UAM-Iztapalapa. Sus temas de interés son las finanzas matemáticas, la valuación de derivados financieros y la economía matemática. En la actualidad, ocupa el puesto de Jefe del Departamento de Análisis y Evaluación de Modelos de Información en la Dirección General Adjunta de Modelos de Información Gubernamental y Encuestas Nacionales de Gobierno, Victimización, Seguridad y Justicia en el Instituto Nacional de Estadística y Geografía (INEGI). Es autor del trabajo “El primer teorema fundamental para la valuación de derivados financieros para tiempo discreto y horizonte finito”, publicado en Mix’ baal, Revista Metropolitana de Matemáticas (vol. II, núm. 1, junio del 2011).


Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *