1. INTRODUCCIÓN
En las últimas décadas la teoría del Derecho de habla española ha mostrado un interés creciente en lo que podemos llamar los hechos en el discurso y en la práctica del Derecho.
Los estudios actuales en la materia pueden dividirse en tres grandes vertientes: una epistemológica, enfocada a esclarecer qué calidad tiene el conocimiento generado en la práctica judicial; otra metodológica, orientada a refinar los procedimientos para recoger y producir pruebas que sirvan para una decisión judicial, lo cual ha sido especialmente intenso en materia penal hasta dar lugar a una disciplina específica denominada “ciencia forense” (forensic science); y una tercera que podríamos llamar argumentativa o lógica, que atiende a las inferencias que conducen desde las pruebas en sí, hasta la proposición de que un cierto hecho se tenga por cierto en el discurso jurídico. Sin perjuicio, en algunos casos se tratan en forma holística problemas metodológicos junto con inferencias fácticas de primer grado. Muchos de dichos estudios han derivado hacia el análisis del problema de la “probabilidad”, tomando como punto de partida las teorías generales en la materia, de larga data en la epistemología y la lógica en general.
El presente trabajo en particular se centrará en un problema de la vertiente lógica: la proposición de una guía de acción originada en un desarrollo libre de algunas herramientas inferenciales creadas en relación con enunciados sobre hechos probables, para auxiliar a quienes toman decisiones en la práctica judicial y administrativa.
El análisis se orientará exclusivamente a las decisiones jurídicas individuales: actos administrativos individuales y muy especialmente sentencias judiciales. Ello obedece a que es en el campo judicial y de los procedimientos administrativos donde las decisiones sobre hechos son mayores en cantidad, y requieren un esfuerzo más minucioso en la justificación, dada la individualidad de dichos hechos y su conexión directa con la decisión. Ello no descarta en absoluto que la fundamentación fáctica de la legislación y los actos administrativos generales (reglamentos) no se apoye en hechos sobre los que existe algún grado de incertidumbre, para los que la noción de “probabilidad” y los “saberes probabilísticos” serían –y en muchos casos efectivamente son- de utilidad.
En primer lugar, se describirá brevemente en qué consiste la “probabilidad” y qué tipo de problemas se abordan bajo la denominación de “probabilística”, diferenciando las cuestiones epistémicas de las lógicas. En segundo lugar, se tratará de responder la pregunta de si es interesante explorar la aplicación de la probabilística en las decisiones judiciales, lo cual se hará desde el punto de vista de las funciones y compromisos del sistema jurídico, especialmente del aparato judicial. En tercer lugar, se expondrán dos modelos de argumentación probabilística: el llamado “teorema de Bayes” y el que toma como base los “axiomas de Kolmógorov”, explicando las razones que me llevan a preferir el segundo para la proposición de una estrategia aplicada a las decisiones judiciales. En cuarto lugar, se expondrá una propuesta de decisión sobre hechos basado en una aplicación extensiva y libre de los axiomas de Kolmógorov. Finalmente, se expondrá un resumen de conclusiones acerca de la propuesta.
2. ALGUNAS CUESTIONES INTROUCTORIAS A LA PROBABILIDAD Y LA PROBABILÍSTICA
“Probabilística” es la denominación de una familia de teorías, técnicas y estrategias de conocimiento y razonamiento en condiciones o contextos de incertidumbre. Su objeto común es la probabilidad, que podríamos definir como una situación epistémica de un sujeto y una propiedad de ciertos enunciados. Una primera aproximación a esa situación epistémica puede partir del lenguaje común, donde el adjetivo “probable”, o el adverbio “probablemente”, se diferencian de “seguro” y “seguramente”, por un lado, y de “imposible” por otro. El sujeto que utiliza las palabras “probable” y “probablemente”, por algún motivo no puede afirmar en forma asertiva que uno o más hechos son seguros ni imposibles, ni tampoco que la conclusión de un argumento no se desprende forzosamente de las premisas. Aunque se haya calificado de simplista esta definición de “probabilidad” o de “lo probable”, creo que capta la esencia de lo que se denomina con esos términos.
Ahora bien, sin mucho esfuerzo podemos advertir que la “probabilidad” como incertidumbre abarca cuestiones muy diversas. Por ejemplo, la incertidumbre puede referir a la ocurrencia de un hecho futuro, o a la ocurrencia o no de un hecho pasado, considerados en forma aislada. Pero también es incierto, y por lo tanto una “cuestión de probabilidad”, determinar si dado un hecho pasado sobre el que no tenemos dudas, se producirá en el futuro otro hecho igual o similar, y en caso de así ser, la frecuencia de la reiteración. Y así podríamos continuar.
Se han propuesto múltiples “interpretaciones” de la probabilidad. En mi opinión, y a diferencia de Keynes, que concebía a la probabilidad como un tema estrictamente lógico, entiendo –con Galavotti- que deben separarse las interpretaciones de la probabilidad como situación epistémica, que implica la forma de conocer los eventos probables, y por otro lado las inferencias que incluyen enunciados probables, que es una cuestión propia del lenguaje y podemos calificar como “lógica”.
Comenzando con la probabilidad como situación epistémica, existen dos formas de entender la incertidumbre que ese término denota: bien como una consecuencia del apoyo estadístico de un enunciado, bien como un grado de creencia en un enunciado independiente de la evidencia estadística que lo apoya. Esta última interpretación es la que llamaremos “subjetiva”, ya que bajo ella el grado de creencia que inspira un enunciado puede depender de diversas razones, más o menos confiables epistemológicamente, pero que siempre tienen en común expresar esa posición intermedia entre lo que se cree indudablemente falso y lo que se cree indudablemente verdadero. Más adelante volveremos sobre este punto, pero observemos desde ya que la interpretación subjetiva de la probabilidad en sentido epistémico puede también abarcar formas muy distintas de fundamentar un enunciado sobre un evento probable, lo cual no es indiferente cuando se trabaja en contextos de incertidumbre.
Por otro lado, y cualquiera sea la interpretación de la probabilidad como situación epistémica, las inferencias realizadas a partir de premisas inciertas requieren de formas especiales de argumento, lo que conduce a una lógica (o quizás una familia de lógicas) de lo probable. En ese sentido, no puede decirse que los sistemas de lógica probabilística sean “puramente formales” (), ya que desde el punto de vista de la filosofía de la lógica y de la matemática un sistema formal sólo es interesante –entre otras cosas- en la medida en que tenga “interpretaciones”: cuando puede tener una aplicación en un lenguaje que nos comunique cosas acerca del mundo. En este caso, las interpretaciones de la lógica probabilística son todos los lenguajes que pretenden dar cuenta de situaciones de incertidumbre, lo que –al pasar- muestra que la vertiente metodológica y la vertiente lógica de la probabilística están siempre conectadas. Lo que sí es cierto es que los modelos lógicos sólo nos aseguran la consistencia entre premisas y conclusión, pero no pueden, en tanto son abstractos, determinar el grado de certeza que otorgamos a las premisas. Esto es sin perjuicio de que los modelos de inferencia probabilístico estén asociados, aunque no necesariamente a la estadística, sí a metodologías racionales para graduar la probabilidad de las premisas, punto sobre el que volveremos más abajo al considerar el caso particular de las decisiones judiciales sobre hechos.
Cabe agregar que es posible formular sistemas lógicos que puedan dar cuenta de todas las variantes epistémicas de probabilidad, lo cual –como veremos- es un aspecto favorable para su aplicación a la materia judicial.
Un elemento importante de la faz lógica de la probabilística es la expresión numérica del grado de probabilidad. Como se desarrollará más adelante (especialmente en el apartado 4), la probabilidad de un evento se expresa normalmente con un número real entre 0 y 1. Esta forma de expresión aparece con Laplace, y si bien fue propuesta inicialmente como una relación entre “eventos favorables” dentro del conjunto total de “eventos posibles” de un cierto tipo, podemos simplificar diciendo que ese número expresa la relación entre circunstancias favorables respecto del total de circunstancias que hacen a la ocurrencia de un cierto hecho.
Dejando para más adelante los “axiomas de Kolmógorov”, que serán objeto de una propuesta específica en este trabajo, el modelo más conocido de inferencia probabilística es el teorema de Bayes, llamado así en honor al matemático inglés que lo propuso por primera vez. En síntesis, se trata de una fórmula que trata de representar una probabilidad condicional: dados dos hechos “a” y “b”, que suponemos enlazados por alguna relación material, este teorema nos permite estimar las probabilidades de uno en función de las probabilidades del otro. La fórmula es:
Siendo “P” un grado de probabilidad, “Pb” expresa la probabilidad que, de antemano, le hemos asignado al evento “b”. Luego tenemos un evento, que llamamos “a”, que suponemos es una evidencia de “b”, y al cual asignamos también un valor probable. La fórmula nos explica, sencillamente, que la probabilidad de que se verifique la relación condicional del evento “b” en función del evento “a”, aumenta en la medida en que aumenta la probabilidad del evento “a”. Esto permite representar el caso en que aumenten las evidencias que apoyan “a”: si ello sucede, aumentará también la probabilidad de “b”. Como ocurre con toda estructura lógica, el modelo en sí carece de contenido epistémico, ya que la asignación de los valores de la variable “P” a los hechos “a” y “b” queda librada al criterio de probabilidad epistémica que adopte quien lo utiliza. Sin perjuicio, su estructura no es azarosa, sino que, como se expresó más arriba, está específicamente concebida para razonar cuando la verdad de las premisas en incierta.
3. PROBABILIDAD Y DECISIÓN JUDICIAL: ¿POR QUÉ INTRODUCIR EN LA PRÁCTICA JUDICIAL MÉTODOS Y ESTRUCTURAS LÓGICAS PROBABILÍSTICAS?
La definición de “probabilidad” como un estado de incertidumbre coincide con la situación epistémica habitual en la actividad judicial, o al menos de la actividad judicial por excelencia, que es –por llamarlo de un modo- la de un litigio efectivo. En efecto, y dejando de lado ciertos casos en los que hay una “eliminación normativa” de la incertidumbre (por ejemplo, cuando una ley manda tener por cierto un hecho por no controvertirlo la otra parte), o cuando un tribunal cumple una actividad de control superficial (por ejemplo, practicar una simple intimación), la situación epistémica normal de un juez es que no puede afirmar ni negar categóricamente, al inicio del proceso, cómo ocurrieron los hechos a cuyo respecto tiene que decidir. Esto significa que es posible que las herramientas probabilísticas, tanto metodológicas como lógicas, puedan utilizarse, en algún grado, en la práctica judicial. No obstante, tenemos que dilucidar si, a pesar de ser posible, dicho uso es interesante, y en caso de serlo en qué grado.
Asumamos que tanto los métodos estadísticos como los razonamientos formalizados mediante alguna estructura lógica probabilística tienden a generar conocimientos o argumentos de mejor calidad que las actividades probatorias y los razonamientos informales. Se deriva de ello que la introducción de esos métodos y estructuras lógicas en la práctica judicial, en primer lugar, implica un compromiso con la misma. Y, en segundo lugar, el uso de esos métodos y estructuras está condicionado por características intrínsecas de la práctica judicial. Examinemos por su orden estas cuestiones.
En cuanto a la aceptación de, y el compromiso con, el sistema jurídico y la práctica judicial, se trata de una cuestión en la que confluyen aspectos descriptivos y normativos. Las sociedades capitalistas contemporáneas, al tener que permitir la incorporación masiva de las personas a la fuerza de trabajo, tuvieron que abolir barreras de diversa índole para la movilidad social y hasta física de las personas, colocando en el centro de las creencias sociales la idea del sujeto autónomo. Más allá de que esta noción tenga connotaciones ideológicas, dada la existencia de otras múltiples restricciones generadas como necesidad de la propia estructura social capitalista, el concepto de “sujeto autónomo” transmite la idea de que no hay ontologías que otorguen a ciertas personas una autoridad indiscutible a priori. En su lugar, la autoridad debe esgrimir razones para ejercer el poder y decidir, lo cual constituye su marco de legitimidad, razones que, en el caso de las decisiones judiciales, equivalen a la inclusión explícita de argumentos como fundamento de las mismas.
Lo dicho hasta aquí tiene carácter descriptivo, ya que se ha dado cuenta de ciertos rasgos que en los hechos tiene la práctica judicial, pero toda propuesta de mejora en esta práctica tiene carácter normativo, por lo cual tiene que contar con alguna fundamentación adicional. Si bien no es posible extenderse sobre este punto sin desviarnos excesivamente del objeto del artículo, los fundamentos para comprometerse con el sistema jurídico y la práctica judicial son en definitiva un corolario de la visión que se tenga de la vida social y, sobre todo, de cuán crítica sea esa visión. Si se sostiene una visión radicalmente crítica del orden social, evidentemente no tiene sentido ninguna propuesta de mejora del sistema judicial dado que éste es una pieza de la institucionalidad funcional a la estructura social vigente. Ahora bien, en la medida en que se acepte, siquiera en forma transitoria, la estructura social y el “juego” que ella propone, es necesario también aceptar en la misma medida una participación en las instituciones vigentes, entre ellas la judicial. Por lo tanto, adoptando ese punto de vista tiene sentido hacer propuestas tendientes a hacer más racional la práctica judicial. Consideremos pues por qué los métodos y las estructuras lógicas probabilísticas deben considerarse herramientas racionales dignas de atención por la práctica judicial.
En nuestra civilización, cualquier argumentación racional tiene como referencia, tanto en métodos como en razonamientos, a la práctica científica, que pasa por ser el “conocimiento objetivo” por excelencia. Ello significa que la ciencia es el campo que produce lo que se considera un “buen conocimiento” y una “buena argumentación”, lo cual –además- va de la mano de la aceptación del supuesto epistemológico más profundo de dicha práctica: la “verdad como correspondencia” . Es del todo cierto que esa identidad entre “ciencia” y “racionalidad” tiene también connotaciones ideológicas, pero también es cierto que el prestigio de la ciencia se funda en su mayor aptitud para resolver problemas.
El sistema jurídico, y en particular la actividad judicial, no fueron ajenas a este proceso social de elevación del “conocimiento objetivo” y la argumentación racional, en desmedro del ejercicio desnudo de la autoridad y el conocimiento intuitivo y el razonamiento informal. A ello obedecen las exigencias, provenientes tanto de los discursos políticos como de los propios lenguajes técnicos internos del Derecho, traducidos a la postre en textos legislativos, de racionalizar las pruebas y de fundamentar aceptablemente las sentencias. Estas exigencias tienen también rasgos ideológicos, como –por ejemplo- cuando las leyes procesales y la dogmática proclaman que el objetivo del proceso es “alcanzar la verdad” material, o cosas semejantes. Pero en todo caso, el contexto social impone a la práctica judicial, como sostén de legitimidad, algún grado de compromiso epistémico efectivo, mucho menos intenso que el de la ciencia, pero que debe tener algún grado de efectividad.
Cuán intenso es dicho compromiso, como condición social de legitimidad de la práctica judicial, es una cuestión de hecho, y su análisis en profundidad excedería largamente el objeto de este artículo, pero podemos señalar algunas posturas en tal sentido. Por ejemplo, Laudan ha sostenido una versión atenuada del compromiso epistémico, al afirmar que –al menos en el proceso penal- la práctica judicial debe asumir criterios de “distribución del error”, ya que una multiplicación excesiva de los enunciados falsos en las sentencias judiciales compromete la legitimidad del sistema jurídico. Por su parte, se ha sostenido que, si bien la intensidad de las exigencias de fundamentación es distinta según la cultura jurídica de cada país, en las culturas jurídicas de matriz occidental está generalizado el requisito de que los enunciados fácticos de las decisiones tengan una “garantía” de apoyo en evidencias. En lo que no parece existir dudas, pues, es en que, más allá de las diferencias insalvables con la ciencia (que observaremos de inmediato), la práctica judicial gana en legitimidad en la medida en que crece su proximidad a lo que llamamos “conocimiento objetivo”, aun cuando –vale la pena reiterarlo- esta última noción tenga rasgos ideológicos. De allí pues hay solo un paso para aceptar que puede resultar útil que la práctica judicial incorpore, en cuanto le sea posible, métodos de observación y estructuras lógicas que usa la ciencia.
4. PRÁCTICA JUDICIAL Y MÉTODOS ESTADÍSTICOS
Pero incluso para el partidario más entusiasta de trasladar a la práctica judicial las metodologías aceptadas en la ciencia, serán evidentes las limitaciones institucionales de los procesos judiciales (limitación temporal de la prueba, efecto de la cosa juzgada, etc.) que vuelven imposible que en la actividad judicial se produzca en toda su extensión el “efecto autocorrectivo” de la ciencia, es decir, la posibilidad ilimitada de revisar un enunciado si hay buenas razones para ello, el cual es un componente esencial de las metodologías estadísticas usuales, que están pensadas para su uso en la ciencia. Sumemos a ello que, en cualquier caso, es prácticamente impensable, que en el transcurso de un proceso judicial se realice un análisis estadístico para el caso. El punto es, entonces, si los resultados de estudios estadísticos elaborados fuera de un proceso pueden ser premisas para decidir judicialmente sobre la ocurrencia de un hecho.
El principal obstáculo para la introducción de premisas estadísticas en las decisiones judiciales es que las mismas son válidas para poblaciones, no necesariamente para un caso particular. En ello radica precisamente su rasgo probabilístico: dado un cierto grupo de eventos o sujetos, estadísticamente podemos saber en general qué tan frecuente es tal o cual propiedad o consecuencia de los mismos, pero sin que con ello se arroje luz sobre las propiedades o consecuencias de un hecho o sujeto en particular. Ello explica la reticencia judicial al uso de estas premisas, dado el carácter generalmente individual que tiene el juzgamiento. Sumemos a ello que los modos de formación de creencias acerca de hechos en una cierta práctica es un fenómeno esencialmente social, por lo que cada práctica tendrá requisitos distintos en virtud de las funciones sociales que cada una cumpla. Es decir, la práctica judicial tendrá modos de acercamiento al conocimiento fáctico diferentes, por ejemplo, a los de la ciencia, en virtud de las diferencias funcionales entre una y otra.
Ahora bien, cualquiera sea la postura que se tenga acerca del uso de metodologías estadísticas, debemos plantearnos de un modo más general si cualquier tipo de fundamentación de premisas fácticas es aceptable en la labor judicial. Es evidente que esta última tiene una serie de limitaciones institucionales (limitación temporal del proceso, restricciones a la proposición de pruebas, efecto de la “cosa juzgada”, etc.) que la separan irremediablemente, en cuanto a los métodos de indagación sobre hechos, de la práctica científica. Lo que debemos establecer, pues, es si la labor judicial tiene exigencias cognoscitivas que hagan necesario, al menos en alguna medida, el uso de metodologías racionales para indagar en las cuestiones de hecho.
5. RAZONAMIENTO JUDICIAL SOBRE HECHOS Y MODELOS DE INFERENCIA PROBABILÍSTICA
En virtud de la justificación general que se expresó en el capítulo 3 para la incorporación de métodos y herramientas lógicas originadas en la ciencia, veamos ahora en qué medida pueden ser útiles estas últimas en la práctica judicial. Para ello es preciso estipular algunas nociones generales para enmarcar la discusión.
En primer lugar, la lógica y su derivación, que es la matemática, se ocupan de inferencias o argumentos, por lo que es oportuno definir qué llamamos con esos nombres. Propongo utilizar dos definiciones que, si bien difieren externamente y en contenido, no son contradictorias sino complementarias: la de Alchourrón y Martino, y la de Peirce. Según los primeros, una inferencia es una operación que nos permite, dado un conjunto de enunciados que llamamos “premisas”, pasar a otro conjunto de enunciados que llamamos “consecuencia” (o “consecuencia lógica”), a través de una serie de operaciones. Para Peirce, por su parte, un argumento es un conjunto de enunciados (premisas) y “principios lógicos”, a partir de los cuales podemos formular otro u otros enunciados que llamamos “conclusiones”. Se desprende de lo dicho que siempre que partimos de uno o más enunciados para llegar a otros, estaremos desarrollando una inferencia o un argumento, sea que las premisas se tomen por ciertas o simplemente como probables. Más aún: quien propone una premisa falsa a sabiendas, o que cree que es cierta o probable y termina siendo falsa, y deriva de ello conclusiones o consecuencias, también está realizando una inferencia. Ello indica, como lo advirtieron Alchourrón y Martino, que una estructura de inferencia o argumento es en buena medida independiente de que sus premisas sean verdaderas, probables o directamente no susceptibles de verdad ni falsedad (como ocurre en el lenguaje normativo), y que su valor depende de que nos permiten proponer enunciados nuevos (las conclusiones o consecuencias) consistentes o no contradictorios con otros (las premisas).
Ello nos allana el camino, porque permite una comprobación quizás trivial, pero crucial para nuestro propósito: está fuera de discusión que los jueces, al decidir sobre hechos a efectos de una sentencia, realizan inferencias o argumentos, ya que parten de algunas premisas relativas a las pruebas producidas o no producidas, también introducen una o más premisas respecto del valor probatorio general de esas pruebas existentes o ausentes, y concluyen acerca de la ocurrencia de uno o más hechos. Podemos dar un paso más: si asumimos que las inferencias sobre hechos cuyas premisas son inciertas, corresponden a un grupo especial de argumentos diferente –por ejemplo- de las deducciones, podemos afirmar que las inferencias de los jueces en materia de hechos pertenecen a ese grupo especial. La duda es, entonces, si aceptaremos o no la introducción de modelos o sistemas desarrollados por la lógica probabilística para encauzar esas decisiones.
Corresponde realizar una precisión más antes de entrar de lleno al tema. Asumiré para el análisis que sigue en el juez no está constreñido jurídicamente a adoptar ningún modelo de inferencia o sistema de inferencias proveniente de la lógica, por lo que las propuestas que se realicen en tal sentido son normativas, pero no en sentido jurídico, en cuanto prescriben como bueno o recomendable realizar inferencias o argumentos de esa forma, pero su motivación radica en la utilidad que puedan tener dichos modelos o sistemas para mejorar la práctica judicial. El propósito de formalizar las inferencias judiciales sobre hechos mediante alguna herramienta lógica puede justificarse por el mismo motivo que Alchourrón y Bulygin propusieron para estudiar los Derechos como “sistemas normativos”: dado un determinado material conceptual que se nos presenta de manera vaga o no ordenada, lo reconducimos, para su mejor comprensión y manejo, a un esquema más ordenado y menos vago que sea fecundo, es decir, que mejore los resultados obtenidos en el manejo de los problemas que abordamos mediante dichos conceptos.
Pasemos ahora a las objeciones al uso de herramientas de lógica probabilística en el razonamiento judicial sobre hechos. Varios autores rechazan el uso judicial de dichas herramientas, especialmente el teorema de Bayes, pero ese rechazo se basa, a mi juicio, en algunos malentendidos o en observaciones llevadas innecesariamente a un punto extremo. En primer lugar, consideremos los malentendidos, que conciernen al valor de las estructuras lógicas.
No puede esgrimirse contra el uso de modelos lógicos probabilísticos el hecho de que ellos no nos auxilien para aceptar las premisas, dado que el grado de probabilidad de un enunciado sobre un hecho queda fuera del modelo en sí. Como se indicó más arriba, las estructuras lógicas nunca tienen en sí un valor epistémico, sino que sólo nos aseguran la consistencia, lo cual no es poca cosa si operamos en un ámbito en el que se necesita argumentar, lo cual incluye –más allá de las grandes diferencias- tanto a la ciencia como a la actividad judicial. De todas formas, es atendible la idea de que no podemos meramente aceptar un modelo lógico desentendiéndonos por completo de la fundamentación fáctica de las premisas. Por lo tanto, si aceptamos, como se propuso en el capítulo 3, un compromiso epistémico de la práctica judicial, queda razonablemente cubierta la necesidad pre-lógica de fundamentar las premisas.
Otro malentendido es aquel en que incurre Taruffo cuando descarta la “probabilidad cuantitativa”, representada por el teorema de Bayes (y, aunque no lo mencione, por los axiomas de Kolmógorov), pero acepta la “probabilidad lógica”. El teorema de Bayes y los axiomas de Kolmógorov son modelos lógicos, en tanto representan estructuras formales de inferencias; los números son, al igual que las letras u otros signos usados en lógica, simples símbolos, que se utilizan por su aptitud para representar abstractamente un concepto, en este caso el “grado de certeza” o de “probabilidad”.
A diferencia de las anteriores, otras objeciones también provenientes de Taruffo son atendibles, pero son consecuencias extremas de un posible abuso de la lógica, y en todo caso sirven para ser precavidos a la hora de proponer el uso de modelos probabilísticos. Una de ellas consiste en la dificultad de los juristas para el uso de instrumentos matemáticos. Ello es absolutamente cierto, y para atender esa dificultad en este trabajo propongo una estrategia que toma elementos de un modelo de inferencia probabilística, pero cuyo uso es bastante simple.
Otra objeción nos dice que el uso de modelos lógicos o matemáticos crea una apariencia de “objetividad” en la evaluación de las pruebas, apariencia falsa si se tienen en cuenta las características reales de la producción y valoración de la prueba. Es cierto que el uso de símbolos y números puede ser un escudo engañoso para disimular, entre muchas cosas, el inevitable margen de subjetividad que tiene la decisión del juez. En efecto, si pensamos el problema en términos de géneros discursivos, que son tipos de lenguaje que abarcan un ámbito de la vida social y se identifican con un léxico, un estilo, y otras características, la presencia de símbolos y número evoca el discurso científico y, por lo tanto, puede constituir, consciente o inconscientemente, una estrategia para dotar de un halo de objetividad a la labor judicial. La solución a esta objeción pasa, entonces, por mantener presente en todo momento que cualquier estructura lógica de razonamiento no evita ni subsana los rasgos de la práctica judicial que corresponden a su función social.
Las objeciones de Haack al uso de la lógica probabilística en las decisiones judiciales, abarcan tanto al teorema de Bayes como a los axiomas de Kolmógorov, y merecen consideración por separado. Una de ellas me parece débil, y creo que otras dos son muy sólidas. En primer lugar, Haack indica que en algunos casos no hay prueba disponible para sostener ninguna de las hipótesis fácticas en pugna. Estrictamente, añade, tendríamos que asignar a todas las hipótesis un valor probabilístico de 0, con lo cual la decisión es imposible. Una vez más, creo, se está confundiendo la probabilidad como incertidumbre epistémica, con los modelos lógicos probabilísticos. Es cierto que, por su obligación de decidir, el juez finalmente tendrá que asignar algún grado de certeza al menos a la hipótesis por la que se incline aun cuando no tenga ninguna prueba, pero ello no es una cuestión lógica, porque ningún modelo de inferencia le dice nada al juez (ni al científico) acerca del grado de certeza que le inspiren las pruebas en caso de haberlas.
Las restantes objeciones de Haack refieren específicamente a los axiomas de Kolmógorov, por lo que serán tratados en el capítulo en que se aborden los mismos. Por el momento agreguemos algunas razones afirmativas para que las decisiones judiciales se auxilien de herramientas de lógica probabilística en sus inferencias sobre hechos.
Las formas lógicas siempre se construyen fuera de los lenguajes en los que luego son utilizadas, y su valor radica en las mejoras que introducen en estos últimos (en sus “modelos”, como dicen los lógicos). Por ejemplo, la “suma aritmética” es una forma lógica, cuyo valor radica en facilitar la expresión lingüística de la operación o representación de agrupar elementos. Eso significa que la adopción de una forma lógica es: a) una solución normativa, es decir, una reconducción de un lenguaje no formal a una estructura predeterminada y deliberada; y b) instrumental, ya que ordena y ayuda a expresarse y comunicarse, pero no genera en sí información ni conocimiento.
Estos son los beneficios que cabe esperar, y también las limitaciones, del uso de estructuras de inferencia probabilística en la labor judicial. Por ejemplo, el teorema de Bayes simplemente nos permite formalizar un razonamiento en el cual un enunciado que expresa que un hecho es probable, determina otro enunciado que expresa que otro hecho es también probable, es decir, la interdependencia de probabilidades entre dos hechos. Es instrumental porque no nos dice cómo asignar un valor de probabilidad, y ni siquiera nos aporta nada para justificar la causalidad entre los hechos. Pero como inevitablemente el juez (o quienquiera que opere con hechos probables) debe, en algún momento, hacer una inferencia con esos enunciados, sabemos que el teorema de Bayes u otras formas lógicas permiten hacer argumentos consistentes, lo cual es un complemento necesario de la exigencia de justificar las premisas de las decisiones judiciales, punto sobre el cual me he extendido más arriba.
6. LOS AXIOMAS DE KOLMÓGOROV Y SU USO EN LAS INFERENCIAS JUDICIALES SOBRE HECHOS: LOS FUNDAMENTOS
Aparte del teorema de Bayes, el otro gran modelo lógico para uso probabilístico es el de los axiomas de Kolmógorov, así llamados por el matemático ruso que los propuso. Advierto desde ya al lector que creo que estos axiomas son útiles no tanto para su aplicación directa en las inferencias sobre hechos de los jueces, sino para diseñar lo que podríamos llamar una estrategia o procedimiento de razonamiento en esa materia. En su versión original los axiomas son como sigue.
Sea E un conjunto de “eventos elementales” (x, y,... n), un conjunto de subconjuntos de E, llamándose a sus elementos “eventos aleatorios” a los que llamamos “A”, “B”, … “n”. Entonces,
- i.
es un “campo de conjuntos” (en la literatura posterior se lo denomina “espacio muestral”):
- ii.
contiene a E.
- iii.
A cada conjunto A (que son, como vimos, eventos aleatorios) en le asignaremos un valor numérico no negativo que llamamos P (A), y que representa su probabilidad.
- iv.
P (E) es igual a 1, porque es la probabilidad total de todos los elementos aleatorios del espacio muestral.
- v.
La probabilidad total de dos subconjuntos de eventos A y B dentro del espacio muestral , es igual a la suma de las probabilidades de cada subconjunto. Simplemente P (A+B)=P(A)+P(B)
Expliquemos estos axiomas en un lenguaje más asequible. El supuesto para que ellos operen es una situación en la que tenemos un conjunto de eventos probables alternativos y excluyentes, que agotan las hipótesis que pueden desencadenarse a partir de otro hecho. El ejemplo clásico es la situación de tirar un dado, luego del cual un evento es que salga el 1, otro que salga el 2, etc. El “espacio muestral” denomina ese conjunto de eventos probables. A cada evento (en los términos de Kolmógorov “A”, “B”, etc.) le asignamos un número que representa su grado de probabilidad. Ese valor nunca puede ser negativo: un evento imposible, que es el mínimo de probabilidad concebible, tendrá un valor igual a 0, pero nunca inferior.
Por otro lado, como hemos asumido que en el espacio muestral se compone de eventos excluyentes que agotan todas las alternativas de “desenlace” de la situación, es indudable que al menos uno de los eventos ocurrirá u ocurrió. Es decir, existe certeza total de que dentro del espacio muestral hay o habrá un evento cierto. Eso es lo que representamos con el número 1, que refleja el grado máximo de probabilidad. De ello se sigue que, de antemano, cada evento en forma aislada que no es imposibles ni totalmente cierto, por lo que sus valores de probabilidad están, a priori, entre 0 y 1. Finalmente, si tomamos dos o más eventos cualesquiera y queremos determinar su probabilidad conjunta, simplemente debemos sumar las probabilidades individuales de cada evento.
Expuestos los axiomas, creo que existen dos rasgos de la labor probatoria y las inferencias sobre hechos en la actividad judicial, que hacen que dichos axiomas sean interesantes para tales inferencias.
El primero es que, generalmente, una decisión judicial no se pronuncia acerca de un evento único e inescindible, sino más bien sobre una secuencia de hechos, lo que ha llevado a proponer que éstos se presentan en la discusión procesal como narraciones o relatos, descompuestos en varios “episodios” unidos por alguna relación causal. Más precisamente, la sentencia debe optar por uno de los varios relatos que rivalizan dentro del proceso, desechando otros. A ello debe sumarse que las pruebas suelen presentarse también de forma fragmentada, y que frecuentemente cada prueba se refiere a un evento concreto de la secuencia de hechos, y no a la secuencia como conjunto. Lo anterior no descarta que la decisión tenga por objeto un hecho aislado, a probarse directamente, o un hecho aislado vinculado causalmente con otro hecho singular, en cuyo caso la formalización de la inferencia mediante el teorema de Bayes es suficiente. No obstante, en muchos casos los relatos rivales tienen eventos comunes y otros diferentes, por lo que la inferencia no puede reducirse a una relación entre un hecho probado y un hecho a probar vinculados causalmente.
El segundo rasgo de la decisión judicial sobre hechos que puede ser relevante para acudir a los axiomas de Kolmógorov, es que el juez debe optar entre dos o más relatos alternativos, por lo que debe sopesar su grado de creencia en cada uno de los mismos, salvo casos especiales, por ejemplo, si la ley ordena dar por bueno el relato de una parte del proceso a raíz de la no comparecencia de la otra.
Dicho lo anterior, los axiomas de Kolmógorov pueden ser de auxilio para estructurar las inferencias sobre hechos que hacen los jueces contemplando los rasgos mencionados, no tanto (o no sólo) tomando los axiomas en su versión original y “pura”, sino con adaptaciones o proyecciones de su contenido y sus supuestos.
En primer lugar, tomemos el “axioma de adición”, que nos dice que, dados dos subconjuntos de eventos dentro del espacio muestral, la probabilidad de ambos es igual a la suma de las probabilidades de cada subconjunto: P (AB) = P(A) + P(B). La idea de subdividir el “espacio muestral” en subconjuntos, nos sugiere –tomándolo como una estrategia de análisis- que un conjunto de hechos, como sucede con los relatos de un proceso, puede segmentarse en eventos más pequeños, para luego determinar la probabilidad del conjunto como la suma de las probabilidades de esos eventos más pequeños. La versión ortodoxa del axioma de la adición de Kolmógorov refiere a eventos excluyentes, no a eventos sucesivos ni vinculados causalmente. Pero la noción básica del axioma de adición es común a todos los casos: la probabilidad total de un conjunto es igual a la suma de probabilidades de sus partes. Esta forma de razonar sugiere que puede adaptarse a una decisión sobre “relatos rivales”, subdivididos en episodios encadenados causalmente, como vimos sucede en muchos procesos.
Si, entonces, sustituimos el “espacio muestral” de Kolmógorov compuesto por eventos alternativos que agotan todas las posibilidades, por un conjunto de eventos no excluyentes, e incluso vinculados causalmente, podemos evaluar la probabilidad de cada evento en forma separada y luego determinar la probabilidad global del conjunto. Si consideramos como un conjunto de hechos a cada relato en pugna en un proceso, y a cada episodio del mismo como un evento, el axioma de adición nos indica que la probabilidad del relato como un todo depende de las probabilidades de cada episodio. Sin embargo, el procedimiento no puede consistir sólo en la asignación de un valor numérico de probabilidad a cada episodio y la suma de cada una de ellas, pues si aplicamos rigurosamente a cada episodio el axioma iii (“la probabilidad se representa con un valor entre 0 y 1”), y sumamos las probabilidades de todos ellos, es muy posible que obtengamos un valor total superior a 1, lo cual violaría, respecto del relato en total, el tercer axioma.
Para evitar ese efecto podemos proponer diferentes alternativas. Una consistiría en que la probabilidad total sea el promedio (simple o ponderado) de las probabilidades individuales de cada episodio, en cuyo caso tendríamos un axioma de la adición adaptado, o sustituido por un “axioma del promedio”. Otra alternativa es asignar también un peso específico a cada evento para la confirmación total del relato, multiplicar el valor de probabilidad de cada evento por el factor resultante, y luego sumar los resultados. El axioma de la adición se transformaría entonces en un “axioma de la adición ponderado”.
Es interesante que la idea de “ampliar” el axioma de adición de Kolmógorov es la forma en que Lakatos interpretó el esfuerzo de –entre otros- Carnap para validar una teoría general (por ejemplo, la mecánica de Newton o la teoría de la relatividad) a partir de la acumulación de probabilidades de enunciados observacionales.
En segundo lugar, el “espacio muestral” en su conjunto tiene siempre una probabilidad igual a 1, como lo expresa el cuarto axioma, porque sus eventos agotan la totalidad de desenlaces de la situación. Esta idea sugiere que el razonamiento probabilístico requiere de la exhaustividad en la consideración de hipótesis posibles. Trasladado al campo judicial, la idea de exhaustividad nos invita a multiplicar las hipótesis alternativas para explicar el hecho, agregando otras a las propuestas por las partes.
Para que podamos hablar de hechos o secuencias de hechos alternativos tiene que existir un entorno común, y si hablamos de secuencias de hechos, al menos algunos eventos de la secuencia deberán ser aceptados por todos los involucrados en la decisión. Supongamos que la discusión es acerca de si la muerte de X obedece o no a un asesinato, y en caso afirmativo acerca de quién es su autor. Como mínimo, deberemos aceptar que X existió, tenía ciertas características, y en algún momento murió o al menos dejó de verse. Las secuencias de hechos alternativas, por lo tanto, referirán a si su desaparición fue o no debida a su muerte; si no hay dudas de que murió, si alguien le dio muerte o X murió por otro motivo; si no hay dudas de que alguien le dio muerte, si fueron Y o Z; etc.
La propuesta de hipótesis alternativas como estrategia de decisión sobre hechos probables, que se vincula con la idea de los “mundos alternativos posibles” de la lógica modal, merece serias objeciones epistémicas y ontológicas. No obstante, la idea es interesante como estrategia de abordaje de los problemas fácticos de la práctica judicial, en la cual normalmente las situaciones alternativas pueden limitarse a una cantidad manejable.
7. OBJECIONES AL USO DE LOS AXIOMAS DE KOLMÓGOROV EN LAS DECISIONES JUDICIALES SOBRE HECHOS
Las objeciones explícitas al uso de los axiomas de Kolmógorov en las decisiones judiciales sobre hechos provienen de Haack. En primer lugar, sostiene que los grados de “garantía” que generan las pruebas para sostener una hipótesis, pueden no ser un continuo de 0 a 1, sino que puede tener “saltos”. Puede ocurrir que los grados de creencia, de hecho, aumenten o disminuyan a ritmos no uniformes, objeción que iría en contra de los axiomas iii) y iv) de Kolmógorov. Su otra observación es que, a veces, la “garantía” (es decir, la fuerza probatoria) que resulta de la suma de dos pruebas, supera la suma aritmética de los valores que se asignarían a cada prueba por separado, objeción que iría directamente contra el axioma v) de Kolmógorov.
En primer lugar, esas observaciones de Haack, si fueran correctas, demuestran que los axiomas de Kolmògorov no son de ayuda en algunas inferencias fácticas judiciales, pero no que no son útiles en ninguna de esas inferencias, ya que sostener que en “muchos” o “algunos” casos dichos axiomas no pueden representar adecuadamente la formación de una convicción fáctica judicial, implícitamente significa que en muchos casos los axiomas sí pueden hacerlo. Pero incluso si aceptamos la objeción para muchas de las inferencias judiciales sobre hechos, ella puede subsanarse si, en vez de aplicar en forma pura los axiomas, los tomamos como punto de partida para diseñar una estrategia de decisión sobre hechos que se base más bien en sugerencias o supuestos de los mismos.
En segundo lugar, la observación de Haack de que la convicción global sobre un conjunto de hechos es superior a la suma de sus elementos, refiere al caso en que un elemento de un relato tiene una influencia decisiva o excluyente en la decisión sobre el todo. Esa situación puede representarse adaptando el axioma v) de Kolmógorov, mediante la asignación de probabilidades ponderadas a uno o más eventos del relato, como ya se propuso más arriba en este artículo. Por otro lado, la observación atinente al “avance a saltos” de la probabilidad asignada a un evento en la medida en que aumentan las pruebas en favor de su ocurrencia es un procedimiento previo a la asignación de un valor a la probabilidad del mismo, y eso –en el contexto de una interpretación subjetiva de la probabilidad- no afecta el uso de la herramienta lógica que constituyen los axiomas, con tal que se trate de métodos que cumplan con el compromiso epistémico de las decisiones judiciales (ver capítulo 3).
Los casos en los que un hecho debe inferirse de un conjunto de varios hechos conexos o varias evidencias posiblemente pueden formalizarse mediante una red bayesiana. Las redes bayesianas son modelos que formalizan las relaciones causales entre dos o más hechos, que son causas posibles de otro hecho. Además, los hechos que son causas posibles de otros hechos, pueden ser independientes o dependientes entre sí. Por ejemplo, propongamos el hecho “la pared está húmeda”: eso puede tener como causas que se haya construido en un terreno naturalmente más húmedo que la media o que existan defectos en los cimientos, aunque ambas causas pueden ser simultáneas, y los defectos en la cimentación agravan los efectos que la humedad natural del suelo provoca en las paredes. La humedad del suelo sería una variable totalmente independiente de los defectos de cimentación, pero éstos no serían independientes de la humedad del suelo en cuanto causa de la humedad de las paredes.
El uso de redes bayesianas en las decisiones judiciales sobre hechos ha sido postulado desde hace tiempo. Es indudable que estos modelos son herramientas totalmente potentes para formalizar las inferencias en las que un hecho deriva de evidencias múltiples, y tiene una ventaja sobre modelos o estrategias basadas en los axiomas de Kolmógorov: las redes bayesianas permiten formalizar las relaciones de las evidencias entre sí, y no sólo con los hechos que pueden ser su consecuencia, lo que no es posible con dichos axiomas.
No obstante, cuando la decisión dependa de hechos excluyentes e independientes (o que puedan independizarse), una estrategia basada en los axiomas de Kolmógorov es suficiente para formalizar la inferencia. La ventaja práctica que, en tales casos, tendría dicha estrategia en comparación con las redes bayesianas es su mayor simpleza, comparada con la mayor complejidad de estas últimas.
Pero incluso cuando existen hipótesis alternativas que pueden relacionarse entre sí en la causalidad de un tercer hecho, pueden estar relacionadas entre sí, esa dependencia puede presentarse como otro hecho alternativo, en términos de los axiomas de Kolmógorov. Por ejemplo, en el caso de la humedad de la pared que puede originarse en humedad natural del suelo o en cimientos defectuosos: la concurrencia de humedad natural con cimientos defectuosos como causas de la humedad de pared puede proponerse como parte de un tercer relato, junto con aquellos en los que figuren como causas sólo la humedad natural o sólo los defectos de cimientos, en forma aislada, aunque lógicamente se trate de una forma menos potente que una red bayesiana.
¿Por qué elegir una herramienta que, sin dudas, es lógicamente menos potente, cuando está disponible la red bayesiana? Creo que hay dos motivos para ello, los cuales ciertamente no excluyen el uso de dichas redes. Primero, el uso efectivo de una red bayesiana supone un manejo experto de herramientas de cálculo, del cual generalmente carecen los jueces, que son los destinatarios de estas propuestas. El segundo motivo es que las redes bayesianas son claramente superiores a una estrategia basada en los axiomas de Kolmógorov, cuando se cuenta con información estadística, de origen empírico, sobre la presencia de cada variable. Sin embargo, eso no sucede en gran parte de las decisiones judiciales, que versan sobre hechos a cuyo respecto no hay información estadística disponible, en todo o en parte. En su lugar, una estrategia basada en los axiomas de Kolmógorov, además de ser compatible con premisas de base estadística, puede utilizarse en los casos en que las mismas están justificadas por métodos no estadísticos y relativamente informales, como frecuentemente ocurre en la práctica judicial.
8. PROPUESTA DE UNA ESTRATEGIA DE DECISIÓN JUDICIAL SOBRE HECHOS BASADA EN LOS AXIOMAS DE KOLMÓGOROV
En función de lo expresado en los apartados anteriores, la propuesta consiste en una estrategia de reconstrucción de los relatos y de inferencia sobre hechos basada en una aplicación libre de los axiomas de Kolmógorov, suponiendo que los hechos en discusión en un proceso forman parte de un relato compuesto de varios eventos sucesivos. Evito deliberadamente llamar a esta propuesta un “modelo”, para que no se la confunda con un sistema formal en el sentido lógico estricto del término. En efecto, se trata más bien de una guía de acción que tiene el fin de ordenar y sistematizar el procesamiento de las evidencias, que sólo en algunas instancias requiere de cálculos, y aun ellas son sumamente simples.
Las razones para un procedimiento de este tipo fueron adelantadas en el apartado anterior, pero pueden recapitularse como sigue:
-
Las inferencias judiciales sobre hechos son argumentos que utilizan premisas probables, y llegan a conclusiones probables.
-
En la lógica probabilística existen modelos o sistemas para formalizar las inferencias que pueden mejorar los resultados en las inferencias que llevan desde las pruebas a las conclusiones sobre hechos.
-
Los axiomas de Kolmógorov, que como conjunto son un sistema de formalización de inferencias sobre hechos probables, sugieren una estrategia o modo de trabajo para sistematizar los razonamientos judiciales sobre hechos.
La estrategia consiste en un conjunto de pasos sucesivos que se detallan seguidamente.
-
a) Definición del “espacio de relatos”. Atendiendo a la concepción de los conjuntos de hechos debatidos como relatos, el primer paso es la definición del elenco de todos los relatos posibles, incluyendo en cada uno los eventos que lo componen. Esto supone reconstruir los relatos propuestos por las partes y, en la medida en que no exista ninguna restricción al respecto, construir la mayor cantidad de relatos alternativos posibles que puedan rivalizar con los alegados por las partes como explicación de lo ocurrido, para que el resto del trabajo de evaluación se aproxime a la exhaustividad. Dado que este concepto sería una proyección del “espacio muestral” de Kolmógorov, podríamos llamarlo “espacio de relatos”. A cada relato lo podemos identificar con una R, más un número natural superior a 0: R1, R2, …. Rn.
-
b) Conjuntamente se debe definir en forma más detallada cada evento o episodio de cada relato, incluyendo con la mayor minuciosidad posible las propiedades que los constituyen. Los aspectos normativo-jurídicos de la definición (por ejemplo, si el evento puede encuadrar en tal o cual hipótesis legal) no serán considerados en mi estrategia, y se realizarán de acuerdo a criterios de clasificación dogmáticos, jurisprudenciales, etc. Estos eventos concretos fueron antes propuestos como partes de cada uno de los relatos rivales en el paso a), por lo que a la par que delimitamos un evento que integra un relato, deberemos delimitar también los eventos paralelos de los relatos rivales.
A cada evento podemos identificarlo con el símbolo de cada relato (R1, R2, …), y otro número natural precedido de un punto.
Por ejemplo, supongamos en un proceso penal el evento propuesto por la fiscalía: “la señora González mató a la señora Rodríguez en la esquina de las calles 1 y 2, el lunes 5 de febrero a las 2 pm” (llamemos a este evento R1.1, por formar parte del relato 1). Ese evento propuesto por la fiscalía forma parte de un relato que, en su conjunto, rivaliza con otros relatos compuestos por otros eventos, por ejemplo: “otra persona diferente a la señora González mató a la señora Rodríguez en la esquina de las calles 1 y 2 el lunes 5 de febrero a las 2 pm” (con los criterios de simbolización ya dichos, lo llamaremos R2.1 por formar parte del relato 2); y “nadie mató a la señora Rodríguez en la esquina de las calles 1 y 2 el lunes 5 de febrero a las 2 pm” (nuevamente con los criterios de simbolización ya dichos, llamémoslo R3.1, por formar parte del relato 3). Y así sucesivamente con todos los relatos alternativos, integrados con sus respectivos eventos.
-
c) Seguidamente ya podemos utilizar el axioma que nos dice que la probabilidad de un evento debemos traducirla a un valor numérico entre 0 y 1. Esta operación deberá realizarse para cada evento integrante de cada uno de los relatos, y será el fruto de otra inferencia que realizará el juez desde las pruebas, o la ausencia de pruebas, hasta afirmar como probable en cierto grado, imposible o totalmente cierto, cada episodio de cada relato.
La descripción de este paso nos proporciona una información importante: la propuesta que estamos formulando sirve para ordenar un nivel o fase de inferencias, pero hay otro nivel de inferencia, más primario o elemental, que es previo a esta estrategia. En efecto, el otorgamiento de un valor de probabilidad a un evento requiere que cada prueba, traducida en enunciados observacionales (por ejemplo, “el testigo X relata que la persona Y corría con una pistola en la mano por la calle Z”), derive en una inferencia que desemboque en dicho valor. A mi entender esa inferencia corresponde, desde el punto de vista lógico, a alguna forma de inducción, pero eso es secundario a los efectos de este trabajo; simplemente dejemos sentado que debe cumplirse con ese escalón de razonamiento desde los enunciados observacionales más elementales hasta la asignación de un valor a cada evento de cada relato. Lo que sí importa destacar es que, partiendo de todos los enunciados observacionales correspondientes, deberemos asignar a la vez valores de probabilidad a todos los eventos pertenecientes a uno o más relatos, que pudieran estar conectados con esas observaciones.
Siguiendo con el ejemplo de la persona X que corre con la pistola en la mano por una calle. Supongamos que en un relato hay un evento en el que esa persona X estaba armada cerca del lugar de la observación, y otro evento, de un relato rival, en el que la persona X nunca tuvo un arma. Con la declaración de ese testigo razonablemente deberemos aumentar la probabilidad del evento del primer relato, y no incrementar la probabilidad del evento del segundo relato.
-
d) El siguiente paso tiene varias opciones. En efecto, más arriba se señaló que, en esta estrategia, el axioma de adición (“la probabilidad total del espacio muestral es la suma de las probabilidades de todos los eventos que lo integran”) no podía aplicarse en su forma pura, puesto que podría desembocar en un valor de probabilidad total para cada relato superior a 1, lo que no podemos admitir en virtud del axioma que nos dice que toda probabilidad se cuantifica con valores entre 0 y 1. En su lugar, dijimos que o bien convertimos el axioma de la adición en un “axioma del promedio”, que a su vez podría ser simple o ponderado, o bien convertimos el axioma de la adición en un “axioma de la adición ponderada”, tomando la idea de Carnap y Lakatos de modificar los axiomas probabilísticos originales a los efectos de un fin especial.
Si optamos por el promedio o la adición ponderadas, antes de realizar la operación final deberemos pues asignar un peso específico para cada evento para cada relato. Otra vez, la determinación de ese peso específico o ponderación es un procedimiento que el juez deberá realizar a partir de otras creencias que quedan fuera de la estrategia que aquí se propone. En todo caso, eso supone que ese valor de ponderación sea un factor para multiplicar el valor probabilístico que se asigne al mismo evento, factor que también deberá tener un valor entre 0 y 1 para que, al hacer la suma final de los valores ponderados de probabilidad, el resultado no sea superior a 1.
Si optamos por el “axioma del promedio ponderado”, todos los factores de ponderación deben ser iguales o superiores a 1, y el promedio se realiza multiplicando el valor de probabilidad de cada evento por su factor de ponderación, y dividiendo el resultado entre la suma de todos los factores de ponderación. Si optamos por el “axioma de la adición ponderado”, la suma de todos los factores de ponderación debe, sin embargo, ser invariablemente igual a 1, ya que debe reflejar la relevancia de cada evento para que el relato como conjunto se tenga por completamente cierto. Y, por último, agreguemos que esa ponderación debe efectuarse parejamente para cada uno de los relatos posibles que se hayan propuesto.
-
e) La operación final consiste en realizar para cada relato o bien el promedio de todos los eventos (si optamos por el “axioma del promedio”, simple o ponderado), o bin la ponderación de las probabilidades y la suma de los valores resultantes (si optamos por el “axioma de la adición ponderado”).
Supongamos que los valores de probabilidad de cada evento del relato R1 son los siguientes:
Si optamos por el “axioma del promedio simple”, el resultado es:
Si optamos por el “axioma del promedio ponderado”, supongamos que el juez entiende que todos los eventos pesan por igual, salvo el evento R1.3, al que quiere asignar un peso específico que triplica el de cada uno de los restantes. Las operaciones serían:
-
R1.1 = 0,6 x 1= 0.6
-
R1.2 = 0 x 1= 0
-
R1.3 = 0,9 x 3= 2,4
-
R1.4= 0,7 x 1= 0,7
-
R1.5= 0 x 1= 0
-
R1.6= 0,5 x 1= 0,5
-
(0,6+0+2,4+0,7+0+0,5): 7 = 0,525
Si optásemos por el “axioma de la adición ponderada” tendríamos, en primer lugar, que ponderar la probabilidad individual de cada evento, y luego sumarlas. Supongamos, otra vez, que el evento R1.3 tiene un peso específico que triplica a los restantes. Como la suma de los factores debe ser igual a 1, y tenemos 6 eventos, dividimos 1 entre 9 (para considerar la triplicación del peso de R1.3):
Luego asignamos a cada evento ese factor, salvo a R1.3, al que asignamos un el triple (0,111 x 3= 0,333), y ponderamos la probabilidad de cada evento por el factor respectivo
-
R1.1 = 0,6 x 0,111 = 0,0666
-
R1.2 = 0 x 0,11 = 0
-
R1.3 = 0,9 x 0,333 = 0,277
-
R1.4 = 0,7 x 0,111 = 0.0777
-
R1.5 = 0 x 0,111 = 0
-
R1.6 = 0,5 x 0,111= 0,0555
-
0,0666+0+0,277+0.0777+0+0,0555=0,4768
Como era previsible, los resultados de cada una de las modalidades son diferentes. Es evidente que el promedio simple y el promedio ponderado no son excluyentes, sino alternativos, como siempre sucede: el promedio simple se utilizará cada vez que el juez entienda que todos los eventos tienen el mismo peso específico para confirmar el relato, y el promedio ponderado en los casos en los que el peso específico de uno o más eventos sea más elevado que el resto. El uso del “axioma de la adición ponderada” se acerca más al axioma de la adición original de Kolmógorov, y por lo tanto refleja mejor la idea de la probabilidad total de un conjunto como la acumulación de las probabilidades de sus elementos.
9. A MODO DE CONCLUSIÓN Y SÍNTESIS
Expuesta la estrategia y sus fundamentos, con sus variantes, queda por resumir lo que ella tiene y lo que no tiene, y por ende lo que cabría esperar de la misma.
En primer lugar, la propuesta está basada en algunos desarrollos lógicos en materia probabilística que han mostrado ser útiles en ciertos campos de la actividad humana en los que se apunta al conocimiento fáctico. Dado que ello también es un compromiso de la práctica jurídica, especialmente judicial, la lógica probabilística puede ser un lugar donde se pueden encontrar algunas herramientas interesantes para los juristas a la hora de formar creencias acerca de hechos.
En segundo lugar, la propuesta no nos dice cómo construir las creencias que nos llevan a asignar cierto grado de probabilidad a un evento: no se proporcionan ni métodos de recolección de pruebas, ni criterios para su valoración individual o conjunta. Es sólo una estrategia para ordenar y sistematizar creencias acerca de eventos concretos, de un modo que nos permita hacerlas confluir con otras similares para emitir juicios sobre conjuntos plurales de eventos. Seguramente las reglas de valoración de la prueba son generalizaciones que, desde el punto de vista lógico, pueden formalizarse como inducciones. Pero como la estrategia que se presenta en este artículo tiene un fin de ordenación de pasos para decidir una vez que hemos valorado las evidencias en particular, no es preciso ingresar a dicho problema.
En tercer lugar, la propuesta tiene una diferencia importante con las modalidades informales de decisión que normalmente se utilizan en la práctica judicial. Por lo pronto, y aun cuando tenga un carácter instrumental, la formalización de las inferencias permitiría comparar qué valor tienen, en opinión de quien decide, cada uno de los hechos y las evidencias que se tienen para rechazarlos o aceptarlos. Como mínimo, esta explicitación aumenta la transparencia de la decisión y facilita el control por terceros, como las propias partes, un tribunal que decide un recurso contra la decisión, o inclusive el resto de la comunidad jurídica y el público en general.
Del lado de las limitaciones, pienso al menos en una que es bastante evidente: cuando, al final del ejercicio, llegamos a una paridad de valor probabilístico entre dos o más relatos. No caben dudas de que en ese caso una decisión en uno u otro sentido estará, en sustancia, provista de una fundamentación también pareja, por lo que quedará en evidencia la subjetividad de la decisión. Una forma de resolver la paridad puede consistir, como señala Lindley, en resolver cuál de las decisiones posibles en ese escenario tiene consecuencias más o menos favorables desde el punto de vista de la apreciación social de la labor judicial, como sucedería –por ejemplo- si se tratara de un caso penal en el que no existieran dudas de que una persona de un par necesariamente cometió el homicidio.
Algo similar sucede con las diferentes exigencias de certeza que, según la materia o por cualquier otro motivo, se proponen para decidir acerca de los hechos en algunos procesos en particular, como por ejemplo ocurre en muchos sistemas jurídicos en los que la sentencia penal de condena debe tener un apoyo probatorio significativamente mayor que una sentencia civil de condena. En efecto, el hecho de que un relato tenga un grado de probabilidad mayor que otros no debe ser tomado como el factor decisivo para darlo por cierto a los efectos de la decisión, ya que para ello pueden concurrir múltiples factores, seguramente normativos (jurídicos, éticos, políticos, etc.), que determinen una decisión en un sentido distinto.
En tercer lugar, pero no por ello de menor importancia, esta estrategia de argumentación, como todas las propuestas de racionalización del discurso jurídico (algunas de las cuales se han mencionado aquí), están pensadas para operar dentro del sistema jurídico y en especial de la práctica judicial, pero no deben verse como intentos de soslayar la funcionalidad social de dicho sistema, ni tampoco las visiones críticas que resultan de poner de manifiesto dicha funcionalidad.
Bibliografía
1
Aitken, C. G.G. y Taroni, F. (2004): Statistics and the Evaluation of Evidence for Forensic Scientists, Chihcester, John Wiley & Sons. https://doi.org/10.1002/0470011238
2
3
Alchourrón, C. E. y Martino, A. A. (1987), Lógica sin verdad. Theoria – Revista de Teoría, Historia y Fundamentos de la Ciencia, Segunda época, vol. III. 7-43. Disponible en https://addi.ehu.es/bitstream/handle/10810/40014/Theoria%207-9%207-43.pdf?sequence=1&isAllowed=y
4
Allen, R. and Leiter, B. (2001): Naturalized Epistemology and the Law of Evidence. Northwestern University School of Law Public Law and Legal Theory Papers, Paper 33 https://doi.org/10.2139/ssrn.293732
5
8
9
Briggs, R. (2015): “Foundations of Probability”, en Journal of Philosophical Logic, 44 (6). 625-640 https://doi.org/10.1007/s10992-015-9377-3
12
13
15
Davis, G. A. (2003): Bayesian reconstruction of traffic accidents. En Law, Probability and Risk, 2. 69-89 https://doi.org/10.1093/lpr/2.2.69
16
Enoch, D. & Fisher, T. (2015): Sense and ‘sensitivity’: Epistemic and Instrumental Approaches to Statistical Evidence. En Stanford Law Review, No. 67. 557-611. Disponible en https://www.law.utoronto.ca/sites/default/files/users/mdubber/CAL/13-14/Fischer-Paper-The%20Case%20for%20Sensitivity.pdf
18
19
20
21
22
24
Hastie, R. y Witterbrink, B. (2006): Heuristics for Applying Law to Facts. En AA.VV.: Heuristics and the Law, Cambridge (Massachusetts), The MIT Press. 259-280 https://doi.org/10.7551/mitpress/3488.003.0015
26
27
28
29
Laudan, L. (1981): Peirce and the Trivialization of the Self-Corrective Thesis. En: Science and Hypothesis. The University of Western Ontario Series in Philosophy of Science, vol. 19, Springer, Dordrecht. 226-251 https://doi.org/10.1007/978-94-015-7288-0_14
30
Laudan, L. (2013): Verdad, error y proceso penal. Un ensayo de epistemología jurídica, Madrid, Marcial Pons https://doi.org/10.2307/jj.2321936
31
Lindley, D. (1991): Subjective Probability, Decision Analysis, and their Legal Consequences. En Journal of the Royal Statistical Society. Series A (Statistics in Society), 154 (1). 83-92 https://doi.org/10.2307/2982697
33
Menashe, D. (2008): Is judicial proof of facts a form of scientific explanation? A preliminary investigation of ‘clinical’ legal method. The International Journal of Evidence and Proof, 12 (1).32-52 https://doi.org/10.1350/ijep.2008.12.1.285
35
Taruffo, M. (2003): “Algunas consideraciones sobre la relación entre prueba y verdad”. Discusiones: Prueba y conocimiento, 3. 15-41 https://doi.org/10.52292/j.dsc.2003.2400
36
Taruffo, M. (2008): La prueba, Madrid, Marcial Pons. https://doi.org/10.2307/jj.2321982
37
Urbaniak, R. y Janda, P. (2020): Probabilistic models of legal corroboration. En International Journal of Proof and Evidence, 24 (1). 1-23 https://doi.org/10.1177/1365712719864608
Notas
[3] El adverbio “imposiblemente” existe, pero lo omito porque suena un tanto forzado por lo infrecuente de su uso.
[5] . Si bien el libro es sumamente extenso, me parece del caso que la referencia sea a su totalidad porque con ello se da cuenta de la vastedad de conceptos de probabilística en el pensamiento epistemológico, filosófico y científico de Occidente
[13] Chalmers 2005: 165-167. La literatura sobre el teorema de Bayes es interminable. La referencia bibliográfica que elijo obedece a que se trata de una obra de fácil acceso y lectura para cualquier tipo de lectores.
[14] Desarrollar la noción de ideología sería absolutamente excesivo para los fines de este trabajo, lo mismo que un repaso, siquiera reducido, de la literatura sobre los discursos ideológicos y su proyección al Derecho. Baste mencionar, por lo tanto, a algunos exponentes recientes en lengua española: , Blanco 2018.
[25] ; y ss. Por otro lado , si bien afirma en forma –digamos- simple que la práctica judicial tiene un compromiso con la verdad como correspondencia, no deriva de ello una justificación para el uso de metodologías probabilísticas.
[35] En su trabajo original Kolmógorov utiliza otros símbolos y términos, pero me pliego a los que se han vuelto usuales para una mejor comparación, teniendo en cuenta además que los sistemas de notación son, por definición, arbitrarios.
[39] A diferencia de lo que sucede con el promedio, la adición nunca puede ser simple por lo expresado más arriba: la suma de las probabilidades de cada evento puede superar el 1, lo cual no podemos admitir sin violar el axioma iv.
[43] Dejo de lado el hecho de que el conjunto de los números reales entre 0 y 1 es infinito, divisible en infinitos subconjuntos cada uno con infinitos elementos.
[45] Empleo símbolos para identificar los elementos abstractos de la estrategia sólo por tratarse de un proceder habitual en la lógica. Pero ello es accesorio para el desarrollo del plan de acción, por lo que éste podrá utilizarse prescindiendo de símbolos, denominando cada elemento como prefiera cada persona.