Parentela

Parentela

Blog: genetica forense y probabilidad

Familias y mucho más
¿No os acordáis? sen^2 x + cos^2 x = 1 :))))))

relMix 2

SoftwarePostado por Lourdes Prieto Solla jue, mayo 17, 2018 20:18:17

Frecuencias mínimas en relMix

Como mucho de vosotros sabéis, en relMix y en Familias se requiere que la suma de las frecuencias alélicas de cada marcador sume 1, como en la vida real. Esto también tiene que ver con los modelos mutacionales que el software puede utilizar (ver por ejemplo, pág. 171 del libro de Thore: http://www.familias.name/book.html). Pero ¿qué pasa si queremos utilizar una frecuencia mínima en algún caso que estemos evaluando? Bueno, pues aquí va la explicación de cómo funciona esto en relMix (aplicable también a Familias), con un ejemplo que me envió Thore.

En realidad existen dos versiones de relMix:
i) la llamada "function version" más orientada a investigadores y
ii) la "GUI version" más orientada a usuarios.
Pero ambas versiones usan el mismo código, la misma función de verosimilitud y necesitan que las frecuencias de cada marcador sumen 1. En la versión GUI, las frecuencias alélicas se "pre-procesan" de forma que si no suman 1, el usuario tiene que tomar una decisión (como en Familias).

Por ejemplo, imaginemos que disponemos de las siguientes frecuencias (no muy realistas, sólo es un ejemplo) para el siguiente marcador M1:

Marker-1

Alelo 8 = 0.0008

Alelo 9 = 0.3992

Alelo 10 = 0.4000

Suman 0.8, en lugar de 1. El software entonces te ofrece dos opciones:

a) Añadir un "rest allele", es decir añadir un alelo extra con la frecuencia necesaria para que la suma sea 1

b) Escalar, es decir, redondear las frecuencias de los alelos 8, 9 y 10 para que sumen 1

En el ejemplo anterior, si el usuario decide añadir un alelo extra llamado "rest allele", obtendrá:

Marker-1

Alelo 8 = 0.0008

Alelo 9 = 0.3992

Alelo 10 = 0.4000

Rest allele = 0.2

Y si por el contrario, el usuario decide escalar, cada frecuencia alélica se dividirá por la suma de todas las frecuencias (en este caso, por 0.8), y así obtendrá:

Marker-1

Alelo 8 = 0.0010

Alelo 9 = 0.4990

Alelo 10 = 0.5000

Pero no nos perdamos, estábamos interesados en usar frecuencias mínimas, así que imaginemos que la frecuencia del alelo 8 (0.0008) nos parece demasiado pequeña e imprecisa y pensamos que esto podría sesgar el resultado. Queremos entonces usar la frecuencia mínima en lugar de la estimada, por ejemplo queremos usar una frecuencia mínima de 0.01. En relMixGUI esto se define cuando cargamos la base de datos (Database -> Options) y así, nuestro archivo original (con alelo 8 = 0.0008) se convierte en:

Marker-1

Alelo 8 = 0.01

Alelo 9 = 0.3992

Alelo 10 = 0.4000

En este caso, como las frecuencias no suman 1 (suman 0.8092), el usuario tiene que decidir si escalar o añadir un alelo extra. Pero en otros casos, si al añadir la frecuencia mínima, la suma supera el valor 1, la única opción es escalar (no se pueden añadir alelos extra, pues la suma aún daría un valor más grande que 1).

En el ejemplo, lo más razonable es añadir un alelo extra, pues si escalamos la frecuencia mínima que hemos introducido en el alelo 8 se modificaría también (0.01/(0.01+0.3992+0.4000) = 0.0125), y no queremos que eso pase.

Veamos cómo funciona entonces con un ejemplo de Thore:

Ejemplo (sin drop-out, sin alelo silente, sin theta)

Madre = 9/9

Padre = 8/10

Mezcla = 8/9

p = frec. alelo 8 = 0.0008

H1 : "Padre" es el padre

H2 : un hombre al azar es el padre

LR = 0.5/p = 625

(En detalle: LR =0.5/(p^2+2*p(1-p)*0.5)=1/p)

El resultado LR = 625 es exactamente el que saldría con relMixGUI si la frecuencia mínima la definimos = 0 y no escalamos.

Si decidimos escalar, pero seguimos sin usar la frecuencia mínima, entonces la frecuencia del alelo 8 pasa de ser 0.0008 a ser 0.001 como hemos visto anteriormente (p = 0.0008 / 0.8) y el LR sería entonces:

LR = 0.5/p = 500

Finalmente, si decidimos usar una frecuencia mínima de 0.01 y no escalamos (p = 0.01), el LR tomaría un valor de:

LR = 0.5/p =50

Para que lo podáis comprobar Thore nos manda archivos con este ejemplo. Podéis descargarlos aquí: mezcla, referencias, database (ya sabéis, una vez estéis en la dirección, control + s para guardarlos en vuestro ordenador)

Espero que os sea útil este comentario! Lo importante es que sigamos aprendiendo!



relMix 1

SoftwarePostado por Lourdes Prieto Solla mar, mayo 15, 2018 10:59:28

Menudo grupo de matemáticos forenses hay en Noruega!! Además de ser buenísimos, son de lo más generoso. Hoy os voy a hablar de una herramienta que ha creado Guro Dørum, una genial matemática que además es la mejor bailarina de salsa de Europa, os lo aseguro!

Guro ha puesto a nuestra disposición de forma gratuita, una aplicación para evaluar mezclas en las que los contribuyentes están emparentados. ¿Habéis tenido alguna vez un caso de agresión sexual con resultado de embarazo en el que hayáis necesitado comparar una muestra de suero de la víctima (mezcla) con un sospechoso? Demostrar la paternidad en este caso es muy importante, pues puede implicar al sospechoso como agresor. Y sin ir a un caso tan extremo... ¿habéis necesitado investigar la paternidad de un niño aún no nacido?

El principal problema de estos casos de mezclas es que no conocemos el perfil genético del bebé, lo tenemos formando parte de una mezcla con su madre. Claramente, en las hipótesis tendremos que tener en cuenta que la mezcla está formada por individuos emparentados.

El software se llama relMix y está hecho en R. Una vez que os descarguéis e instaléis el paquete "relMix" en R, podéis acceder a él con los siguientes comandos:

> library(relMix)

> relMixGUI()

Es bastante frecuente que en las muestras de plasma materno detectemos la mezcla muy desequilibrada, con un perfil muy mayoritario procedente de la madre y un perfil muy minoritario correspondiente al niño. No pasa nada! Con relMix podéis evaluar este tipo de mezclas sin problemas, pues se puede tener en cuenta que puede haber drop-out y drop-in en la mezcla (y también podéis evaluar varios replicados de la mezcla a la vez). El software también es capaz de evaluar la mezcla considerando mutación (con diferentes modelos). Es decir, que el caso puede ser complicado, pues relMix está preparado para evaluar casos complejos.

Más aún, las relaciones de parentesco no tienen por qué ser el típico trío padre-madre-hijo, relMix evalúa también otros parentescos. Por ejemplo, una mujer que ha mantenido relaciones con 2 hermanos y queda embarazada puede querer saber cuál de los dos es el padre, antes de que nazca el bebé. Pues simplemente hay que definir bien las hipótesis y ya está. Alucinante!!

Podéis encontrar toda la información sobre relMix en la publicación de Guro:

Dørum, G., Kaur, N. & Gysi, M. Pedigree-based relationship inference from complex DNA mixtures. Int J Legal Med (2017) 131: 629. https://doi.org/10.1007/s00414-016-1526-x

Y además podéis descargaros una presentación .pdf y un vídeo explicativo de nuestro queridísimo Thore en estos links:

http://www.few.vu.nl/~ksn560/Block-III-Part2-Mixtures-TE-ISFG2017.pdf

http://familias.name/VideosBook.pdf (es el primer vídeo de la lista)

Bueno, pues además tenemos que dar la enhorabuena a Guro doblemente, por el software y porque ha sido mamá hace poco. Esperamos que hayas pasado un feliz día de la madre querida Guro!!



El peligro de las exclusiones en los casos de parentesco

HipótesisPostado por Lourdes Prieto Solla vie, marzo 23, 2018 18:26:55

El establecimiento de hipótesis en los casos de parentesco también tiene sus matices. Ya vimos en los comentarios sobre el significado del LR (http://parentela.familias.name/#category8) que es posible que no conozcamos todos los escenarios posibles de nuestros casos. Como ya vimos, el LR no nos dice si una hipótesis es cierta o no, más bien, si los resultados apoyan más una hipótesis que otra. Pero resulta que ambas hipótesis podrían no ser ciertas!!

Imaginaros que una mujer que viaja con tres menores (niña1, niña2 y niño3) declara en la frontera que son sus hijos. La policía detecta que el pasaporte de la mujer es falso. Esto podría ser un caso de inmigración ilegal, pero también pude ser algo más grave como tráfico de menores. Para aclarar la situación os piden que hagáis estudios de ADN con el fin de determinar si los tres menores son hijos de esta mujer... y tras analizar aSTRs veis que la niña1 presenta incompatibilidades con esta mujer en 12 de los 21 marcadores analizados y los otros dos menores son compatibles con la mujer.

Bueno, pues parece un caso fácil. Y si calculamos LRs suponiendo "maternidad" vs. "no relacionado" para cada uno de los tres menores obtendríamos un LR muy cercano a 0 en el caso de la niña1 (demasiadas mutaciones para que la hipótesis de maternidad sea cierta!) y LRs muy elevados en el caso de los otros dos menores.

Hasta aquí todo perfecto, pero en los casos en los que se vean involucrados varios individuos y tengamos exclusión en uno de ellos, os recomiendo ir un poco más allá y pensar en la posibilidad de otras hipótesis. Tenemos claro que la niña1 no es hija de esta mujer, pero quizás esté emparentada por vía paterna con los otros dos menores o al menos con uno de ellos. También tendremos que ver entonces si la niña2 y el niño3 pueden tener o no tener el mismo padre, con las siguientes hipótesis:

H1 = la niña2 y el niño3 son hermanos completos, la mujer es su madre

H2 = la niña2 y el niño3 son medio-hermanos, la mujer es su madre

Imaginaros que obtenemos esto cuando hacemos este cálculo con Familias:

Claramente, H1 se ve favorecida por los resultados (LRH1vsH2 = 42e+06). Así que ahora podemos plantear las siguientes hipótesis, pero sin perder de vista que lo que estamos intentando aclarar es si la niña1 puede pertenecer a este grupo familiar de alguna forma o se trata de una persona no emparentada con ninguno de ellos. Planteemos entonces las hipótesis:

H3 = la niña2 y el niño3 son hermanos completos (la mujer es su madre), y la niña 1 es medio hermana paterna de 2 y 3.

H4 = la niña2 y el niño3 son hermanos completos (la mujer es su madre), y la niña 1 no está relacionada con este pedigrí.

Quizás el LR aquí no sea muy elevado (imaginaros que alrededor de 380) y decidamos ampliar análisis. El estudio de XSTRs nos ayudaría mucho en este caso, está clarísimo. Imaginaros que hemos analizado las 4 muestras, que la niña1 y la niña2 comparten alelos en cada cluster y que planteamos las mismas hipótesis H3 y H4. Con FamLinkX podemos calcular de manera muy sencilla si los resultados de nuestro análisis de XSTRs apoyan más una hipótesis que otra. Supongamos que obtenemos LRH3vsH4 = e+07. Menos mal que hemos pensado en otras hipótesis y no nos hemos limitado a informar de la exclusión entre la niña1 y la madre!! Está claro que las consecuencias podrían haber sido terribles para esta madre.

Pero Thore me ha dicho que hay una forma mejor de hacer los cálculos! No es necesario que bombardeemos con tantos LRs en los informes... se pueden contrastar todas las hipótesis a la vez:

H1 = la niña2 y el niño3 son hermanos completos, la mujer es su madre

H2 = la niña2 y el niño3 son medio-hermanos, la mujer es su madre

H3 = la niña2 y el niño3 son hermanos completos (la mujer es su madre), y la niña 1 es medio hermana paterna de 2 y 3.

H4 = la niña2 y el niño3 son hermanos completos (la mujer es su madre), y la niña 1 no está relacionada con este pedigrí.

Si hacemos esto con Familias (marcadores autosómicos) y escalamos en H4, obtenemos:

Es decir, un LR de unos 380 favoreciendo H3: lo mismo que cuando comparábamos H3 y H4 sólo. Veis que para H1 nos sale 1 (como H4 escalado). Es porque H1 y H4 son básicamente la misma hipótesis, pero la hemos definido para poder compararla con H2. Para ello, escalamos en H2 y obtenemos:

En este caso, H1 se ve favorecida 42E+06 veces, como ya habíamos visto al comparar sólo H1 y H2. De nuevo, H1 y H4 nos da el mismo resultado porque son en realidad la misma hipótesis.

Bueno, pues espero que os haya sido útil este ejemplo! Nos ha servido para ilustrar una vez más lo importante que son las hipótesis y tener la mente abierta a varias posibilidades!!



COMPRENDIENDO EL LR

Documentos en EspañolPostado por Lourdes Prieto Solla mar, marzo 06, 2018 17:41:39
En España tenemos la suerte de tener numerosos expertos en estos temas de la valoración estadística de la prueba de ADN. Y uno de ello es José Juan Lucena, Coronel de la Guardia Civil. Es increíble cómo una persona que no es experta en temas de ADN puede explicarnos tan bien cómo valorar nuestra prueba.
Tengo la suerte de contar con su amistad y generosidad, y quería compartir con vosotros este privilegio. Recientemente me ha enviado este documento:

Lucena_comprendiendo_LR_ADN

que considero de muchísima utilidad.

Espero que os resulte muy interesante, yo he disfrutado muchísimo leyéndolo!
Mil gracias José Juan por estar siempre dispuesto a enseñarnos!







Hipótesis en mezclas de dos contribuyentes

HipótesisPostado por Lourdes Prieto Solla dom, febrero 18, 2018 08:31:52

Buenos día World!
¿Cuál sería la probabilidad de que yo estuviera escribiendo esto si me hubiera tocado la lotería? Pues ni yo misma lo sé, pero si además de haberme tocado la lotería, estuviera presa en la cárcel, seguro que la probabilidad sería alta, sólo por evitar el aburrimientosmiley

Una de las cuestiones primordiales en la valoración de la prueba forense es el establecimiento de las hipótesis. Y parece que en esto, a veces fallamos. Se nos olvida que las hipótesis deben representar los puntos de vista de las partes involucradas en el proceso legal, y no nuestro punto de vista como genetistas.

Hoy voy a centrarme en las hipótesis más adecuadas en casos de mezclas de 2 contribuyentes. Obviamente, el establecimiento de las mismas depende enormemente de las circunstancias del caso, y con unos cuantos ejemplos veremos algunas diferencias en cuanto a los perfiles que pueden cuestionarse.

Imaginemos que tenemos una mezcla M compatible totalmente con las referencias de una víctima V y un acusado A; y supongamos para todos los casos que: (i) los implicados en la mezcla no están relacionados genéticamente y (ii) la población de interés es la española (para no tener que añadir estas dos puntualizaciones en cada hipótesis).

Es bastante razonable pensar que si la mezcla la hemos detectado en una muestra corporal (ej. hisopo vaginal de una víctima de agresión sexual), uno de los perfiles será el de la víctima, y es muy lógico que ni el fiscal ni la defensa cuestionen ese perfil. En estos casos entonces podemos establecer las hipótesis:

Hp: la mezcla procede de V y de A
Hd: la mezcla procede de V y otra persona desconocida

Pero, ¿qué pasa si no tenemos información alguna sobre el caso? Pues que las hipótesis pueden ser varias, ya que no sabemos qué es lo que pretende esclarecer el tribunal:

H1: la mezcla procede de la víctima y el acusado
H2: la mezcla procede de la víctima y otra persona desconocido
H3: la mezcla procede del acusado y otra persona desconocida
H4: la mezcla procede de otras dos personas desconocidas

En nuestra rutina diaria, es bastante probable que conozcamos el punto de vista del fiscal, pues lo que normalmente quiere es implicar al/los acusado/s. Pero en los casos de mezclas es más difícil establecer el punto de vista de la defensa. Imaginaros que nos encontramos ante una mezcla compatible con dos acusados A1 y A2. Lo que puede estar claro es que a ambas partes, fiscalía y defensa, les interesa que ambos perfiles sean valorados. Podemos tener la tentación entonces de establecer las siguientes hipótesis:

Hp: la mezcla procede de A1 y A2
Hd: la mezcla procede de otras dos personas desconocidas

Sin embargo, no debemos esperar que las defensas de A1 y A2 tengan el mismo punto de vista, pues es perfectamente posible que la defensa de A1 reclame su inocencia pero quiera implicar a A2. El problema aquí es que estamos intentando utilizar un marco de dos hipótesis en un caso donde hay potencialmente varias propuestas de defensa (Gittelson, y otros, 2016).

Por tanto, el perito debe ser consciente de la gama de alternativas que hay en estos casos, y al menos debe considerar las siguientes hipótesis:

Hp1: la mezcla procede de A1 y otra persona desconocida
Hp2: la mezcla procede de A2 y otra persona desconocida

que serán contrastadas por separado con:

Hd: la mezcla procede de otras dos personas desconocidas

Nuestra condición de genetistas también hace que muchas veces nos empeñemos en cuestionar perfiles que ni fiscalía ni defensa cuestionarían. Tal es el caso por ejemplo de una mezcla hallada en la empuñadura de un cuchillo lleno de sangre, que aparece al lado de un cadáver (pero no clavado en el cadáver). Aunque la mezcla sea perfectamente compatible con víctima y acusado (sin drop-out, drop-in, etc), nuestra mente científica hace que cuestionemos que el perfil de la víctima esté ahí, aunque ni el fiscal ni la defensa duden de que tenga que estar. Nos lanzamos entonces a establecer las hipótesis:

Hp: la mezcla procede de la víctima y el acusado
Hd: la mezcla procede de otras dos personas desconocidas

Pues bien, el valor de LR que vamos a obtener considerando este par de hipótesis va a ser mucho mayor que el que obtengamos si no cuestionáramos la presencia del perfil de la víctima (víctima + acusado vs víctima + desconocido). Lo único que la defensa y el fiscal quieren aclarar es si el acusado ha participado en la mezcla o no, y estaríamos siendo tremendamente injustos si en nuestro informe ni si quiera mencionamos que hay otras posibles hipótesis que se pueden contrastar y con las cuales obtendríamos otros valores de LR.

En fin… para pensar un poco

También recordaros que debemos enunciar las hipótesis de la forma más clara y precisa posible. Aquí las he enunciado muy resumidas porque he aclarado al principio que, en todas las hipótesis que iba a plantear, la población de referencia sería la española y los contribuyentes a la mezcla no estarían relacionados genéticamente (tampoco sería un problema si lo estuvieran…sólo habría que definirlo). Pero si en nuestros informes no hacemos estas aclaraciones generales, debemos incluir esta información en las hipótesis. Por ejemplo:

Hp: la mezcla procede de A y de otra persona desconocida de la población española no relacionada genéticamente con A
Hd: la mezcla procede de dos personas desconocidas de la población española, no relacionadas genéticamente ni con A, ni entre sí

… que se nos suele olvidar poner “ni con A” o “ni entre sí”.





Significado del LR - Parte 3

Significado del LRPostado por Lourdes Prieto Solla jue, febrero 08, 2018 16:55:27

Bueno, pues veamos ahora cómo se calcula una probabilidad a posteriori en forma de apuesta (Bayes Theorem in odds form). Nos basaremos en la diapositiva 30 de la charla de Thore, y usaremos el mismo ejemplo que veníamos usando.

Posterior odds de la comparación de H3 (gemelos) y H1 (hermanos):


Es decir, H3 (gemelos) es 2000 veces más probable que H1 (hermanos) teniendo en cuenta estos priors. No sabemos si hay más hipótesis o no, si sólo hubiera una más (por ejemplo H2 = no relacionados), su prior sería = 1 – P(H1)-P(H3)=0.4999995. Pero podría haber más hipótesis, y el prior 0.4999995 de H2 se subdividiría entre las hipótesis adicionales. En cualquier caso, el cálculo y la interpretación que hemos realizado en forma de odds sería igual de válido, ya que sólo estamos comparando H3 y H1.

Veis entonces que los posterior en forma de odds nada tienen que ver con las probabilidades a posteriori (que deben tener en cuenta todas las posibilidades y sumar 1!!).

Quería también poneros un ejemplo clarísimo en el que enseguida nos damos cuenta de que no conocemos todas las hipótesis posibles. Imaginaros que nos piden saber si un varón y una mujer son hermanos en un caso de inmigración, y que resulta que al analizar ADNmt nos damos cuenta de que no pueden ser hermanos de madre porque sus haplotipos son distintos. Claramente, no conocemos todas las hipótesis: podrían ser medio-hermanos, primos, no estar relacionados…Le pregunté a Thore sobre esto y me ha recomendado leer este paper:

Karlsson et al., 2007. DNA testing for immigration cases: the risk of erroneous conclusions. For. Sci. Int. 172: 144-149

Bueno, seguro que os resulta interesante a los que hacéis casos de inmigración ilegal y reagrupación familiar. Ya me diréis que os parece!!

***Comentario de revista Hola: el primer autor de este paper (Andreas Karlsson) es en realidad nuestro conocidísimo Andreas Tillmar, que se puso el apellido de su mujer cuando se casó. Yo creo que este cambio de Karlsson a Tillmar puede deberse a dos motivos: quizás lo hizo porque Karlsson es el tercer apellido más frecuente en Suecia, o quizás porque está enamoradísimo de su esposa. La segunda opción es tan bonita….



Significado del LR - Parte 2

Significado del LRPostado por Lourdes Prieto Solla mié, enero 31, 2018 13:25:18

Algunos os preguntaréis cómo hemos calculado las probabilidades a posteriori en el comentario anterior. Pues simplemente hemos aplicado Bayes, para k hipótesis y con cualquier probabilidad a priori (En: “Relationship inference with Familias and R”, Chapter 2, Egeland et al., 2016):

Horror!! Vaya fórmula! Pero no es para tanto, sólo tenemos que multiplicar cada LR por cada prior (columna “PRODUCTO” del Excel que veréis abajo), sumar los resultados de esta multiplicación (casilla “denominador”), y luego dividir cada producto por el denominador (columna “POSTERIOR”). Mejor lo vemos con el ejemplo:

a) Si H1, H2 y H3 son igualmente probables a priori (1/3 cada una), obtenemos:

Si queréis ver un ejemplo real en Familias, podéis descargaros el archivo que ha preparado Thore. He alucinado con este archivo porque Thore ha definido las persons y las hipótesis en español!! Cada vez tiene menos de nórdico y más de latino… está totalmente mimetizado con nosotrosJ))Bueno, el archivo os lo podéis descargar en este link: http://familias.name/blog/blog-dormant.fam (usando los comandos Control+s, una vez que estéis dentro del link). Obviamente las cifras son diferentes, pero la idea es la misma. En este archivo podéis ver cómo definir H3 (gemelos) en Familias (seleccionando “direct match” en el pedigrí). Y además podéis comprobar que el LR de H3 vs H2 es igual al valor de 1/RMP que obtenemos en la ventana “Case DNA data” cuando hacemos click en “Compare DNA” (como ya discutimos en la validación del cálculo de RMP, post del 10/01/2018)

b) Si H1 y H2 son a priori más probables que H3, obtenemos:

Que es justo lo que veíamos en las diapos de Thore.

Pero lo más importante de todo esto es destacar lo que hemos aprendido con este ejemplo:

a) Como ya vimos, el LR no nos dice si una hipótesis es cierta o no, más bien, si los resultados apoyan más una hipótesis que otra (y ambas hipótesis podrían no ser ciertas!!)

b) Que en nuestros casos reales, sólo debemos calcular probabilidades a posteriori si nuestras hipótesis son exhaustivas, es decir, si conocemos y tenemos en cuenta TODAS las hipótesis relevantes. Ya hemos visto con este ejemplo que existe la posibilidad de que los resultados de ADN apoyen fuertemente una hipótesis que tenía una probabilidad a priori extremadamente baja (H3, en el ejemplo b, con prior = 10^(-6))

La mayoría de las veces sí que conocemos las hipótesis relevantes, por el contexto del caso. Pero ¿qué hacemos entonces si nuestras hipótesis no son exhaustivas? Pues podemos calcular posteriors en forma de apuesta (posterior odds), pero no probabilidades a posteriori.

Si queréis ver cómo, darme un tiempecito y preparo otro post!


02/02/2018
Añado aquí unas imágenes que me ha mandado Thore respecto a este post. Se trata del uso de una página web en la que podéis calcular directamente las probabilidades a posteriori sin necesitad del Excel anterior. Hay de todo en Internet!!

La única precaución que hay que tener es que debemos introducir en la página la verosimilitud de cada hipótesis, no el LR. Aquí veis en ejemplo de Thore (marcador D3 del archivo de Familias anteriro: http://familias.name/blog/blog-dormant.fam)


Y una vez calculado el likelihood, ya podéis meter los datos (prior y likelihood) en la web http://psych.fullerton.edu/mbirnbaum/bayes/BayesCalc3.htm para calcular la probabilidad a posteriori:


Very useful Thore! Many thanks!



Significado del LR - Parte 1

Significado del LRPostado por Lourdes Prieto Solla mié, enero 24, 2018 20:01:22

Como sabéis el LR no nos dice si una hipótesis es cierta o no, más bien nos dice si nuestros resultados apoyan más una hipótesis que otra. Por tanto, cuando decimos que:

a) Si el LR > 1: los resultados apoyan H1 (la del numerador)

b) Si el LR = 1: la evidencia es neutra

c) Si el LR < 1: los resultados apoyan H2 (la del denominador)

estamos hablando realmente en términos relativos, es decir esto sólo es cierto en el caso de H1 con respecto a H2. Pero, qué pasa si hay más escenarios posibles?, si hay más hipótesis?

Los que hayáis echado un vistazo a las diapos del curso de enero que dieron Thore y Magnus en Oslo (y a las que tan amablemente Thore nos dio acceso, ver cursos), sabréis la respuesta. Para los que no hayáis tenido tiempo de verlas, aquí os reproduzco un ejemplo que, desde mi punto de vista, es buenísimo para entender bien esto.

Imaginemos que analizamos los perfiles genéticos de dos individuos y que queremos saber si pueden ser hermanos. Nuestras hipótesis podrían ser: “H1 = hermanos” vs “H2: no relacionados”.

Imaginemos que tras el análisis hemos obtenido exactamente el mismo perfil genético en los dos individuos. Si valoramos nuestra evidencia teniendo en cuenta esas dos hipótesis, lógicamente el LR nos va a salir elevado, por ejemplo 10^6. La evidencia por tanto apoya la hipótesis de que son hermanos, pero sólo cuando la comparamos con la hipótesis de que no estén relacionados.

Obviamente, si descartamos un error en el lab (como podría ser el hecho de haber analizado la misma muestra dos veces en lugar de analizar las dos muestras), enseguida nos viene a la mente una tercera hipótesis: “H3= gemelos idénticos”. Si ahora valoramos este resultado teniendo en cuenta las hipótesis H3 y H2, el LR nos dará un número aún más elevado (imaginemos que sale 10^15).

Consideremos ahora que a priori, las tres hipótesis tienen la misma probabilidad (1/3 cada una). En la tabla siguiente (diapositiva 43 de la charla “Forensics I: paternity cases, complex identification cases” de Thore), podéis ver las probabilidades a posteriori:

Así que, en este caso, aunque el LR que obtenemos al tener en cuenta H1 y H2 es mucho mayor que 1 (10^6), lo cierto es que la probabilidad a posteriori (P (H1│E)) es menor que la probabilidad a priori (10^9 < 1/3).

Imaginemos ahora que damos mucha más probabilidad a priori a las hipótesis H1 y H2, y una probabilidad a priori muy pequeña a H3; por ejemplo casi 0.5 a H1 y H2, y sólo 10^(-6) a H3 (0.000001). Si calculamos las probabilidades a posteriori, obtenemos (diapositiva 44 de la charla anterior):

De nuevo, la probabilidad a posteriori de H1 es menor que su probabilidad a priori. Y respecto a H3, a pesar de que hemos definido que su probabilidad a priori sea muy baja, su probabilidad a posteriori es muy elevada, ya que H3 es la mejor explicación de nuestros resultados.

Por tanto, aunque el LR que evalúa nuestros resultados comparando H1 (hermanos) y H2 (no relacionados) es mucho mayor que 1, esto no significa que H1 sea una buena hipótesis (o que H1 sea cierta). Perfectamente puede significar que H1 no es una buena hipótesis y que H2 es aún peor. Lo dicho entonces, que el LR no nos dice si una hipótesis es cierta o no.

En el siguiente post veremos cómo se han calculado las probabilidades a posteriori en este ejemplo, y lo que podemos aprender de él.

« AnteriorSiguiente »