frases

jueves, 18 de julio de 2013

Descubrimiento científico

A pesar de que no es mi especialidad de ninguna manera, en esta ocasión voy a probar a meterme en una rama de la ciencia de la que habitualmente no hablo: la sociología. En concreto me he dedicado a comprobar una hipótesis que he formulado (y la he formulado así, porque el otro día se me ocurrió mientras estaba sentado en un Roca). Es la siguiente.

Hipótesis de partida: Cuanta más proporción de costa tiene un país, más teléfonos móviles tiene respecto a los habitantes.

¿Que por qué? Podría intentar justificar la hipótesis de muchas formas: desde la mayor presencia de turismo hasta la posible calidad del servicio de telefonía… buscando recovecos y dobles vueltas… pero esta justificación la dejaré, mejor, para el final. Dejaré el objetivo de mi estudio como una sorpresa final. ¿Os parece?

Metodología
Para llevar a cabo el estudio he tomado un total de 12 países al azar. He separado la lista total de países en dos: aquellos que tienen una proporción de costa superior al 50% y aquellos que la tienen igual o inferior a dicho valor. De ese modo, he seleccionado por extracción azarosa seis países de cada grupo. Con este método evito los sesgos de información y dejo la estadística más o menos equilibrada, asegurándome que la mitad de mis países son de "poca costa" y la otra mitad de "mucha costa".

Gracias a la Wikipedia en español, he podido obtener el dato del número medio de teléfonos móviles por habitante de cada uno de esos países.

Posteriormente se compararán los datos de costa y móviles de cada país entre sí y con el resto de países, para así comprobar si nuestra hipótesis de partida se confirma, si ocurre justo lo contrario, o si esos dos datos carecen de relación.

Resultados

Los países han sido ordenados de menor a mayor cantidad de costa, para que la visualización de los datos sea más directa. De entrada, viendo los datos obtenidos, aparentemente sí que hay una relación directa entre el porcentaje de costa y el número de móviles por persona, ya que desde la tabla, ambos valores crecen juntos. ¿Qué tipo de relación será? ¿Lineal? ¿Tal vez exponencial? Una gráfica nos solucionará este enigma…

Para la tabla, he representado en el eje X, la relación de países en función del porcentaje de costa, y en el eje Y el número medio de teléfonos móviles por persona. A partir de ahí, he calculado mediante la función de "linea de tendencia" de Excel, qué tipo de progresión se ajusta más a los datos, comparándo cada progresión con su valor de R2, que ha presentado su máximo (R2=0,982) en una linea de tendencia exponencial; ese valor de Res un ajuste extremadamente bueno. A partir de la ecuación, que el propio Excel sabe calcular muy acertadamente, y que es  Y=0,379e1,619x podemos calcular cuáles son los datos esperados, y de ese modo, hemos calculado un error para cada uno de los datos, que será igual al valor absoluto de la diferencia entre los datos observados y los esperados, divididos por los datos esperados (|O-E|/E). De este modo, nos encontramos que el mayor error de nuestro estudio lo presenta Tailandia, con un 12,2%, y que el error promedio es inferior a un 4%. Como hemos dicho, el ajuste es óptimo.

¿Algo más?
Si lo dejáramos aquí, podríamos sacar directamente una conclusión muy clara. Efectivamente, una mayor presencia de costas en un país es un marcador del número de teléfonos móviles por persona que tenga ese país, siguiendo esa regla. Si cogiéramos cualquiera de los países estudiados y aplicáramos la ecuación correspondiente al porcentaje de costa, obtendríamos directamente el dato del número de teléfonos móviles por persona de dicho país, con un error medio de 4% y un máximo de 12,2%. ¿Por qué ocurre esto? No lo sabemos. Sería algo para continuar estudiando. Lo que sí que sabemos es que a mayor cantidad de costa, más teléfonos móviles por habitante.

Todo esto es muy bonito (aunque los datos que yo he tomado son datos que ya sabemos de antemano que no tienen ninguna relación), y así, de este modo, aparece en innumerables ocasiones en muchos medios de comunicación. Pero nada más lejos de la realidad. Realmente, lo que en este supuesto estudio estoy mostrando es una conjunción de errores garrafales. Concretamente, son dos errores que muchas veces nos pasan desapercibidos, y que no podemos olvidar cuando leemos noticias similares.

1. Manipulación metodológica y sesgo de información
¿Estamos seguros de que la selección de los países se realizó al azar? ¿O simplemente el investigador nos está diciendo que lo hizo al azar, y realmente manipuló la metodología para obtener, ad hoc, el resultado buscado? ¿Es el resultado extrapolable?

Para responder a estas preguntas, basta con hacer una cosa básica en ciencia. La revisión. Cuando un científico publica algo, sobre todo cuando es algo revolucionario o sorprendente, siempre hay otro u otros científicos detrás que intentarán buscarle las vueltas. Es por eso que hay que tener siempre mucho cuidado con la publicación de resultados a la ligera y revisarlo todo correctamente para no caer en errores.

En este caso, la forma más sencilla de realizar la revisión es escoger otros doce países, de nuevo al azar, y aplicarles la fórmula mágica que según el investigador inicial relaciona la costa con los teléfonos móviles. De nuevo, hemos seleccionado doce países, seis con más del 50% de costa y otros seis con una costa menor o igual al 50%. Y esta tabla es la que hemos obtenido. Nótese que hemos agregado los datos esperados según la ecuación, y los datos observados.

De este modo podemos observar claramente la enorme diferencia que hay entre los valores observados en la naturaleza (o en la sociedad, por seguir el supuesto de este estudio) y los esperados según la fórmula del estudio original. Se puede ver claramente dónde está el sesgo de información. Si analizáramos los rangos de error sobre estos nuevos doce países, siguiendo la diferencia de observados y esperados dividida por los esperados, nos encontramos un error medio del 58,9%, siendo el mínimo error el de Sudáfrica, con más de un 20%, y el máximo el de Paraguay con un error total de más de 160%.

De la misma manera que en el estudio original, también podemos observar los datos en forma de tabla; en esta primera tabla replicaremos los resultados anteriores y añadiremos los nuevos datos superpuestos, colocando en ella tanto los datos observados como los esperados en este nuevo estudio.

Como veíamos evidente al visualizar los datos, los nuevos doce países no se ajustan de ninguna manera a la ecuación de la investigación inicial. Pero, nos queda una duda. ¿Es directamente falsa la hipótesis de partida? ¿O simplemente es errónea la conclusión, y la relación sigue siendo creciente, aunque el régimen de crecimiento sea diferente al propuesto por el investigador inicial? Intentaremos ajustar la tabla (ahora con 24 datos) a una nueva progresión.

Al realizar esta nueva tabla, vemos que la progresión que más se ajusta a los 24 datos es la lineal, pero con un ajuste mediocre (R2=0,248) y cuya fórmula aplicada como datos expresa una linea de pendiente muy baja (m=0,65; insignificante, dada la gran variación de los datos cuantitativos iniciales), generando además un error medio de 25,3% y un máximo de 58,1%; errores demasiado altos para resultar admisibles de cara a una predicción teórica.

La conclusión de hacer estas correcciones me lleva al segundo de los errores…

2. Correlación no significa causalidad
Que en un momento dado, en una gráfica dada, los datos coincidan de forma correlativa no es motivo suficiente para deducir que haya una causalidad directa de un dato sobre otro.

Es decir.

En el inicio del experimento vimos que había doce países que presentaban una correlación entre el porcentaje de costa y el número medio de teléfonos móviles por habitante.

¿Qué pasaría si realmente la norma fuera extrapolable al resto de países, es decir, que todos ellos se ajustaran a esa progresión? ¿Pensaríamos inmediatamente que hay una relación causa-efecto?

Dado que el valor de porcentaje de costa es una constante invariable, de ningún modo puede ésta ser la consecuencia de un valor variable; de modo que ha de ser la causa, ¿no?

Es decir… que la presencia de costa genera en la población la necesidad de adquirir más terminales de telefonía móvil. Relación causa-efecto. ¿no?

¿Y de qué modo? ¿En qué forma? Como expliqué al principio, podríamos dar mil vueltas y terminar buscando una relación ad hoc, para que esta regla se cumpliera. Pero eso no significaría que fuera cierto. En el momento en que hiciéramos una encuesta a los usuarios de telefonía móvil, nos daríamos cuenta de que su decisión de tener o no más o menos teléfonos es independiente a la presencia o no de costa en su país.

De hecho, ¿podríamos extender este estudio en el tiempo? En la aparición de la telefonía móvil, algunos países con mucha costa (como Filipinas) tenían muchos menos teléfonos móviles por persona que otros países con mucha menos costa (como Alemania). Este valor cambia a lo largo del tiempo, en función de nuevas necesidades, nivel adquisitivo y en ocasiones, ideologías. Sin embargo, el porcentaje de costa solo cambia en escalas de tiempo geológico, y a los rangos temporales que trabajamos en este caso comparativo, son una constante.

Como hemos dicho, correlación no siempre es causalidad. Y hay muchos casos de este tipo de enunciados en la publicidad y en las tendencias pseudocientíficas (como en la homeopatía o en la astrología, donde se ve a diario). Una correlación puede deberse a una coincidencia casual, o como hemos visto en el caso anterior, a un sesgo de la información y una manipulación de la metodología. Para que se de una causalidad, tiene que existir una causa real, y un efecto igual de real, y una cadena causal lógica y firme.

«Si suelto un martillo en un planeta con gravedad positiva, no necesito verlo caer para saber que en efecto ha caído» (Spock).






12 contribuciones:

Jose Luis dijo...

Excelente Vary, una de las mejores explicaciones que he leído sobre la ciencia, hay mucha teoría por ahí (blogs y otras páginas) pero tu desarrollo en forma de ejemplo practico es excelente y creo que muy accesible.

Vary Ingweion dijo...

Muchas gracias, José Luis. Seleccioné cuidadosamente los datos para que encajaran en algún tipo de progresión. No fue muy complicado, pero sí lento… aunque también muy entretenido.

Me alegro que te guste, creo que este es una de mis entradas favoritas, y me gustaría que llegara a más gente.

Jose Luis dijo...

Estoy de acuerdo en que a muchos les puede resultar interesante.

Pumby dijo...

Al menos el ochenta por ciento de las personas que tomaban leche en el desayuno en 1920, han fallecido. Es peligroso desayunar con leche
:-)

Vary Ingweion dijo...

Sí. Y el cien por cien de las personas que han padecido cáncer, consumen y han consumido monóxido de dihidrógeno. Cuidado con ese peligrosísimo compuesto, presente prácticamente en todas las sustancias que comemos y bebemos, con muy pocas, poquísimas excepciones.

Anónimo dijo...

Muy bueno, Vary.
Os recomiendo leer:
http://www.ludusvitalis.org/textos/foro/25_aznavurian.pdf
Estrella Alfaro.

Anónimo dijo...

Mira, y hablando de cabrones que mienten en estudios científicos sólo porque su estatus y sus amiguismos se lo permiten, quiero hacer una mención especial sobre aquel Premio Nobel de la Paz que se concedió al grupo del IPCC (Intergovernmental Panel on Climate Change)en el año 2007. Ese grupo en España (que es lo que conozco) no sólo lo conformaban un comité de expertos en otras materias, que no tenían nada que ver con el clima, sino que además, redactaron un informe en el que no tuvieron en cuenta los estudios de tendencias climáticas que sí se estaban llevando a cabo por científicos del país, y además, se dignaron a decir que existían otras teorías con las que no estaban de acuerdo, para terminar de desprestigiar a la gente que realmente estudiaba el clima, pero cuyos estudios no demostraban lo que Al Gore estaba intentando vender a EEUU y al mundo entero. Mentiras que a algunos les dieron mucho dinero por desprestigiar a sus colegas...
Ese mismo año, el Premio Nobel de la Paz fue negado a una verdadera luchadora, Irena Sendler.
Señores, merece la pena ser ético en la investigación, aunque el precio sea que el Premio se lo lleve otro...

Vary Ingweion dijo...

Gracias, Estrella. Lo haré en cuanto tenga un rato.

Al anónimo del último mensaje, antes que nada bienvenido/a. Es habitual aquí que la gente de un nombre al cual poder dirigirme.
Yo no hablo de "cabrones que mienten en estudios científicos", tienes que tener en cuenta que si es un fraude, inmediatamente pierde la calificación de científico. Hablo más bien de cabrones que se inventan tonterías y quieren hacerlas pasar como ciencia sin serlo.
Los premios Nobel los proporcionan particulares, y de hecho el premio Nobel procede de una fundación privada.
Lo que dices sobre el IPCC es bastante falso en el mejor de los casos, y absolutamente falso en el resto. No solo en ese panel hay expertos en clima, sino que está compuesto de forma mayoritaria por ese colectivo , climatólogos, y muchos expertos de ramas científicas afines (físicos, meteorólogos, ecólogos, geólogos, paleontólogos…). El informe redactado no solo tuvo en cuenta los estudios climatológicos existentes, sino una enorme cantidad de variables que implicaban diferentes probabilidades y diferentes supuestos, englobando así un sin fin de planteamientos hipotéticos de futuro.

Finalmente, a mi no me parece que el premio que citas fuera dado en balde. El premio Nobel de la paz de 2007 fue dado conjuntamente a Al Gore y al IPCC, literalmente, «por sus esfuerzos para construir y difundir un mayor conocimiento sobre el cambio climático provocado por el hombre, y para sentar las bases de las medidas que son necesarias para contrarrestar ese cambio»… lo cual me parece una buena misión, a decir verdad. Divulgación científica en favor del medio ambiente, y búsqueda de modos de frenar un inminente desastre, tomando "inminente" como algo que va a ocurrir, a mucho tardar, en el próximo siglo.

¿Acaso eres un negacionista del cambio climático? Deberías echar un vistazo a las evidencias científicas al respecto y abandonar cualquier tipo de creencia magufa.

Pepe dijo...

Para ilustrar lo de "correlación no implica causalidad" va muy bien la relación entre los asesinatos en Estados Unidos y la cuota de mercado de Internet Explorer: http://gizmodo.com/5977989/internet-explorer-vs-murder-rate-will-be-your-favorite-chart-today

magufin dijo...

Solamente un charlatán le pondría etiquetado de "antropología" a un post que no tienen nada que ver. Tu post no dice nada nuevo, eso cualquier lo puede encontrar en un manual de ESO de metodología básica. Enseña algo nuevo.

magufin dijo...

Censor, censor, censor, censor, típico de los Naukas, CírCULOS Escépticos, Arpíos y demás fauna. Ah sí, su vida social:

-Poner tweets contra la homeopatía
-Lista de la vergüenza
-Comentar en todo blog para llamarta "magufo", "charlatán", "vendedor de humo".
-Doble moral acusando a la gente de imbécil, débil mental y diciendo en su blog que ellos no dicen eso.
-Claro, claro, haciendo seudocoloquios copias de Amaz!ing Meeting ahora naukillos y con revistas de baja calidad como elescéptico, journaloffeelsynapsis y otras basuras.
-Claro, claro la típica censura de lamentiraestaahífuera y lacienciaysusdemonios.

¡Qué vida social tienes Vary! ¿Pagan por insultar en tweetter y en los blogs?

Vary Ingweion dijo...

La demografía entra dentro del campo de estudio de la antropología.

Respecto a tu segundo comentario: te he indicado en aquel post, lo que puedes hacer para que no se te censure. Si comentas desde el respeto, y promueves un diálogo educado, no serás censurado de ningún modo. Sin embargo, con faltas de respeto y con insultos no llegarás a ninguna parte aquí. No me gusta alimentar a trolls.

Tweets contra la homeopatía: porque es un timo, y pocas cosas me repugnan más que aquellos que se lucran del mal ajeno.
Lista de la vergüenza: porque ninguna pseudociencia debería enseñarse como cierta.
Sólo llamo magufos a los magufos, y vendedores de humos a los vendedores de humos.
Sólo insulto a quienes me insultan. Y no siempre.
Algunos tenemos cosas interesantes que hacer. Enlazo al blog cosas interesantes, que tengan una base científica sólida.
No sé qué censura tienen esos sitios web (aunque a mi nunca me han censurado), pero mi censura está especificada. Sólo censuro actitudes que falten al respeto. Y tú lo has hecho. ¿Quieres que publique tus mensajes insultándome o prefieres no caer más bajo aún?

Si pagaran por insultar tu estarías bien enterrado, así que deduzco, dado que tu me lo preguntas, que no, no pagan.

Ahora si no tienes nada inteligente que decir, deja de ensuciar mi blog.

Publicar un comentario en la entrada

No se permiten comentarios anónimos. Considero que el anonimato busca proteger la libertad de expresión de quienes se verían amenazados si se supiera su identidad, y fuera de ese contexto, carece de sentido.

Sé respetuoso con la gente que aquí escribe. Actitudes agresivas e insultantes serán eliminadas. Luego no me vengas diciendo que censuro.

Ten siempre en cuenta que en esta casa se siguen unas normas básicas del debate. Si no cumples con esas normas se considerará que no estás debatiendo y serás tratado como un troll.


Códigos para comentarios:
Negrita: <b> Tu texto </b>
Cursiva: <i> Tu texto </i>
Enlace:<a href="http://www.pagina.com"> Texto explicativo </a>
Gracias por comentar.