Medidas de desigualdad en un microcosmos
académico

image
image

Realícese el siguiente ejercicio de la ociosidad académica que dispone de recursos. Visítese el sitio del Departamento de Química y Biología Química de la Universidad de Harvard. Descúbrase que ahí están listados sus veintitrés profesores regulares —exclúyanse los profesores de investigación y los eméritos—. Aprovéchese la información privilegiada de que tres de ellos fueron contratados este año y elimíneselos también. Váyase a las bases de datos de la productividad científica y averígüese cuántos papers ha publicado cada uno de estos profesores y, ya que se está ahí, cuál es su índice H —prométase una descripción detallada de este parámetro más adelante—.

Limítese a tomar en cuenta los papers que tienen a Harvard como institución de origen. Escójase sorprenderse o no ante los números que se obtengan. Pregúntese cómo cantamos las rancheras en la Facultad de Química de la UNAM. Cunda el desánimo ante la tarea de hacer una búsqueda semejante para 272 profesores. Elíjase la salida fácil del muestreo. Vulnérese el principio del muestreo aleatorio confiando a la memoria los nombres de los investigadores más productivos de allá. Regrésese a las bases de datos y recopílese la información correspondiente a estos profesores. Constrúyase el índice de Gini de la desigualdad en el número de papers publicados por este conjunto de académicos. Cítese, verbatim, la explicación reciente de este mismo autor acerca de la construcción y el significado del índice de Gini:

  • Primero vamos a definir la curva de Lorenz. Y para hacerlo vamos a utilizar un ejemplo concreto. Consideremos un grupo de personas, digamos cien, para hacer fáciles las cuentas. Ordenémoslas de acuerdo a la cantidad de dinero que traen en su bolsa, de menor a mayor, y contemos todo ese dinero. Empezaremos con las cinco personas más pobres, 5% de la población. Contemos cuánto dinero tienen entre sí. En el improbable caso de que todo el mundo trajera la misma cantidad de dinero en la bolsa, ese 5% de las personas tendría 5% del total del dinero de esa población. En un caso típico, ese grupo —ya que son los más pobres— tendrá menos de 5% del total del dinero, digamos 2%. Tomemos ahora el siguiente grupo de cinco personas y contemos cuánto dinero tienen entre ellos. De nuevo, en el improbable caso de la distribución uniforme, sumarían otro 5% del total de dinero, pero en una interpretación más realista, juntarían menos —pero un poco más que el primer grupo—, digamos 3%. Ya está. Para construir la curva de Lorenz, el primer punto es (5%,2%) —el 5% más pobre acumula 2% de los recursos—, el segundo punto es (10%,5%) —el 10% más pobre acumula 5% de los recursos, 2% de los más pobres y 3% de los que siguen—. Y así le seguimos grupo por grupo. O sea que la curva de Lorenz es la gráfica del porcentaje de bienes acumulados contra el porcentaje de la población incluida. Reiteramos que, si la distribución de bienes fuera uniforme, la curva de Lorenz sería una recta diagonal; y que, en los casos reales de distribución desigual, será una curva por debajo de esa recta diagonal ideal.
  • Una vez definida la curva de Lorenz, el índice de Gini se calcula fácilmente: es igual al doble del área encerrada entre la recta de distribución uniforme y la curva de Lorenz. Nótese que el valor mínimo de este índice se alcanza para la distribución uniforme: la curva de Lorenz coincide con la recta diagonal y no hay área encerrada, el Gini vale cero. Y que el valor máximo se alcanza para otra distribución extrema, aquella en la que sólo un individuo tiene todos los bienes —una recta sobre el eje x y un punto en (100%,100%)—, para la que el Gini vale el doble del área del triángulo inferior, o sea el área de todo el cuadrado, o sea uno —diez mil en porcentaje, pero uno en valor absoluto—. El índice de Gini va, pues de 0 a 1; 0 corresponde a la máxima igualdad y 1 corresponde a la máxima desigualdad.

Véase la gráfica 1, en donde se presenta el resultado de este juego —el índice de Gini para un microcosmos académico— junto con la correspondiente a la desigualdad en el ingreso per capita de 162 países. Trátese de encontrar diferencias. Sorpréndase ante la ausencia de éstas. Sáquese conclusiones pesimistas u optimistas asegún se desée. Pregúntese quién es el químico unamita que está enmedio de los harvardianos. Crúcense apuestas.

image
  • Figura 1. Curva de Lorenz (línea continua) para el número de papers de un grupo mixto de profesores de química de Harvard (rombos) y la UNAM (cruces). Curva de Lorenz para el ingreso per capita de un grupo de 162 países (línea discontínua). El índice de Gini es el mismo para los dos casos —la mayor desigualdad en los papers en la parte superior de la curva se compensa con la menor desigualdad en la parte inferior—.

***


El índice H es una medida del impacto acumulado de los papers de un científico, de manera totalmente cienciométrica, en los papers de los demás científicos. Originalmente se confiaba esa medida al número de citas totales que acumulan los papers de un autor, pero se objetó que algunos autores encontraron oro muy temprano en sus carreras, publicaron durante su doctorado un paper que resultó ser muy citado, y gozan de ese reconocimiento sin haber mantenido una carrera de largo aliento. Lo que andamos buscando es un científico que haya publicado varios papers profusamente citados. Aquí aparece el índice H. La idea es que uno publica N papers, algunos más citados que otros, ¿cuántos han sido citados P veces? La Profra. Petaquillas tiene veinte papers, uno ha sido citado 80 veces, pero todos los demás nunca han sido citados. Así que tiene sólo un paper citado 80 veces y 19 citados 0 veces. Mientras tanto, El Prof. Menchaca tiene diez papers, uno citado 9 veces y nueve citados ocho veces —o sea que tiene casi las mismas citas totales de Petaquillas—, nos importa decir que tiene cuando menos ocho papers citados ocho veces —en realidad tiene diez papers citados cuando menos ocho veces, pero aguántenme tantito—. El índice H se define como el número de papers, H, que han sido citados cuando menos H veces. Petaquillas tiene H=1, porque sólo tiene un paper que ha sido citado cuando menos una vez —ochenta, pero es sólo un paper— mientras que Menchaca tiene H=8, porque tiene ocho papers que han sido citados cuando menos ocho veces. Nótese que su índice H no puede ser nueve porque no tiene nueve papers que hayan sido citados cuando menos nueve veces. Y menos puede ser diez... ¿De acuerdo?

La gráfica 2 muestra el índice de desigualdad de Gini para el índice H de nuestro microcosmos académico.

image
  • Figura 1. Curva de Lorenz (línea continua) para el índice de impacto H de un grupo mixto de profesores de química de Harvard (rombos) y la UNAM (cruces). Curva de Lorenz para el ingreso per capita de un grupo de 162 países (línea discontínua). La desigualdad en el índice H es menor que en el ingreso per capita nacional.