Un ejercicio de datos para visibilizar la brecha de género en la representación de geógrafas en Wikipedia y Wikidata.
Por: Selene Yang, Ph.d
Wikipedia es hoy una de las principales fuentes de conocimiento del mundo. Sin embargo, la enciclopedia no es neutral, de la misma forma que los mapas tampoco lo son, ya que reproducen y amplifican las desigualdades del mundo .
Las investigaciones académicas han documentado esta asimetría de manera consistente durante más de una década. Wagner et al. (2015) demostraron que la desigualdad de género en Wikipedia se manifiesta en múltiples dimensiones simultáneas: desigualdades en relación con la relevancia sobre incluir un artículo de una persona, sesgos temáticos en el contenido, sesgos lingüísticos en cómo se describe a las mujeres y desigualdades estructurales en los metadatos e hipervínculos. Reagle y Rhue (2011) encontraron que, si bien Wikipedia tiene más artículos sobre mujeres que la Encyclopædia Britannica en términos absolutos, estos artículos son más propensos a estar ausentes en comparación con los sobre hombres. Más recientemente, Tripodi (2021) documentó que las biografías de mujeres que cumplen los criterios de inclusión de Wikipedia tienen más probabilidades de ser consideradas no notables que las de hombres, lo que introduce un sesgo sistemático antes incluso de que el artículo exista.
Existen barreras materiales visibles al momento de producir conocimiento sobre las mujeres en Wikipedia, debido a la escasez de documentación histórica sobre su vida, especialmente en tiempos anteriores al siglo XX. Lo mismo ocurre al buscar publicaciones en medios o en la literatura, donde tampoco figuran muchas de las mujeres.
Este patrón tampoco se limita a un idioma específico. Una revisión sistemática de la literatura publicada en Profesional de la Información (Ferran-Ferrer, Boté-Vericad y Minguillón, 2023) analizó más de cien estudios sobre la brecha de género en Wikipedia entre 2007 y 2022 y concluyó que ninguna de las aproximadamente 300 ediciones de Wikipedia está libre de desequilibrio de género, ni en la edición ni en el contenido. Al escribir sobre ciertas mujeres, sus artículos se centran en su relevancia a partir de la relación que pueden tener con algún hombre prominente (por ejemplo, Marie Curie, esposa de Pierre Curie, en lugar de Marie Curie, la primera mujer en ganar un premio Nobel).
En este contexto, desde Geochicas realizamos un ejercicio específico: ¿cómo se manifiesta esta brecha en el conocimiento escrito sobre la geografía? La geografía es una disciplina con una historia marcadamente masculina. Durante gran parte del siglo XX, las instituciones geográficas más prestigiosas excluyeron formalmente a las mujeres; el Explorers Club, por ejemplo, no admitió mujeres hasta 1981. La entrada masiva de mujeres en la academia geográfica se produjo principalmente a partir de 1970. Este contexto histórico es importante para interpretar los datos que presentamos.
Hallazgos
- A través de consultas en el Wikidata Query Service, encontramos una marcada disparidad en la cantidad de biografías de mujeres geógrafas en relación con la de los hombres geógrafos.
- Solo el 15,8 % de los geógrafos registrados en Wikidata son mujeres. Por cada geógrafa hay 5,3 geógrafos.
- En Wikipedia, solo aproximadamente el 20 % de las biografías son de mujeres; entre geógrafas, la representación es aún menor.
- Antes del siglo XIX casi no aparecen mujeres geógrafas en los registros. El gran salto ocurre después de 1970, cuando las mujeres ingresan masivamente a la academia.
- Wikipedia en inglés tiene más geógrafas en número absoluto (418), pero la versión en francés es la más equitativa, con un 16,1 % de mujeres.
- Las brechas más profundas se encuentran en las ediciones en sueco (3,2 %), italiano (3,9 %) y ruso (5,3 %).
- Solo alrededor de 100 geógrafas tienen una categoría explícita de «women geographers» en Wikipedia, lo que significa que la estructura de categorías de la enciclopedia subrepresenta aún más a las geógrafas que los propios datos de Wikidata.
Investigaciones sobre Wikidata muestran, además, que la representación de personas está sesgada hacia el norte global, lo que refleja desigualdades socioeconómicas y en la producción de conocimiento. [1] Zhang y Terveen (2021) encontraron que solo el 22 % de los ítems de Wikidata que representan personas son de mujeres y que los editores tienden a sobrerrepresentar profesiones dominadas por hombres.
[1] Referencia al estudio sobre sesgos de representación en Wikidata hacia el norte global: https://arxiv.org/abs/2505.02352
El gráfico sobre Cantidad de Geografxs se refiere a la cantidad de artículos sobre geógrafos y geógrafas desde el siglo XIV hasta el XXI. El pico de crecimiento de la visibilidad de las geógrafas en el siglo XX se debe al ingreso de las mujeres en los ámbitos académicos.
En el siguiente mapa, pueden encontrar, en los puntos violeta, a las mujeres geógrafas y, en los puntos verdes, a los hombres geógrafos.
Nuestros datos son coherentes con lo documentado en la literatura académica, pero revelan particularidades propias que emergen en el campo geográfico.
La brecha es estructural, no solo numérica en relación con la cantidad de biografías publicadas. Langrock y González-Bailón (2022) demostraron que las mujeres están menos representadas en los artículos que enlazan a sus biografías, lo que las deja en las periferias de Wikipedia: si se empieza a navegar desde cualquier artículo aleatorio, es mucho menos probable llegar a una biografía de una mujer que a una de un hombre. Esto sugiere que agregar artículos nuevos no es suficiente si no se trabaja también en la red de enlaces.
La categorización misma es problemática. Vale la pena resaltar que el sistema de organización del conocimiento de Wikipedia reproduce una asimetría de base: los hombres geógrafos se clasifican en la categoría neutral «geógrafo», mientras que las mujeres requieren la categoría específica «mujer geógrafa». Esto establece al hombre como norma implícita e invisible. Centelles & Ferran-Ferrer (2024) analizaron este problema en profundidad y propusieron que Wikidata, cuya ontología de género es más inclusiva y no amplifica los sesgos presentes en la sociedad, podría funcionar como sistema de organización del conocimiento para Wikipedia.
La brecha también refleja la historia de la disciplina. La escasísima presencia de geógrafas antes del siglo XIX no es solo un problema de documentación: refleja la exclusión real de las mujeres de las instituciones académicas y científicas. Al mismo tiempo, la brecha que persiste hoy, décadas después del ingreso masivo de mujeres a la geografía académica, sí es un problema de documentación: muchas geógrafas contemporáneas existen, producen conocimiento y forman parte de instituciones reconocidas, pero no tienen un artículo en Wikipedia o su artículo no está enlazado a la red principal del conocimiento.
Las diferencias entre las versiones lingüísticas son significativas. El hecho de que la versión francesa sea la más equitativa, mientras que las versiones en sueco, italiano y ruso presentan las peores brechas, sugiere que las comunidades editoriales locales desempeñan un papel determinante. Esto también da cuenta del recorrido de la disciplina geográfica desde Francia, como una de las potencias en la producción de conocimiento geográfico. Al mismo tiempo, no se trata solo de un problema técnico o de datos: también es un problema de quiénes editan y de qué consideran digno de documentar.
Metodología
Este conjunto de datos fue construido a partir de consultas al Wikidata Query Service (WDQS) para identificar personas clasificadas como geógrafas y geógrafos en Wikidata y analizar su distribución por género, siglo de nacimiento, país de ciudadanía y cobertura por idioma de Wikipedia.
Fuente principal: Wikidata, consultada a través del Wikidata Query Service. Ítem de ocupación utilizado: geographer (Q901402).
Criterios de selección:
- instance of (P31) = human (Q5)
- occupation (P106) = geographer (Q901402)
Variables utilizadas:
- sex or gender (P21) — conteo por género
- date of birth (P569) — evolución por siglo
- country of citizenship (P27) — distribución geográfica
- sitelinks a Wikipedia — cobertura por idioma
Limitaciones:
- La cobertura de Wikidata y de Wikipedia no es exhaustiva y refleja sesgos históricos y editoriales.
- No todas las personas tienen registradas todas las propiedades; algunas pueden carecer de género, fecha de nacimiento o país de ciudadanía.
- La variable de país utiliza country of citizenship (P27), que no equivale necesariamente al país de nacimiento, de residencia o al principal lugar de trabajo.
- La cobertura por idioma indica la existencia de un artículo en una edición lingüística de Wikipedia, pero no mide la extensión, la calidad ni la actualidad del contenido.
- Los resultados pueden cambiar con el tiempo porque Wikidata y Wikipedia son bases de datos actualizadas constantemente.
- La clasificación binaria de género en Wikidata excluye identidades no binarias y trans, lo que implica que estos datos subestiman la diversidad real de las personas en la disciplina.
Fecha de extracción: 14 de marzo de 2026.
Referencias
Fuentes de datos
- Wikidata item: geographer (Q901402) — https://www.wikidata.org/wiki/Q901402
- Wikidata Query Service — https://query.wikidata.org/
- Tutorial SPARQL de Wikidata — https://www.wikidata.org/wiki/Wikidata:SPARQL_tutorial/en
Literatura académica citada
- Beytía, P., & Wagner, C. (2022). Visibility layers: A framework for systematising the gender gap in Wikipedia content. Internet Policy Review, 11(1). https://doi.org/10.14763/2022.1.1621
- Ferran-Ferrer, N., Boté-Vericad, J.-J., & Minguillón, J. (2023). Wikipedia gender gap: A scoping review. Profesional de la Información, 32(6), e320617. https://doi.org/10.3145/epi.2023.nov.17
- Centelles, M., & Ferran-Ferrer, N. (2024). Assessing knowledge organization systems from a gender perspective: Wikipedia taxonomy and Wikidata ontologies. Journal of Documentation, 80(7), 124–147. https://doi.org/10.1108/JD-11-2023-0230
- Klein, M., Gupta, H., Rai, V., Konieczny, P., & Zhu, H. (2016). Monitoring the gender gap with Wikidata Human Gender Indicators. En Proceedings of the 12th International Symposium on Open Collaboration. ACM. https://doi.org/10.1145/2957792.2957798
- Langrock, I., & González-Bailón, S. (2022). The gender divide in Wikipedia: Quantifying and assessing the impact of two feminist interventions. Journal of Communication, 72(3), 297–321. https://doi.org/10.1093/joc/jqac004
- Reagle, J., & Rhue, L. (2011). Gender bias in Wikipedia and Britannica. International Journal of Communication, 5, 1138–1158. https://ijoc.org/index.php/ijoc/article/view/777
- Tripodi, F. (2021). Ms. Categorized: Gender, notability, and inequality on Wikipedia. New Media & Society, 25(7), 1687–1707. https://doi.org/10.1177/14614448211023772
- Wagner, C., Garcia, D., Jadidi, M., & Strohmaier, M. (2015). It’s a man’s Wikipedia? Assessing gender inequality in an online encyclopedia. En Proceedings of the 9th International AAAI Conference on Web and Social Media (pp. 454–463). AAAI Press.
- Zhang, C. C., & Terveen, L. (2021). Quantifying the gap: A case study of Wikidata gender disparities. En Proceedings of the 17th International Symposium on Open Collaboration. ACM. https://doi.org/10.1145/3479986.3479992

