Imagínate hojear las páginas de un libro en un idioma que no conoces. Puedes mirar las fotos, pero entenderás muy poco del texto.

Millones de personas tienen una experiencia similar cuando se conectan y tratan de navegar por la web.

Los principales software, aplicaciones, sistemas operativos y tecnologías de voz se producen solamente en inglés y en otros idiomas con ventajas comerciales.

Las personas a quienes les interese ver que sus idiomas se extiendan en línea, pueden unirse a comunidades para traducir, adaptar, escribir, tipear y tuitear con determinación, pero para un idioma poco representado es difícil adquirir relevancia social cuando existen idiomas más usados como alternativas.

Para idiomas menos hablados o escritos, esto lleva a lo que algunos investigadores llaman “extinción digital”, algo que incluso pasa en países prósperos donde la mayoría de personas están en línea.

Menos de 400 000 personas hablan islandés, así que los islandeses cambian al inglés para dar comandos de voz a sus dispositivos. Algunos ven la falta de tecnología en su idioma natal como un factor que contribuye al dominio del inglés y al debilitamiento del islandés.

Las tecnologías y traducciones multilingües no son suficientes. Lo que se necesita para una internet saludable es contenido que sea localmente relevante, es decir, que represente genuinamente los idiomas y experiencias de las personas que conecta. Donde falta contenido relevante, en el lugar que sea, puede ser un obstáculo para el uso de internet y una experiencia frustrante para quienes buscan noticias e información.

En este punto, probablemente te preguntes cuál es la magnitud y alcance de tu idioma en internet… pero eso es sorprendentemente difícil de evaluar. Primero, ¿cómo evaluarías qué cantidad de contenido es adecuado para una determinada población? ¿O cómo rastrearías si la diversidad del idioma mejora en el mundo?

Un método común es comparar la cantidad estimada de usuarios de internet que hablan diferentes idiomas, con el porcentaje estimado de sitios web en esos idiomas. Este resultado muestra cifras impresionantes. Por ejemplo, que más del 50 % de la web está en inglés y solamente el 25 % de los usuarios de internet habla inglés. Lo dijimos en la primera versión del Informe de la Salud de Internet. Pero es probable que esos números sean erróneos.

Alguien que ha cuestionado la exactitud estas medidas de idiomas populares en la web es Daniel Pimienta de FUNREDES, grupo de investigación y acción de internet casi inactivo de República Dominicana. En 2009, Pimienta fue coautor de un documento para UNESCO que describe cómo los sesgos que exageran el dominio del inglés se volvieron normales a fuerza de repetirlos.

Por ejemplo, muchos investigadores de la web – incluido W3Techs, que genera el porcentaje de contenido subido en cada idioma – se basan en los índices de los sitios web más populares del mundo de Alexa Internet. Esto es un porcentaje mínimo de los miles de millones de páginas web que existen. La ventaja es que el sitio tiene la garantía de estar libre de spam, dominios aparcados y otras páginas web irrelevantes (para humanos).

Sin embargo, es un secreto cómo hace exactamente Alexa (herramienta de marketing en línea propiedad de Amazon) para reunir datos. Algunos sitios web instalan un código de Alexa para ayudar a rastrear las visitas a su sitio. Además, Alexa dice que da seguimiento a “decenas de millones” de usuarios web a través de “más de 25 000 extensiones de navegador”, pero no divulga información de cuántos de esos usuarios viven en China, por ejemplo.

Hay muchas iniciativas en curso para medir con más exactitud la presencia de diferentes idiomas.

Pimienta sugiere un método alternativo de medición de idiomas que recurre a docenas de diferentes indicadores disponibles para calcular el “poder” relativo de un idioma, como páginas de Wikipedia, descargas de software y usuarios de redes sociales. Estima que el inglés en la web alcanza casi el 30 %.

El Índice de Internet Inclusivo evalúa el grado de contenido en idioma local en 86 países diferentes  preguntando a ciudadanos si hay publicaciones de noticias locales, servicios electrónicos de gobierno, salud, finanzas y sitios web de entretenimiento.

También es probable que un proceso de UNESCO para elaborar nuevos Indicadores de Universalidad de Internet incluya algunas mediciones sobre la relevancia del contenido en idiomas locales (ver el borrador).

Esta tal vez sea la era de los ‘grandes datos’, pero recopilar información correcta y relevante sobre idiomas sigue siendo difícil, incluso en un mundo hiperconectado.

Es importante reconocer los defectos de los actuales enfoques, pero es aún más vital que no nos demos por vencidos. Necesitamos saber el estado en línea de los idiomas del mundo para poder evaluar mejor si internet está cumpliendo su promesa.

Para comunidades diversas, accesibles y saludables– en línea y fuera de línea – es fundamental que sigamos trabajando para entender y apoyar una web multilingüe.

Lectura adicional:

Twelve years of measuring linguistic diversity in the Internet: balance and perspectives [Doce años de medir diversidad lingüística en internet: Balance y persepectivas], Daniel Pimenta, Daniel Prado y Álvaro Blanco, UNESCO, 2009
The Inclusive Internet Index [Índice de Internet Inclusivo] de la Unidad de Inteligencia de The Economist
Internet Universality Indicators [Indicadores de Universalidad de Internet], UNESCO, 2018
Proyecto Rising Voices, Global Voices