Santhosh Thottingal
Santhosh Thottingal. Photo de Kavya Manohar, 2017 (CC BY-SA 4.0)

Sur Internet, taper du texte et en lire dans une langue autre que l’anglais et qui plus est avec un alphabet non latin se révèle parfois compliqué.

En ligne, les locuteurs de la langue indique malayalam dépendaient de polices de caractère boguées, au très mauvais rendu. Toutefois, au terme de près d’une décennie d’efforts, taper du texte en malayalam sur Internet est aujourd’hui une simple formalité.

Santhosh Thottingal, ingénieur logiciel confirmé de la Fondation Wikimédia, a aidé à mener les travaux pour s’assurer que les près de 38 millions de citoyens indiens qui parlent malayalam puissent communiquer en ligne dans leur langue.

« Il n’existait pas de police de caractère exempte de bogues pour le malayalam, ni dans le domaine des logiciels libres, ni dans les systèmes d’exploitation propriétaires », explique-t-il dans un entretien publié sur le blog de Wikimédia.

Déterminé à faire pleinement entrer sa langue maternelle dans l’ère numérique, Santhosh Thottingal s’est formé en linguistique informatique de manière autodidacte et a travaillé avec Swathanthra Malayalam Computing, un collectif qui œuvre en faveur du logiciel libre.

« Nous avons développé des outils de saisie, résolu des problèmes de rendu, conçu et développé de nouvelles polices de caractère, défini et implémenté de nombreux algorithmes de calcul pour le malayalam, par exemple pour gérer la collation et la césure. Nous avons également continué à travailler sur des projets plus complexes et le groupe de bénévoles liés à la communauté s’est fortement agrandi.

Offrir aux internautes les moyens de saisir du texte et de lire dans la diversité de langues que compte le monde représente un enjeu pour la santé d’Internet. Toutefois, les polices conçues pour l’anglais, les langues latines et les systèmes d’écriture dextroverses dominent le paysage et la traduction de logiciels est souvent traitée a posteriori, en partie parce qu’il s’agit d’une opération complexe.

 

« Internet est plus sain lorsque tout le monde peut lire et écrire dans sa propre langue » rédigé dans la police de caractères malayalame.
« Internet est plus sain lorsque tout le monde peut lire et écrire dans sa propre langue » rédigé dans la police de caractères malayalame.

La maîtrise de l’anglais reste un avantage tangible en matière de saisie de caractères, de correcteurs orthographiques, de saisie automatique et de recherches. Aussi, le développement de logiciels lui-même privilégie l’anglais.

Pour la majorité des citoyens du monde qui ne parlent pas anglais, ce parti pris augmente les obstacles à l’adoption de la technologie et à l’accès à l’information. Ainsi, le favoristime dont bénéficie l’anglais a aidé à créer une fracture numérique mondiale et contribue aujourd’hui à l’entretenir.

« Le champ de la création typographique latine est saturé. Les langues qui utilisent cet alphabet comptent plusieurs milliers de polices dans tous les styles imaginables. Il est compliqué de se démarquer par la création d’une nouvelle police . En malayalam, par contre, il existe à peine une dizaine de polices Unicodes fonctionnelles. »

« Sans polices de caractères exemptes de bogues et fonctionnelles, l’accès au contenu est impossible » précise Santhosh Thottingal. Voilà pourquoi il considère la création de nouvelles polices gratifiante.

En offrant l’accès au monde numérique à un peu plus de 38 millions de personnes, les travaux de Santhosh Thottingal illustrent comment les ingénieurs logiciels d’horizons linguistiques différents peuvent aider à combler le fossé linguistique numérique afin de créer un Internet plus sain.

Pour en savoir plus :

Thoughtingal, blog de Santhosh Thottingal
Wikimedia engineer contributes several fonts to Malayalam language, blog de Wikimedia, 2018