Limburgs als taal bij Microsoft

Hoe een dialect in Limburg te spellen levert altijd discussie op. De ouderen schrijven en ondersteunen vaak de Veldeke 2003 of Raod veur ’t Limburgs-spelling in meer conventionele media. De jongeren vertonen veel variatie in hun schrijven op sociale media – Whatsapp, Snapchat, Twitter en Facebook. Hoe aan vele manieren van schrijven tegemoet te komen, inclusief die van Veldeke 2003, is vanaf eind augustus opgelost. Want dan is Microsoft voor nu het eerste grote IT bedrijf dat het Limburgs als taal toevoegt voor mobiele applicaties.

Hun afdeling Swiftkey stelt de Beta (of test-)versie beschikbaar in de nacht van 17 op 18 augustus voor het Limburgse keyboard en spellingschecker voor alle mobiele Android applicaties. Bij elk Microsoft Swiftkey keyboard komt het Limburgs dan als taalkeuze voor. Uiteindelijk is het de bedoeling dat het intikken van de vele diakritische tekens zoals ë, ò, é, äö, oë, oeë, àè, ieë, ieè, eë, ië, aeë, èë, èw, àèë, àèw, aoë geen probleem meer oplevert. Gebruikers kunnen snel blijven tikken.Elke gebruiker kan vanaf 18 augustus gedurende twee weken deze testversie testen en feedback sturen aan Microsoft Swiftkey. Daarna wordt, waarschijnlijk begin september, de definitieve versie gelanceerd, die dan ook voor mobiele iOS (Apple) applicaties beschikbaar is (te downloaden via de App store).

Het Limburgse model voor het toetsenbord en de spellingschecker bij de Microsoft Swiftkey Beta app heeft een grote verzameling van Limburgse woorden. De woorden komen in de spelling van veel dialecten voor op basis van de Veldeke 2003-spelling, maar daarnaast zijn ook Limburgse spellingsvarianten van internet en sociale media toegevoegd. Niet alle spellingsvariatie kon worden opgenomen, maar de bestaande spellingsvariatie zal nog verruimen, omdat iedere individuele gebruiker altijd zijn/haar voorkeursspelling kan toevoegen.

De software dat het taalmodel levert, leert van de spellingsvoorkeur van de individuele gebruiker. Als deze gebruiker vaker een bepaalde spelling van een woord intikt, wordt zijn/haar spellingsvoorkeur na verloop van tijd aan de schrijver aangeboden. De software voegt ook nieuw toegevoegde woorden en spellingsvoorkeuren aan de collectieve woordenlijst voor het Limburgs toe. Hoe meer gebruikers een bepaald woord op een specifieke wijze spellen, hoe meer waarschijnlijk het wordt dat dit woord bij individuele gebruikers als mogelijkheid geopperd wordt.

Het voorspellingsmodel van het Limburgse toetsenbord en de spellingschecker werkt als volgt. Aan de hand van de eerste letters die getypt worden, voorspelt de software welk woord en in welke spelling de gebruiker typt. Het intikken van bijvoorbeeld sto roept stoon (staan) als voorspelling op of het intikken van sjta voorspelt sjtaon. Daarnaast voorspelt de software welk woord in alle waarschijnlijkheid op het vorige woord volgt en geeft hiervoor verschillende mogelijkheden aan.

Limburgs wordt dus ook als taal toegevoegd bij Microsoft. Je kunt bij Microsoft Swiftkey verschillende talen instellen. Op Android applicaties een maximum van 5 talen en op iOS applicaties een maximum van 2. Het toetsenbord zal weten in welke taal getypt wordt en woorden (en spellingen) uit die taal als mogelijkheden aanbieden.

De grote trekker achter dit resultaat is Dr. Yuri Michielsen-Tallman. Yuri is al heel lang actief als voorzitter van de Stichting Limburgse Academie en sinds de zomer projectcoördinator voor het Limburgs Corpus Woordenboek. Beide activiteiten vallen onder de Leerstoel Taalcultuur in Limburg bij de Universiteit Maastricht.​

Na Microsoft veroverd te hebben, is Yuri ook met de andere IT giganten bezig om hen zover te krijgen. Bij op zijn minst één andere lijkt dat te gaan lukken. Hierover op termijn meer. Dit resultaat is volledig tot stand gekomen door liefde voor het Limburgs, er is geen budget aan te pas gekomen maar wel internationale samenwerking met Dr. Ligeia Lugli (King’s College Londen), Michael Anthony Schuler, BA (Harvard) en Dr. Jean Robert Opgenort in San Francisco.

Wat deze digitale middelen voor het schrijven in het Limburgs voor gevolgen hebben, laat zich goed raden. Een nieuwe impuls om Limburgs vooral op digitale media te schrijven en veel spellingsvariatie. De norm van Veldeke 2003 zal bekender worden maar daarnaast zullen de gebruikers op het net ook zelf een consensusspelling weten te creëren. Microsoft goes Limburgs is voor deze regionale taal een revolutie.

Verschenen op Neerlandistiek online op 11 augustus 2017.

Dialect App: Eèsjdes en Mestreechs

Een wens is eindelijk in vervulling gegaan. Zo’n drie jaar geleden spraken Lukas van der Hijden (Bureau Interactieve Communicatie) en ik met elkaar af hoe we een Dialect App zouden kunnen realiseren, een idee dat al langer leefde bij streektaalfunctionaris Ton van de Wijngaard. Het ontwikkelen van zo’n (web)App door een bureau kost geld, er is technische kennis voor nodig en het moet zich lenen voor wetenschappelijk onderzoek. Het lukte niet om het benodigde budget bij elkaar te krijgen.

Na drie jaar na veel overleg met veel diverse wisselende mensen, verzinnen van plannen en bureaucratische hobbels is de Dialect App er toch gekomen! De (web)App voor smartphones en computers komt eind augustus uit en is bedoeld voor iedereen die dialect wil leren, zijn/haar dialect wil laten horen en plezier wil beleven aan dialect. De App bevat zo’n vijftig zinnen in het Eèsjdes en Mestreechs (aangeboden in dialect, Nederlands en Engels) die handig zijn voor iedere toerist of bezoeker. Met hulp van de App kan iedereen de weg vragen in het Eèsjdes en Mestreechs, een biertje bestellen in het café, naar de menukaart in het restaurant vragen en informeren waar een geldautomaat te vinden is. De zinnetjes zijn zo gekozen dat ze niet alleen handig zijn voor de toerist, maar ook dat ze een aantal taalkundige eigenschappen bevatten die interessant zijn voor onderzoek. Hoe meer mensen de zinnetjes inspreken in hun vorm van het Maastrichts en Eijsdens, hoe meer individuele verschillen er zijn om te onderzoeken. Zo krijgen we een schat aan taalkundige informatie hoe het huidige Maastrichts en Eijsdens gesproken wordt: door mannen en vrouwen, door ouderen en kinderen, door oudkomers en nieuwkomers, door sprekers van wie de ouders al dan niet een ander dialect of taal spreken. Ik vind het belangrijk dat iedereen kan meedoen ongeacht hoe hij/zij het Eèsjdes en Mestreechs spreekt.

De Dialect App heeft drie doelen. Inspreken: iedereen die Maastrichts of Eijsdens dialect spreekt, in welke vorm dan ook, kan de dialectzinnetjes inspreken en opnemen voor anderen. Leren spreken: toeristen, nieuwkomers, (im)migranten en andere lang- of kortblijvers kunnen via deze App horen hoe het dialect klinkt en kunnen daardoor zelf het dialect proberen te spreken en opnemen. Onderzoek: de App verzamelt zo veel mogelijk uitspraken van hopelijk heel veel sprekers van dezelfde zinnetjes in Eèsjdes en Mestreechs voor taalkundig onderzoek.

Mijn wens is dat veel meer dialecten en veel meer zinnen in de App terechtkomen maar daarvoor is natuurlijk een groter budget nodig. Het is gelukt om deze App te realiseren door goede wil, excellente samenwerking en kwaliteit. Huub Hamers van de Faculteit Psychologie en Neurowetenschappen van de Universiteit Maastricht wist een excellente BA student (Programmeur en ICT Ontwikkelaar) genaamd Somtochukwu (Somto) Enendu. Somto is afkomstig uit Nigeria, verstaat en leest een beetje Nederlands en nu ook dialect. Hij begrijpt alles van meertaligheid want hij spreekt van huis uit Engels, Igbo en Frans. De gemeente Eijsden-Margraten bood aan om te sponsoren, het Meertens Instituut heeft Somto een stageplek aangeboden met coaching van Antal van den Bosch en mijzelf en vooral Henk van den Heuvel en Wessel Stoop van de Radboud Universiteit (Centrum voor Taal en Spraaktechnologie) hebben Somto begeleid. Veel vrijwilligers hebben de App ingesproken en Laurent Rutten en Roger Weijenberg hebben de zinnen vertaald in het Eijsdens en Maastrichts. En bovenal, Somto’s inzet en kunde maakte dit project tot een succes.

Het dialect is nu digitaal: het Limburgs als taal bij Microsoft en een heuse Dialect App! Begin september is de Dialect App op het web te vinden onder Maasgeluide.nl.

Column 99 in De Limburger/Limburgs Dagblad, 21 augustus 2017.