Terug naar Artikelen

Taalwisselingen

Hoe ga je om met een taalwisseling binnen een webpagina? Wat is een 'natuurlijke taal' ?

Taalwisselingen: Veranderingen in de natuurlijke taal

Succescriterium 3.3.1  van de W3C Richtlijnen voor de Toegankelijkheid van Web Content 2.0 luidt:

Taal van de pagina: De standaard menselijke taalvan elke webpagina kan door software bepaald worden. 

Succescriterium 3.3.2 luidt:

Taal van onderdelen: De menselijke taal van elke passage of zin in de content kan door software bepaald worden, behalve waar het gaat om eigennamen, technische termen, woorden van onbepaalde taal en woorden of zinsdelen die deel zijn gaan uitmaken van het jargon van de onmiddellijk omringende tekst.

In dit artikel wordt uitgelegd wat bedoeld wordt met 'menselijke taal' en het aangeven van veranderingen hierbinnen. Ook wordt uitgelegd waarom dit belangrijk is en welke technieken hiervoor gebruikt worden.

Menselijke taal en schermlezers

De menselijke of natuurlijke taal van een pagina is de taal waarin het artikel geschreven is, bijvoorbeeld Nederlands, Engels, Duits. Dit in tegenstelling tot een computer- of programmeertaal, bijvoorbeeld de HTML-code waarmee een webpagina geschreven is.

Een verandering in de natuurlijke taal wil zeggen dat er in een tekst meerdere natuurlijke talen voorkomen. Een voorbeeld is een Nederlandstalige pagina met een Engels citaat. Of een Nederlandstalige pagina met een paar alinea's Frans.

In de succescriteria worden twee dingen geëist: dat je aangeeft wat de hoofdtaal van het document is, en dat je lokale wijzigingen ten opzicht van deze hoofdtaal aangeeft.

De belangrijkste motivatie voor dit succescriterium zijn de mensen die afhankelijk zijn van schermlezers (ook wel screenreaders genoemd) en mensen die geen mogelijkheid hebben om naar het beeldscherm te kijken. Hieronder vallen onder andere blinden en sommige mensen met dyslexie, maar ook mensen die 'eyes-free' willen surfen bijvoorbeeld in de auto. Voor deze mensen is het belangrijk om de pagina goed voorgelezen te krijgen.

Een schermlezer zoals voor blinden leest het document voor in de hoofdtaal van het document. Een schermlezer kan meerdere talen voorlezen, en gebruikt daar de taalspecifieke uitspraakregels voor. Ook kan een moderne schermlezer overschakelen van de éne naar de andere taal, wanneer een pagina uit meerdere talen bestaat en in de code aangegeven is dat er op een andere taal wordt overgegaan.

Wanneer in de code niet is aangegeven dat een paginagedeelte in een andere taal is, detecteert een schermlezer dit zelf niet automatisch. De schermlezer zal dan ook niet op een andere taal overgaan en blijven voorlezen met de uitspraakregels van de hoofdtaal.

Hierdoor kan tekst onbegrijpelijk of onverstaanbaar worden. Wanneer een Engelstalige tekst met Nederlandstalige uitspraakregels wordt uitgesproken, is het stuk voor iemand die zowel Engels als Nederlands beheerst, toch onbegrijpelijk.

De hoofdtaal

Het succescriterium vereist dat de hoofdtaal van een pagina is aangegeven. Voor een Nederlandstalige website zorg je ervoor dat er standaard in het html-element aangegeven is dat het om Nederlandstalige pagina's gaat. Wanneer een Nederlandstalige website ook Engelstalige pagina's bevat, geef je bij alle Nederlandstalige pagina's aan dat de hoofdtaal Nederlands is, en bij alle Engelstalige pagina's dat de hoofdtaal Engels is.

De hoofdtaal wordt aangegeven in het html-element. In HTML gebeurt dit net iets anders dan in XHTML:

De hoofdtaal aangeven in HTML

In HTML wordt het lang-attribuut gebruikt om aan te geven welke taal gebruikt wordt. Om aan te geven wat de hoofdtaal van een document is, wordt aan het html-element een lang-attribuut toegevoegd met daarin de taalcode.

Een paar voorbeelden voor het aangeven van de hoofdtaal in HTML:

  • Voor een Nederlandstalige pagina: <html lang="nl">
  • Voor een Friestalige pagina: <html lang="fy">
  • Voor een Engelstalige pagina: <html lang="en">
  • Voor een Duitstalige pagina: <html lang="de">
  • Voor een Franstalige pagina: <html lang="fr">
  • Voor een Spaanstalige pagina:<html lang="es">
  • Voor een Portugeestalige pagina: <html lang="pt">

Andere taalcodes zijn op te zoeken in het overzicht met taalcodes. De taalcodes worden doorgaans met kleine letters geschreven.

Er zijn natuurlijk talen die in verschillende landen (vaak op verschillende werelddelen) andere uitspraakregels, spelling, idioom en grammatica hebben. Zoals Engels, Spaans en Portugees. Deze talen kunnen in verschillende landen erg van elkaar afwijken. Daarom kun je een taal nog verder specificeren. Hiervoor worden de landcodes, doorgaans in hoofdletters, van de ISO voor gebruikt. Bijvoorbeeld Brits-Engels 'en-GB' en Amerikaans-Engels 'en-US'.

Voor een pagina in het Amerikaans-Engels is de code voor de hoofdtaal dan <html lang="en-US">

De hoofdtaal aangeven in XHTML

XHTML heeft een eigen attribuut om taal aan te geven: xml:lang. Ook hier wordt aangegeven wat de hoofdtaal is door het taal-attribuut met taalcode toe te voegen aan het html-element. De code voor een Nederlandstalige pagina zou dan <html xml:lang="nl"> zijn.

Om de pagina's optimaal bruikbaar te laten zijn in oudere browsers ('backward compatibility') is het goed om in XHTML ook het gewone lang-attribuut te gebruiken, dat ook nog geldig in XHTML is. In toekomstige versies van XHTML zal het lang-attribuut echter verdwijnen en plaats maken voor het xml:lang-attribuut. Met alleen het lang-attribuut is een pagina echter weer niet optimaal bruikbaar met nieuwe of toekomstige browsers ('forward compatiblity'). Het is dus het beste om voor een XHTML 1.0-pagina de volgende code te gebruiken om de hoofdtaal van een pagina aan te geven. Voor een Nederlandstalige pagina is de code:

<html lang="nl" xml:lang="nl">

Een paar voorbeelden voor het aangeven van taalwisselingen in XHTML 1.0:

  • Voor een Friestalige pagina: <html lang="fy" xml:lang="fy">
  • Voor een Engelstalige pagina: <html lang="en" xml:lang="en">
  • Voor een Duitstalige pagina: <html lang="de" xml:lang="de">
  • Voor een Franstalige pagina: <html lang="fr" xml:lang="fr">
  • Voor een Spaanstalige pagina: <html lang="es" xml:lang="es">
  • Voor een Portugeestalige pagina: <html lang="pt" xml:lang="pt">
  • Voor een Amerikaans-Engelstalige pagina: <html lang="en-US" xml:lang="en-US">

Taalwisselingen: Afwijkingen van de hoofdtaal

Op het internet bestaan veel pagina's die uit meerdere talen bestaan. Wanneer er overgegaan wordt op een andere taal, ook al is dat maar een paar woorden, noemen we dat een taalwisseling. Vaak gaat het dan om een document in één taal waarbij termen, citaten of passages vreemde taal zijn gebruikt. Leenwoorden die echt deel uitmaken van de hoofdtaal, zoals in het Nederlandse bijvoorbeeld 'bureau', 'restaurant', 'carpoolen' en 'überhaupt', worden niet beschouwd als een vreemde taal.

Als we het hebben over afwijkingen van de hoofdtaal, dan is dat van toepassing op veranderingen in de natuurlijke taal van de documenttekst en van alle tekst-equivalenten. Onder de documenttekst wordt alle zichtbare tekst verstaan, inclusief de pagina titel die in de titelbalk van de browser te zien is. Onder tekst-equivalenten worden alternatieve teksten bij afbeeldingen verstaan en bijvoorbeeld ondertitels bij multimedia.

Wat de documenttekst betreft wordt alleen gekeken naar anderstalige passages of zinsdelen. Er wordt dus niet gekeken naar individuele woorden die in een andere taal staan geschreven, of zinsdelen (bijv. uitdrukkingen of leenwoorden) die deel zijn geworden van de natuurlijke taal.

Ook worden eigennamen buiten beschouwing gelaten bij dit ijkpunt. Bij eigennamen valt te denken aan namen van personen, bedrijfsnamen, produktnamen, enzovoorts.

Striptekening van een man die zegt: "komment sa va".
Voorbeeld van een stukje Franse tekst, dat als Nederlandse tekst wordt uitgesproken.

Om ervoor te zorgen dat de taalwisselingen duidelijk zijn voor bijvoorbeeld schermlezers geven we in de HTML-code aan waar overgegaan wordt op een andere taal en waar weer terug gegaan wordt naar de hoofdtaal.

Eerst moeten we dus kijken of en waar taalwisselingen voorkomen. Vaak kan je iets ook eenvoudiger in het Nederlands zeggen, bijvoorbeeld 'toetsenbord' in plaats van 'keyboard'. Of 'personeelszaken' in plaats van 'Human Resource Management'.

Wanneer een taalwisseling gevonden wordt, moet deze worden aangegeven. Het stuk vreemde taal moet omsloten worden door een element in combinatie met het lang-attribuut in geval van HTML en het lang-attribuut samen met het xml:lang-attribuut in het geval van XHTML. Bij een afbeelding wordt het taal-attribuut (of de taalattributen bij XHTML) aan het img-element toegevoegd. Het lang-attribuut en het xml:lang-attribuut kunnen bij bijna elk element gebruikt worden. De enige uitzonderingen zijn br, frame, frameset, iframe, param en script.

Voorbeelden.

Voorbeeld 1

Stel je voor dat de volgende zin volledig in het Nederlands wordt uitgesproken:

De kroonprins had twee zonen. 'A heir and a spare', zoals de Britten zeggen.

Wanneer in dit voorbeeld het Engels op zijn Nederlands wordt uitgesproken kunt u zich voor stellen dat het moeilijk te begrijpen is, ook voor iemand die goed Engels kan. Dit is nog maar één zin, maar vaak bevatten pagina's meerdere delen in een vreemde taal.

Om te zorgen dat een moderne schermlezer de Engelstalige woorden als Engels uitspreekt, maken we de zin in HTML als volgt op:

<p>De kroonprins had twee zonen. '<span lang="en">An heir and a spare</span>', zoals de Britten zeggen.</p>

 En in XHTML natuurlijk als:

<p>De kroonprins had twee zonen. '<span lang="en" xml:lang="en">An heir and a spare</span>', zoals de Britten zeggen.</p>

 Voorbeeld 2

Het komt ook vaak voor dat grotere delen in een vreemde taal zijn opgenomen in een pagina met een andere hoofdtaal. Bijvoorbeeld het transcript van een toespraak, of een citaat. Wanneer een taalwisseling niet is aangegeven kan het zijn dat een schermlezer daar een onverstaanbare brei van klanken van maakt. Omsluit een langer stuk bijvoorbeeld met de elementen <div> <blockquote> (voor een langer citaat) of <p>, in combinatie met het lang-attribuut en/of het xml:lang-attribuut. Een Engelstalige toespraak op een Nederlandstalige pagina kan bijvoorbeeld in HTML als volgt opgemaakt worden (denk bij XHTML aan het extra attribuut):

<p>Minister Sharp hield in Liverpool de volgende toespraak:</p>
<blockquote lang ="en">
<p>First paragraph ......</p>
<p>Second paragraph ....</p>
<p>Last paragraph ....</p>
</blockquote>

Voorbeeld 3

Een ander voorbeeld is een lijst van vertalingen van artikelen:

Het artikel is al in verschillende talen vertaald:

  • Français: XHTML 1.0 - Le langage de balisage hypertexte extensible
  • Espagnol: XHTML 1.0 - El Lenguaje de Etiquetado Hipertextual Extensible

Deze lijst kan als volgt opgemaakt worden:

<p>Het artikel is al in verschillende talen vertaald:</p>
<ul> 
<li lang="fr" xml:lang="fr">Français: XHTML 1.0 - Le langage de balisage hypertexte extensible </li> <li lang="es" xml:lang="es">Espagnol: XHTML 1.0 - El Lenguaje de Etiquetado Hipertextual Extensible </li>
</ul>

Voorbeeld 4

Op een Nederlandstalige pagina staat de volgende banner:

Fly with OsmanAir to Greece

De code hiervoor in XHTML is:

<img src="afb1.gif" alt="Fly with OsmanAir to Greece" lang="en" xml:lang="en" />

Wanneer de banner ook een link is, dan kan het a-element er gewoon om heen gezet worden. Maar de attributen voor taalwisselingen kunnen ook in het a-element in plaats van in het img-element gezet worden. Er zijn meerdere manieren denkbaar om aan te geven dat hier een taalwisseling is.

Voorbeeld 5

Hier is sprake van een link die bestaat uit een afbeelding en tekst ('Fly to Greece with'):

Fly to Greece with OsmanAir

De code kan in XHTML bijvoorbeeld zijn:

<a href="adreswebsite.html" lang="en" xml:lang="en" >Fly to Greece with<img src="afb1.gif" alt="OsmanAir" /></a>

Huidige en toekomstige voordelen

Het lang-attribuut en het ijkpunt zijn geïntroduceerd met een lijst van potentiële voordelen in gedachten. Op dit moment is het aangeven van taalwisselingen eigenlijk alleen nog van belang voor schermlezers. Maar in de toekomst kan het aangeven van taalwisselingen ook de volgende voordelen hebben:

  • Foto van een brailleleesregelBlinden bekijken webpagina's vaak ook met brailleleesregels. Iemand die een pagina leest in braillekortschrift kan delen die in een vreemde taal zijn in gewone onverkorte braille lezen. Braillekortschrift is specifiek voor elke taal. Bepaalde combinaties die vaak voorkomen kunnen in één karakter worden gestopt, in het Nederlands bijvoorbeeld 'oe' en 'sch'. Je kunt het bijna vergelijken met een soort sms-taal, waarbij je met minder tekens hetzelfde kunt zeggen als in de gewone taal. In het Nederlands is het braillekortschrift op de achtergrond geraakt, maar in het Engels wordt het veel gebruikt. Het braillekortschrift ken je vaak alleen in je eigen taal. Bij een taalwisseling zou in plaats van braillekortschrift voor een vreemde taal het normale onverkorte braille gebruikt kunnen worden.
  • Gebruikers die niet zelf in staat zijn om stukken tekst in een vreemde taal te begrijpen zouden in staat kunnen zijn dit automatisch te laten vertalen.
    Babel Fish
  • Het aangeven van taalwisselingen zou zoekmachines kunnen helpen bij het indexeren van pagina's.
  • Het aangeven van taalwisseling zou browsers kunnen ondersteunen bij het maken van keuzes over woordafbreking, ligatuur (aaneengekoppeld geschreven letters, zoals æ en œ) en spatiëring bij dit stuk vreemde taal.
  • Het aangeven van taalwisselingen zou spelling- en grammaticacontroles kunnen ondersteunen. Hiermee zouden bijvoorbeeld ontwikkelaars een spellingscontrole kunnen doen van een HTML-pagina die uit meerdere talen bestaat.

Meer informatie

  • Delen op Facebook
  • Delen op Twitter
  • Delen op LinkedIn