Terug naar Richtlijn U.8 Identificatie van tekens en symbolen

Succescriterium U.8.1 Specificeer UTF-8

Specificeer UTF-8: Specificeer voor tekstuele content die door middel van een opmaaktaal is vastgelegd de UTF-8 karakterset. (Niveau A)

U.8.1 Specificeer UTF-8: Specificeer voor tekstuele content die door middel van een opmaaktaal is vastgelegd de UTF-8 karakterset. (Niveau A)

Niveau van conformiteit

A

Bedoeling van dit Succescriterium

Veel karaktersets hebben karakters die ook voorkomen in andere karaktersets, maar die op een andere manier zijn gedefinieerd. Daarnaast bevatten de meeste karaktersets slechts een deel van de karakters die in verschillende talen in gebruik zijn. Wanneer content karakters bevat die niet in de gespecificeerde karakterset voorkomen, of op een andere wijze zijn gedefinieerd, kunnen al snel problemen ontstaan met de consistentie - en de conversie - van content. Teksten waarbij letters met een trema of een accent in de browser zijn vervangen door onverklaarbare tekens of vraagtekens zijn daarvan het gevolg.

Met de UTF-8 karakterset kan elk karakter in de internationale standaard ISO/IEC 10646 worden weergegeven. Deze internationale standaard is ontwikkeld in nauwe samenwerking met het Unicode Consortium.

Een ander kenmerk is dat alle 128 tekens in de veel gebruikte ASCII karakterset exact overeenkomen met de eerste 128 tekens in UTF-8.

Consequente toepassing van de UTF-8 karakterset is een geschikt middel om de consistentie van content te borgen en meertaligheid te ondersteunen.

Opmerking: Niet alle contentformaten ondersteunen UTF-8 even goed. Dat is onder meer het geval bij eerdere versies van Microsoft Office documentformaten en eerdere versies van PDF. Daarom is het bereik van dit succescriterium beperkt tot opmaaktalen.
Aangeraden wordt om, indien de mogelijkheid beschikbaar is, altijd te kiezen voor de UTF-8 karakterset.

Definities

Tags:
Categorie:
Kennisbank
  • Delen op Facebook
  • Delen op Twitter
  • Delen op LinkedIn