Sinds HTML 4 hebben webontwikkelaars de mogelijkheid om de natuurlijke taal van documenten en tekstfragmenten aan te geven. Dit is belangrijk voor automatische toepassingen die HTML-documenten verwerken, zoals zoekmachines en schermlezers.
Het aangeven van de natuurlijke taal doet men met de eigenschap "lang". Een voorbeeld:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0
Transitional//EN">
<html lang="nl" dir="ltr">
<!-- Hiermee geef je aan dat de hoofdtaal van het
document Nederlands is en dat deze taal van links
naar rechts gelezen wordt. -->
<head>
<meta http-equiv="Content-Type" content="text/html;
charset=iso-8859-1">
<title>Ik spreek mijn talen</title>
</head>
<body>
<p>Ik spreek Nederlands<br>
<span lang="en">I speak English</span><br>
<span lang="da">Jeg taler Dansk</span></p>
</body>
</html>
Bij talen die niet in het latijnse alfabet geschreven worden, dient men overigens wel de juiste tekenset te definiëren. Bij het opnemen van een tekstfragment in bijvoorbeeld het Arabisch in latijns schrift dient men aan de taalcode "-la" toe te voegen. Bijvoorbeeld:
<span lang="ar-la">arabiya</span>
Hetzelfde principe wordt ook toegepast bij het aangeven van het verschil tussen Amerikaans en Brits Engels:
<span lang="en-us">organization</span>
<span lang="en-uk">organisation</span>
Een overzicht van de tweeletterige taalcodes (volgens de ISO 639-1 specificatie) vindt men in de tabel hieronder.
ISO 639-1 | Taal |
---|---|
af | Afrikaans |
ar | Arabisch |
be | Witrussisch |
bg | Bulgaars |
br | Bretons |
ca | Catalaans |
co | Corsicaans |
cs | Tsjechisch |
cy | Kymrisch (Welsh) |
da | Deens |
de | Duits |
el | Grieks |
en | Engels |
eo | Esperanto |
es | Spaans |
et | Ests |
eu | Baskisch |
fi | Fins |
fo | Faroëes |
fr | Frans |
fy | Fries |
ga | Iers Gaelic |
gd | Schots Gaelic |
gl | Galicisch |
he | Hebreeuws |
hi | Hindi |
hr | Kroatisch |
hu | Hongaars |
hy | Armeens |
ia | Interlingua |
id | Indonesisch (Bahassa) |
is | IJslands |
it | Italiaans |
ja | Japans |
jw | Javaans |
ka | Georgisch |
kk | Kazachs |
ku | Koerdisch |
la | Latijn |
lt | Litouws |
lv | Lets |
mk | Macedonisch |
mo | Moldavisch |
ms | Maleis |
mt | Maltees |
nl | Nederlands |
no | Noors |
oc | Occitaans |
pl | Pools |
pt | Portugees |
rm | Retoromaans |
ro | Roemeens |
ru | Russisch |
sa | Sanskrit |
sh | Servo-Kroatisch |
sk | Slovaaks |
sl | Sloveens |
sq | Albanees |
sr | Servisch |
sv | Zweeds |
tr | Turks |
yi | Jiddisch |
zh | Chinees |