PHP legt die Seitenkodierung fest. Beheben von Problemen mit falscher Webseitenkodierung. Zeichenkodierung und Sprache

Vlad Merzhevich

Meta-Tags werden zum Speichern von Informationen verwendet, die für Browser und Suchmaschinen bestimmt sind. Beispielsweise greifen Suchmaschinen auf Meta-Tags zu, um Website-Beschreibungen, Schlüsselwörter und andere Daten zu erhalten.

Meta-Tags für Suchmaschinen

Unter Website-Entwicklern herrscht die Meinung vor, dass richtig geschriebene Meta-Tags es einem ermöglichen, an die Spitze der Suchmaschinen zu gelangen. Tatsächlich stimmt das nicht; Meta-Tags allein werden Ihnen nicht dabei helfen, weit oben aufzusteigen, aber schlecht umgesetzter Meta-Tag-Inhalt kann das Ranking der Website verschlechtern.

Zwei Meta-Tags wurden speziell für Suchmaschinen entwickelt: Beschreibung und Schlüsselwörter. Einige Webmaster fügten dem Abschnitt „Schlüsselwörter“ Schlüsselwörter hinzu, die nichts mit dem Thema der Website zu tun hatten, aber dennoch einen gewissen Erfolg bei Suchmaschinenbesuchern hatten. Nach einiger Zeit haben Suchmaschinen jedoch gelernt, mit diesem Phänomen umzugehen und den Inhalt einer Webseite auf Übereinstimmung mit den angegebenen Schlüsselwörtern zu überprüfen.

Einige Prinzipien im Zusammenhang mit Meta-Tags:

Fügen Sie keine Schlüsselwörter ein, die nicht auf Ihren Seiten enthalten sind.
Schlüsselwörter nicht wiederholen;
Meta-Tags für den vorgesehenen Zweck verwenden;
Machen Sie die Beschreibung und die Liste der Schlüsselwörter für jede Seite der Website unterschiedlich und berücksichtigen Sie dabei den Inhalt.

Beschreibung

Die meisten Suchmaschinen zeigen bei der Anzeige von Suchergebnissen den Inhalt des Beschreibungsfelds (Beispiel 1) an. Befindet sich dieser Tag nicht auf der Seite, listet die Suchmaschine einfach die ersten auf der Seite gefundenen Wörter auf, die in der Regel keine große Relevanz für das Thema haben.

Beispiel 1: Beschreibung verwenden

Beschreibung

Schlüsselwörter

Dieses Meta-Tag sollte Schlüsselwörter beschreiben, die auf der Seite erscheinen (Beispiel 2). Aber dadurch sind die Handlungen von Leuten, die mit allen Mitteln an die Spitze der Suchmaschinen gelangen wollen, inzwischen diskreditiert. Daher überspringen viele Suchmaschinen diesen Parameter.

Beispiel 2: Verwendung von Schlüsselwörtern

Schlüsselwörter

Schlüsselwörter können durch Leerzeichen oder Kommas getrennt aufgelistet werden. Suchmaschinen selbst konvertieren den Eintrag in die von ihnen verwendete Form.

Automatisches Laden von Seiten

Um nach einer bestimmten Zeit automatisch ein neues Dokument herunterzuladen, verwenden Sie die Anweisung http-equiv="refresh" (Beispiel 3).

Der Browser versteht diesen Eintrag so, dass er 5 Sekunden wartet und dann die im URL-Parameter angegebene neue Seite lädt, in diesem Fall einen Link zur Website-Site.

Mit diesem Meta-Tag können Sie eine Weiterleitung zu einer anderen Site erstellen. Wenn keine URL angegeben ist, wird die aktuelle Seite nach der im Inhaltsattribut angegebenen Anzahl von Sekunden automatisch aktualisiert.

Codierung

Um dem Browser mitzuteilen, in welcher Kodierung die Zeichen auf einer Webseite vorliegen, müssen Sie den Parameter festlegen . Für das Windows-Betriebssystem und das kyrillische Alphabet nimmt der Zeichensatz normalerweise den Wert utf-8 oder windows-1251 an (Beispiel 4).

Beispiel 4. Auswahl der aktuellen Kodierung

Codierung

kyrillisch

Wenn keine Kodierung angegeben ist, versucht der Browser selbst zu ermitteln, welche Art von Zeichen im Dokument verwendet wird, und wählt automatisch die erforderliche Kodierung aus. Der Browser erkennt die Sprache einer Webseite möglicherweise nicht immer genau und schlägt in einigen Fällen die vietnamesische Kodierung anstelle der kyrillischen Kodierung vor. Aus diesem Grund ist es besser, immer die angegebene Zeile einzuschließen. Es gibt jedoch Umstände, unter denen die Angabe der Kodierung Schaden anrichten kann. Beispielsweise verwendet der Webserver automatisch die Datentranskodierung in KOI-8, und der Browser konvertiert den Text in die Windows-Kodierung, wenn er auf den Parameter charset=windows-1251 stößt. Dies führt zu einem doppelten Zeichenwechsel; es ist nicht einfach, einen solchen Text zu lesen. Glücklicherweise gehört ein solches Problem bereits der Vergangenheit an und kann auf Serverebene auf jeden Fall leicht identifiziert und neutralisiert werden.

Hallo, liebe Leser meines Blogs. Heute werden wir mit Ihnen über die Kodierung sprechen. Wenn Sie meinen Artikel dazu lesen, wissen Sie, dass jedes Dokument im Internet nicht in der Form gespeichert wird, in der wir es gewohnt sind. Es ist mit Symbolen und Zeichen geschrieben, die für den Menschen unverständlich sind. Genauso ist es auch mit Text.

Es gibt mehrere Kodierungen, und daher sieht man manchmal seltsame Zeichen, wenn man ein Buch in einer mobilen Anwendung öffnet oder einen Artikel auf eine Website hochlädt, und wenn man einige Werte in den Einstellungen ändert, sieht man das Alphabet, mit dem man vertraut ist Auge.

Windows-1251-Kodierung – was ist das, welche Bedeutung hat sie bei der Erstellung einer Website, welche Zeichen werden verfügbar sein und ist sie heute die beste Lösung? Über all das im heutigen Artikel. Wie immer in einfacher Sprache, so klar wie möglich und mit einem Minimum an Begriffen.

Eine kleine Theorie

Jedes Dokument auf einem Computer oder im Internet wird, wie gesagt, in Form eines Binärcodes gespeichert. Wenn Sie beispielsweise die ASCII-Kodierung verwenden, wird der Buchstabe „K“ als 10001010 geschrieben, und in Windows 1251 ist das Symbol – Љ unter dieser Zahl versteckt. Wenn also ein Browser oder ein Programm auf eine andere Tabelle zugreift und Windows 1251-Codes anstelle von ASCII liest, sieht der Leser ein für ihn völlig unverständliches Symbol.

Die logische Frage ist: Warum sollte man sich die Mühe machen, so viele Tabellen mit Codes zu erstellen? Tatsache ist, dass es neben dem russischen Alphabet auch Englisch, Deutsch und Chinesisch gibt. Schätzungen zufolge sind es etwa 200.000 Zeichen. Obwohl ich diesen Statistiken nicht wirklich traue, erinnere ich mich an Japanisch.

Vergessen Sie nicht, dass Sie für Groß- und Kleinbuchstaben einen eigenen Code erstellen müssen, es gibt Kommas, Bindestriche usw.

Je mehr Symbole in der Tabelle enthalten sind, desto länger ist der Code für jedes Symbol, was bedeutet, dass das Gewicht des Dokuments größer wird.

Stellen Sie sich vor, ein Buch wiege 4 GB! Das Laden würde sehr lange dauern und den gesamten freien Speicherplatz auf dem Computer belegen. Die Entscheidung zum Download scheint nicht einfach zu sein.

Wenn Sie an Websites denken, ist es im Allgemeinen beängstigend, sich vorzustellen, was passiert wäre. Das Öffnen jeder Seite dauerte mehr als eine Stunde, selbst bei Hochgeschwindigkeits-Glasfaserverbindungen! Ich denke, Mobiltelefone könnten bedenkenlos weggeworfen werden. Kann man sie auch mit 4G im Freien nutzen? Ich bezweifle.

Aus diesen Gründen hat jeder Programmierer einmal versucht, seine eigene Symboltabelle zu erstellen. Um die Handhabung zu vereinfachen und das Gewicht optimal zu halten.

Microsoft hat beispielsweise Windows-1251 für das russischsprachige Segment erstellt. Es hat natürlich seine Vor- und Nachteile. Genau wie jedes andere Produkt.

Heutzutage sind nur noch 2 % aller Seiten im Internet in 1251 geschrieben. Die meisten Webmaster verwenden UTF-8. Warum so?

Nachteile und Vorteile

UTF-8 ist im Gegensatz zu Windows-1251 eine universelle Kodierung; es enthält Buchstaben verschiedener Alphabete. Es gibt sogar UTF-128, das alle Sprachen enthält – Teulu, Swahili, Laotisch, Maltesisch und so weiter.

UTF-8 ist schlechter, Buchstaben nehmen viel weniger Platz ein und beanspruchen nur ein Byte Speicher, wie bei 1251. UTF enthält seltene Zeichen aus anderen Sprachen oder Sonderzeichen. Sie wiegen 5-6 Bytes, werden aber im Dokument äußerst selten verwendet.

Diese Codierung ist durchdachter und wird daher von den meisten Anwendungen standardmäßig verwendet. Das heißt, wenn Sie dem Programm nicht mitteilen, welche Kodierung Sie verwenden, prüft es zunächst, ob es sich um UTF-8 handelt.

Wenn Sie ein HTML-Dokument für eine Website erstellen, teilen Sie Browsern mit, welche Tabelle beim Dekodieren von Datensätzen betrachtet werden soll.

Dazu müssen Sie die folgenden Daten in das Head-Tag einfügen. Nach den „charset=“-Symbolen kommt entweder UTF oder Windows, wie im Beispiel unten.

Wenn Sie in Zukunft etwas ändern und mithilfe dieser Dekodierungstabelle eine Phrase auf Albanisch einfügen möchten, funktioniert nichts, da die Kodierung diese Sprache nicht unterstützt. UTF-8 ermöglicht Ihnen dies problemlos.

Wenn Sie sich für die korrekte Erstellung einer Website interessieren, dann kann ich Ihnen den Kurs von Mikhail Rusakov empfehlen.“ Website-Erstellung und Werbung von A bis Z ».

Es enthält viel – 256 Lektionen zu JavaScript und XML. Zusätzlich zu den Programmiersprachen werden Sie in der Lage sein, zu verstehen, wie Sie eine Website monetarisieren, d. h. schneller und mehr Gewinn erzielen. Einer der wenigen Kurse, der alles, was Sie brauchen, so detailliert erklärt.

Ich studiere jetzt seit einem Jahr. an der Bloggerschule Alexander Borisov . Es dauert um ein Vielfaches länger, das Ende ist noch nicht in Sicht, aber es ist nicht weniger erschöpfend und diszipliniert. Motiviert zur Weiterentwicklung.

Wenn Fragen auftauchen, ist eine Suche im Internet nicht erforderlich. Es gibt immer einen kompetenten Mentor.

Irgendwie bin ich vom Thema abgekommen. Kommen wir zurück zu den Kodierungen.

Baddatenbanken

Wenn es um PHP geht, ist im Allgemeinen alles beängstigend. Über Datenbanken habe ich bereits gesprochen; sie dienen dazu, die Website zu beschleunigen. Normalerweise wenden Sie sich nicht an sie, aber wenn die Notwendigkeit besteht, eine Website zu übertragen, werden Sie unruhig.

Schwierigkeiten passieren jedem, unabhängig von Berufserfahrung, Dienstalter oder Betriebszugehörigkeit. Einige Seiten in der Datenbank enthalten möglicherweise alle verfügbaren Zeichen für Windows 1251, andere, beispielsweise in Seitenvorlagen, in einer anderen Kodierung.

Bis die Übertragung erforderlich ist, funktioniert und funktioniert alles, wenn auch nicht ganz korrekt. Doch nach dem Umzug beginnen die Probleme. Idealerweise sollten Sie entweder nur UTF oder Windows 1251 verwenden, aber tatsächlich passieren solche Mängel immer jedem.

Damit die Entschlüsselung konsistent ist, müssen Sie den Code mysql_query("SET NAMES cp1251") eingeben. In diesem Fall erfolgt die Konvertierung über ein anderes Protokoll – cp1251.

Htaccess

Wenn Sie sich unbedingt für die Verwendung von 1251 auf Ihrer Website entscheiden, sollten Sie eine htaccess-Datei suchen oder erstellen. Er ist für die Konfigurationseinstellungen verantwortlich. Sie müssen drei weitere Zeilen hinzufügen, damit alles zusammenpasst.

DefaultLanguage ru; AddDefaultCharset Windows-1251; php_value default_charset „cp1251“

Ich empfehle Ihnen dennoch dringend, die Verwendung von UTF-8 in Betracht zu ziehen. Es ist beliebter, einfacher und reichhaltiger. Welche Entscheidungen Sie jetzt auch treffen, wichtig ist, dass Sie später alles korrigieren können. Das Hinzufügen einer englischen Version der Website mit dieser Kodierung wird viel einfacher sein. Es muss nichts repariert werden.

Die Entscheidung liegt bei Ihnen. Abonnieren Sie den Newsletter, um schnellstmöglich zu erfahren, wo Sie lernen können, um die Fehler anderer nicht zu wiederholen, und welche Blogger mehr Besucher bekommen.

Wir sehen uns wieder und viel Glück bei Ihren Bemühungen.

1. Wir haben eine Datei: Myfile.html.
2. Sie müssen es in der Kodierung Unicode -> UTF-8 speichern. Lösung 1.

Öffnen Sie Myfile.html in einem Texteditor Notizbuch.
Wählen Sie „Speichern unter...“.
Wählen Sie UTF-8-Kodierung.
Klicken Sie auf die Schaltfläche - Speichern.

Lösung 2.

Öffnen Sie Myfile.html in einem Texteditor Notepad++(es gibt auch einen PSPad-Editor)
Menü -> Kodierungen.
Hier sehen wir (Notepad++ bestimmt sich selbst) die Kodierung der von uns geöffneten Datei.
Wählen Ohne Stückliste in UTF-8 konvertieren(BOM – Byte Order Mark).
(Codiroaka „UTF-8 ohne BOM“ wird bevorzugt und unterscheidet sich von nur „UTF-8“).
Menü -> Datei -> Speichern.

Erkennung der Browser-Kodierung

Wir selbst teilen dem Browser mit, welche Kodierung für diese HTML-Datei eingestellt ist.
Dies geschieht mithilfe des META-Tags 1) Das obige Beispiel weist den Browser an, dass die heruntergeladene HTML-Datei in der UTF-8-Kodierung gespeichert wird. Wenn die HTML-Datei in Windows-1251-Kodierung gespeichert ist, dann: 2) Wichtig!
Beim Transkodieren von Dateien Vergiss nicht, dich zu ändern Anweisungen im META-Tag müssen relevant sein.
Wenn im META-Tag eine Kodierung angegeben ist und die Datei in einer anderen Kodierung gespeichert wird, wird auf dem Bildschirm „Kauderwelsch“ angezeigt.

3) Wenn Das META-Tag enthält die erforderliche Codierung, die Site zeigt jedoch weiterhin „abracadabra“ an. Anschließend müssen Sie die Site-Einstellungen auf dem Hosting (Webserver) überprüfen.
Normalerweise ist beim Hosting die Kodierung in den Site-Einstellungen auf utf-8 eingestellt.
Wenn in den Hosting-Einstellungen die Kodierung Windows-1251 angegeben ist, müssen Sie die Einstellung auf utf-8 ändern.

Später ASCII wurde erweitert (ursprünglich wurden nicht alle 8 Bits verwendet), so dass es möglich wurde, nicht 128, sondern 256 (2 hoch 8) verschiedene Zeichen zu verwenden, die in einem Informationsbyte kodiert werden können.
Diese Verbesserung ermöglichte eine Erweiterung der Kodierung ASCII Symbole der Nationalsprachen verschiedener Länder, zusätzlich zum bereits vorhandenen lateinischen Alphabet.
Erweiterte Kodierungsoptionen ASCII Davon gibt es viele, da es auf der Welt auch viele Sprachen gibt. Ich denke, dass viele von Ihnen von einer Kodierung wie KOI8 (Code of Information Exchange, 8 Bits) gehört haben – auch dies ist eine erweiterte Kodierung ASCII. KOI8 umfasste Zahlen, Buchstaben des lateinischen und russischen Alphabets sowie Satzzeichen, Sonderzeichen und Pseudografiken.

ISO-Kodierung

Die International Standards Organization hat eine Reihe von Kodierungen für verschiedene Alphabete/Sprachen erstellt.

Kodierungen der ISO 8859-Serie

Codierung	Beschreibung
ISO 8859-1 (Latin-1)	Erweitertes Latein, einschließlich Zeichen aus den meisten westeuropäischen Sprachen (Englisch, Dänisch, Irisch, Isländisch, Spanisch, Italienisch, Deutsch, Norwegisch, Portugiesisch, Rätoromanisch, Färöisch, Schwedisch, Schottisch-Gälisch und Teilen des Niederländischen, Finnischen, Französischen), as sowie einige osteuropäische (Albanisch) und afrikanische Sprachen (Afrikaans, Swahili). In Latin-1 fehlen das Eurozeichen und der Großbuchstabe Ÿ. Diese Codepage gilt als Standardkodierung für HTML-Dokumente und E-Mail-Nachrichten. Auch die ersten 256 Unicode-Zeichen entsprechen dieser Codepage.
ISO 8859-2 (Latin-2)	Erweitertes Latein, einschließlich Zeichen aus mittel- und osteuropäischen Sprachen (Bosnisch, Ungarisch, Polnisch, Slowakisch, Slowenisch, Kroatisch, Tschechisch). Bei Latin-2 fehlt wie bei Latin-1 das Euro-Zeichen.
ISO 8859-3 (Latin-3)	Erweitertes Latein, einschließlich Zeichen aus südeuropäischen Sprachen (Maltesisch, Türkisch und Esperanto).
ISO 8859-4 (Latin-4)	Erweitertes Latein, einschließlich Zeichen aus nordeuropäischen Sprachen (Grönländisch, Estnisch, Lettisch, Litauisch und Sami).
ISO 8859-5 (Latein/Kyrillisch)	Kyrillisch, einschließlich Zeichen aus slawischen Sprachen (Weißrussisch, Bulgarisch, Mazedonisch, Russisch, Serbisch und teilweise Ukrainisch).
ISO 8859-6 (Latein/Arabisch)	Auf Arabisch verwendete Symbole. Zeichen aus anderen auf Arabisch basierenden Sprachen werden nicht unterstützt. Für die korrekte Anzeige von ISO 8859-6-Text ist Unterstützung für bidirektionales Schreiben und kontextsensitive Zeichenformen erforderlich.
ISO 8859-7 (Latein/Griechisch)	Symbole der modernen griechischen Sprache. Kann auch zum Schreiben altgriechischer Texte in monotoner Rechtschreibung verwendet werden.
ISO 8859-8 (Latein/Hebräisch)	Symbole des modernen Hebräisch. Es wird in zwei Versionen verwendet: mit einer logischen Reihenfolge der Zeichen (erfordert Unterstützung für bidirektionales Schreiben) und mit einer visuellen Reihenfolge der Zeichen.
ISO 8859-9 (Latin-5)	Eine Variante von Latin-1, die selten verwendete isländische Zeichen durch türkische ersetzt. Wird für türkische und kurdische Sprachen verwendet.
ISO 8859-10 (Latin-6)	Eine Latin-4-Variante, die besser für skandinavische Sprachen geeignet ist.
ISO 8859-11 (Latein/Thai)	Symbole der thailändischen Sprache.
ISO 8859-13 (Latin-7)	Latein-4-Variante, besser geeignet für baltische Sprachen.
ISO 8859-14 (Latin-8)	Eine erweiterte lateinische Schrift, die Zeichen aus keltischen Sprachen wie Schottisch-Gälisch und Bretonisch enthält.
ISO 8859-15 (Latin-9)	Eine Variante von Latin-1, die selten verwendete Zeichen durch solche ersetzt, die zur vollständigen Unterstützung von Finnisch, Französisch und Estnisch erforderlich sind. Darüber hinaus wurde Latin-9 um das Euro-Zeichen erweitert.
ISO 8859-16 (Latein-10)	Erweitertes Latein, einschließlich Zeichen aus südeuropäischen und osteuropäischen Sprachen (Albanisch, Ungarisch, Italienisch, Polnisch, Rumänisch, Slowenisch, Kroatisch) sowie einigen westeuropäischen Sprachen (Irisch in der neuen Schreibweise, Deutsch, Finnisch, Französisch). Wie Latin-9 fügte auch Latin-10 das Euro-Zeichen hinzu.

Für Dokumente in Englisch und den meisten anderen westeuropäischen Sprachen wird die Kodierung weitgehend unterstützt ISO-8859-1.

In HTML ISO-8859-1 ist die Standardkodierung (in XHTML und HTML5 ist die Standardkodierung UTF-8).
Wenn Sie eine andere Seitenkodierung als ISO-8859-1 verwenden, müssen Sie dies im Tag angeben .

Für HTML4:

Für HTML5:

Ein Beispiel für die ANSI-Kodierung ist die bekannte Windows-1251.

Windows-1251 unterscheidet sich positiv von anderen 8-Bit-Kyrillisch-Kodierungen (wie CP866 und ISO 8859-5) durch das Vorhandensein fast aller Zeichen, die in der russischen Typografie für Klartext verwendet werden (nur das Akzentzeichen fehlt). Es enthält auch alle Symbole für andere slawische Sprachen: Ukrainisch, Weißrussisch, Serbisch, Mazedonisch und Bulgarisch.
Unten sind die Dezimalwerte der Kodierungszeichen aufgeführt Windows-1251.

Um Tabellensymbole in einem HTML-Dokument anzuzeigen, verwenden Sie die folgende Syntax:

& + Code + ;

Windows-Kodierung-1251 (CP1251)

	.0	.1	.2	.3	.4	.5	.6	.7	.8	.9	.A	.B	.C	.D	.E	.F
8.	Ђ 402	Ѓ 403	‚ 201A	ѓ 453	„ 201E	… 2026	† 2020	‡ 2021	€ 20 n. Chr	‰ 2030	Љ 409	‹ 2039	Њ 40A	Ќ 40 °C	Ћ 40B	Џ 40F
9.	ђ 452	‘ 2018	’ 2019	“ 201C	” 201D	2022	– 2013	- 2014		™ 2122	љ 459	› 203A	њ 45A	ќ 45°C	ћ 45B	џ 45F
A.	A0	Ў 40E	ў 45E	Ј 408	¤ A4	Ґ 490	¦ A6	§ A7	Yo 401	© A9	Є 404	« AB	¬ A.C.	ANZEIGE	® A.E.	Ї 407
B.	° B0	± B1	І 406	і 456	ґ 491	µ B5	¶ B6	· B7	e 451	№ 2116	є 454	» BB	ј 458	Ѕ 405	ѕ 455	ї 457
C.	A 410	B 411	IN 412	G 413	D 414	E 415	UND 416	Z 417	UND 418	Y 419	ZU 41A	L 41B	M 41C	N 41D	UM 41E	P 41F
D.	R 420	MIT 421	T 422	U 423	F 424	X 425	C 426	H 427	Sch 428	SCH 429	Kommersant 42A	Y 42B	B 42C	E 42D	YU 42E	ICH 42F
E.	A 430	B 431	V 432	G 433	D 434	e 435	Und 436	H 437	Und 438	Th 439	Zu 43A	l 43B	M 43C	N 43D	Ö 43E	P 43F
F.	R 440	Mit 441	T 442	bei 443	F 444	X 445	ts 446	H 447	w 448	sch 449	ъ 44A	S 44B	B 44C	äh 44D	Yu 44E	ICH 44F

UNICODE-Standardkodierungen

Unicode ist ein Zeichenkodierungsstandard, mit dem Sie die Zeichen fast aller Schriftsprachen der Welt sowie Sonderzeichen darstellen können. In Unicode dargestellte Zeichen werden als vorzeichenlose Ganzzahlen codiert. Unicode bietet verschiedene Formen der Zeichendarstellung auf einem Computer: UTF-8, UTF-16 (UTF-16BE, UTF-16LE) und UTF-32 (UTF-32BE, UTF-32LE). (Englisch: Unicode-Transformationsformat – UTF).
UTF-8 ist eine derzeit gängige Kodierung, die in Betriebssystemen und im Web weit verbreitet ist. Text, der aus Unicode-Zeichen mit einer Nummer kleiner als 128 besteht (Codebereich U+0000 bis U+007F), enthält festgelegte Zeichen ASCII mit den entsprechenden Codes. Als nächstes folgen Bereiche mit Zeichen verschiedener Schriftarten, Satzzeichen und technischen Symbolen. Für kyrillische Zeichen sind Zeichenbereiche mit Codes von U+0400 bis U+052F, von U+2DE0 bis U+2DFF, von U+A640 bis U+A69F reserviert.

Codierung UTF-8 ist universell und verfügt über eine beeindruckende Zukunftsreserve. Dies macht es zur bequemsten Kodierung für die Verwendung im Internet.

Bitte aktivieren Sie JavaScript, um das anzuzeigen