Tag Meta Charset în HTML5

Setarea codificării de caractere în HTML5

Înainte de introducerea HTML5, setarea codificării caracterelor pe un document cu elementrequiredyou pentru a scrie linia oarecum verbose văzută mai jos. Acestea sunt elementele Meta Charset dacă utilizați HTML4 în pagina Web:

Ce este important să observați în acest cod sunt ghilimele pe care le vedeți în jurul atributului content : content = " text / html; charset = iso-8859-1 " . Ca toate atributele HTML, aceste ghilimele definesc valoarea atributului, indicând faptul că întregul text / html; charset = iso-8959-1 este conținutul acestui element.Acest lucru este corect HTML și este modul în care acest șir a fost menit să fie scris. Este, de asemenea, greu lung și urât! De asemenea, nu este ceva ce îți vei aminti probabil de pe capul tău! În majoritatea cazurilor, dezvoltatorii web ar trebui să copieze și să lipsească acest cod de pe un site în oricare altul nou pe care îl dezvoltau, deoarece scrierea de la zero a cerut foarte mult.

HTML5 taie materialele extra & # 34;

HTML5 nu numai că a adăugat o serie de elemente noi în limbaj, dar a simplificat și mult sintaxa HTML, inclusiv elementul Meta Charset. Cu HTML5, puteți adăuga codificarea caracterului cu sintaxa mult mai ușor de memorat pentru elementul META care vedeți mai jos:

Comparați această sintaxă simplificată cu ceea ce am scris la începutul acestui articol, vechea sintaxă folosită pentru HTML4 și veți vedea cât de mult este mai ușor să scrieți și să vă amintiți în realitate versiunea HTML5. În loc să aveți nevoie să copiați și să lipiți acest lucru dintr-un site existent în oricare altul pe care lucrați, este absolut ceva care, ca dezvoltator de web front-end, vă puteți aminti. Această economie de timp nu este mult, dar când vă gândiți la celelalte zone de sintaxă pe care HTML5 le-a simplificat, economiile nu se adaugă!

Includeți întotdeauna codificarea caracterelor

Ar trebui să includeți întotdeauna codificarea caracterelor pentru paginile dvs. web, chiar dacă nu ați intenționat vreodată să introduceți caractere speciale . Dacă nu includeți codificarea de caractere, site-ul dvs. devine vulnerabil la un atac de scripting pe site-uri care utilizează UTF-7.

În acest scenariu, anattacker vede că site-ul tău nu are codificare de caractere definită, așa că înșelă browserul să creadă că codificarea caracterului paginii este de fapt UTF-7. Apoi, atacatorul injectează scripturi codate UTF-7 în pagina web și site-ul dvs. este hacked.This este evident problematic pentru toți cei implicați, de la compania dvs. la vizitatorii dvs. Vestea bună este că este o problemă simplă de evitat - nu uitați să adăugați codificare de caractere pentru toate paginile dvs. web.

Unde se adaugă codificarea caracterelor

Codificarea caracterelor pentru o pagină Web ar trebui să fie prima linie a elementului al HTML-ului dvs. Acest lucru asigură că browser-ul știe ce codificare de caractere este înainte de a face altceva în altă pagină decât să determine modelul doctype și să identifice că este Pagina HTML. HTML-ul dvs. ar trebui să citească:

...

Utilizarea anteturilor HTTP pentru securitate suplimentară

De asemenea, puteți specifica codificarea caracterelor în antetele HTTP. Acest lucru este chiar mai sigur decât adăugarea acestuia la pagina HTML, însă ați avea nevoie de acces la configurațiile serverului sau la fișierele .htaccess, ceea ce înseamnă că este posibil să aveți nevoie să lucrați cu furnizorul de servicii de găzduire a site-ului dvs. pentru a obține acest tip de acces sau a le face schimbările pentru dvs. Accesul este într-adevăr provocarea aici. Schimbarea în sine este simplă, astfel încât orice furnizor de hosting ar trebui să poată face această schimbare pentru dvs. cu ușurință.

Dacă folosițiApache, puteți seta setul de caractere implicit pentru întregul site adăugând: AddDefaultCharset UTF-8 la fișierul dvs. root .htaccess . Aparatul implicit al setului Apache este ISO-8859-1 .