Scurtă introducere în codarea adreselor URL

Adresa URL a unui site web, cunoscută și sub denumirea de "adresa site-ului web", este ceea ce cineva ar intra într-un browser web pentru a accesa un anumit site web. Când transmiteți informații printr-o adresă URL, trebuie să vă asigurați că utilizează numai anumite caractere admise. Aceste caractere permise includ caractere alfabetice, cifre și câteva caractere speciale care au semnificație în șirul de adrese URL. Orice alte caractere care trebuie adăugate la o adresă URL trebuie codificate astfel încât să nu provoace probleme în timpul călătoriei browserului pentru a găsi paginile și resursele pe care le căutați.

Codarea unei adrese URL

Cel mai frecvent codificat caracter din șirul de adrese URL este caracterul . Veți vedea acest personaj ori de câte ori vedeți un semn plus (+) într-o adresă URL. Aceasta reprezintă caracterul spațial. Semnul plus acționează ca un caracter special reprezentând acel spațiu într-o adresă URL. Cea mai obișnuită metodă pe care o veți vedea este într-un link mail care include un subiect. Dacă doriți ca subiectul să aibă spații în el, le puteți codifica drept pluse:

mailto: subiectul e-mailului = acest lucru este + + + meu subiect

Acest bit de text de codificare ar transmite un subiect de "acesta este subiectul meu". Caracterul "+" din codificare va fi înlocuit cu un spațiu atunci când este redat în browser.

Pentru a codifica o adresă URL, pur și simplu înlocuiți caracterele speciale cu șirul lor de codificare. Acest lucru va începe aproape întotdeauna cu un caracter%.

Codarea unei adrese URL

În mod strict, trebuie să codificați întotdeauna orice caractere speciale găsite într-o adresă URL. O notă importantă, în cazul în care vă simțiți puțin intimidată de toată această discuție sau de codificare, este că, în general, nu veți găsi niciun caracter special într-o adresă URL în afara contextului său normal, cu excepția formularului de date.

Cele mai multe adrese URL utilizează caracterele simple care sunt întotdeauna permise, astfel încât nu este necesară nicio codificare.

Dacă trimiteți date către scripturile CGI utilizând metoda GET, trebuie să codificați datele așa cum va fi trimisă prin URL. De exemplu, dacă scrieți un link pentru a promova un feed RSS , URL-ul dvs. va trebui codificat pentru a adăuga la adresa URL a acestuia pe care o promovați.

Ce ar trebui să fie codificat?

Orice caracter care nu este un caracter alfabetic, un număr sau un caracter special care este folosit în afara contextului său normal va trebui să fie codificat în pagina dvs. Mai jos este un tabel de caractere comune care ar putea fi găsite într-un URL și codarea lor.

Caracterele URL rezervate

Caracter Scop în URL Codare
: Protocol separat (http) de la adresa % 3B
/ Se separă domeniul și directoarele % 2F
# Ancore separate 23%
? Șir de interogare separat % 3F
& Separați elementele de interogare % 24
@ Se separă numele de utilizator și parola din domeniu % 40
% Indică un caracter codificat % 25
+ Indică un spațiu % 2B
Nu este recomandat în adresele URL % 20 sau +

Rețineți că aceste exemple codificate diferă de cele pe care le găsiți cu caractere speciale HTML . De exemplu, dacă trebuie să codificați o adresă URL cu un caracter ampersand (&), ați folosi% 24, ceea ce este prezentat în tabelul de mai sus. Dacă ați scris HTML și ați vrut să adăugați un ampersand la text, nu ați putut folosi% 24. În schimb, ați utiliza fie "& amp;"; sau "& # 38;", ambele care ar scrie "în pagina HTML atunci când sunt redate. Acest lucru poate părea la început confuz, dar este în principiu diferența dintre textul care apare pe pagina însăși, care face parte din codul HTML, și șirul de adrese URL, care este o entitate separată și, prin urmare, este supusă unor reguli diferite.

Faptul că personajul "&", precum și multe alte personaje, pot apărea în fiecare dintre ele nu ar trebui să vă confunde diferențele dintre cele două.

Articolul original de Jennifer Krynin. Editat de Jeremy Girard.