Pengenalan ringkas ke pengekodan URL

URL laman web, yang juga dikenali sebagai "alamat laman web", adalah seseorang yang masuk ke dalam pelayar web untuk mengakses laman web tertentu. Apabila anda menyampaikan maklumat melalui URL, anda perlu memastikan ia hanya menggunakan aksara tertentu yang dibenarkan. Watak-watak yang dibenarkan ini termasuk aksara abjad, angka, dan beberapa aksara khas yang mempunyai makna dalam rentetan URL. Mana-mana watak lain yang perlu ditambah ke URL hendaklah dikodkan supaya mereka tidak menimbulkan masalah semasa perjalanan penyemak imbas untuk mencari halaman dan sumber yang anda cari.

Mengekodkan URL

Watak yang paling dikodkan dalam rentetan URL ialah watak . Anda melihat watak ini apabila anda melihat tanda tambah (+) dalam URL. Ini mewakili watak ruang. Tanda tambah bertindak sebagai watak istimewa yang mewakili ruang dalam URL. Cara yang paling biasa anda lihat ialah pautan MU yang merangkumi subjek. Sekiranya anda ingin subjek mempunyai ruang di dalamnya, anda boleh menyandikannya sebagai tambah:

mailto: email? subject = this + is + my + subject

Teks penyandian ini akan menghantar subjek "ini adalah subjek saya". Watak "+" dalam pengekodan akan digantikan dengan sebenar apabila ia dipaparkan dalam penyemak imbas.

Untuk mengekod URL, anda hanya menggantikan aksara khas dengan rentetan pengekodannya. Ini hampir selalu bermula dengan aksara%.

Mengekodkan URL

Sebenarnya, anda harus selalu mengekod mana-mana aksara khas yang terdapat dalam URL. Satu nota penting, sekiranya anda merasa sedikit terancam dengan semua perbualan atau pengekodan ini, anda biasanya tidak akan menemui apa-apa aksara khas dalam URL di luar konteks biasa mereka kecuali dengan data bentuk.

Kebanyakan URL menggunakan aksara mudah yang selalu dibenarkan, jadi tiada pengekodan diperlukan sama sekali.

Jika anda menyerahkan data ke skrip CGI menggunakan kaedah GET, anda harus mengodkan data kerana ia akan dihantar melalui URL. Sebagai contoh, jika anda menulis pautan untuk mempromosikan suapan RSS , URL anda perlu dikodkan untuk ditambahkan ke URL skrip yang anda promosikan.

Apa yang perlu dikodkan?

Mana-mana watak yang bukan watak abjad, nombor, atau watak istimewa yang digunakan di luar konteks biasa akan perlu dikodkan di halaman anda. Berikut ialah jadual aksara biasa yang boleh didapati di URL dan pengekodannya.

Pengekodan URL Karakter Tempatan

Watak Tujuan dalam URL Pengekodan
: Protokol berasingan (http) dari alamat % 3B
/ Domain dan direktori berasingan % 2F
# Berlabuh berasingan % 23
? Rentetan query berasingan % 3F
& Elemen pertanyaan berasingan % 24
@ Nama pengguna dan kata laluan berasingan dari domain % 40
% Menunjukkan watak yang dikodkan % 25
+ Menunjukkan ruang % 2B
Tidak disyorkan dalam URL % 20 atau +

Ambil perhatian bahawa contoh-contoh yang dikodkan ini berbeza daripada apa yang anda dapati dengan aksara khas HTML . Sebagai contoh, jika anda perlu menyandikan URL dengan aksara ampersand (&), anda akan menggunakan% 24, iaitu apa yang ditunjukkan dalam jadual di atas. Sekiranya anda sedang menulis HTML dan anda mahu menambahkan ampersand ke teks, anda tidak dapat menggunakan% 24. Sebaliknya, anda akan menggunakan sama ada "& amp;"; atau "& # 38;", keduanya akan menulis & dalam halaman HTML apabila diberikan. Ini mungkin kelihatan mengelirukan pada mulanya, tetapi pada asasnya adalah perbezaan antara teks yang muncul di halaman itu sendiri, yang merupakan sebahagian daripada kod HTML, dan rentetan URL, yang merupakan entiti yang berasingan dan oleh itu tertakluk kepada peraturan yang berlainan.

Hakikat bahawa watak "&", serta banyak karakter lain, boleh muncul dalam setiap tidak boleh mengelirukan anda untuk perbezaan antara kedua-dua.

Artikel asal oleh Jennifer Krynin. Diedit oleh Jeremy Girard.