Tag Meta Charset dalam HTML5

Menetapkan Pengekodan Watak dalam HTML5

Sebelum pengenalan HTML5, menetapkan pengekodan aksara pada dokumen dengan elemen yang diperlukan untuk menulis garis yang agak kasar di bawah. Ini adalah elemen Meta Charset jika anda menggunakan HTML4 di laman web anda:

Apa yang penting untuk diperhatikan dalam codeare ini tanda petikan yang anda lihat di sekitar atribut kandungan : content = " text / html; charset = iso-8859-1 " . Seperti semua atribut HTML, tanda petikan ini menentukan nilai atribut, menunjukkan bahawa keseluruhan teks rentetan / html; charset = iso-8959-1 adalah kandungan elemen ini.Ini adalah HTML yang betul dan ia adalah bagaimana string ini dimaksudkan untuk ditulis. Ia juga panjang dan hodoh! Ia juga bukan sesuatu yang anda mungkin ingat dari bahagian atas kepala anda! Dalam kebanyakan kes, pemaju web perlu menyalin dan menyisipkan kod ini dari satu laman web ke mana-mana yang baru yang mereka usahakan kerana menulis ini dari awal adalah banyak bertanya.

HTML5 Memotong Out & # 34; Stuff & # 34;

HTML5 bukan sahaja menambah beberapa elemen baru kepada bahasa itu, tetapi ia juga memudahkan banyak sintaks HTML, termasuk unsur Meta Charset. Dengan HTML5, anda boleh menambah pengekodan aksara anda dengan lebih mudah untuk mengingati sintaks untuk elemen META yang anda lihat di bawah:

Bandingkan sintaks yang dipermudahkan kepada apa yang kami tulis pada awal artikel ini, sintaks lama yang digunakan untuk HTML4, dan anda akan melihat betapa mudahnya menulis dan mengingat versi HTML5 sebenarnya. Daripada perlu untuk menyalin dan menampal ini dari tapak yang sedia ada ke mana-mana yang baru anda kerjakan, ini benar-benar sesuatu yang, sebagai pemaju web front-end, anda boleh ingat. Penjimatan masa ini banyak yang tidak banyak, tetapi apabila anda mempertimbangkan kawasan sintaks yang lain yang HTML5 dipermudahkan, penjimatan itu menambah!

Sentiasa Sertakan Pengekodan Watak

Anda harus sentiasa menyertakan pengekodan aksara untuk halaman web anda, walaupun anda tidak pernah bermaksud menggunakan sebarang aksara khas . Jika anda tidak memasukkan pengekodan aksara, tapak anda menjadi rentan terhadap serangan skrip tapak silang menggunakan UTF-7.

Dalam senario ini, anattacker melihat bahawa laman web anda tidak mempunyai pengekodan aksara yang ditakrifkan, jadi ia menipu penyemak imbas memikirkan bahawa pengekodan watak halaman sebenarnya UTF-7. Seterusnya, penyerang menyuntik skrip yang disandikan UTF-7 ke laman web dan tapak anda digodam.Ini jelas bermasalah untuk semua orang yang terlibat, dari syarikat anda kepada pelawat anda. Berita baiknya adalah bahawa ia adalah masalah mudah untuk dielakkan - hanya pastikan anda menambah pengekodan aksara ke semua halaman web anda.

Di mana Tambah Pengekodan Watak

Pengekodan watak untuk laman web harus menjadi baris pertama elemen HTML anda. Ini memastikan bahawa penyemak imbas mengetahui apa yang pengekodan watak itu sebelum ia melakukan apa-apa lagi di halaman selain untuk menentukan doktom dan mengenal pasti bahawa ia adalah Halaman HTML. HTML anda harus dibaca:

...

Menggunakan Pengepala HTTP untuk Keselamatan Tambahan

Anda juga boleh menentukan pengekodan aksara dalam tajuk HTTP. Ini lebih selamat daripada menambahkannya ke halaman HTML, tetapi anda perlu mempunyai akses kepada konfigurasi pelayan atau fail .htaccess, yang bermaksud anda mungkin perlu bekerja dengan penyedia hosting laman web anda untuk mendapatkan akses semacam ini atau memilikinya perubahan untuk anda. Akses adalah benar-benar cabaran di sini. Perubahan itu sendiri adalah mudah, jadi mana-mana penyedia hosting harus dapat membuat perubahan ini untuk anda dengan mudah.

Jika anda menggunakanApache, anda boleh menetapkan set aksara lalai untuk keseluruhan laman anda dengan menambah: AddDefaultCharset UTF-8 ke fail .htaccess root anda. Set aksara lalai Apache adalah ISO-8859-1 .