Cách xử lý ký tự đặc biệt trong html

Nội dung này đã được lưu trữ và không còn được duy trì bởi Đại học Indiana. Thông tin ở đây có thể không còn chính xác và các liên kết có thể không còn khả dụng hoặc đáng tin cậy

Để sử dụng các ký tự đặc biệt như âm sắc ( ö ) hoặc dấu ngã ( ñ ), bạn cần sử dụng một chuỗi thoát và mã thích hợp cho ký tự. Trong HTML chuỗi thoát bắt đầu bằng dấu và ( & ) và kết thúc bằng dấu chấm phẩy ( ; ).

Ví dụ: để tạo một chữ thường o có âm sắc, bạn phải nhập

  ö

Bạn cũng có thể sử dụng mã ASCII cho ký tự. Trong trường hợp này, bạn sẽ nhập.

  ö

Các ký tự đặc biệt cũng cho phép bạn hiển thị các ví dụ về thẻ HTML trên trang web. Đối với các dấu ngoặc nhọn bao quanh các thẻ, hãy nhập

Trong HTML, XHTML hoặc XML, bạn có thể sử dụng ký tự thoát để biểu thị bất kỳ ký tự Unicode nào chỉ bằng các chữ cái ASCII. Thoát ký tự được sử dụng trong đánh dấu bao gồm tham chiếu ký tự số (NCR) và tham chiếu ký tự được đặt tên.  

Tham chiếu ký tự số ở định dạng thập lục phân. Số hex không phân biệt chữ hoa chữ thường và tất cả các tham chiếu ký tự số đều bắt đầu bằng &# và kết thúc bằng ;

Các trường hợp thoát hiểm hữu ích

Các dấu thoát rất hữu ích để biểu diễn các ký tự không rõ ràng hoặc mơ hồ.  

Các tham chiếu ký tự số hoặc ký tự được đặt tên, cũng như các ký tự thoát CSS, có thể được sử dụng để biểu thị các ký tự trong thuộc tính kiểu HTML. Phần tử kiểu HTML không được chứa các tham chiếu ký tự số hoặc ký tự được đặt tên. Điều tương tự cũng xảy ra với một biểu định kiểu bên ngoài.  

Những trường hợp thoát hiểm không nên sử dụng

Bạn phải luôn cố gắng sử dụng một mã hóa cho phép bạn thể hiện các ký tự ở dạng tự nhiên của chúng.  

Nếu các thực thể được xác định bên ngoài tài liệu của bạn và các công cụ xử lý XML không truy cập được các tệp bên ngoài, thì việc sử dụng các ký tự được đặt tên có thể trở nên rắc rối. Các ký tự sẽ không được sử dụng để thay thế các tham chiếu thực thể trong những trường hợp như vậy

Do đó, nếu bạn cần sử dụng các lối thoát trong quá trình phát triển web, sẽ an toàn hơn khi sử dụng các tham chiếu ký tự số

Ký tự thoát HTML

Trong bảng bên dưới, bạn có thể tìm thấy danh sách đầy đủ các ký tự thoát HTML hữu ích nhất. Hãy cho chúng tôi biết nếu bạn sử dụng thứ gì đó mà chúng tôi không đề cập để chúng tôi có thể cập nhật danh sách của mình

if your goal is just to protect your page from Cross Site Scripting (XSS) attack, or just to show HTML tags on a web page (showing on the page, for example), then using htmlspecialchars() is good enough and better than using htmlentities().  A minor point is htmlspecialchars() is faster than htmlentities().  A more important point is, when we use  htmlspecialchars($s) in our code, it is automatically compatible with UTF-8 string.  Otherwise, if we use htmlentities($s), and there happens to be foreign characters in the string $s in UTF-8 encoding, then htmlentities() is going to mess it up, as it modifies the byte 0x80 to 0xFF in the string to entities like é.  (unless you specifically provide a second argument and a third argument to htmlentities(), with the third argument being "UTF-8").

The reason htmlspecialchars($s) already works with UTF-8 string is that, it changes bytes that are in the range 0x00 to 0x7F to < etc, while leaving bytes in the range 0x80 to 0xFF unchanged.  We may wonder whether htmlspecialchars() may accidentally change any byte in a 2 to 4 byte UTF-8 character to < etc.  The answer is, it won't.  When a UTF-8 character is 2 to 4 bytes long, all the bytes in this character is in the 0x80 to 0xFF range. None can be in the 0x00 to 0x7F range.  When a UTF-8 character is 1 byte long, it is just the same as ASCII, which is 7 bit, from 0x00 to 0x7F.  As a result, when a UTF-8 character is 1 byte long, htmlspecialchars($s) will do its job, and when the UTF-8 character is 2 to 4 bytes long, htmlspecialchars($s) will just pass those bytes unchanged.  So htmlspecialchars($s) will do the same job no matter whether $s is in ASCII, ISO-8859-1 (Latin-1), or UTF-8.

Một số ký tự được dành riêng trong HTML và chúng có ý nghĩa đặc biệt khi được sử dụng trong tài liệu HTML. Ví dụ: bạn không thể sử dụng dấu lớn hơn và nhỏ hơn hoặc dấu ngoặc nhọn trong văn bản HTML của mình vì trình duyệt sẽ xử lý chúng theo cách khác và sẽ cố gắng rút ra ý nghĩa liên quan đến thẻ HTML

Bộ xử lý HTML phải hỗ trợ năm ký tự đặc biệt sau được liệt kê trong bảng sau

Ký hiệu
Mô tả
Tên đối tượng
Mã số
 "
dấu ngoặc kép<
""'apostrophe
''
&
ampersand
&&
<
less-than
<<
>
greater-than
>>

Cách xử lý ký tự đặc biệt trong html


Cách xử lý ký tự đặc biệt trong html

HTML có hỗ trợ các ký tự đặc biệt không?

Các ký tự đặc biệt HTML có thể được nhập trực tiếp vào tài liệu HTML, nhưng việc hiển thị và diễn giải chính xác của chúng không được đảm bảo và sẽ phụ thuộc vào mã hóa ký tự được sử dụng bởi tài liệu HTML. Điều này thường được thực hiện với bàn phím có các chữ cái có dấu, chẳng hạn

Làm cách nào để thêm các ký tự đặc biệt vào tài liệu HTML?

Để thêm các ký hiệu như vậy vào trang HTML, bạn có thể sử dụng tên thực thể hoặc số thực thể (tham chiếu thập phân hoặc thập lục phân) cho ký hiệu.

Bạn chỉ định các ký hiệu ∨ và ∧ trong HTML như thế nào?

Chọn mã toán học của bạn

một trong HTML là gì?