Làm thế nào để bạn xử lý dấu ngoặc kép trong html?

Chúng tôi đang trong quá trình nâng cấp lên San Diego, nhận thấy rằng các dấu ngoặc kép (") được sử dụng trong các biến mục danh mục của chúng tôi (văn bản trợ giúp và hướng dẫn) đang hiển thị mã html " thay vì "

Đây có phải là sự cố SD không?

Hiển thị

Làm thế nào để bạn xử lý dấu ngoặc kép trong html?

thay vì

Làm thế nào để bạn xử lý dấu ngoặc kép trong html?

Cảm ơn

Chuỗi trích dẫn kép bắt đầu đơn giản, sau đó trở nên phức tạp hơn một chút so với chuỗi trích dẫn đơn. Với chuỗi trích dẫn kép, bạn có thể sử dụng dấu gạch chéo ngược để thêm một số ký tự đặc biệt vào chuỗi của mình. Chương 3 sẽ đề cập đến cách tương tác giữa chuỗi trích dẫn kép và biến

Chuỗi trích dẫn kép cơ bản là một chuỗi các ký tự được bao quanh bởi dấu ngoặc kép. Nếu bạn cần sử dụng dấu ngoặc kép bên trong chuỗi, bạn có thể sử dụng ký tự dấu gạch chéo ngược

Chữ này tương tự như chữ bạn đã thấy. Chỉ là các trích dẫn là khác nhau. Một nghĩa đen khác sử dụng dấu ngoặc kép bên trong chuỗi được trích dẫn kép

"David said, \"It is fun to learn Perl.\""

Lưu ý cách sử dụng dấu gạch chéo ngược ở dòng thứ hai để thoát khỏi các ký tự trích dẫn kép. Và trích dẫn đơn có thể được sử dụng mà không có dấu gạch chéo ngược

Một điểm khác biệt chính giữa chuỗi trích dẫn kép và trích dẫn đơn là chuỗi trích dẫn kép có một số trình tự thoát đặc biệt có thể được sử dụng. Chuỗi thoát biểu thị các ký tự không dễ nhập bằng bàn phím hoặc khó nhìn thấy bên trong cửa sổ soạn thảo. Sau đây là tất cả các chuỗi thoát mà Perl hiểu được đưa ra trong Bảng 2. 1

ban 2. 1. Perl Escape SequencesEscape SequencesDescription or Character\bBackspace\eEscape\fForm Feed\nNewline\rCarriage Return\tTab\vVertical Tab\$Dollar Sign\@Ampersand\0nnnAny Octal byte\xnnAny Hexadecimal byte\cnAny Control character\lChange the next character to lowercase\uChange the next character to uppercase\LChange the following characters tolowercase until a \Esequence is encountered. Lưu ý rằng bạn cần sử dụng chữ hoa E ở đây, chữ thường sẽ không hoạt động. \QTrích dẫn siêu ký tự dưới dạng chữ. \UĐổi các ký tự sau thành chữ hoa cho đến khi gặp chuỗi \Esequence. Lưu ý rằng bạn cần sử dụng chữ hoa Ở đâu, chữ thường sẽ không hoạt động. \EChấm dứt chuỗi \L, \Q hoặc \U. Lưu ý rằng bạn cần sử dụng chữ hoa E ở đây, chữ thường sẽ không hoạt động. \\Dấu gạch chéo ngược

Lưu ý Trong chương tiếp theo, chúng ta sẽ thấy lý do tại sao bạn có thể cần sử dụng dấu gạch chéo ngược khi sử dụng các ký tự $ và @

Các ví dụ sau bảng sẽ minh họa một số trong số họ

"\udave \umarshall is \x35\x years
old."

Nghĩa đen này đại diện cho những điều sau đây. Dave Marshall 35 tuổi

\u được sử dụng hai lần trong từ đầu tiên để viết hoa các ký tự d và m. Và ký hiệu thập lục phân được sử dụng để biểu thị tuổi bằng cách sử dụng mã ASCII cho 3 và 5

"The kettle was \Uhot\E!"

Nghĩa đen này đại diện cho những điều sau đây. Ấm đun nước rất HẤP DẪN. \U viết hoa tất cả các ký tự cho đến khi nhìn thấy chuỗi \E

Một ví dụ cuối cùng

print "Bill of Goods



Bread:\t\$34.45\n";

print "Fruit:\t";

print "\$45.00\n";

print "\t======\n";

print "\t\$79.45\n";

Trên thực tế, ví dụ này không quá khó, nhưng nó liên quan đến việc xem xét nhiều hơn một nghĩa đen cùng một lúc và đã mất vài trang kể từ ví dụ nâng cao cuối cùng của chúng tôi. Hãy xem chuỗi thoát của \t và \n

Chương trình này sử dụng hai phương pháp để ngắt dòng

  • Đầu tiên chỉ đơn giản là bao gồm ngắt dòng trong mã nguồn
  • Thứ hai là sử dụng ký tự \n hoặc dòng mới

Tôi khuyên bạn nên sử dụng ký tự \n để sau này khi xem mã của mình, bạn có thể yên tâm rằng bạn có ý định ngắt dòng chứ không phải chỉ nhấn nhầm phím ENTER

Thận trọng Nếu bạn là lập trình viên C/C++, tài liệu này không mới đối với bạn. Tuy nhiên, chuỗi Perl không giống với chuỗi C/C++ vì chúng không có ký tự NULL kết thúc. Nếu bạn đang nghĩ đến việc chuyển đổi các chương trình C/C++ sang Perl, hãy cẩn thận sửa đổi bất kỳ mã nào dựa trên ký tự NULL để kết thúc một chuỗi

Nếu bạn đang trực tiếp tạo HTML, SGML và XML, có lẽ bằng cách sử dụng trình soạn thảo văn bản hoặc viết chương trình, cách tiếp cận an toàn nhất là sử dụng “tham chiếu ký tự số thập phân” để cuộn các ký tự trích dẫn đơn và kép (các dấu này được gọi là “dấu ngoặc kép thông minh . Nói cách khác, đối với dấu ngoặc kép trái và phải, hãy sử dụng “ và ” - và đối với dấu ngoặc đơn trái và phải (và dấu nháy đơn), hãy sử dụng ‘ và ’ - và bạn sẽ rất vui vì đã làm như vậy. Cách tiếp cận này tuân thủ tất cả các tiêu chuẩn quốc tế và về cơ bản hoạt động ở mọi nơi

Đây là một bảng hiển thị những gì tôi muốn nói

Để hiển thị Trong HTML, SGML hoặc XML, hãy sử dụng Hiển thị trên hệ thống của bạn dưới dạng Dấu ngoặc kép bên trái““Dấu ngoặc kép bên phải””Dấu ngoặc kép bên trái‘‘Dấu ngoặc kép bên phải (bao gồm cả sở hữu từ và từ rút gọn trong tiếng Anh)''

Bằng cách này, văn bản của bạn sẽ trông đẹp mắt trên rất nhiều trình duyệt và người xem, đồng thời bạn có thể dễ dàng cắt và dán các phần dữ liệu giữa các tài liệu HTML, SGML và XML (cho phép bạn tự động truy vấn và tạo tài liệu mới từ tài liệu hiện có

Nếu bạn không muốn làm điều này trực tiếp, hãy sử dụng các công cụ sẽ làm điều đó cho bạn. Nếu bạn đang sử dụng các tệp văn bản ASCII đơn giản, SmartyPants có thể làm việc này cho bạn

Cách thay thế tốt nhất là sử dụng UTF-8. UTF-8 thật tuyệt vời, nhưng các bộ ký tự khác vẫn đang được sử dụng và có thể gây ra sự cố

Có nhiều lợi thế cho khuyến nghị cụ thể này. Đây là các mã hóa chính thức, tiêu chuẩn, trung lập với nhà cung cấp cho các ký tự này theo cả Unicode và ISO-10646, vì vậy bạn không cần lo lắng về việc chúng không hoạt động trong tương lai. Chúng cũng hoạt động trên XML, HTML và SGML, đơn giản hóa việc trích xuất dữ liệu - các lựa chọn thay thế như tham chiếu thực thể ký tự được đặt tên không dễ dàng hoạt động trên XML và HTML (đặc biệt). Các hệ thống có thể hiển thị các dấu ngoặc kép (với phông chữ hiện tại) sẽ làm như vậy và thực tế không có ngoại lệ sẽ quay trở lại các ký tự trung tính (dọc) một cách duyên dáng nếu chúng không thể - ngay cả khi chúng là một trình duyệt hơi cũ. Tôi đã thử nghiệm phương pháp này trên một số phiên bản Internet Explorer, Netscape (4 phiên bản cũ. 5 và 6. X), Mozilla (0. 9. 9 và 1. 0) và lynx (trình duyệt văn bản), trên nhiều hệ thống khác nhau (Windows, Linux, Sun Solaris). Một vấn đề nhỏ là trên một số hệ thống cửa sổ X cũ hơn với phông chữ cũ, dấu ngoặc đơn bên trái có thể được ánh xạ tới một ký tự là ký tự có góc cạnh cho dấu ngoặc đơn bên phải - nhưng nó trông không tệ, các lựa chọn thay thế trông

Không sử dụng các lựa chọn thay thế khác nhau

  • Không sử dụng các tham chiếu thực thể ký tự của HTML được chỉ định cho mục đích này. ", ", ', và '. Các tham chiếu thực thể ký tự sẽ không hoạt động trong SGML hoặc XML nói chung, bởi vì chúng không phải là một thực thể được xác định trước trong SGML hoặc XML (xem đặc tả XML phiên bản 1. 0 trên các thực thể được xác định trước để biết thêm thông tin). Chúng được xác định trước trong triển khai HTML hiện đại và bạn có thể định nghĩa chúng trong cả SGML và XML, nhưng điều này khiến việc sử dụng các đoạn dữ liệu trở nên khó khăn hơn - nếu bạn lấy các phần của tài liệu, các định nghĩa có thể sẽ không xuất hiện. Bạn có chắc chắn thông tin của bạn sẽ không bao giờ được sử dụng lại? . Một vấn đề khác là chúng không được hỗ trợ bởi các trình duyệt cũ hơn (chẳng hạn như Netscape 4. 5) và các công cụ, và hãy nhớ rằng một số người dùng phải mất nhiều thời gian để nâng cấp. Một số trình duyệt văn bản cũ hơn không hỗ trợ chúng - và trình duyệt văn bản rất quan trọng đối với khả năng truy cập vì chúng là cơ sở của hầu hết các trình đọc dành cho người mù. Cũng dễ mắc lỗi với các tham chiếu thực thể ký tự - các phiên bản trước của tài liệu này đã sử dụng sai “lsquot” thay vì “lsquo” (lưu ý chữ t thừa). Nếu bạn chắc chắn rằng mình sẽ không bao giờ sử dụng văn bản trong SGML hoặc XML, thì bạn có thể cân nhắc sử dụng các ký hiệu này sau một vài năm nữa khi các trình duyệt ngừng hoạt động, nhưng điều đó không đáng. Bạn có thể tốt hơn nhiều nếu làm theo khuyến nghị ở trên; . g. , để tạo kết quả động) bằng cách làm theo đề xuất này
  • Không sử dụng các tham chiếu ký tự số thập lục phân HTML, chẳng hạn như “, ”, ', và'. Tham chiếu ký tự số thập lục phân là tốt vì các tài liệu chính thức xác định tiêu chuẩn ký tự cũng sử dụng hệ thập lục phân. Tuy nhiên, hỗ trợ cho hệ thập lục phân là một tính năng gần đây với hỗ trợ không nhất quán. các trình duyệt cũ hơn (như Netscape 4. 5) không hỗ trợ nó và nhiều bộ xử lý SGML và XML khác không hỗ trợ nó. Thật vậy, SGML hoàn toàn không bao gồm khả năng này. Vì chúng hiếm khi được sử dụng (so với các phiên bản thập phân), nên cũng có nguy cơ gặp lỗi với chúng cao hơn
  • Không nhúng trực tiếp các ký tự UTF-8 (hoặc UTF-16) vào văn bản và phụ thuộc vào việc đặt bộ ký tự UTF-8 ngay bây giờ. Ví dụ: đối với dấu nháy đơn bên phải (bao gồm cả từ sở hữu và từ rút gọn trong tiếng Anh), hãy sử dụng ' và không sử dụng mã hóa UTF-8 11100010 10000000 10011001 (nhị phân) hay còn gọi là e2 80 99 (thập lục phân) hay còn gọi là 342 200 231 (bát phân) hay còn gọi là 226 . UTF-8 thật tuyệt vời, nhưng nó chưa phổ biến và vấn đề là các bộ ký tự khác vẫn đang được sử dụng. Mã hóa UTF-8 sẽ không hoạt động trên một số trình duyệt văn bản (e. g. , linh miêu, và do đó, nhiều trình đọc mù phụ thuộc vào kết xuất văn bản). Trong XML và HTML có thể chỉ định rằng các ký tự sẽ được diễn giải theo một bộ ký tự cụ thể (bộ ký tự), nhưng việc yêu cầu một bộ ký tự cụ thể có nhiều nhược điểm. Đặt bộ ký tự thành utf-8 sẽ hoạt động ở nhiều nơi, nhưng chỉ khi bạn đặt bộ ký tự một cách rõ ràng; . Về cơ bản, điều này làm cho việc kết hợp tài liệu của bạn với các nguồn khác trở nên khó khăn hơn vì chúng có khả năng sử dụng các bộ ký tự khác. Ví dụ: bộ ký tự không chuẩn của Microsoft (thảo luận tiếp theo) gây trở ngại cho nó, do đó, việc sử dụng mã hóa UTF-8 có thể gây rắc rối khi cố gắng kết hợp với dữ liệu từ một số công cụ của Microsoft và MacOS trong một số trường hợp. Về lâu dài, hy vọng mọi người sẽ chuyển sang UTF-8 và UTF-16, và khi đó đây sẽ là một giải pháp thay thế hợp lý. Hiện tại, đừng làm điều đó
  • Không sử dụng các bộ ký tự không chuẩn của Microsoft (chẳng hạn như các vị trí từ 145 đến 148 cho bộ ký tự windows-1252). Chúng không chỉ không đạt tiêu chuẩn mà còn xung đột với các tiêu chuẩn - thông số kỹ thuật cho HTML rõ ràng cấm sử dụng các vị trí ký tự từ 128 đến 159, vì Unicode và ISO 10646 dành các vị trí từ 128 đến 159 làm ký tự điều khiển. Các ký tự không chuẩn của Windows không được hỗ trợ trên tất cả các trình duyệt và trình xem. Trên thực tế, việc sử dụng chúng có thể gây rắc rối ngay cả khi mọi người chỉ sử dụng các sản phẩm của Microsoft. Việc sử dụng chúng (ngay cả trong các trình duyệt hỗ trợ chúng) yêu cầu bạn đặt “bộ ký tự” thành một giá trị không chuẩn (thường là windows-1252) ở đầu tài liệu của bạn. Nếu bạn đặt bộ ký tự thành windows-1252, nó hoạt động khá rộng rãi, nhưng làm điều này sẽ khiến việc kết hợp văn bản kết quả với tài liệu khác trở nên khó khăn hơn (vì không đảm bảo rằng tài liệu khác của bạn sử dụng bộ ký tự này - có nhiều bộ ký tự khác đang được sử dụng . Do đó, giống như giải pháp nhúng utf-8, cách tiếp cận này khiến việc kết hợp dữ liệu với các nguồn khác trở nên khó khăn hơn - nếu nguồn khác không sử dụng cùng một bộ ký tự (rất có thể. ), nó sẽ ngừng hoạt động. Nhiều trình duyệt cố gắng làm cho những thứ này hoạt động miễn là bộ ký tự cụ thể này được đặt, vì nhiều sản phẩm của Microsoft tạo ra chúng, nhưng đó là thao tác chạm và di chuyển. ngay cả với các sản phẩm của chính Microsoft. Thật kỳ lạ, việc chỉ định các vị trí mã Microsoft này bằng cách sử dụng mã định danh số thường hoạt động trên các hệ thống hiện có, nhưng làm điều đó hoàn toàn không phù hợp với các tiêu chuẩn (chúng bị cấm chính thức), vì vậy sẽ không an toàn khi phụ thuộc vào điều này. (W3C đặc biệt lưu ý điều này. ) Vì có nhiều bộ ký tự Microsoft, nên việc thực hiện kiểu này sẽ gây ra sự phức tạp trong thế giới chỉ có Microsoft - bạn có thể dễ dàng có hai tệp, cả hai đều sử dụng các bộ ký tự Microsoft khác nhau, không thể kết hợp dễ dàng. Bài báo của Larisa Thomason trên NetMechanic cũng lưu ý điều tương tự - rằng ngay cả trong thế giới chỉ có Microsoft, những nhân vật này vẫn gây ra vấn đề. Và bên cạnh tất cả những điều đó, Microsoft đã tuyên bố rằng họ đang hướng tới ISO 10646/Unicode và hãng đã sửa đổi phần lớn phần mềm của họ để thực hiện điều này, vì vậy ngay cả khi bạn chỉ sử dụng các sản phẩm của Microsoft thì đây không phải là mục tiêu của chính Microsoft. Microsoft gọi chúng là "các trích dẫn thông minh" và mọi người thường phàn nàn về các trích dẫn thông minh - vấn đề không phải là Microsoft tự động cuộn tròn các dấu ngoặc kép theo mặc định (không sao cả), mà là Microsoft sử dụng các ký tự không chuẩn này can thiệp vào các tiêu chuẩn để làm như vậy. Vì vậy, phương pháp này là độc quyền, nó yêu cầu bạn đặt một bộ ký tự không chuẩn (điều này làm cho việc này khó thực hiện hơn và gây trở ngại cho việc hợp nhất văn bản) và thay vào đó, Microsoft đã tuyên bố rằng họ đang chuyển sang ISO 10646, vì vậy đừng làm điều này
  • Trên thực tế, tránh cần đến bộ ký tự nếu bạn đang truyền tài liệu tiếng Anh. Có các bộ ký tự khác, chẳng hạn như nhiều bộ ký tự của Apple, nhưng chúng không gây ra nhiều vấn đề. Gắn bó với một tệp chỉ có ký tự ASCII đơn giản và sử dụng các tham chiếu ký tự số thập phân cho tất cả các ký tự không phải ASCII, có thể chiếm thêm một chút dung lượng nhưng nó loại bỏ hoàn toàn rất nhiều vấn đề. Việc yêu cầu một hệ thống xác định chính xác bộ ký tự trong khi hệ thống đang cố đọc tệp là một vấn đề và có rất nhiều cài đặt cấu hình có thể sai - cũng như các hệ thống máy khách có thể không xử lý mọi thứ một cách chính xác. UTF-8 ít nhất có nghĩa giống nhau ở mọi nơi, vì vậy bạn có chút hy vọng nếu thực sự muốn sử dụng bộ ký tự không phải ASCII và sử dụng UTF-8. Nhưng vì không phải tất cả các tài liệu đều sử dụng UTF-8 và các bộ ký tự khác (như bộ ký tự của Windows) gây trở ngại cho chúng, nên việc tuân thủ phương pháp được đề xuất ở đây có cơ hội thành công cao nhất trong HTML, SGML và XML

Bây giờ, tại sao đây là một vấn đề? . Thật không may, các nhà thiết kế ban đầu của bộ ký tự ASCII đã không xác định một phương pháp tiêu chuẩn để xác định dấu ngoặc kép cong chính xác, vì vậy máy tính đã gặp sự cố với việc trao đổi dấu ngoặc kép đúng cách kể từ đó

“Dấu ngoặc kép ASCII và Unicode” của Markus Kuhn mô tả tốt vấn đề chung. Anh tóm tắt thế này

Vui lòng không sử dụng dấu huyền ASCII (0x60) làm dấu ngoặc kép bên trái cùng với dấu nháy đơn ASCII (0x27) làm dấu ngoặc kép bên phải tương ứng. Mặt khác, văn bản của bạn sẽ xuất hiện khá lạ với hầu hết các phông chữ hiện đại (e. g. , trên hệ thống Windows và Mac). Chỉ các phông chữ Hệ thống X Window cũ và một số thiết bị đầu cuối video cũ hiển thị ASCII 0x60/0x27 dưới dạng dấu ngoặc kép trái và phải, trong khi hầu hết các hệ thống hiện đại đều tuân theo các tiêu chuẩn ISO và Unicode thay thế. Nếu bạn chỉ có thể sử dụng các ký tự máy đánh chữ của ASCII, thì hãy sử dụng ký tự dấu nháy đơn (0x27) làm cả dấu ngoặc kép trái và phải. Nếu bạn có thể sử dụng các ký tự Unicode, các dấu ngoặc kép định hướng đẹp có sẵn ở dạng ký tự U+2018 và U+2019
Có một trang kiểm tra thú vị để kiểm tra một số ký tự. W3C có một trang về mã hóa ký tự

Thật không may, Kuhn không mô tả cụ thể cách giải quyết vấn đề trong HTML, XML và SGML, đó là lý do tại sao tôi viết trang này

Nếu bạn tò mò, đây là các trang văn bản tôi đã sử dụng để kiểm tra sự cố trên nhiều loại máy

Lưu ý rằng phương pháp này có nghĩa là nếu bạn đang cố gắng tạo văn bản ASCII đơn giản từ HTML, SGML hoặc XML, thì bạn sẽ cần dịch các dấu ngoặc kép thành dấu ngoặc kép thẳng. Nhưng điều này nói chung là đúng - nếu bạn bắt đầu với bộ ký tự phong phú hơn (chẳng hạn như HTML, SGML hoặc XML khi sử dụng tham chiếu ký tự số) và phải chuyển sang bộ ký tự kém hơn, thì bạn nên biết rằng một số ký tự sẽ cần được . Có nhiều nhân vật khác mà bạn phải xử lý, vì vậy đây là bước bạn sẽ phải làm.

Sau khi tôi viết trang này, tôi thấy rằng những người khác cũng đi đến kết luận tương tự (vì những lý do tương tự). Ví dụ Peter K. Sheerin's Rắc rối với EM 'n EN đề xuất cùng một giải pháp, vì nhiều lý do giống nhau (mặc dù anh ấy không lưu ý đến các vấn đề với SGML và XML, những thứ mà tôi nghĩ cũng quan trọng). Anh ấy cũng thảo luận về việc sử dụng hợp lý dấu gạch ngang em (—), được sử dụng để biểu thị sự ngắt quãng đột ngột trong suy nghĩ, dấu gạch ngang en, (–), được sử dụng để biểu thị phạm vi hoặc mối liên hệ giữa các sự vật và số nguyên tố duy nhất (′ . Một lần nữa, giải pháp là sử dụng tham chiếu ký tự số thập phân

Lưu ý rằng W3C khuyến nghị chỉ sử dụng các lần thoát đó như một ngoại lệ. Họ đề xuất sử dụng mã hóa dựa trên Unicode (UTF-8, UTF-16 hoặc UTF-32) và đối với XML sử dụng UTF-8 hoặc UTF-16. Vấn đề là chúng ta vẫn đang trong giai đoạn chuyển tiếp khi không phải tất cả các công cụ đều xử lý chúng tốt như vậy và đề xuất được đưa ra ở đây sẽ LUÔN có hiệu quả (bây giờ và trong tương lai)

Nếu bạn muốn thông số kỹ thuật chi tiết về một số điều này, đây là một vài gợi ý. đây là Microsoft Windows Codepage 1252 (Windows Latin 1), cũng như Microsoft Windows Codepage 1253 (còn nhiều nữa). Đã có bản tóm tắt trang mã PalmOS. Có thể quan trọng hơn, đây là một số tài liệu ánh xạ cho biết cách chuyển đổi từ một số mã hóa ký tự này thành Unicode/ISO 10646. Microsoft Windows 1252 sang Unicode, MacOS Roman sang Unicode và đây là bộ ánh xạ từ các bảng mã khác nhau sang Unicode/ISO 10646

Tôi cung cấp công cụ trích dẫn phần mềm nguồn mở/phần mềm tự do (OSS/FS), công cụ này sử dụng các phương pháp phỏng đoán để cố gắng sửa các dấu ngoặc kép trong HTML, XML hoặc SGML (nó đủ thông minh để để nguyên các trích dẫn khi được sử dụng trong các thẻ). Nó miễn phí, vì vậy hãy thoải mái sử dụng nó (nó yêu cầu hệ thống giống Unix hoặc Cygwin trên Windows)

Chương trình demoroniser sửa nhiều dấu chấm câu không tương thích của Microsoft để chúng tuân thủ các tiêu chuẩn, nhưng thật không may, phiên bản cuối cùng tôi thấy (xuất bản tháng 1 năm 1998) chỉ chuyển đổi dấu ngoặc kép của Microsoft thành dấu ngoặc kép ASCII thẳng thay vì triển khai phương pháp được mô tả tại đây. Kết quả trình hủy điều chỉnh ít nhất trông đẹp hơn và có khả năng tương tác hơn là không làm gì cả, nhưng chúng không tốt bằng phương pháp được đề xuất ở đây. Điều này có lẽ hợp lý; . Công cụ trích dẫn của tôi thực hiện công việc dịch các dấu ngoặc kép tốt hơn;

Trình soạn thảo, trình chỉnh sửa HTML trong Mozilla và Netscape 6 (và phiên bản mới hơn), thường sẽ chỉnh sửa chính xác các tệp bao gồm các trích dẫn cuộn tròn được xác định theo cách này. Nói cách khác, nếu tệp có chúng và bạn chỉnh sửa tệp, chúng sẽ ổn thôi. Tuy nhiên, nếu bạn đặt giá trị Loại nội dung trong tệp HTML, hãy đảm bảo sử dụng cài đặt như ascii hoặc iso-8859-1. Đây là một ví dụ về các mã HTML bạn nên đặt, nếu bạn chọn đặt Loại nội dung (thường là một ý tưởng hay)

Nếu bạn đặt một số bộ ký tự khác có thể đại diện trực tiếp cho các ký tự trích dẫn, chẳng hạn như utf-8, thì Trình soạn thảo sẽ tự động chuyển đổi bất kỳ tham chiếu ký tự số nào sang bộ ký tự đó. Điều này là hợp lý để Composer thực hiện, nhưng nó có thể gây rắc rối khi bạn cố gắng kết hợp các tệp sau này (khi đó bạn có thể phải sử dụng nhiều công cụ chuyển đổi khác nhau). Bạn cũng có thể muốn sử dụng menu Chỉnh sửa/Tùy chọn và chọn “Giữ lại định dạng nguồn gốc. ” Rất tiếc, tại thời điểm viết bài này, Trình soạn thảo không có cài đặt tùy chọn cho phép bạn tự động sử dụng dấu ngoặc kép khi nhấn nút trích dẫn thẳng (khả năng này đôi khi được gọi là “dấu ngoặc kép thông minh”) cũng như Chèn/Ký tự và Ký hiệu của nó . Tôi đã nhập một gợi ý để làm như vậy; . Do đó, hiện tại, để nhập các trích dẫn cuộn tròn trong Trình soạn thảo, bạn phải chuyển sang chế độ xem nguồn HTML; . Một cách khác là chỉ chỉnh sửa tệp bình thường, sau đó sử dụng các công cụ như công cụ trích dẫn của tôi để sửa mọi thứ sau khi chỉnh sửa

Plucker, kể từ phiên bản 1. 2, xử lý các trích dẫn này một cách chính xác

Cocoa của MacOS X hỗ trợ cuộn tròn các trích dẫn, cả nhập và hiển thị chúng, sử dụng các giá trị ký tự Unicode tiêu chuẩn được ủng hộ tại đây. Tuy nhiên, người dùng có thể không nhớ cách nhập dấu ngoặc kép. Andrew C. Stone cho biết cách tự động thêm dấu ngoặc kép vào hệ thống Văn bản của Cocoa

Nếu bạn có văn bản hiện có trong một bộ ký tự, đặc biệt là văn bản không chuẩn như Windows’, bạn có thể sử dụng một trong nhiều công cụ để chuyển đổi văn bản đó sang một thứ khác. Các hệ thống giống Unix như GNU/Linux thường có iconv, cho phép bạn chuyển đổi giữa các bộ ký tự thành một bộ ký tự thống nhất (iconv đi kèm với thư viện GNU C). Thay đổi mọi thứ bằng cách sử dụng iconv thành một thứ gì đó tiêu chuẩn (như utf-8), sau đó chạy một chương trình đơn giản để thay đổi tất cả các ký tự không phải ASCII thành các tham chiếu ký tự số thập phân, sẽ là một cách rất tốt để biến văn bản ngẫu nhiên trong các bộ ký tự khác nhau thành một ký tự duy nhất

Mã HTML cho trích dẫn kép là gì?

Giới thiệu

Thực thể ký tự nào được sử dụng cho dấu ngoặc kép trong HTML?

Một số thực thể ký tự HTML hữu ích