ویژگی کاراکتر در HTML

برای نمایش صحیح یک صفحه HTML، یک مرورگر وب باید بداند که از کدام مجموعه کاراکتر استفاده کند.

Charset با نام های Character Sets (مجموعه های کاراکتری) یا Encoding (رمزگذاری) نیز شناخته می شود و برای نمایش صحیح و درست صفحه وب استفاده می شود.

مجموعه کاراکتر (Character Sets) در تگ <meta> مشخص می شوند:

<meta charset="UTF-8">

 

نکته: بهتر است بیشتر از کدگذاری UTF-8 استفاده کنیم، چرا که این کد بیشترین سازگاری را با تمامی مرورگرها دارد و تقریبا از تمام کاراکترهای موجود در سطح وب پشتیبانی می کند.

 

مجموعه کاراکتر ASCII

ASCII اولین استاندارد رمزگذاری کاراکتر در HTML، برای وب است که 128 کاراکتر مختلف را تعریف می کند و می توان از آن در اینترنت استفاده کرد:

  • حروف انگلیسی (A-Z
  • اعداد (0-9)
  • بعضی کاراکترهای خاص مانند ! $ + – () @ <> 

نکته: مشکل اصلی در رمزگذاری ASCII دامنه محدود کاراکترها بود که شامل 128 کاراکتر است.

 

مجموعه کاراکتر ANSI

مجموعه کاراکتر ANSI، نسخه توسعه یافته مجموعه کاراکتر ASCII است. این مجموعه از 256 کاراکتر پشتیبانی می کند. ANSI با عنوان 1252Windows- نیز شناخته می شود:

  • 127 کاراکتر اول یکسان با ASCII
  • از 128 تا 159 کاراکترهای ویژه
  • از 160 تا 255 کاراکتر یکسان با UTF-8
<meta charset="Windows-1252">

مجموعه کاراکتر ISO-8859-1

ISO-8859-1 مجموعه کاراکترهای پیش فرض برای HTML 4 است. این مجموعه کاراکتر از 256 کد کاراکتر مختلف و همچنین از UTF-8 پشتیبانی می کند.

  • 127 کاراکتر اول یکسان با ASCII
  • از کاراکترهای 128 تا 159 استفاده نمی کند.
  • از 160 تا 255 کاراکتر یکسان با ANSI و UTF-8

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

<meta charset="ISO-8859-1">

مجموعه کاراکتر 8-UTF

8-UTF یک رمزگذاری کاراکتر با محدوده متغیر است که تقریباً تمام کاراکترها و نمادهای موجود در جهان را پوشش می دهد.

  • از 0 تا 127 کاراکتر یکسان با ASCII
  • از کاراکترهای 128 تا 159 استفاده نمی کند.
  • از 160 تا 255 کاراکتر یکسان با ANSI و 8859-1
  • از 256 تا 10000 کاراکتر ادامه می یابد.
<meta charset="UTF-8">

 

نکته: چون ANSI و ISO-8859-1 بسیار دامنه های محدودی دارند، HTML4 از 8-UTF نیز پشتیبانی می کند. 8-UTF رمزگذاری کاراکتر پیش فرض برای HTML5 است.

 

خلاصه درس

در این درس با ویژگی کاراکتر در HTML:

  • مجموعه کاراکتر ASCII
  • مجموعه کاراکتر ANSI
  • مجموعه کاراکتر ISO-8859-1
  • مجموعه کاراکتر 8-UTF

آشنا شدیم.

تمرین


مشاهده پاسخ
توسعه دهندگان
احسان اسلامی