اولین بار است که به این وب‌سایت می‌آیید. راهنما را مطالعه کنید!
x
موسسه خیریه محک

شهر ریاضی بازی-ریاضی

تعریف utf-8 گیج‌کننده ست!

0 امتیاز
332 نمایش

تعریف utf-8 یه جورایی متناقضه! ویکیپدیا می‌گه 8 bit variable-width encoding توی تعریفش. یعنی چی؟!

هیچ پژوهش انسانی نمی‌تواند ادعای علمی بودن داشته باشد، مگر این‌که از برهان ریاضی برخوردار باشد (لئوناردو داوینچی)
پرسیده شده جمعه ۳۰ فروردین ۱۳۹۲ در زبان‌های برنامه‌نویسی توسط prodo  

1 پاسخ

0 امتیاز

در یونیکد هر کاراکتر ممکنه ۱ یا چند بایت رو اشغال کنه. مثلاً برای کاراکترهای اسکی که مقادیرشون توی یک بایت جا می‌شه همون یک بایت رو در نظر می‌گیره ولی برای کاراکترهای دیگه مثلاً کاراکترهای فارسی دوبایت یا بیشتر در نظر می‌گیره. بنابراین ممکنه یک رشته‌ی ۳ بایتی دوتا کاراکتر داشته باشه. یا یک رشته‌ی ۴ کاراکتری مثلاً ۷ بایت باشه. این برای قسمت variable length

برای قسمت 8-bit منظور اینه که واحد ذخیره‌سازیش ۸ بیت هست. یعنی وقتی یه کاراکتر رو ذخیره می‌کنیم با واحد ۱ بایتی ذخیره می‌شه. به طور کلی یک کاراکتر utf-8 دوبایتی رو هم می‌شه دو کاراکتر معمولی یک بایتی در نظر گرفت. utf-8 در حقیقت یک تفسیر دیگه از کاراکترهای یک بایتی پشت سرهمه که در اسکی طور دیگه‌ای تفسیر می‌شن.

هیچ پژوهش انسانی نمی‌تواند ادعای علمی بودن داشته باشد، مگر این‌که از برهان ریاضی برخوردار باشد (لئوناردو داوینچی)
پاسخ داده شده سه شنبه ۱۱ تیر ۱۳۹۲ توسط prodo