ابتدا این مطلب رو در مورد یونیکد ببینین
utf-32
یکی از پیادهسازیهای یونیکد هست که در حقیقت سادهترین اونها هم هست. در پیادهسازی utf-32
هر کاراکتر برای ذخیرهسازی دقیقاً از همون مقدار استاندارد یونیکد استفاده میکنه. برای این ذخیرهسازی از ۳۲ بیت استفاده میشه.
مثلاً برای ذخیرهسازی کاراکتر «س» که معادل یونیکد U+633H
یا U+1587
هست همین عدد ۱۲۵۷ مستقیماً ذخیره میشه
00000000-00000000-00000110-00110011
مشکل این روش اینه که شما برای ذخیرهسازی هر کاراکتر از ۳۲ بیت استفاده میکنین در صورتی که نیازی به این همه حافظهی اضافی نیست. شاید یک متنی فقط از کاراکترهای یونیکدی استفاده میکرد که در محدودهی اسکی هستند و بنابراین نیاز به ۸ بیت برای ذخیرهسازی هر کاراکتر بیشتر نباشه
هیچ پژوهش انسانی نمیتواند ادعای علمی بودن داشته باشد، مگر اینکه از برهان ریاضی برخوردار باشد (لئوناردو داوینچی)