utf-16
یه پیادهسازی از استاندارد یونیکد هست که ارتقای UCS-2
هست. در این استاندارد برای کاراکترهای U+0000
تا U+D7FF
از ۱۶ بیت استفاده میشه برای ذخیرهسازی و برای کاراکترهای بزرگتر یونیکد از ۳۲ بیت.
بنابراین در utf-16
کاراکترها یا در ۲ و یا در ۴ بایت ذخیره میشن. در این حالت حدود ۱ میلیون و صدهزار کاراکتر در این استاندارد قابل ذخیرهسازی هست.
utf-8
یک پیادهسازی عمومیتر از utf-16
هست که برای ذخیرهسازی مقادیر اسکی از یک بایت استفاده میشه، برای ذخیرهسازی مقادیر بین U+80
و U+7FF
از دو بایت استفاده میشه و ...
بنابراین از نظر اندازه محدودیت نداره و میتونه همین طور گسترش پیدا کنه. تا امروز کاراکترهای utf-8
تا ۶ بایت رو پشتیبانی میکنن (به عنوان استاندارد). در صورت اضافه شدن کاراکترهای بیشتر میشه این تعداد بیشتر هم بشه.
هیچ پژوهش انسانی نمیتواند ادعای علمی بودن داشته باشد، مگر اینکه از برهان ریاضی برخوردار باشد (لئوناردو داوینچی)