یونیکد یک استاندارد جهانی هست که به هر کاراکتر یک عدد منحصر به فرد (code point
) نسبت میده. بنابراین در هر کاربردی که مبتنی بر یونیکد باشه، متنها در همهی دنیا به یک شکل دیده میشن.
در سیستمهای قدیمی کاراکتری مثلاً وقتی شما از ۱۲۲۰ برای کاراکتری در زبان فارسی استفاده میکردین، این ۱۲۲۰ بستگی به فونت مورد استفادهی شما داشت. یعنی اگه فونت رو عوض میکردین این ۱۲۲۰ تبدیل میشد به کاراکتری در یک زبان دیگه. اما در یونیکد ۱۲۲۰ فقط و فقط مربوط به یه کاراکتر خاص هست و با عوض کردن فونت (در صورتی که روش ذخیرهسازی و خوندن مبتنی بر یونیکد باشه) تغییر نمیکنه. در بدترین حالت به دلیل اینکه نمایش یک کاراکتر در فونت در دسترس نیست به جاش یک علامت سوال یا مربع نمایش داده میشه.
بنابراین یونیکد یه جدول با دو ستون هست. ستون اول کاراکتر مورد نظر و ستون دوم یک عدد منحصر به فرد که کد یونیکد اون عدد هست. برای مثال کد یونیکد حرف «س» U+633H
هست.
دقت کنین که یونیکد شامل هیچ پیادهسازی خاصی نیست و برای استفاده از این استاندارد لازمه که پیادهسازیهایی مثل utf-8
استفاده بشه.
سایت رسمی یونیکد
هیچ پژوهش انسانی نمیتواند ادعای علمی بودن داشته باشد، مگر اینکه از برهان ریاضی برخوردار باشد (لئوناردو داوینچی)