استفاده از یونیکد به صورت خام و مستقیم صورت نمیگیره. یونیکد فقط یه استاندارده که استفاده از کاراکترها رو در همهی دنیا یکسان میکنه. مثلاً توسط استاندارد یونیکد حرف «ی» در همهی دنیا معادل عدد خاصی هست.
برای استفاده از یونیکد استانداردهای مختلفی پیشنهاد شده که معروفترین و پرکاربردترین اونها UTF-8
هست که یه پیادهسازی از یونیکد هست.
هنگامی که ما یک متن رو در یک فایل مینویسیم در حقیقت به ازای هر کاراکتر مقدار عددی اون رو در مجموعه کاراکتر (character set
) مورد استفاده در فایل ذخیره میکنیم.
مثلاً اگه در حال استفاده از UTF-8
باشیم تایپ حرف «ی» یک عدد رو وارد فایل متنی میکنه و اگه در حال استفاده از eindows-1254
باشیم، همین تایپ حرف «ی» عدد دیگهای رو در فایل وارد میکنه.
حالا وقتی که فایل رو باز کنیم با استفاده از یه مجموعه کاراکتر، مقدار عددی وارد شده در فایل متنی در اون مجموعه کاراکتر که برای خوندن استفاده میشه تعبیر شده و خروجیش به ما داده میشه
برای درج یک کاراکتر مشخص در فایل متنی توسط مجموعه کاراکتر نوشتن مورد استفاده
character I--> تبدیل به مقدار عددی در مجموعه کاراکتر نوشتن I--> درج مقدار عددی در فایل
برای خواندن یک کاراکتر از فایل متنی
خواندن عدد از فایل I--> تبدیل عدد به کاراکتر معادل در مجموعه کاراکتر خواندن I--> مشاهدهی کاراکتر
هیچ پژوهش انسانی نمیتواند ادعای علمی بودن داشته باشد، مگر اینکه از برهان ریاضی برخوردار باشد (لئوناردو داوینچی)