موسسه خیریه محک

شهر ریاضی بازی-ریاضی

خواندن کاراکتر دلخواه از رشته‌ی utf-8

0 امتیاز
378 نمایش

در مورد یک رشته‌ی معمولی اسکی در یک فایل برای به دست آوردن کاراکتر n ام کافیه بایت n ام رو بخونیم. اما از اون‌جا که utf-8 یک روش خاص پیاده‌سازی داره این کار و نمی‌تونیم انجام بدیم. روش سریعی وجود داره که لازم نباشه کل بایت‌ها رو بخونیم؟

هیچ پژوهش انسانی نمی‌تواند ادعای علمی بودن داشته باشد، مگر این‌که از برهان ریاضی برخوردار باشد (لئوناردو داوینچی)
پرسیده شده دوشنبه ۱۴ مرداد ۱۳۹۲ در زبان‌های برنامه‌نویسی توسط prodo  

1 پاسخ

0 امتیاز

روش به هرحال ترتیبی هست و نمی‌شه با یه دستور به طورت تصادفی کاراکتر n ام رو خوند. اما لازم نیست متن به طور کامل پردازش بشه. کافیه دو بیت اول هر بایت خونده بشه. در صورتی که 01 یا 00 یا 11 باشه یعنی یک کاراکتر جدید

11010111-10100010-00111000-01011101-xxxxxxxx

این متن یونیکد قبل از xxxxxxx سه کاراکتر داره. بنابراین کاراکتری که از xxxxxxxx شروع می‌شه کاراکتر ۴ ام هست

هیچ پژوهش انسانی نمی‌تواند ادعای علمی بودن داشته باشد، مگر این‌که از برهان ریاضی برخوردار باشد (لئوناردو داوینچی)
پاسخ داده شده دوشنبه ۱۴ مرداد ۱۳۹۲ توسط prodo