کمپيوټرپروګرام

UTF-8 - کرکټر

د يوني وزات ټول موجوده کرکټر سیټونه ملاتړ کوي. د نایونیکوډ لوښه د کوډييزونه لپاره تر ټولو غوره ده UTF-8 په کوډيزوينو. دا چې د معلوماتو، د موثریت او د پروسس په اسانۍ تحريف د توافق سره ASCII، د مقاومت ملاتړ کوي. خو د لومړي کارونه لومړي.

د کوډونې فورمه

byte او 32-bit لغاتونه - کمپیوټر نه یوازې په توګه شمېر انتزاعي محاسبوي شيانو، او همدارنګه د د خونو د واحدونو د جوړښت او د ټاکلې اندازه معلومات فغانستان کې فعالیت کوي. د خونديګون معياري باید کله ټاکلو څنګه ته د وړاندې کولو په پام کې دې واخلي د تورو شمېر.

په کمپيوټر سيستم، د integers کې د 8 دلیږدرالیږد له (1 byte)، د 16 يا 32 دلیږدرالیږد حافظه حجرو ساتل. هر فارم د يوني د کوډييزونه لپاره، چې د حافظې حجرو تسلسل یو integer سره سمون لري چې د يو ځانګړي سمبول دی تعریفوي. په معیاري د 8، 16 او 32-bit بلاکونو د کوډونې د يوني خویونه + له دریو بڼې شتون لري. سره سم، دوی په توګه UTF-8، UTF-16 او UTF-32 په نامه دي. نوم UTF لپاره د يوني بدلون په شکل دی. د کوډييزونه لپاره وسیله درې فورمې، هر ده مساوي استازیتوب د يوني کرکټر په مختلفو غوښتنلیکونه ګټې لري.

اومتوک کوډییزونې وکارول شي چې په د يوني معياري ټولو خویونه استازيتوب وکړي. په دې ډول، دوی لپاره د بېلابېلو دليلونو دي د حل په بشپړه توګه د ټولينزو، د کوډونې د مختلفو بڼو کاروي. هر ايښودنه کولای شي په روښانه توګه پرته د معلوماتو له لاسه د دوو بل هر شي بدلیږي.

nenalozheniya اصل

د غير قسمي تداخل محتویات یی د فورمې د يوني د کوډييزونه لپاره هر جوړ کړي دي. د مثال په توګه، د Windows-932 د کوډ د یوه یا دوه بايټونو د تورو تشکيلوي. د تسلسل د آرايش د لومړي byte پورې تړاو لري، له دې امله د دوو-byte او واحد byte disjoint په لړ کې د مخکښ byte ارزښتونو. که څه هم، د يو واحد byte د ارزښت او د څرک byte تعاقب ښايي سمون. دا په دې مانا د مثال په توګه، چې د کرکټر د لټون D (44 کوډ) کولای شي دا په غلطۍ سره د دوه-byte کرکټر "D" په ترتیب دوهم برخه ورننوتلو (کوډ 84 44). ترڅو ومومي چې د تعاقب سمه ده، دا پروګرام باید په پام کې د تیر بايټونو واخلي.

حالت پیچلي ده، که د رهبري او د څرک بايټونو لوبه. دا په دې مانا چې د دې لپاره چې د ابهام لرې به د متن او یا د بې ساري کوډ تعاقب پیل رسېدو وړاندې د يوه سرچپه ګورلو وي. دا نه يوازې بې کفایته ده، خو له تیروتنو ممکن نه دی ساتل شوي دي، ځکه چې د بشپړ متن يوازې يو غلط byte بدل unreadable.

شکل بدلولو د يوني دا ستونزه اووايي، ځکه چې د مخکښ، شمېرل ارزښت، او د زيرمه کولو واحد واحد ورته معلومات نه دي. دا په لټه او په پرتله، هيڅکله نصارا هم د پايلو له امله د کرکټر کوډ په بیلابیلو برخو کې د تصادف ورکولو باوري کوي چې ولې د يوني. دا حقيقت چې د کوډونې دغو فورمو د اصل nenalozheniya وڅاري، د نورو د ختيځې اسيا د څو byte کوډیزونه يې توپير.

nonintersection بل اړخ د يوني کوډیزونه داده چې د هر کرکټر لري واضح تعريف پوله لري. دا له منځه وړي د اړتيا د پخواني سمبولونه نامحدود شمېر څيړنه. دا ځانګړنه، چې کله ناکله ځان د Clocking د کوډييزونه لپاره غږ وکړ. د کوډ واحدونو اړونه به یوازې یو کرکټر تحریفونو معرفي کړي، او شاوخوا خویونه اوس هم روغ رمټ دي. په 8-bit په بڼه اړول، که د آفسيټ د byte، سره 10xxxxxx پیل (په دويال کوډ) ټکي ته د سمبول د پیل لپاره یو له دریو څخه سرچپه انتقال ته اړتيا پيدا کړي.

ثبات

د يوني د شرکتونو مجموعې د کوډیزونه ټولو 3 ډولونه په بشپړه توګه ملاتړ کوي. دا مهمه ده چې د UTF-8 او د يوني، د ټولو بدلولو فرمت څخه مخالفت - په مساوي توګه د نایونیکوډ کرکټر-د کوډييزونه لپاره معياري پورتني د اعتبار وړ فورمې.

Byte-الرښوونې

د UTF-32 تورو استازيتوب به د 32-bit کوډ واحد، چې د يوني کوډ سره سمون ته اړتيا لري. UTF-16 - يو دوه 16-bit واحدونو. يو UTF-8 د 4 بايټونو پورته کاروي.

UTF-8 په کوډيزوينو کې طرحه شوې ده چې سره byte لرونکې ASCII په بنسټ د سيستمونو وي. د د اوږدې مودې لپاره د موجوده د سافټ او د معلوماتي ټکنالوژۍ عمل کې زیاتره برخه د بايټونو یو تسلسل د تورو څخه د استازيتوب تکیه. ګڼ پروتوکولونه د constancy پورې تړاو لري ASCII د کوډييزونه او کاروي يا د کنترول ځانګړي خویونه اخلال نه. يوه ساده لاره چې د حالاتو د يوني کولای د خپلولو ته، لپاره د يوني خویونه، کوم معادل ASCII کرکټر يا د کنترول کرکټر استازيتوب 8-bit ايښودنه کاروي. د دې لپاره، او دا UTF-8 په کوډيزوينو.

متحول اوږدوالي

UTF-8 - د متحول په اوږدوالي د کوډونې، د 8-څه ذخیره واحدونه شامل دي، د مشرانو دلیږدرالیږد چې ښيي چې د هر فرد byte په ترتیب برخه پورې اړه لري. د ارزښتونو د ټاکل شویو ته د کوډ د تعاقب لومړی عنصر يو لړ، بل - د راتلونکو. دا برابروي disjointness د کوډييزونه.

ASCII

UTF-8 په کوډيزوينو کې په بشپړه توګه ملاتړ ASCII کودونه (د 0x00-0x7F). دا په دې مانا چې د يوني خویونه + کلنو 0000-کلنو + 007F په واحد byte 0x00-0x7F UTF-8 بدل شوي دي او په دې توګه شي له ASCII توپير. سربیره پردې، د ابهام د مخنيوي، د ارزښت په 0x00-0x7F له دې زيات په د نایونیکوډ خویونه د یو واحد byte استازیتوب نه کارول شوې. د encode سمبولونو څخه ASCII نورو neideograficheskih، د دوه بايټونو یو تسلسل په کارولو. سمبولونه نیولې کلنو + 0800-کلنو + FFFF له خوا درې بايټونو کیږي، او هغه سره کلنو + FFFF زیات اضافي کوډونه څلور بايټونو ته اړتيا لري.

د غوښتنلیک د SPHERE

UTF-8 په کوډيزوينو کې معمولا د ده په HTML پروتوکول د لومړیتوب ورکول، او په څېر.

د ایکس ایم سره د UTF-8 په کوډيزوينو بشپړ ملاتړ د لومړي معياري شي. د ستندرد ادارو هم دا سپارښتنه. د URL پته ده چې له ASCII-خویونه بیلابیلو په ملاتړ ستونزه، حل شوې کله چې د شرکتونو د مجموعې W3C او IETF د انجنيرۍ ډلې ته د ټولو د ايښودنه يو تړون راغلل URL پتې انحصاري په UTF-8.

سره د ASCII د پخیدلوموده چې د نوي سافټ د انتقال لپاره اسانتیا برابروي. سره UTF-8 تر ټولو متن چلوونکو په ګډون JEdit، Emacs، BBEdit، نيونې، او "د Notepad" د وينډوز ايکسپی کې کار کوي. د کوډييزونه لپاره د يوني نورو نه فورمه د وسيلې په ډول ملاتړ نه شي کولای اوښان جوړوي.

د کوډونې ګټه دا ده چې د بايټونو يو ترتيب لري. سره UTF-8 سلسله اسانه ده، چې په (C) او نورو پروګرامونو ژبو کې کار وکړي. دا د کوډييزونه لپاره یوازې فورمه، د نظم نه نښې ته اړتيا بايټونو هیښ او يا په ایکس یو د کوډييزونه اعلامیه.

د ځان د همغږی

په یوه چاپیریال کې چې په پرتله د نورو څو byte کرکټر سټونه د پروسس 8-bit سمبولونه کاروي، او UTF-8 د لاندې ګټې لري:

  • د byte کوډ لومړي تسلسل لرونکی د خپل اوږدوالي په اړه معلومات. دا د د مستقیم لټون موثریت زیاتوي.
  • چینایی د سمبول په پيل کې د موندلو په توګه د پیل byte دا دی چې د ارزښتونو د يوه ثابت لړ محدود.
  • نه تقاطع byte ارزښتونو.

د ګټو په پرتله

UTF-8 په کوډيزوينو دی تړون. خو کله چې د ختيځې اسيا خویونه د کوډييزونه لپاره کارول (د چين، جاپان، کوريا، نښې په کارولو سره د چين د لیکلو) 3-byte سلسله کارول. هم UTF-8 په کوډيزوينو دا دی چې د د کوډونې پروسس سرعت د نورو ډولونو سفلي. د دويال د ډلبندۍ د مزو د دويال د ډلبندۍ د يوني په توګه په همدې پايله کې توليدوي.

د کرکټر پروګرام

د کرکټر طرحې لري د کوډييزونه لپاره سمبولونه فورمه او د واحد byte ځای کود واحدونو طريقه. د کوډييزونه لپاره طرحې د يوني معیار د یوه byte نظم لومړنۍ نښه (هیښ، Byte نظم نښه) په کارولو یې چمتو کوي.

کله چې په UTF-8 ځانګړنه په پېژندتورو د هیښ د کوډونې فورمې په کارولو محدود يوازې د مرجع ده. په endian UTF-8 په ټاکلو ستونزې لرو، په توګه د کوډييزونه لپاره واحد اندازه یو byte. د کودي دې فورمه کې د هیښ په کارولو سره ده نه غوښتل او نه سپارښتنه. هیښ ښايي په متن کی واقع کيږي تر څو له نورو codings لپاره UTF-8 په کوډيزوينو byte نظم نښه یا لاسلیک په کارولو سره بدل شي. آیا د 3 بايټونو EF BB 16 16 د BF 16 يو ترتيب.

څنګه کولای شو چی د UTF-8 په کوډيزوينو کې جوړ

د HTML د کوډونې UTF-8 د ده سره د لاندې کوډ نصب:

سر

meta http-equiv = "منځپانګه-ډول" منځپانګه = "text / html؛ charset = UTF-8" ˃

په PHP UTF-8 په کوډيزوينو ده ټاکلو د محصول کچه ارزښت ګمراهۍ وروسته د سرۍ () د دوتنې په پيل دنده په کارولو جوړ:

˂؟ php

error_reporting (-1)؛

سرۍ ( "منځپانګه-ډول: متن / html؛ charset = UTF-8")؛

پیوستون د يوه مای ډیټابیس UTF-8 په کوډيزوينو کې ټاکل شوې ده:

˂؟ php

mysql_set_charset (utf8 ")؛

د CSS-دوتنه د کوډييزونه لپاره ده UTF-8 خویونه لري په لاندې ډول مشخص:

charset "UTF-8"؛

په بل ځای به کار نه کله چې تاسو د ژغورلو د ټولو ډولونو د دوتنې غوره UTF-8 په کوډيزوينو پرته هیښ،. د دې په DreamWeave اړتيا د غورنۍ توکی "تعدیل - د مخ ځانتياوې - سرلیک / د خونديګون" انتخاب ته UTF-8 په کوډيزوينو کې د بدلون. ورپسې د پاڼې ژر خرابېږي، له "سره نښلوي د نایونیکوډ لاسلیک (هیښ)» پوستې نښه لرې او د بدلون غوښتنه وکړي. هر متن په يوه پاڼه وګوری او یا په یو ډیټابیس شو د ايښودنه بل ډول معرفي که، دا د بيا ته ننوځي او يا بيا encode ضروري ده. کله چې تاسو سره د منظمو څرګندونې کار، ډاډه اوسئ چې د بدلوونی وکاروي u.

تاسو هم کولای شی چې د د وينډوز "Notepad" په UTF-8 په کوډيزوينو کې د دوتنې وژغوري. د انتخابولو د غورنۍ توکی وروسته چې د "دوتنه - لکه څنګه Save ..." چې د کوډييزونه لپاره ضروري فورمه نصب او په UTF-8 د دوتنې وژغوري.

په یوه متن مدير Notepad ++، که په پرتله UTF-8 د نورو، ټاکل شوې د غورنۍ توکی له لارې "پرته هیښ ته UTF-8 واړوئ» د کرکټر ته بدلون ورکړي او په UTF-8 وژغوري.

نه بدیل شته دی

د Globalization، چیرته چې سیاسي او ژبني سرحدونه دي لاهو په برخه کې، د کرکټر سیټونه چې د ځايي ځانګړتیاوې لري، د لږ استعمال کې دي. د يوني یو واحد لوښه چې د ټولو localizations ملاتړ دی. يو UTF-8 - د نایونیکوډ مناسب تطبيق، کوم چې داسې يوه بیلګې په توګه:

  • په دې کې د وسیلې په ګډون د توافق سره ASCII د کوډييزونه لپاره په پراخه کچه ملاتړ کوي؛
  • د ویلو ده چې تحريف د معلوماتو په وړاندې مقاومت؛
  • ساده او په د درملنې اغېزمن؛
  • ده پلاتفورم خپلواکه.

د UTF-8 د مناظرې په اړه د کوډييزونه لپاره يا لوښه څه ډول ښه ده د ظهور، دا بې معنا شي.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 ps.birmiss.com. Theme powered by WordPress.