Privacy Policy Cookie Policy Terms and Conditions Punycode - Wikipedia

Punycode

aus Wikipedia, der freien Enzyklopädie

Punycode ist ein Kodierungsverfahren zum Umwandeln von Zeichenketten mit einem großen Zeichensatz in eine Zeichenkette mit einem kleineren Zeichensatz.

Punycode wird besonders bei der Umwandlung von Unicode (und anderen Zeichenketten, die nicht ASCII-Zeichen enthalten) zu ASCII verwendet. Das ist vor allem nützlich, um so genannte Umlautdomains (IDN, Internationalized Domain Names) zu verwalten. In dem Artikel zu IDNA finden sich auch Beispiele zur Konvertierung.

Die Umwandlung einer Zeichenkette, die Sonderzeichen enthält, in eine neue Zeichenkette mit ausschließlich Standardzeichen erfolgt nach folgenden Regeln:

  • enthält die zu konvertierende Zeichenkette keinerlei Sonderzeichen, so wird nur ein "-" nachgestellt. Beispiel:
 abcdef = abcdef-
  • enthält die zu konvertierende Zeichenkette Sonderzeichen, werden alle Standardzeichen unter Beibehaltung ihrer Reihenfolge aufgeführt und schließlich die kodierten Sonderzeichen durch "-" getrennt angehängt. Beispiele:
 abæcdöef = abcdef-qua4k
 ยจฆฟคฏข  = 22cdfh1b8fsa

Um die resultierende Zeichenkette möglichst kompakt zu gestalten, werden die Sonderzeichen nicht "eins-zu-eins" kodiert, sondern durch ein adaptives Deltaverfahren, bei dem aus der Position des Zeichens und dem Status der bereits kodierten Zeichen eine Zahl gebildet wird.

[Bearbeiten] Browser mit Punycode-Unterstützung

[Bearbeiten] Weblinks

  • RFC 3492 - Punycode: A Bootstring encoding of Unicode for Internationalized Domain Names in Applications (IDNA)
  • Punycode-Konverter Damit lassen sich IDN-Domains in Punycode konvertieren (Nur ein Konverter von vielen)

Static Wikipedia 2008 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -