• pemga
    #14
    totya4, az unicode önmagában nem jelenti azt, hogy minden karakter 2byte-on lenne tárolva (kivéve az UTF-16, UTF-32 és társai), hanem bitek jelentik azt, hogy ez most 1, 2 vagy 3 byte-on tárolt karakter (gyakoriságtól függően). Ennek megfelelően a sima 7 bites alapkarakterek továbbra is egy byte-ot foglalnak, a magyar ékezetesek már 2-t. A ritkább távolkeletiek 3-t is simán. (Asszem csak 3-ig, megy.) A doksi meg is erősíti: UTF-8 szabványt akarnak alkalmazni (tehát dinamikus hosszúságúak a karakterek.)

    BlackVoid, az nem a szabvány hibája, hanem a feltehetően levelezőkliensé (hazudik az encoding-nál, vagy hibásan van beállítva).