|
|
6番째 줄: |
6番째 줄: |
|
| |
|
| === 서러게이트 雙 === | | === 서러게이트 雙 === |
| "[[유니코드]]는 모든 文字가 2[[바이트]]"라는 認識이 있지만, 이미 옛날 얘기가 되었다 볼 수 있다. [[UCS-2|2바이트(16비트) 固定길이}} 로는 全世界에서 쓰였거나 쓰이고 있는 文 字體 系를 모두 收錄하기에는 택도 없이 不足했기 때문이다. {{*|여기에서 實際로 쓰인 字形이 8萬가지는 된다는 [[漢字]]가 큰 役割(?)을 했다. [[完成型]] [[한글]] 11,172字도 만만찮았다(...).}} 이에 얼마 안 남은 空間을 '서러게이트 雙'이라는 이름으로 豫約하여, 이 領域의 코드를 두個 늘어놓는 組合으로 한 글字를 表現하게 하였다. | | "[[유니코드]]는 모든 文字가 2[[바이트]]"라는 認識이 있지만, 이미 옛날 얘기가 되었다 볼 수 있다. [[UCS-2|2바이트(16비트) 固定길이]] 로는 全世界에서 쓰였거나 쓰이고 있는 [[ 文 字]]體 系를 모두 收錄하기에는 택도 없이 不足했기 때문이다. {{*|여기에서 實際로 쓰인 字形이 8萬가지는 된다는 [[漢字]]가 큰 役割(?)을 했다. [[完成型]] [[한글]] 11,172字도 만만찮았다(...).}} 이에 얼마 안 남은 空間을 '서러게이트 雙'이라는 이름으로 豫約하여, 이 領域의 코드를 두個 늘어놓는 組合으로 한 글字를 表現하게 하였다. |
|
| |
|
| 그 結果, 유니코드의 可用 코드포인트가 U+FFFF에서 U+10FFFF까지로 11倍 擴張되었다. 그 後로는 擴張된 '平面'中 [[表意文字補充平面|오직 漢字만을 爲해 만들어진 것]]을 금세 거의 채우고, [[表意文字第三平面|平面을 하나 더 割當해서]] [[甲骨文]]이나 [[金文]], [[篆書]]같은 새로운 글字가 보이는대로 追加되고 있다. [[繪文字]]가 유니코드에 導入될수 있었던 契機도 이렇게 擴張이 되지 않았으면 機會가 없었을 것이다. | | 그 結果, 유니코드의 可用 [[ 코드포인트]] 가 U+FFFF에서 U+10FFFF까지로 11倍 擴張되었다. 그 後로는 擴張된 '平面'中 [[表意文字補充平面|오직 漢字만을 爲해 만들어진 것]]을 금세 거의 채우고, [[表意文字第三平面|平面을 하나 더 割當해서]] [[甲骨文]]이나 [[金文]], [[篆書]]같은 새로운 글字가 보이는대로 追加되고 있다. [[繪文字]]가 유니코드에 導入될수 있었던 契機도 이렇게 擴張이 되지 않았으면 機會가 없었을 것이다. |
|
| |
|
| [[BMP]]에서 서러게이트雙으로 쓰는 1024字는 다른 곳에 쓰이지 않고 UTF-16에서만 쓰이도록 豫約되어 있다. | | [[BMP]]에서 서러게이트雙으로 쓰는 1024字는 다른 곳에 쓰이지 않고 UTF-16에서만 쓰이도록 豫約되어 있다. |
2023年3月14日(火)10時47分 版
유니코드에서 使用하는 인코딩方式의 하나. 16비트를 單位로한 可變길이 인코딩인 故로 UTF-16이라는 이름이 붙었다.
인코딩 方法
多國語基本平面에 들어간 글字들은 코드포인트 그대로 2바이트로 貯藏한다. 다만 單位數가 16비트인만큼 엔디언處理를 해야 한다. 엔디언이 미리 定해지지 않았다면 BOM이라는 코드로써 自動으로 把握하도록 具現되기도 한다.
서러게이트 雙
"유니코드는 모든 文字가 2바이트"라는 認識이 있지만, 이미 옛날 얘기가 되었다 볼 수 있다. 2바이트(16비트) 固定길이로는 全世界에서 쓰였거나 쓰이고 있는 文字體系를 모두 收錄하기에는 택도 없이 不足했기 때문이다. [1] 이에 얼마 안 남은 空間을 '서러게이트 雙'이라는 이름으로 豫約하여, 이 領域의 코드를 두個 늘어놓는 組合으로 한 글字를 表現하게 하였다.
그 結果, 유니코드의 可用 코드포인트가 U+FFFF에서 U+10FFFF까지로 11倍 擴張되었다. 그 後로는 擴張된 '平面'中 오직 漢字만을 爲해 만들어진 것을 금세 거의 채우고, 平面을 하나 더 割當해서 甲骨文이나 金文, 篆書같은 새로운 글字가 보이는대로 追加되고 있다. 繪文字가 유니코드에 導入될수 있었던 契機도 이렇게 擴張이 되지 않았으면 機會가 없었을 것이다.
BMP에서 서러게이트雙으로 쓰는 1024字는 다른 곳에 쓰이지 않고 UTF-16에서만 쓰이도록 豫約되어 있다.
關聯文書
- ↑ 여기에서 實際로 쓰인 字形이 8萬가지는 된다는 漢字가 큰 役割(?)을 했다. 完成型 한글 11,172字도 만만찮았다(...).