IT

IT
グリフとは?フォント・Unicode・OpenType・シェイピングの基礎と実務ポイント

グリフとは ── 文字と記号の「見た目」を表す単位 「グリフ(glyph)」は、文字や記号の具体的な描画(見た目)を表す視覚的単位です。簡潔に言えば、文字(character/コードポイント)が「何を意味するか」を表すの […]

続きを読む
IT
結合文字(Unicode)完全ガイド:正規化・グラフェム・実務対応とセキュリティ対策

結合文字とは — 基本の定義 結合文字(けつごうもじ、英: combining character)は、Unicodeで定義される文字カテゴリの一つで、前後の「基底文字(base character)」に視覚的に結合して […]

続きを読む
IT
サロゲートペアとは — UTF-16の仕組み、絵文字や文字列処理で起きる問題と実務的な対処法

サロゲートペアとは — 概要 サロゲートペア(surrogate pair)は、Unicode の符号位置(コードポイント)が U+10000 から U+10FFFF の範囲にある「補助平面(supplementary […]

続きを読む
IT
BOM(バイトオーダーマーク)完全ガイド:UTF-8の文字化け・ヘッダーエラーの原因と実務で使える対処法

バイトオーダーマーク(BOM)とは何か バイトオーダーマーク(Byte Order Mark、略してBOM)は、テキストファイルの先頭に置かれる特別なバイト列で、主に文字エンコーディングの情報(特にバイト順=エンディアン […]

続きを読む
IT
コードポイント完全ガイド:Unicodeの基礎、UTF-8/16の違い、実務上の注意点とセキュリティ対策

コードポイントとは — 概念と実務で重要なポイントを深掘り 「コードポイント(code point)」は、Unicodeや文字エンコーディングを扱う上で基礎中の基礎となる概念です。見た目は単純に思えますが、実務では「文字 […]

続きを読む
IT
Shift_JISとは|CP932との違い・文字化け対策と実務での安全な変換・UTF-8移行ガイド

Shift_JISとは:概要 Shift_JIS(シフトジス、Shift Japanese Industrial Standardsの略、略称:SJIS)は、日本語を表現するための文字エンコーディング(符号化方式)の一つ […]

続きを読む
IT
ISO-8859-1(Latin-1)完全ガイド:Windows-1252との違い・UTF-8移行と文字化け対策

ISO-8859-1(Latin-1)とは何か ISO-8859-1(通称 Latin-1)は、ISO/IEC 8859 系列の第1部として定義された文字エンコーディングで、西ヨーロッパの言語(英語、フランス語、ドイツ語 […]

続きを読む
IT
ISO/IEC 10646(UCS)完全ガイド:Unicode・UTFの違いと実務ベストプラクティス

ISO/IEC 10646 とは — 概要と役割 ISO/IEC 10646(通称:UCS = Universal Coded Character Set)は、国際標準化機構(ISO)と国際電気標準会議(IEC)が共同で […]

続きを読む
IT
UCSとは?Cisco UCS・Unicode(ISO/IEC 10646)・Univention UCSの違いと使い分け完全ガイド

UCSとは — 用語の整理と全体像 ITの文脈で「UCS」と言うと複数の意味を持ちます。代表的なのは「Cisco UCS(Unified Computing System)」「UCS(Universal Coded Ch […]

続きを読む
IT
UTF-32とは?仕組み・エンディアン(BOM)・メリット・デメリットと実運用の注意点

はじめに — UTF-32とは何か UTF-32はUnicodeの文字集合(Unicodeコードポイント)を固定長の4バイト(32ビット)単位で直接表現する文字エンコーディング(符号化方式)です。UTF-8やUTF-16 […]

続きを読む