【応用情報】Unicode・UCS・UTFの違いをスッキリ理解！文字コードの基本を図解で整理してみた

はじめに：文字コードって結局なに？

「UTF-8」「Unicode」「文字化け」「エンコード」――

応用情報を勉強しているとこれらの言葉をよく理解できていなかったなと実感しました

本記事では、「Unicode・UCS・UTFって何が違うの？」という疑問に、図と具体例を使って整理していきます

「文字セット」と「エンコーディング」は別物です

文字セット（Character Set）

エンコーディング（Encoding）

コードポイントとUTF-8の具体例は以下です

Unicodeは、世界中の文字に一意の番号（コードポイント）を割り当てる国際規格です。

例：「あ」は U+3042、「漢」は U+6F22

コードポイントをバイト列に変換する方法がUTF（UCS Transformation Format）です。

UTF-8が普及しているのは、英数字が1バイトで済み、互換性が高いからです。

項目	意味
Unicode/UCS	文字セット（どの文字にどんな番号か）
UTF-8など	エンコーディング（番号をどうバイトに）

「文字コードってややこしい」と感じていた方も、この関係を押さえればスッキリ理解できます。

試験対策だけでなく、実務の場でも役立つ知識なので、ぜひこの機会にマスターしておきましょう！