ログイン

文字コードって知ってますか?

 2020.2.7 ゴリラーブログ ブログ ものぐさゴリラー本山

 

こんにちわこんばんわおはようございます!

ものぐさゴリラー本山です。

 

あまり技術的な話をブログにしないのですが、ネタが…(ゲホゲホッ)…諸事情により技術的な内容にしたいと思います。

今回はエンジニアではない人でも(フワッとしたイメージで)理解出来る様な内容にします。

 

文字コードという言葉を聞いたことはあるでしょうか。

エンジニアなら誰でも知っている言葉ですが、意外とエンジニアの中でも間違って理解している人も多いと思います。

 

文字コードとは日本語や英語の様な言語

いきなり主テーマですが、文字コードとは日本語や英語といった言語に当てはめられます。

 

例えば……次の特徴に当てはまるものは何でしょうか?

 ・木になる赤い果物

 ・スーパーで1個100円くらいで買える

 ・皮ごと食べるのが良いとされている

 ・ジュースやジャムにもなってる

 ・アニメとかでは丸かじりしてる印象

 

「りんご」を想像したあなたは正解です!

そうです。あの赤い果物を日本語では「りんご」と読んでいます。英語では「apple」ですね。

つまり、「日本語のテーブル」に登録されている言葉と「英語のテーブル」に登録されている言葉は違います。

コンピュータ上ではこの「テーブル」を上手いこと選んで抽出する事で人間にもわかる文字を画面に表示しています。

 

文字化けは何故起きる?

文字コードと一緒によく付いてくる言葉・現象は「文字化け」です。

日本語で表示するWebサイトなどを閲覧すると、まれに記号やら英字やらグチャグチャに混在したページになってしまう事があります。

これは所謂「テーブル選択の誤り」によって発生します。

 

何故、誤ったテーブルを選択してしまうのか。これも我々の日常に当てはめると「英語を聞いて日本語と間違える!」です。

例えば有名な “Tsunami” です。これは日本語でも英語でも同じ読み方ですね。

この単語だけを口頭で聞いた時、日本語か英語か判断出来無い、これこそが文字化けの原因です。

 

日本語の中でも同音異義語(資料や飼料)は前後の文脈から判断すると思います。

コンピュータもデータの内容を抽出して特定の言葉から日本語と判断したものの、実際は英語だったという「テーブル選択の誤り」が発生します。

それにより、コンピュータが受けた情報を無理矢理「日本語のテーブル」に当てはめてしまい、画面に無茶苦茶な文字が表示されてしまう事になります。

 

文字コードについてのお話はここまで。

この様な話を月次定例会で共有してたりしています。

何か発表したい事があれば手を挙げて機会を得る事ができます。

月次定例会は色々な人の様々な意見が聞ける貴重な機会でもあるので、個人的には楽しみなイベントですね。

以上!

 

© 2020 Mountain Gorilla Co., Ltd. 

プライバシーポリシー