Facebook Twitter Google Maps RSS
Home その他 文字コードにまつわる基本的なお話2
formats

文字コードにまつわる基本的なお話2

こんにちは。月曜担当・ほんだです。

先日、うさぎカフェに行ってきて、自分がうさぎアレルギーだと発覚しました。

猫は大丈夫になったので、うさぎも同じかと思ったのですが甘かった…

花粉症もあるので、外にいても中にいてもどちらも辛いという…でもうさぎは可愛いですね!

 

先週のブログにて、どうやらUTF-8という文字コードが熱い、むしろそれがほぼ標準!というお話をしました。

なぜそんなにもUTF-8が浸透しているのか…?今回はその疑問に迫ります。

 

○UTF-8はASCIIとの親和性が高い

ASCIIとは、1963年にアメリカの規格協会ANSIによって制定されたものです。

英語圏で使われる文字を7ケタの2進数(7ビット)で表すことができます。

UTF-8はASCIIとの互換性があり、

ASCIIと同じものはASCIIの表現方法を流用し、それ以外に関しては容量を拡張して表現しています。

昔からのものに慣れていらっしゃる方だと、こちらの方が使い勝手がいいのかもしれません。

 

○UTF-8は世界的に使われている

UTF-8の対抗馬として日本で使われているのは、Shift-JISなどのJISコードが主。

JISという名前でお分かりかもしれませんが、日本語独自の規格です。

ですので、よりグローバルに色んな人に見てもらおうとすると、

文字化けの可能性のある独自規格より、UTF-8の方が優位というわけです。

 

○様々なサービスがUTF-8化

こちらにFC2ブログが完全UTF-8化という記事が載っていました。

先週載せましたデータにもありますように、UTF-8が浸透するにつれて

様々なサービスでUTF-8が利用されています。

そうした動因で、ますますUTF-8の利用が広まっているのかもしれないですね。

 

jsやHTMLなどでは、文字コードをあらかじめ指定できますが、

必ずUTF-8にしなくてはいけないわけではありません。

しかしながら今後の広がりや可読性、手間を考えると時流に身を任せるのが無難なのではないでしょうか…?

来週も続く?かもしれません。

 

参考:http://ja.wikipedia.org/wiki/UTF-8

http://www.shuiren.org/chuden/teach/code/main8.htm

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です


*