MySQL初心者入門講座 に関する質問
【質問】
MySQLにはキャラクタセットがいろいろあるようですが、どれを選べばよいのでしょうか?
【回答】
キャラクタセット(character set)とは、アルファベット、ひらがな、カタカナ、漢字などの文字の集まりのことで、いろいろな規格があります。
日本語を扱うキャラクタセットで、MySQLで使えるものには、以下のようなものがあります。
・sjis
・cp932
・ujis
・eucjpms
・utf8
MySQLでは、サーバー、データベース、テーブル、フィールドの文字コードと、mysqlなどのクライアントツールの文字コードをすべて統一したほうが、「文字化け」の問題に悩まずに済みます。
MySQL初心者入門講座で、MySQLをインストールする時に「sjis」を勧めたのは、当講座の読者が初心者で、 Windows を使っている人が多いからです。
Windows 利用者の場合、MySQL側を「sjis」に統一すれば、クライアントからの操作で、文字コードを意識する必要がなくなります。初心者が MySQL の学習環境を整えるには、これが一番簡単です。sjis は文字化けの問題がありますが、文字コードを統一しておけば大丈夫です。
しかし本格的に PHP や Java で作ったアプリケーションから MySQL を操作するなら、「eucjpms」や「utf8」を使ったほうがよいでしょう。
また最近では、楽天や Amazon などの Webサービスで提供されるデータは UTF-8 が一般的です。他社のWebサービスを活用するシステムを作る予定がある場合は、 utf8 に統一したほうがいいと思います。
MySQLの基本的な操作に慣れてきたら、他のキャラクタセットにも挑戦してみてください。