メモ代わり。てきとーに。 いや、ですからてきとーですって。 2年前ぐらいにPythonあたりでメールくれた方、ごめんなさい。メール紛失してしまい無視した形になってしまいました。。。

2008年1月24日木曜日

[mod_chxj][携帯] 絵文字定義の再構成(2)

間違えた
絵文字定義の再構成(1)で作った定義ファイルを眺めていたら気づいてしまった。
UTF-8じゃなくてUNICODEじゃないかと。


&#xe63e


上記はDoCoMoのUNICODE絵文字の「晴れ」。
UTF-8であらわすと、

0xee98be


が正解。

ということで定義ファイルと読込ルーチンを再度修正。。。
UTF-8はSJISから変換できるけどcp932が使えないlibiconvの場合困りそうなので、
定義ファイルに追加しておこう。


・・・で、追加完了。
UTF8部も完了。

これで、サーバサイドではEUCJP-WIN/SJIS/UTF-8で記述することが可能になった。
UTF-8の場合だけ注意が必要で、UNICODEのバイナリコードは使用できない。
以下に今回の変更で使用できる絵文字記述方法を書いておく。
  1. UTF-8の10進参照文字列
  2. UTF-8の16進参照文字列
  3. UTF-8のバイナリコード
  4. UNICODEの10進参照文字列(DoCoMoの仕様どおり)
  5. UNICODEの16進参照文字列(DoCoMoの仕様どおり)
  6. EUCJP-WINの10進参照文字列
  7. EUCJP-WINの16進参照文字列
  8. EUCJP-WINのバイナリコード
  9. SJISの10進参照文字列(DoCoMoの仕様どおり)
  10. SJISの16進参照文字列(DoCoMoの仕様どおり)
  11. SJISのバイナリコード(DoCoMoの仕様どおり)

WindowsからDebian-Etchにputty等で接続すれば、特に意識せず上記すべてを
入力できる。バイナリコードは、DoCoMoの提供するi絵文字なるソフトを使用すればOK。
文字コードの変換は端末とvimまかせでOKになるし、実際なった。

0 コメント: