OSTRACISM CO.

iTunesあるいはSoundJAMのID3タグにおける日本語の扱いの混乱について


 おくればせながら、この件に関する情報はかなり不正確なものが多いようなので。

1. 問題の本質

 端的に表現すればID3v1.0/v1.1のタイトル名、アルバム名、アーティスト名に使う文字コードに何を使うかの問題です。現実として、Windows向けのツールは全てAPIネイティブな文字コードをそのまま入れています。ほとんどのツールは欧米で作成されているため、事実上そこに入っている文字コードはWindows-1252(Windows西欧、Code Page 1252、Windows ANSI文字コード表)と想定されます。
 iTunesはMacintoshのソフトなので、欧米ではMacRomanと呼ばれるApple拡張ASCIIコードがAPIネイティブな文字コードであり、それをLatin-1(ISO-8859-1)に変換してID3タグを作成します。
 Windows-1252はISO-8859-1のスーパーセットで、ようはISO-8859-1の文字セットはWindows-1252に完全に含まれるため、欧米では概ねこの方法がWindowsと互換性を保つ最善の解決方法といえます。

 ところがiTunesを日本語にローカライズする際、MacRomanからLatin-1に変換するコードがそのまま残ってしまいました。Macintoshの日本におけるAPIネイティブな文字コードはShift-JISであり、MacRomanではありません。だのにShift-JISをMacRomanとみなしてLatin-1に変換してしまいます。こんなタグが他環境のツールで読めるはずがありません。
 また、iTunesはフォント決め打ちなので日本語版ではそもそもMacRomanを入力できません。日本語版でMacRomanからLatin-1に変換するのは単純に間違った動作なのです。

2. 誤解

 SoundJAM(iTunes)開発チームが「我々はID3の仕様に沿っている。正しいのは我々だ」と主張している(していた)とよく紹介されていますが、その元の主張のWebページが見当たりません。原文を読んでみたいのですが、どこかに残っていませんか? 主張を取り下げたのならそれでもいいのですが、いまだiTunes日本語版の実装は上記問題点において正しい解決に至っていません。

 で、その伝聞情報の主張の裏をとるため、ID3v1.0/v1.1の仕様書をさがしたところ、見つかったのは以下のページです
http://alternic.net/drafts/drafts-n-o/draft-nilsson-id3-00.html(リンク切れ)
ID3v1.0/v1.1の仕様書(バックアップ)
 これはID3v2.xの仕様を策定しているMartin Nilssonによる仕様書です。RFCとして書いたようですが、ドラフトでかつ期限切れです。でもたぶんこれが最も詳しい仕様です。
 この仕様では「TAG」という識別文字および「年」にISO-8859-1を使えと書いてありますが、それ以外は全く規定されていません。タイトル名、アルバム名、アーティスト名にどんな文字コードを使うかの記載は全くありません。そもそも「TAG」とか「年(数字)」だって、ASCIIしか使いようがないわけで、ISO-8859-1の出る幕はないのです。
 Eric Kempによるオリジナルな仕様はさらにあっさりしており、ようは構造体を1つ定義しただけです。
Eric Kempによるオリジナルな仕様?(バックアップ)

 SoundJAM開発チームが「ID3の仕様に沿っている」というのは間違った主張であり、「そんな仕様は存在しない」というのが事実のようです。「西欧ではこの変換をしないと他環境と共存できないからだ」とはっきり言ってくれればいいのですが。

 ID3v1.xにおける仕様通りの実装は「なにもしない」であり、「なにもしない」と「MacRomanをLatin-1に変換」のどちらをデフォルトの動作にするかはユーザの選択に任せるのが正しい態度です。

 ちなみに、iTunesの持っているMacRomanとISO-8859-1の間の変換に使われているテーブル('ISOM' 4000)を見ましたが、ISO-8859-1で定義されていない文字コードがWindows-1252の相当文字コードになるわけではありません(例えばoとeがくっついたような文字)。想定ターゲットが何なのかは不明です。どうせやるならWindowsと合わせれば良いのですがこのあたりも中途半端です。

3. 表現

 iTunesの中途半端な対策として、「ID3タグを変換」コマンドがあります。ここに「ASCIIからISO Latin-1へ」といった機能がありますが、この表現を見てクラクラしたのは私ばかりではないでしょう。これがどういった機能のことを表現しているのかかなり考えないとわかりませんでした。問題は「ASCII」という表現です。ここでいうASCIIって何でしょう?
 一般的にMacintoshの欧文文字コードはMacRomanと言い、これが最も通じる言葉です。ASCIIはその一部($00〜$7F)であり、ASCIIと書いてMacRomanを示すなどという腐った表現をいままで見たことがありません。  少なくともこの一点で「SaundJAM開発チームは文字コードのことなんて、なんにも解ってない」ってことがバレています。
 Appleは独自に国際化を頑張った製品を世に送り出していると思っていましたが、iTunesはかなり恥ずかしい日本語対応だと言えます。iTunesをAppleの名前で出荷してて良いのでしょうか?

4. デジタルハブ

 iTunes日本語版(2.0.3)でのデフォルトのID3タグはv2.2で、日本語はUNICODE(BOM付き、リトルエンディアン)で保存されます。ID3v2.2ではISO-8859-1とUNICODEが正式な文字コードとして規定されています。
 iTunesはSonicBlue RioとCreative NOMADに曲データを転送できます。RioとNOMADはアップルストアで扱っており、デジタルハブ構想の一部をなす製品です。RioはAppleのテレビCMでも使われていました。しかしこの両製品ともにUNICODEが扱えません。私はNOMAD日本語版のユーザなので調べたところ、NOMADはv2.2のID3タグを解釈するものの、文字コードは単純にShift-JISとして扱うようです。もちろんMacRomanとしてLatin-1に変換されたShift-JISを扱うなんてことはありません。
 たぶん、NOMAD日本語版から日本語フォントを消せば、Latin-1を扱うのであろうことは想像できます。欧米ではiTunesの書き出すタグはNOMADで正しく読めるでのでしょう。
 ID3v2.2でShift-JISを扱うというNOMADの動作は明らかに規格外なのですが、AppleがiTunesと組み合わせて使えるとして販売するにしてはiTunes側の対応があまりに中途半端です。
 くり返しますが、「なにもしない」と「MacRomanをLatin-1に変換」のどちらをデフォルトの動作にするか、およびデフォルトのID3タグバージョンをユーザに選択させるべきです。

5. ID3v2.x

 Martin Nilssonによるv2.xの仕様書は以下のページにあります。
http://www.id3.org/
 ここにあるv2.2〜v2.4の仕様を読んで、開いた口が塞がりません。なんとv2.2とv2.3は上位下位ともに全く互換性がなく、加えてv2.3を正確に実装してもv2.4タグで解釈できないものが作れるのです。なんですかコレは。
 iTunes 2.0.3のデフォルトのタグがID3v2.2であり、ID3v2.4に未対応の理由がわかります。ID3v2.2が最も無難なバージョンであり、ID3v2.4なんてものに対応する義理も必要もないということです。
 iTunesは無駄のない簡潔なタグを出力します。日本語を入れたコメントの言語がなぜか'eng'なのはご愛嬌。

6. デマ

 こばやしゆたか氏の記事(http://www.zdnet.co.jp/macwire/0103/06/r_itunesj_10.html(リンク切れ))で間違っている点。

 『ちゃんと仕様書は存在するんだけど,世の中の多くのソフトはその仕様書を守っていない。でも,iTunesは,きちんと仕様書通りに作ってある』
 ID3v2.xの動作は仕様通りだが、ID3v1.xの動作は明らかにSoundJAM開発チームの間違い。ただしID3v2.xもiTunesのバージョンによっては間違った解釈やバグがありました。

 『Windows Meに標準でついてくる「Windows Media Player」は「世の中」仕様だった』
 MacRomanとLatin-1の違いはMacintosh固有の問題であり、Windows-1252はISO-8859-1を含んでいるため、Windowsでは欧米における文字コードの変換という問題自体が存在しません。そのため、Shift-JISでも何もしないという最も正しい実装になったといえます。

2002.02.04

Subject: Re: SoundJAM(iTunes)開発チームの主張について
To: sRIVA
Date: Tue, 19 Feb 2002 10:55:12 +0900

 情報ありがとうございます。

 MacAmpの実装は論外としても、やはりSoundJAMチームの人は欧米のことしか
気にしていませんね。
 そもそもISOMリソースを分離しているのにそれをローカライズで利用して
いない点が変なところです。
 たぶん、日本語ローカライズを引き受けた人なり会社が「正しいローカライズ
の方法」を知らないか説得を諦めたかしたんだと思われます。
 SoundJAMのローカライズ時に「ASCII←→Latin-1」の機能を付けてもらった
というハナシをどこかで読んだ記憶があるんですが、URLは失念。HULINKSだった
のかなぁ。

 Latin-1とMacRomanの文字コンバートの問題は、WindowsとMacintosh両方で
ファイルを互換を持って扱えるソフトでは一般的なもので、変換テーブルを
リソース等に追い出してローカライズ時に無視させるというテクニックも
普通に使われています。少なくとも有名どころの製品でこんな問題を残した
ままリリースされたら単純にバグだとされます。

 きわめて普通のハナシなのに、なんでこんなに混乱しているのかが変な
んですよね。

2002.02.19

注:
 sRIVAさん(http://www.alles.or.jp/~sahpro/(リンク切れ))はID3EDSの開発者。

To: Yutaka Kobayashi
Subject: Re: iTunes...のID3 タグにおける日本語の扱いの混乱について
Date: Sat, 20 Apr 2002 10:47:49 +0900

 こんばんは、OSTRAです。

> そこで、わたしはMacWIREに訂正というか転向というかの記事を書かなければ
> いけないのですが、そのときに上記ページへのリンクをはらせてもらって
> かまわないでしょうか。話の流れの中で、最初に提示させていただきたいので。
>  (リンクフリーとは書かれていますが、商用サイトからのリンクになります
> ので、いちおう確認させてください)。

 了解しました。

> >SoundJAM(iTunes)開発チームが「我々はID3の仕様に沿っている。
> >正しいのは我々だ」と主張している
>  これは、わたしも今探し出そうとしたのですが、再発見できませんでした。
> ごめんなさい。SoundJam日本語版のサイトにあったと記憶しますが、すでに
> 失われているようです。
>  また、http://www.mp3.co.jpには開発者への直接インタビュー記事もあった*はず*
> なのですがこのサイトも係争中のようで、いまクローズされています。

 ID3EDSの作者から以下のアドレスを教えてもらいました
http://web.archive.org/web/20010214235436/http://www.mp3onthemac.com/info/letter/soundjam.html
 個人での問い合わせのようですが、基本的に話が噛み合っていません。

 以前、たぶんヒューリンクスのサイトで、「Latin-1からASCIIへ」の機能を
作ってもらった云々のページを読んだような記憶があるのですが、やはり
これも見つかりませんね。

>  さて、今、わたしは、次のようなことであろうと理解しているのですが、
> もしよかったら、これで正しいかどうかを教えていただけません
> でしょうか(また間違えていると、困ったものですので)。

 正しいと思います。
 加えるとすれば、MacRomanとLatin-1の変換はWindowsとMacintoshの両方で
同じ製品が存在するようなプロダクト一般で必ず持っている機能で、かつ
日本語ローカライズ時にきっちり無効にしてあげなくてはいけない機能です。
 こんな変換機能を残したまま日本語版を発売したら普通はバグとして
扱われます(信用を失います)。わざわざテーブルをリソースで外に
追い出したのに、それを活用してないところがiTunes(SoundJAM)の理解
できない点です。

 ウチのカミさんは、以前ローカライズの仕事をよくしていて、iTunesの
化けた日本語を見て「ああ、このパターンよく見た」と言っています。
 MacExpo2002のブースででXPlayのデモをしていたのがカミさんです。

 さっさとTune-up iTunes 1.0が必要なくなくなってほしいもんですね。

2002.04.20

 こばやしゆたか氏の訂正記事(http://www.zdnet.co.jp/macwire/0204/26/c_ppoi.html(リンク切れ))が公開されています。Appleがこの問題を正しく解決することを望みます。

2002.04.27
Subject: Re: SoundJamのID3タグについて
To: Naotaka Morimoto
Date: Mon, 12 Aug 2002 23:30:16 +0900

 こんばんは森本さん。メールありがとうございます。

> ホームページの「iTunesあるいはSoundJAMのID3タグにおける日本語の扱いの混
> 乱について」を拝見させて頂きました。日付が2002.02.04ですから今頃この件に
> ついてお知らせするのもどうかとは思いましたが、以前Casady&Green社の方に伺っ
> た話をホームページ上に掲載したことがあり、

 ID3EDS(というマック用のID3タグ編集ツール)の作者からweb.archive.org
に記録されている、たぶん森本さんのページを教えてもらっています。
http://web.archive.org/web/20010214235436/http://www.mp3onthemac.com/info/letter/soundjam.html

 以前、これとは別にヒューリンクスのページだったかで日本での販売担当と
米国のSoundJAM開発チームとのやりとりを読んだ記憶があります。頑張って
やっとLatin-1からASCIIへの変換機能を付けてもらったといった内容でした。
元凶はこのへんにありそうだとは思います。
 こばやしさんの書いてるのもたぶんこれかと思います。

> Macをクライアントとして利用することが少なくなったため最近のMac事情につい
> て疎くなっていましたが、まだこの問題が尾を引いているとは少々驚きました。

 いやはや、なかなか解決には至りません。iTunesはバージョン3になって
ユーザフィードバックのページができたので、一応この問題をAppleに指摘
しましたが、本当に開発チームに届くかは疑問です。
 長いMacintoshユーザの例にもれず私もAppleを信頼してはいませんから(^^;)。

2002.08.12

Subject: Re: SoundJamのID3タグについて
To: Naotaka Morimoto
Date: Tue, 13 Aug 2002 23:15:19 +0900

 こんばんは。

> > For the text fields, songname, artist, album and comment, different
> > programs uses different character encodings, where the most used and
> > recommended encoding is ISO-8859-1 [ISO-8859-1], but one should not be
> > surprised if one encounters a different character encoding.
>
> draft-nilsson-id3-00.txtを拾い読みしてみましたが、ID3v1でもテキストフィー
> ルドはISO-8859-1が「推奨」というわけではないんでしょうか?いずれにせよ明
> 確に規定はしていないようですが。

 推賞してますね。まぁ、でも「most used」が嘘なんでドラフトかつ期限切れ
なんでしょうかねぇ。多分最も使われているエンコードは「ASCII(7bit)」で
次が「Shift_JIS」僅差で「Latin-1」程度かなと思います。
 どのみちShift_JISをMacRomanとみなしてLatin-1変換するなんて馬鹿げた
コトを正当化する根拠にはならないでしょうねぇ。

2002.08.13

 現在使っているMP3プレーヤーのCreative MuVo N200を調べると、ファイル名は欧文和文混載でもオッケイなUNICODEらしい(VFATってそうだっけ?)。ID3タグはUNICODEが通るが、言語情報を日本語に設定してると欧文が化ける。逆に英語等に設定してると和文が化ける。ファイルシステムでできてることができない理由はないだろうに残念。
 ともかくもうUNICODEを使ってもたいして問題ないという結論を得た。
 「iTunesあるいはSoundJAMのID3タグにおける日本語の扱いの混乱について」の問題はiPodがシェアナンバーワンになり、UNICODEが普及するという形で解消したということだ。

2006.01.31

 久しぶりに http://www.id3.org/ を見ると『A follow on version, 2.4, is documented on this website but has not achieved popular status due to some disagreements on some of the revisions and the tremendous inertia present in the software and hardware marketplace.』なんて書いてあった。当然の結果。
 リンク切れをフォロー。

2010.02.11

「ホーム」へ戻る
OSTRACISM CO.
OSTRA / Takeshi Yoneki