今のインターネットにはまだまだIT革命という感じはしない。
IT革命が起こるには、情報が世界規模のデータベースに収められなければならないが、現状の我々がたどり着いたのは、せいぜい、Googleのテキスト検索に過ぎない。
あらゆる情報を柔軟に格納できるデータベースフォーマットにXMLがある。しかし、このXMLにも問題がある。
例えば、整数1をPowershellのXMLで表現すると、
<Objs Version="1.1" xmlns="http://schemas.microsoft.com/powershell/2004/04"><I32>1</I32></Objs>
となる。
アニメ作品のシリーズ共通タイトルをNameに、続編タイトルをValueに持つ次のようなデータがあったとしよう。
Name Value
---- -----
無限の住人 BLADE OF THE IMMORTAL
ゼロの使い魔 {双月の騎士, 三美姫の輪舞}
d\.c\. {s\.s\., ii, ii s\.s\.}
魔法少女リリカルなのは {A's, StrikerS}
shuffle! memories
コードギアス 反逆のルルーシュ R2
clannad after story
ひだまりスケッチ ×365
これをXMLに変換すると、
<Objs Version="1.1" xmlns="http://schemas.microsoft.com/powershell/2004/04"><Obj RefId="RefId-0"><TN RefId="RefId-0"><T>Deserialized.System.Collections.Hashtable</T><T>Deserialized.System.Object</T></TN><DCT><En><S N="Key">コードギアス 反逆のルルーシュ</S><S N="Value">R2</S></En><En><S N="Key">ゼロの使い魔</S><Obj N="Value" RefId="RefId-1"><TN RefId="RefId-1"><T>Deserialized.System.String[]</T><T>Deserialized.System.Array</T><T>Deserialized.System.Object</T></TN><LST><S>双月の騎士</S><S>三美姫の輪舞</S></LST></Obj></En><En><S N="Key">d\.c\.</S><Obj N="Value" RefId="RefId-2"><TN RefId="RefId-2"><T>Deserialized.System.Object[]</T><T>Deserialized.System.Array</T><T>Deserialized.System.Object</T></TN><LST><S>s\.s\.</S><S>ii</S><S>ii s\.s\.</S></LST></Obj></En><En><S N="Key">魔法少女リリカルなのは</S><Obj N="Value" RefId="RefId-3"><TNRef RefId="RefId-2" /><LST><S>A's</S><S>StrikerS</S></LST></Obj></En><En><S N="Key">shuffle!</S><S N="Value">memories</S></En><En><S N="Key">無限の住人</S><S N="Value">BLADE OF THE IMMORTAL</S></En><En><S N="Key">clannad</S><S N="Value">after story</S></En><En><S N="Key">ひだまりスケッチ</S><S N="Value">×365</S></En></DCT></Obj></Objs>
となり、大幅に文字数が増えてしまう。
項目数が数百万のデータをXMLデータベースに格納して利用するのはまだまだ現実的ではない。