紅い婆 潰れる

加藤法之




0:序論

 少し前の事になるが、簡易カメラのついたノートパソコンのCMで、自分を自己紹介した映像をそのカメラで録画し、それをメールで送れることを謳い文句にしたものがあった。このCM中では、相手が難なくそれを受け取ってにこやかに談笑している予定調和的な画で終わるのだが、この展開に現実味を感じなかった人は多かったのではなかろうか。筆者もそうした一人であり、何故なら我が身に照らして考えるとき、実際に自分にそんなメールを送られたとしたら、一体どの位の容量になるのか見当もつかないわけで、それをダウンロードすることを考えたとき、これはほとんど嫌がらせ、いやもうメールボムとすら思うだろう。
 どうしてこんな事になってしまうかと言えば、少なくとも現状環境ではまだ、映像を送るにはネットワークの転送速度が高くないということがあげられる。それならば転送速度を今すぐにでも上げられればよいのにとなるのだが、これにはモデムの高性能化だけでなく、転送媒体であるケーブルの張り替えも必要になってくるため、一朝一夕でできるものではない。そうなるとここに発想を転換して、送るデータの方を減らすことを考えることになる。これなら、ハード面の向上に依らないので安価に実現できる皮算用を出せるため、この問題を解決する有効な手段となりうるのである。
 そこで更に突き詰めるとこれには二つの方法、つまり、データの質を落とす方法と、データを圧縮する方法が考えられる。しかし現実には、質を落とすアイデアも、映像のようなアナログデータを変換する時ならともかく、文章などでは落とすわけにもいかないし、かといって圧縮技術も、例えばLHA圧縮をかけたファイルをそれ以上小さくすることが難しいことに代表されるように、その向上は現在は頭打ちになってしまっている。
 ところが最近この分野にて、全く新しい観点から圧縮効率を向上させようという試みが出てきており、その斬新な方法が急速に世間の耳目を集めている。そこで本稿では、様々な角度から圧縮の向上にチャレンジしている研究の最前線を紹介していくことにする。


 純粋圧縮型
 古典的圧縮方法として、圧縮技術の中でも最も基礎研究が進んでいるのがこのタイプである。原理は至って単純、なりふり構わずとにかく同じところにデータを押し込めていくというもので、解凍するには、薄っぺらになった内容を適当に摘み出してから水をかけて元に戻すという、かなり強引な圧縮法である。
 この方法なら確かに、圧縮を受け持つプレス機の性能が上がれば即それが圧縮率の向上になるわけで、開発リスクが他の間接的な方法に比べて低く抑えられるなどの利点もあるのだが、被圧縮物が後で元に戻すことが出来るのかという点が圧縮の限界値を決めるという欠点も持っている。実際、急速に元に戻すと被圧縮物にひび割れなどの影響が出ることが判っており、小錦の画像データを圧縮して元に戻したところ、ジャミラの画像に変質するといった弊害も出ている。
 他にも、圧縮時にデータから排出される多量の水分も問題である。データが内包している水分量が膨大であることはずいぶん前から指摘されていたのであるが、圧縮率が飛躍的に向上した近年ではそれが更なる危機感を伴って顕在化してきており、中国における新世紀をリードする新技術の開発を目的とした国家プロジェクトの一環で、極秘裏に行われていた大規模圧縮装置の暴走が、先年起きた黄河大氾濫の真の原因であるということは公然の秘密とされている程である。そしてまったく同様の理由で、解凍時の水分供給が深刻視されていることは言うまでもないだろう。
 圧縮法にはこうした問題だけでなく、圧縮率そのものにも既に限界が見えてきている。というのも、トカマクの中で発生させたねじれ磁場を用いた究極ともいえる圧縮技術により、元の大きさの実に一千万分1までの圧縮を達成しており、もはやこれは核融合の一歩手前まで来ているレベルにあるのだ。現に研究者の一人はこれまでの気苦労を語る中で、輸送中にうっかり臨海点に達してしまった文書ファイルの事をにこやかに語ってくれたものだ。(この文書ファイルは“我が闘争”だったらしく、被圧縮文書内容がそもそも危ないものだったのだともいえる。ちなみに暴走時の爆発音は、「ジーク・ハイル!」だったという。)
 圧縮法の最後に、異色な研究を紹介しよう。圧縮方法の中でも特異なこの研究は、なんと人工的に高重力を発生させて押しつぶす方法である。マンガじゃあるまいし、そもそも現代科学で可能なのかと思うのだが、実際科学ではなく、バルタン星人の重力嵐術という忍法を用いる。同星人の鋏状の腕から発射される光線を利用するらしいのだが、その方法の全貌は謎に包まれており、取材を試みた筆者も「キレテ・キレ・キレキレテ」と挨拶を試みたが、「君ノ宇宙語ハ判リ難イ。」と断られてしまったのである。残念だ。


 圧縮型はその単純さ故に技術限界が比較的早期の段階から認識されたため、近年ではめっきり、同研究に勤しむ者は減少した。(あくまで仮定の話ではあるが、圧縮型が一般的技術として普及してしまったとすると、各パソコンの中には臨界点間際のファイルがうようよしているなどということになりかねなかったわけで、研究者の賢明な処断に胸を撫で下ろすばかりである。)
 これに変わるかのように増えてきたのが、データをそのままの形ではなく、何らかの別の形式に一旦置き換えるという考え方を基礎としているものである。


 要約型。
 元のデータから、そのデータの核となる部分を抽出することでデータサイズの縮小化を目論むのがこのタイプである。元に戻すときは欠損箇所を核部分から連想してゆくという特殊な考え方に基づいた圧縮法であり、核となる部分を小さくするほど圧縮率を高くすることができると判るだろう。  だが、このタイプの欠点が解凍時の精度にある事は、聡明な読者ならすぐにお気づきと思う。例えば、両側から両親に手をつないでもらい、ぶら下がって喜んでいる少女を題材とした微笑ましい画像が、解凍後にはヒューストンで発見された宇宙人の死体が軍人二人に連行される画像に変質してしまうなどということもしばしばおこるのだ。
 結局このタイプにおける解凍の質はそのまま、“核”の質及び個数に比例するわけで、圧縮率が果てしなく高くできる反面、そこから元のデータを復元するのはこれもまた果てしなく難しくなってしまうという難点も持つのだ。

 上記のような諸問題を抱えている要約型であるが、効果を上げている研究もあるにはある。
 新聞や雑誌などの連載小説は、最初から読んでいない読者を置いていかないようにするため、一程のペースで梗概を載せる。一般に粗筋を作るという行為自体、圧縮技術の一例とみなせるのだが、新聞小説の梗概は、書くスペースが一定量であるため、回を追う毎にその文章作成は困難を極める作業になるという、他の粗筋作成とは違った特質がある。つまり、それを難なくこなしてしまう梗概文作成者の方法論を利用しようというのがこの研究である。
 梗概圧縮と命名されているこのタイプはかなり実用化に近いところまで来ており、サザエさん全五千話を入力して、「お魚加えたドラ猫追っかけて裸足で賭けてく妖気なサザエさん。」と出力するなど、見事な成果を上げている。これを解凍した結果も良好で、復元された五千話には、120話に一度のペースで磯野家に泥棒が入り、1280話の周期で磯野家のお隣さんが伊佐坂さんと浜さんとで入れ替わることも確認されている。(この周期性の報告については、その事例の少なさから、本件の信憑性に対し疑問を表明する向きがあったのだが、これに対する確証を得るための再吟味の際、驚くべきことに、引っ越して来た浜さんが、初めて会ったサザエさんをお手伝いさんと間違えるところまで再現されていることが判明したという。)  要約型の欠点をほぼクリアーしたかに見える梗概圧縮であるが、実用化に向けての課題を問うと、「“加えた”を喰わえた”、“賭けてく”を“駆けてく”、“妖気”を“陽気”にすることですかね。」と研究者は胸を張って答えてくれた。ATOKを紹介した方がよいだろうか。


 重ね合わせ型
 圧縮型がデータの物理的押し込めによったことがその限界を決めていたことは前述したとおりだが、“押し込め”でなく“変質させる”という考え方を採用しているのが以下に示す“重ね合わせ型”である。
 力学などで学ぶベクトルの概念。これは任意の大きさと方向を持つ矢印が、幾つかの単位方向に分解することができるというものであるが、重ね合わせ型は正にこれを圧縮技術に利用している。つまり、同じ場所に別の単位方向の成分を持ったデータを重ね合わせていくというものである。合成された情報は圧縮型の様に密度が高くなるわけではなく、ベクトルの矢印の向きが変わるだけであるから、単位方向が互いに干渉しない状態であれば、いくらでも重ね合わせが効くのである。
 実験中のあるシステムでは、片方に生きた猫、片方に死んだ猫を入れ、合成状態を作り出すことに成功している。いったい中ではどうなっているのかとても知りたかったのだが、良く判らないことにそれを知った途端その状態は維持できなくなってしまうそうである。「覗いちゃ駄目ですよ。」と、研究者から念を押されてしまい、鶴の恩返しの主人公のような気分になってしまった。

 実用化されそうなのはxyz成分、RGB成分など、比較的物理的表現のしやすいものを中心に研究されているのであるが、中にはn次元成分を利用できるという、無限の可能性を秘めたシステムも考案されている。
 これはその名の通りあらゆる次元に情報を持たせるというものだが、こんな途方もない重ね合わせシステムが、理論段階から研究に値する段階まで来ているというのは、重ね合わせを受け持つベクトルを表現する媒体が見つかったからに他ならない。そして、n次元ベクトルをも表現し得る媒体とは、驚くべき事に猫なのである。
 これは上記猫実験から偶然見つけられたらしいのだが、猫の持つ鋭敏な感覚はあらゆる単位ベクトルを感知することが出来るらしく、これを利用することでn次元の情報を重ね合わせようと考えているらしい。実際最新の実験では、与えられた15次元にも及ぶ多方向からの情報を、被験体の猫はすべて認識し、それら情報を重ね合わせたベクトルを向くという成果を得ているとのことだ。この状態、端から見ると猫がいつものように気紛れているとしか見えないのだが、研究者に言わせると正にそれこそが15次元合成ベクトルを表現しているらしいのである。
 つまり、“そっぽを向いて”いるのだ。


 阿吽(あうん)型
 長年連れ添った夫婦になると、日常何か伝えようとするのにいちいち会話で主語と動詞を連ねるようなことはせず、ただ「あ。」と言うと、「うん。」そうか、と伝わるらしい。阿吽の呼吸と言われるこのコミュニケーションを解析し、圧縮技術に応用しようとしているのが阿吽型システムだ。
 圧縮という言葉を用いたが、このタイプにおける圧縮は、他のシステムのそれとは少し違う。どういうことかというと、例えばこのシステムを使って大容量の画像データを圧縮したとしよう。出来上がった圧縮ファイルは、とにかく驚くほど小さくなっており、試しに中をエディターなどで見てみると、多くの場合「あ」としか記されていないのである。こんなのでホントにいいのだろうかと訝ってしまうのだが、これを解凍側システムにかけると、起動中一瞬だけ、「うん」という音がして、それでもう解凍は終わるそうなのである。筆者が見学した実験で元に戻したファイルを調べてみると、確かに圧縮前のラムちゃんのセーラー服姿の絵が解凍後に再現されていたのであった。
 このシステムの特徴は、解凍を担当する側がデータを圧縮した側の環境を、隅から隅まで知り尽くしているところにある。それこそハードウェアのスペックから、使用者の年齢,性別,性格まで、ありとあらゆる情報が網羅されているのである。そうした上で圧縮された“あ”を見たとき、解凍側システムはその“あ”が醸し出す微妙な雰囲気から元のシステムの状態を読みとり、見事元のファイルに修復するというわけだ。
 ほとんどのファイルが“あ”にしかならないという意味では画期的なシステムと思われるのだが、欠点と言えばやはり解凍側に必要な圧縮側のデータであろう。なにしろ些細な文書データを解凍するだけで20TB(テラバイトと読む。たくさんを示す記号。)にも及ぶ圧縮側データが必要になるのであり、解凍精度を向上させるほど大容量の情報が必要になるとなれば、大々的な導入に二の足を踏まざるを得ないのが現状であろう。
(ちなみに、先述の例で見た“ラムちゃんの画像”を解凍したコンピュータは、画像を圧縮した側の研究者が寝食どころか、行動まで共にしたモノであった(背負って持ち歩いたそうだ)らしい。まったくマック使いってやつは。)

 孔子曰く。「賢なるかな回也。一を効いて十を知る。」
 孔子が一言言葉を発すると、孔子の弟子の一人である顔回子淵は、即座にその本質的なところまで悟ることが出来るため、その頭脳の聡明さを孔子が称賛している。孔門の十哲の中でも最も明晰といわれる顔回の文章解読能力を利用したのが阿吽型を応用した一十型だ。
 一十型はその由来の通り、少ない情報から判断して元の情報を復元するため、前述の要約型に系統を辿っても間違いではない。が、一十型の特徴的なところは、時にオリジナルよりも多くの解凍内容になってしまうことがあることだ。
 例えば圧縮された内容に、“やまと”とあったとしよう。要約型ではこんな場合、“日本を表す別表現”とか“近畿の一地方を指す名称”とか、“第二次世界大戦中日本海軍が所有していた戦艦”とか、その程度の広辞苑のような解凍をするだけである。が、これが一十型だと、“西暦2199年に遊星爆弾を受けて放射能が蔓延した地球を救うべく宇宙に飛び出した戦艦”といった出だしに始まり、“敵のミサイルが当たる瞬間に消えて一気に火星まで飛んでいってしまい”、“正面にある穴からは木星の浮遊大陸を吹っ飛ばす程のエネルギー波を撃ち出すことが”などと、訳の分からないことを延々と出力するのである。このタイプが別名“うんちく型”と呼ばれていることからも察せられるとおり、一度調子に乗って出力し出すともう全然止まらない、知っていることをみんな出してしまう“暴走”をしてしまうのだ。ドメル将軍の悲運を思うあまり感涙に咽ぶようであったらもう、使用者は溜息を一つ付いてパソコンの電源を切るしかないのである。
 本システムはそれでも、基本的には良くできたものなので、研究者は解凍時に暴走を起こす恐れのある言葉をピックアップして禁則単語とすることで、本研究の価値を向上させようと試みている。しかしこの禁則単語も、“ミノフスキー”,“バルキリー”,“使徒”,“デュエリスト”など、あまり耳慣れないものだけならともかく、4500文字もあると流石に実用性を疑ってしまうのである。(禁則単語を紹介した冊子はちょっとした辞書を思わせ、部外者からは“オタク事典”と陰口をたたかれている。)


 話しかけ型
 本研究を圧縮法の一つとみなすのは一体正しいのだろうかと悩んだのだが、バラエティに富んだ同分野を紹介するのが本論であれば、多少の逸脱はご容赦いただきたい。
 この話しかけ型、これまでの圧縮が保管と転送を主眼としてきたのに対し、本研究は保管のみに主眼を置いているのが特徴だ。すなわち、本方法は次々と入れ込まれるデータのうち、あまりいそうにないなぁと思われる物を勝手に消してしまうというもので、寂しい独り者がお人形さんに話しかける言葉のように、見返りを期待しない行動になぞらえたのが命名の由来である。
 本方法、消す基準が面白い。一般的には長い間使われない物から順に消していくと考えるのだが、本方法は、使用者の“顔色”を見るのである。つまり、保管してあるデータのうち、使用者の興味の対象を惹かなくなったものを「ひっそり」消すのだ。使用者が忘れてしまった物を消すというもの凄いことをしているので、どういう原理になっているのか聞いてみると、壁紙とかスクリーンセーバとか機動音とかの、常駐データの変遷を目安の一つにしていることを教えてくれた。
 何となく分かると思うが、本方法の欠点は、使用者の好みが未来において戻ってくることまでは予測できない事である。映画も完結して「もう大人になろう。」と外しておいた綾波レイの壁紙を、少年エースの連載再開からふとまた見てみようなどと思ったときに困ってしまうのであり、慌てたCPUが、「記憶にございません。」と言ったとか言わないとか。


 さて以上、現在最新の圧縮技術研究の数々を見てきたのだが、その真価である圧縮率の高さについては一目置くものの、どれもこれも一癖ありそうに感じてしまうあたり、このうちのどれが後世に標準化されていくかという点、なかなか興味を引かれるところである。
 しかし、上記いずれが採用されるにせよ、圧縮システムそのものが大容量になるのは否めないから、どうやら筆者のパソコンには入りそうもないのである。


論文リストへ