第121回「リンク切れ対策に特効薬があった」
◆私の考えるリンク切れ対策は二つ
「goo」と「infoseek」を検索の両輪にしてネットから社会を探る――この連載を始めて数ヶ月で、リンク切れがかなりの頻度で発生すると知った。そのために、当初は当該URLのアドレス紹介に止め、直ぐに内容へのコメントに入っていたものを、リンク切れになっても意味が通じなくならないよう、しっかり引用する方向に転換した。当時はそれくらいしか対策はなかった。
昨年、検索サイト事情に大変動があり、新しく首座を占めた「google」サイトの特性がリンク切れ対策になることを知った。リンクURLの元のタイトルがいかに長かろうと、検索窓にそのままコピー&ペーストしてやれば、さっさと移転した先を割り出してくれる。タイトルが短い普通名詞のような場合、リストアップされる対象が増えすぎて困る。しかし、プロバイダーを変えたり、同じ業者内でサーバーを移転しても、ディレクトリーの構造を変えない人が多く、ファイル名もまず変えない。元の短いタイトル名に加えてファイル名「***.html」を入れるだけで効率的に絞り込めることも分かった。
ファイル名はそのままでは読めないが、リンクの場所をマウスで右クリックし、「ショートカットのコピー」を選び、メモ帳などのソフトに貼り付けてもらうとアドレスが読める。この作業は次の項目でも必要になるので手順を覚えて欲しい。
この方法がかなりのリンク切れ場面で威力を発揮することは、体験的に分かっていた。しかし、特効薬と称するには苦しい。そんな折、INTERNET WATCHの「過去5年間の100億ページものWebページを保管したWebアーカイブが公開」で紹介されたThe Internet Archive「Wayback Machine」は確かに大量のリンク切れ原文を保管してくれていた。「デジタルコンテンツの永久ライブラリを構築」は本気である。リンク先アドレスを入力して調べるだけで、うまくいけば、繰り返し保存してくれているので原文の時系列変動まで見られる。試して使う限り、これは相当、頼りになると感じられた。
という次第で、私の考えるリンク切れ対策は次の両者併用になる。
1)Wayback Machineを使い原文を復活する
2)googleにタイトルを、必要ならファイル名も入れ移転先を検索
◆「復活・移転先発見とも不能」はほんの1割
googleだけでもかなり使えたから、両方あれば強力だろうと実際の場面で検証してみることにした。古い作品でニーズがあるものをと考え、検索サイト経由でアクセスが多いものから、3編を選んだ。1997/11/13の第27回「酸性雨問題に期限が切られた」に、1997/12/18の第32回「冷凍冷蔵庫に起きている事件」そして1998/07/09の第53回「明治維新(上)志士達の夢と官僚国家」である。冒頭の「奇抜と実験」で指摘されたのは「明治維新(上)」である。総合的学習スタートのせいか、いずれも最近、アクセスが増えている。環境、テクノロジー、歴史と分野的にもバランスがとれている。
リンク切れ対策の2項目を適用した結果を、それぞれ示す。
Wayback Machineにデータ収集されていても、内容が壊れて読めないものがいくつかあり、これは不可とした。なお、リンクの数字からは、私のサイト内のコラムをリンクした場合は修正されていて当然なので除外してある。
以上3回分の結果を合計、リンク数とリンク切れ数に対する結果の内訳をそれぞれ百分率で示すと次のようになる。
リンク切れの多さは私にも意外なほど。また、Wayback Machineも万能ではなく、googleによるアシストが予想以上に効いている。結局、リンク切れのまま手の施しようがないケースは1割ほどに止まる。4年以上前に書いた3作品のリンク49件中、4件だけ。しかも、「地球温暖化防止京都会議」のように会議終了までだけ存在し、コラム発表時点で早くも消えていたリンクを1件含む。残りの「純リンク切れ」3件は個人のウェブサイトである。
この結果だから、私の2項目併用対策は「特効薬」と称していいと思う。なお、Wayback Machineは米国側が昼間の時間、非常に混雑している印象だった。反応が遅い時は、時刻を改めて調べ直すことを勧める。
注:多くの読者はご存じかと思い、敢えて触れていませんが、ほんの少し前に消えたページなら、Googleのキャッシュで探すのが簡便です。アドレスを入力すると、キャッシュがあれば答えてくれます。Googleの情報更新までの期間しか生きませんから、ちょっと古いリンク切れには無効です。