ソース掲示板




すべてから検索

キーワード   条件 表示 現行ログ 過去ログ トピックス 名前 本文
リンク切れチェックと .htaccess ( Website Explorer )
日時: 2009/07/13 23:28
名前: lightbox



以前、ブログでリンク切れチェックをやった時に、
Website Explorer
Web_exp

というソフトにお世話になりましたが、あれから重宝しています。
使い方もいろいろ覚えて、ノウハウもありますが、今日は自分の
メインサイトのチェックするのに、ページが多すぎてラチがあかないので
ディレクトリ単位で気長にやっていこうと思ったのですが・・・

ハタと、ディレクトリ以下を見渡すリンクなんか無いぞ?

というわけで、sakura ですが .htaccess をそのディレクトリに設定したのですが、
話は簡単に終わらないものです



もともと、ルートディレクトリにあるのがデフォルトドキュメントとエラーリダイレクト
なので、該当ディレクトリにインデックスリストを表示しようと .HtaccessEditor
へ行ってみたのですが( だいたい、Apache は専門外 )、うまくいきません。で、いろいろ
試しているうちに↓のようになりました


拡張子:
DirectoryIndex index.html
  ↓ルートディレクトリ
拡張子:
DirectoryIndex index.html index.htm index.cgi
ErrorDocument 403 外部 URL
ErrorDocument 404 内部 URL
しかし、今度は sakura のサーバーがディレクトリリスト用のアイコンを用意してくれて 無かったので、http://www.apache.org/icons/ から必要なのをダウンロードして配置。 で、Website Explorer を使ってみました。このディレクトリは階層が無いので目的どうり うまくいったのですが( 階層ある場合はアプリでファイル一覧が必要ですね )、404 は沢山 ありすぎるので、後からやろうと保存したら読み込め無い・・ これは以前もあったのですが、リンクに ftp が含まれていて、そのせいで外部リストが 読みこめないエラーが出ます。テキストエディタで該当部分を削除すると読み込み OK です。 404 のチェックは、Website Explorer のエラーが発生しているページから 「開く」とすると、Website Explorer 内でブラウザ機能がついてるので、 さらに、ページを開いた同じポップアップメニューから「ソースを開く」と Website Explorer がその場所を専用ビュアーで開いてくれるので、該当 テキストをチェックして、Website Explorer 内ブラウザから、ページメンテ 用の CGI( そういうサイトなので ) を呼び出すというわりと効率の良い 作業ができます。 検索後、本体から「外部リンク一覧」を出します ツールバーの左端からデータチェックを行います( 最初は F5 で OK ) ※ リンクが多い場合はかなり時間かかりますが、全部終了を待たないでも、エラーが表示されたら ※ チェックを中止させて、残りは後から実行します。 エラーまたはリダイレクト部分を選択して下段のリンク元からポップアップメニーを出して 「ソースを開く」を選びます 該当部分が表示されるので、そのリンクのテキスト部分を覚えておいて、 ブラウジングされている場所を探します( 前画面のポップアツプメニューから「開く」) しかし、対象ページがそのブラウジング中にメンテできない静的ページの場合 は、いったん全てローカルにダウンロードして localhost でチェックするべきですね。 いずれにしても時間のかかる大変な作業ですが・・・・ リダイレクトに関しては、HTML 単位で自動で置き換え処理アプリ作れます けれど、力仕事でできない場合の選択肢ですね。
メンテナンス


日時: 2009/07/13 23:28
名前: lightbox