クロールにおける『URL エラー』をなくする
①.WordPress のURLは https://arakan60.com
②.ホームページのURLは http://arakan60.mydns.jp
③.このURLにパスを指定し http://arakan60.mydns.jp/wordpress
で WordPress にアクセス と、3つのURLを用意している。
以下は、それぞれのURL毎のエラー発生状況で、8月の末頃から『見つかりません』が発生し、その後、『サーバーエラー』が増加した。
①.https://arakan60.com: スマートフォン。
②.http://arakan60.mydns.jp : PC。
②.http://arakan60.mydns.jp : スマートフォン。
③.http://arakan60.mydns.jp/wordpress: PC。
③.http://arakan60.mydns.jp/wordpress: スマートフォン。
『URL エラー』の内容は、あるはずもないディレクトリーがクロールされており、ページ内に設定した内部リンクのせいで、ディレクトリーを遷移しながらURLを探しているように思われる。そこで、 ディレクトリーの遷移を防ぐべく、存在しないディレクトリー構成を robots.txt に登録し、アップロードしてみる。 すると、少しずつエラーが減少するとともに、ブロックされるエラーが増加するので、毎日クロールエラーの発生状況を監視し、新たにエラーになったURLをチェックしつつ robots.txt にブロックすべきディレクトリを追加するという作業を地道に続ける。
(テキストエディターで編集し、FTPでアップロード)
robots.txt でブロックしたら、サイトマップのチェックが必要。
検索結果に反映されるよう、ブロック条件の見直しが必要。
①.wordpress ディレクトリーに設置した robots.txt の内容(一部)。
Disallow: /wp-admin/
Disallow: /wp-includes/
Allow: /wp-includes/js/
Disallow: /04kousaku/
Disallow: /03bike/
Disallow: /02jiko-su/
Disallow: /01kaidou/
Disallow: /02jiko-su/27oosaka/img27osk/green/
robots.txt でブロックした結果 2016.10.21 現在の状況 https://arakan60.com
②.www ディレクトリーに設置した robots.txt の内容(一部)。
Disallow: /05forum/04kousaku/
Disallow: /05forum/03bike/
Disallow: /05forum/02jiko-su/
Disallow: /05forum/01kaidou/
Disallow: /05forum/img05/
Disallow: /04kousaku/03bike/
Disallow: /04kousaku/02jiko-su/
Disallow: /04kousaku/01kaidou/
Disallow: /03bike/03bike/
Disallow: /03bike/01kaidou/
Disallow: /02jiko-su/01kaidou/
Disallow: /02jiko-su/27oosaka/img27osk/green/
Disallow: /02jiko-su/27oosaka/img27osk/
Disallow: /02jiko-su/img227/27-032/
Disallow: /02jiko-su/img227/27-029/
Disallow: /02jiko-su/img227/27-024/
Disallow: /02jiko-su/img227/27-013/
Disallow: /02jiko-su/img226/26-012/
Disallow: /02jiko-su/img224/24-021/
~ 省略 ~
Disallow: /pagead/04kousaku/
Disallow: /pagead/03bike/
Disallow: /pagead/02jiko-su/
Disallow: /pagead/01kaidou/
Sitemap: http://arakan60.mydns.jp/sitemap.xml
robots.txt でブロックした結果 2016.10.21 現在の状況
http://arakan60.mydns.jp
http://arakan60.mydns.jp/wordpress
徐々に減少するも、毎日、クロールエラーの発生状況を監視する状況が続く。
①.https://arakan60.com
このサイトは、完全に無くなったわけではないが、スマートフォンの『見つかりませんでした』の1件のみになった。
②.http://arakan60.mydns.jp : 完全に無くなった。
③.http://arakan60.mydns.jp/wordpress: 完全に無くなった。
これで、クロールエラーとの戦いが終わった訳ではないと思われるが、一旦は終息したので記事にして残す。
以上。
(2016.10.25)