KazMuzik.net
Music / Technology / Healthcare / Immigration / アメリカ
Google
 
<< Daylight Saving Time starts tomorrow this year.Sibelius Mix Window - incompatible between Mac and Windows >>

sitemap - KazMuzik.net Project #4 - KazMuzik Blog
2008-03-09 11:29

3/7 に紹介した、Google Webmaster Central から、Webmaster Tool にログインすると、自分のサイト(私の場合は、KazMuzik.net)を管理できるようになります。サイトを登録して、しばらく(数日?)すると、Google がサイトを crawl して、検索の Index に反映されることになります。

昨日までは、Google の Index に、まったく含まれていなかったのですが、今朝になって、site:kazmuzik.net で検索すると、24 ページ含まれていました。しかし、含まれているページには、かなり偏りがあり、top page も含まれていないため、別のサイトからのリンクで、一部だけ crawl (fetch) されたようです。(*)

そこで、sitemap を作成して、登録することにしました。下記のように、テキストの sitemap ファイルを作成しました。
$ find . -name '*.html' -print \
| sed \
  -e 's/^./http:\/\/kazmuzik.net/' \
  -e 's/\/index.html$/\//' \
| sort -u \
> sitemap.txt
$ 

831 URL(s) ありました。Tag の URL で、Latin-1 を含むものが 2つ、漢字を含むものが 3つあったので、それらはマニュアルで修正しておきました。

Google の Index に含まれないと、次のステップに行けないので、早く crawl してほしいところです。


2008-03-09 19:30 update
(*) 夕方になり、292 ページになっていました。右上の、検索ボックスからの検索結果も、それっぽくなってきました。

Tags: computer_technology