現在ホームページのリニューアル中で作業量が半端じゃない状態でこのゴールデンウィークを終えました。現在も尚制作中なのですが、今現在のホームページ事情について少々書きたいと思います。
インターネットは歴史的にいうとつい10年前ぐらいから始まったといっても過言ではないわけですが、実際は1960年代からすでにネットワーク自体は実用化されていました。しかしHD機器のお値段がちょっと個人には手出しができない...という現実的な問題がありましたし、光ケーブルはまだまだ実験段階ということで通信網は専ら電話回線か今でいうところのLANケーブルが主流だったわけです。しかしこの2011年現在はもはやインターネットなしでは生きてゆけないという方々がおられるほどになってしまいました。少し前にいわれていた「インターネットは怪しげなところ」という印象も全くなくなり、誰もがネット上に自分のカード番号をホイホイ入力できるという信頼性が常識となり、その信頼感のもと私自身もネット上で買い物なんかをごく頻繁にします。Facebook、mixi、Apple Store、Amazon、Twitter...と単なるショピングやソシャルネットワークを超えて殆ど日常的にインターネットに触れる現代人なのですが、実はこんな世の中でもまだまだ様々な誤解があります。その中でもSEO対策(検索エンジン最適化*1)についてちょっと触れたいと思います。
各企業、各個人...理由はともあれホームページのアクセス数をあげておきたいものです。しかしこのSEO対策に対しては未だに様々な誤解と先入観があります。というのもこの「検索エンジン最適化」を生業としているネット広告会社やネットワークイノベーションを行っている会社が多数あるために、それらの企業利益も含めて本当のところが出てきたり隠されたりと...なかなか本当のところが見えづらいことになっているのです。少なくともSEO対策として数百万という価格がこの世に存在することから言ってもそれらの戦略はごく内密にされているというわけです。しかしながら、数百万の投資をしなくとも自分でできるSEO対策は実はたくさんあります。またネットワーク社会(ここではあえて社会といわせてもらいますが)は日々刻々と進化しています。例えばFacebookはつい一年前まではここ日本では殆どマイナーなソシャルサイトだったわけですし、それ以前はmixi全盛期でした。Twitterに火がついたのも数年前、それ以前はソシャルメディアすらなく個人や企業のホームページと人気のエロサイトがポツポツとあったという時代です。
しかし、その前に検索エンジンというサイトはどのようにして成り立っているのかという基礎知識を身につけておくと同時にSEO対策というものの中身を覚えてしまいましょう。検索エンジンは基本的にはbot(ボット)とかクローラーと呼ばれるサイト巡回ロボットというプログラムによってネットワーク上の情報を収取します。これはどんなプログラムかというとやや語弊はありますが大雑把にいって、「テキスト」を読むロボットです。人間のようにテキスト(文章)を読むのかというとそうではなくてあるルールにしたがってテキストを読みます。実際にはこの「ルール」に従うことが検索エンジン最適化の鍵になります。そしてそのルールにしたがって読み込んだデータをデータセンターという巨大サーバーに送り込みインデックス化します。これはどのURLにどのテキストがあるのかというデータを要約して保存するのです。この要約は人間のように重要なポイントを絞り込んで短くまとめるという要約ではなく、出現する単語の頻度、またはその単語同士の関連性の重複度を調べ、重要な単語とそうでない単語をより分けてゆきます。例えば企画塾ですと、少なくとも「企画」という単語は既に社名でもつかっているということでホームページ上にもごく頻繁に現れます。ボットは「企画」という単語が重要であろうことを予想します。そしてそれに連動する頻度の高い単語を関連付けてゆくのです。これは元々欧米の言語を元にプログラムが組まれている為に「単語」という単位とそれを羅列した「テキスト)文章)」というデータ分析の方法論が出来上がっているのです。欧米の文章は単語ごとに半角スペースが入ることから単語単位の分析がスムーズに行われるのです。日本語の場合は、てにをはという助詞が文章をつなげてゆくことから検索エンジンのボットを構築するのにこれまた違ったアルゴリズムを使用しています。しかしここ現在に至ってはかなり優秀な検索をすることが可能になっています。
この単語の重要度は、どのように分析するのかというと、細かい文章の中に現れる単語よりもタイトルなどに現れる単語に敏感に反応します。つまりHTMLタグでいうと<h1></h1>というタグです。これはWebデザイナーの能力にもよるところですが、ただ綺麗に大きく見せるという意味ではその他のタグを使用することもできるし、画像などをタイトルに使うこともできます。しかしSEO的には大問題です。画像に描かれた単語は正直いってボットには読むことができません。画層のxxx.jpgというファイル名を読むのがやっとです。(*1)単語の重要度はそのHTMLタグの種類によって位置づけられています。まずこれが第一です。
このURLにはこの単語が重要らしいというわけで、検索エンジンはキーワード(単語)検索を行うことができます。複数の単語をスペースで区切って自分の探したいページに行き着くというわけです。
しかしこの単語レベルのランキングがどのようにして検索エンジンのランキングに影響を与えるのでしょう。簡単にいえば「誰にどれだけ必要とされているか?」という評価基準で検索ランキングの高低を判定しているのです。では、この必要とされているという基準は何で測るのか?それは、他のサイトにどれだけリンクが貼られているか、です。他のサイトにたくさんのリンクが貼られている、または紹介されている、「ここを読んでみてください。」を複数のサイトでそのように扱われているページは検索ランキングを確実に伸ばします。つまり文章がつまらない、危険である、見たくない、人気がない...というページは自然淘汰的に「その他のページにリンクされていない。」ということになります。ボットはごく頻繁に現れるURLをチェックしそれを分析しランキングの基準に反映させます。例えば、Gigazine (http://gigazine.net/)というサイトですが、今現在では朝日新聞、毎日新聞、日経新聞、産経新聞...の部数を足してもまだ足りないというぐらいのアクセス数をもったニュースサイトです。このサイトはあまりにも人気があるために検索エンジンでもトップに必ず位置していますし、gi...と検索窓に打っただけでGoogleのサジェスト機能は「Gigazin」とすべての単語を補完してくれます。このサイトは日本全国の人々に本当に必要とされているのです。インチキなSEO対策でトップを維持しているわけではないのです。そして勿論私の個人ブログにもブックマークしてあります。こういう人が日本全国にたくさんいらっしゃる...そんなわけで検索ランキングが一位なのです。このリンクの数というのが第二の重要ポイント。
かつては、.php や.cgiという動的なページは.htmlに比べ重要度の低いページであると判断された時代もありましたが今はそんなことがなくなりました。スクリプトで出力したテキスト(専門的に言えばサーバーサイドスクリプト)はhtmlと同様の価値を持ちます。しかし、これから先が問題です。重いデータを扱うページの表示時間が長くて諦めて他のページへ飛んでしまったという経験はありませんでしょうか?実にここがポイントです。開くのに時間のかかるページはダメ!とボットは判断するのです。素早く表示するというページを重要視するのです。ですのでサーバーレスポンスの遅いサイトは少しずつランクを落としてゆくという事実がGoogleより数ヶ月前にアナウンスがありました。他の検索サイトもそれにならう傾向にあります。実際上の感覚としてこのサーバーレスポンスが検索ランキングに重要な意味をもたらすかどうかというのは私自身は大きな声でYESと言えないまでも、一応公的にアナウンスされているということで注意しておいた方がいいと思います。
そして第4のポイントです。ごく頻繁に更新され活発であるサイトが検索ランキングの重要な位置を閉めます。例えばインターネット夜明けの2000年前後のホームページというのは今でも残っています。しかし検索している最中にそれらを発見することはあるでしょうか?例えば更新が1999年で止まっているページを発見するということは稀なのです。なぜなら更新のないページ、または関連するページが全く更新のない場合にはそれらの重要度を低く見積もるわけです。つまりこういうことです。更新がないページ(保存してあるページ)があったとしても、そのサイト(同ドメイン)の他のページが日々生成され更新されてゆくと、更新のない同サイト(同ドメイン)のページも同様に活発なコンテンツの1つとみなされるわけです。つまり1つのサイトでもってドメインを一揃えにしておくことは非常に大切なことです。ツリー上に広がるその階層を検索エンジンのボットは総合的に判断します。かっこいいからといってたくさんのドメインをマルチドメイン機能でもって無秩序に生成しそれらをリンクさせるのもよいかもしれませんが、ほどほどにしておいた方がいいでしょう。
以上4点を簡単に説明しましたが、まだまだ注意すべきことはたくさんあります。そのニッチなテクニックを生業にしているキーワード広告の会社もありますし、また日々刻々と変化する検索エンジンのアルゴリズムをそもそも知っている人なんかもいるわけなので、我々としては日々それらの情報に耳を傾けている必要があります。
しかし、これらの検索エンジン最適化(SEO)の基本的なコツは、実際問題として我々の人間生活と何ら変わりがないことがわかります。タイトルタグ<h1></h1>に関しては、誰だって要点となる重要な言葉を最初に話してもらいたいし、そうすることによって理解度は深まるし早まります。だらだらと最後の方で重要な言葉をぽつりとつぶやかれたのでは何が重要で何が要点だったのかはさっぱりわかりません。同様にして他のサイトにどれだけリンクされているかという問題も、必要とされている人間は常に誰かに紹介され、誰かのアクセスが頻繁で、電話がくるし、メールが来るし、話しかけられるし、手紙がきます。サーバーレスポンスも同じでしょう。反応があまりにも遅い人には声をかけにくいし、まして何かを聞いたり質問したりする気分にはなれません。最後に1999年の知識を最後に更新されていない人間がいたとしたら皆様に必要とされるでしょうか...。。
ということで誰にでもできるSEO対策の話でした。
*1 検索エンジン最適化とは、自分のホームページなどがあるキーワード(単語)によって検索エンジン(GoogleやYahooなどの大手検索エンジンサイト)に期待通りのランキングできちんと表示されるようにホームページを操作することをいいます。黙っていたらホームページは殆ど死んでしまいます。手を打てば瞬く間に(あるいは、ゆっくりと確実に)検索ランキングを上げることができます。
*2 勿論、画像が検索エンジンのボットによって読み込まれないわけではありません。最近では色の分析や大きさの分析、また周囲のテキストとの関連から様々なアルゴリズムで画像の検索も可能になっています。OCNなどの画像テキストを読み込む技術もかなり発達しています。ですので数年後にはもしかしたら画像検索がテキスト同様に行われる可能性もあります。



