トップページ > TIPS > 検索エンジンスパムについて

CSSレイアウト[TIPS]

検索エンジンスパムについて

検索結果の上位に表示させるために施した行為で、サーチエンジン側に悪質と判断されるものを「検索エンジンスパム」という。

ロボット型検索エンジンと言われる全文検索型サーチエンジンでは、クローラ(巡回ロボット)というプログラムが、WEBページの発見や内容の回収をし、結果をデータベースに反映させる。
クローラはHTMLのテキスト、PDF、ExcelやWordなどの文書ファイルも回収。外部CSSファイルも回収するらしい。HTMLではテキストだけでなく段落や見出しタグなど文書構造も認識する。

サーチエンジン側は、悪質にクローラを騙して上位に表示させようとするテクニックを「検索エンジンスパム」とし、これがあるページは上位にヒットさせない。さらに悪質な場合は検索結果から排除される。

悪気なく使っているテクニックも「検索エンジンスパム」とされる行為だったら、ペナルティの対象になってしまう?  とにかく、どんな行為が「検索エンジンスパム」なのか知っておく必要がある。

検索エンジンスパムとされる行為
スパムとされる行為で、デザイナーに関係ありそうなのはざっと下記のようなものだった。
[1]隠しテキスト・隠しリンク
[2]キーワードの乱用
[3]その他
[1]隠しテキスト・隠しリンク

隠しテキストとは、display: none、text-indent: -9999、背景と同色の文字、1pxの文字など。
タイトルに画像にh1、メニューボタンにh2を使う時、私もCSSで「text-indent: -9999」を使っていたが、 この行為は隠しテキストになるらしい。しかし使っているサイトもあるので、絶対にスパムとは言えなさそう。

他にも、背景と同じ色で読めない文字(背景とほとんど同色で人間にはほぼ読めない文字もダメ)、1pxで細かすぎて読めない文字もダメ。これは分かる気がする。

隠しリンクとは、クロールされるためだけにユーザにはわからないリンクを貼ること。隠しテキストを使ったリンクや、1×1ピクセルの画像やハイフンなど小さいものに貼ったリンク。

ただ、このスパムは、クローキング(クローラには読めてヒトには読めない内容の表示)のために行う、いかにも悪そうな行為を言うのだと思う。
「display: none」を使わないと無理な場合もあるので、あまり神経質にならないようにしたいのだが。

[2]キーワードの乱用

ページ内にヒットされそうな言葉を列挙すること。またはサイトに関係ないキーワードを書くこと。
隠しテキストを使ったり、画像のalt属性や、titleタグに大量にテキストを書くような行為。
キーワードは文脈に合わせて効果的に使用すること。上位表示を目的に、サイトとは全く関係ないがヒットしやすいキーワードを書く行為がスパム。

また、head内に記述するMETAタグのキーワード(keywords)と紹介文(description)だが、
昔はkeywordsにキーワードをたくさん書いたので、いまのサーチエンジンはkeywordsを重視していないそうだ。 ただ、検索結果に紹介文(description)は採用されることがあるので、必要事項はきちんと書くこと。

[3]その他

そのほかに、
・重複するコンテンツ(上位表示を意図して、コンテンツを複数ドメインにまたがって複製する偽装行為)
・実質のないアフィリエイトサイト
・検索エンジンだけを対象に作成された誘導ページ
など。

Google、Yahoo! のガイドライン

Google、Yahoo! で「検索エンジンスパム」に関して公開しているガイドラインはこちら。
Google:ウェブマスター向けガイドライン「品質に関するガイドライン」
Yahoo!:Yahoo!検索 インフォセンター「検索エンジンスパムとは?」