去る2012年7月18日に、GoogleがPandaアップデートを日本語と韓国語に対応してからというもの、オリジナリティのあるコンテンツを提供できるWebマスターは長年の溜飲が下り、無断でコンテンツをコピーしていたWebマスターには天罰が下るといったことが日常的に起きるようになりました。

これは素晴らしいことであると実感する一方で、このブログでもガジェット関連の記事を書く際に、他のサイトから情報収集した内容を掲載することもあるので、我が身を振り返って本当に大丈夫かどうか、少し不安になりましたので、コピーサイトとはどこまでのことを指し示すのか考察してみました。


Googleはなんと定義している?

GoogleのWebマスターツールではコピーサイトについて以下のように定義しています。
無断複製されたコンテンツの例としては、次のようなものが挙げられます:
  • 他のサイトのコンテンツをコピーし、独自のコンテンツや付加価値を加えることなく転載しているサイト
  • 他のサイトのコンテンツをコピーし、(語句を類義語に置き換えたり自動化された手法を使用したりして)若干の修正を加えた上で転載しているサイト
  • 何らかの独自の体系付けやユーザーへの利便性を提供することなく他のサイトからのコンテンツ フィードをそのまま掲載しているサイト
Googleウェブマスターツール:無断複製されたコンテンツ
ふむ、まるっきりコピーをしてはならないということでもなさそうですが、重要なところは『付加価値を付けずにコピーする』というところでしょう。
また、2番目の『自動化された手法』のリンク先を見てみると、”自動化されたツールで翻訳されたテキストが人間によるチェックや管理を経ず公開されたもの”という記述がありますが、ここから窺えることは、Googleのアルゴリズムは、きちんと人の手によって翻訳されているかどうかまでチェックしているということです。スマホ・タブレットの最新情報はどうしても海外の方が耳が早かったりしますので、このブログでも度々海外のサイトから仕入れた情報を元に記事を書くことがあるので、実はかなり気にしていたところではあります。一応わからない単語や熟語を調べることはあっても、原文丸々をエキサイト先生に翻訳依頼してそれをそのまま掲載するということはしていないので、問題ないと判断しています。

Googleのいうところの『付加価値』を考える

Googleはコピーがまるっきりだめなのではなく、付加価値が無いのが駄目なのだと言っていると理解していますが、それではGoogleが認める付加価値とはいったい何ぞや?ということを考えていきます。

 まずは質という観点から。どれだけのクオリティを誇ればGoogle先生に花丸をいただけるかということですが、明確な基準が無いので正直わかりません。が、Google先生はヒントを残してくださっています。以前にこのブログでも紹介しましたが、Pandaアップデートに伴い、良質なサイトについて明言しています。

Googleウェブマスター向け公式ブログ:良質なサイトを作るためのアドバイス

Google先生に「いいね!」と言わしめたら、それはもう充分な付加価値を提供していると見て間違いないでしょう。特に以下の点を反芻してみるといいでしょう(もちろん全部大事ですが)。
  • この記事は独自のコンテンツや情報、レポート、研究、分析などを提供しているか?
  • 同じ検索結果で表示される他のページと比較して、はっきりした価値を持っているか?
  • 記事はしっかりと編集されているか? それとも急いで雑に作成されたものではないか?
  • 記事が、あたりまえのことだけでなく、洞察に富んだ分析や興味深い情報を含んでいるか?
  • 記事が短い、内容が薄い、または役立つ具体的な内容がない、といったものではないか?
記事の内容を引用するにしても、自分なりの所感や分析を入れ、それが読む人にとって役立つ情報となり、文脈がめちゃくちゃになっていない読みやすい文章で、わかりきったことばかり書かず、おっと目を引くような発見があり、決して淡白ではなく、読む人の血肉になるような、そんな記事を私は書きたい。ということですね。

 続いて量という観点。いくら付加価値を付けたといっても、全体の1割にも満たないものであれば、それはオリジナルのコンテンツとしては認められないでしょう。
これまた明確な基準は無いみたいなので、主観的な話になってしまいますが、Webマスターは自分のサイトがコピーされていると感じたら、Googleに対してスパムサイトとして報告できたり、異議申し立て(デジタル ミレニアム著作権法)を行うことが出来ます。
そのときに、もし自分がやられて思わずGoogle先生に言いつけたくなるレベルのコピーの程度はどれくらいか考えてみたところ、全体の半分以上コピーされているときかなぁ。と思いました。4割くらいなら「まあ似たような記事を取り扱ってたら、似たような文章の構成になったりすることもあるわな。」と思えるレベルじゃないでしょうか。

 最後に、ここで書いた内容は自分の主観が大いに入っていますし、これまでの記事でも、僕自身はOKだと思っていたことが、端から見たら明らかにNGであるということも絶対にないと言い切れません。もしこのブログを見てくれている方で、認識違いをしていると思われた方は、是非ご指摘いただきたく存じます。