グーグル以前の検索エンジンは、あるページに含まれるキーワードを合算しただけでした。グーグルはこれに対して、そのページに対するリンク数という考え方を打ち出しました。
しかし、グーグルの評価が、単純に被リンク数を加算するだけなら、相互リンクを増やしたサイトがトップに立つはずです。しかし、必ずしもそうならないのは、被リンクの質を評価に付け加えているからです。これは、評価の高いところからリンクを受けているサイトは、高評価にするというだけではありません。評価の低いサイトからリンクを受けているサイトは、減点にするということも行っているはずです。この裏技破りによって、グーグルの評価は妥当性を維持しつづけているのです。
森リンの評価も、これに似ています。
森リン以前の文章評価は、おおまかに言えば、ある文章の中にあるプラスの要素を合算しただけでした。例えば、句読点の数が妥当であるとか、高度な語彙が多く使われているとか、接続語の数が多いとかいう要素にそれぞれ配点を割り当てて合算していました。評価の正確さを追求すると、要素の数を増やしていかなければなりません。そして、評価の仕組みは、作った人にもわかりにくいブラックボックスになっていきました。
森リンの評価は、もっとシンプルです。更に、そのシンプルさに加えて、語彙間のバランスを評価の中に組み入れています。このバランスの評価が、いわゆる裏技に対応する仕組みになっています。
グーグルは、検索のアルゴリズムを基本的に公開しています。しかし、裏技に対抗するアルゴリズムまでは公開していません。もしそこまで公開すれば、検索の妥当性という本来の目標を離れて、裏技への対応のいたちごっこが始まってしまうからです。
グーグルがアルゴリズムを公開しているのは、それを公開することによって、よりよりサイト作りの指針が提供できると考えているからだと思います。
森リンも同様に、作文の勉強にプラスになる指針作りのために、アルゴリズムを公開していきたいと思っています。
ロボット検索よりも人間の登録の方が信頼できるという考えをくつがえしたのがグーグルです。グーグルは、日本ではまだヤフーよりも知名度が低い検索エンジンですが、世界的にはトップシェアです。そのグーグルが開発した方法が、被リンク数でした。
グーグル以前の検索ロボットは、あるページ内に含まれるキーワード数を中心にページの評価を行っていました。しかし、このやり方では、すぐに裏技が使えてしまいます。サイト運営者がページ内のキーワードを意識的に増やせば、ロボットの評価も上がっていくからです。つまり、内容は変わらないのに、評価だけが上がるという操作が可能になってしまうのです。
これに対してグーグルの評価は、あるページに対するリンクの数でそのページを評価します。このやり方は比較的裏技の使いにくいものでした。グーグルの評価に対応するために、さまざまなサイトが相互リンクなどの試みを行いました。グーグルへの対策は、今もいろいろな試みが続けられています。しかし、全体的に見て、グーグルの検索結果はほかの検索エンジンと比べて妥当性が高いと多くの人が認めています。
なぜでしょうか。グーグルの評価の妥当性が高いのは、被リンク数を評価する方法自体にあるのではありません。被リンク数を評価する方法が、裏技を破りやすい点にあるのです。つまり、検索エンジン対策として行われるテクニックに対して、そのテクニックを上回るアルゴリズムを作りやすいというところにグーグルの優位性があったのです。
これと同じことが、森リン以前の文章評価ソフトと、森リンとの違いについても言えます。