概要
食べログの得点は3.00を下回ると3.01に底上げされることが分かった。
背景
食べログの掲載店舗の得点について、インターネットのまとめサイトでは、「評価3.8以上は年会費を払わなければ3.6に下げられる」という流言がしばしば掲載されてきた。これを受けて、藍屋えんは、統計的手法によりこの仮説を実証したと主張した。これに対して、konkon3249は、店舗が会員店舗であるか否かで得点の傾向に違いがみられないことから、食べログによる得点の処理が会員店舗への利益誘導ではないことを示した。さらに、井上明人は、店舗のレビューの数によって得点のピークが異なることから、食べログによる得点の算出は複数の閾値を用いた複合的な処理であることを示した。
トデスキングと井上明人 (前掲) が引用しているように、食べログは公式ドキュメントで得点の算出方法を明らかにしている。核心部分は「悪意のある不正な業者」に悪用されることを防ぐためとして非公開としているが、公開されている部分だけでも多くの情報を含んでいる。
食べログの得点が複雑な処理を経て算出されていることは、食べログの公式ドキュメントが自ら明らかにしている通りである。では、食べログの得点の算出アルゴリズムは、まとめサイトと藍屋えんが主張するような、会員店舗 (食べログの運営者による用語では「有料集客サービス」) への利益誘導に利用されているのだろうか? それとも、すべての処理が、純粋な善意 (あるいは、サービスの向上という営利企業として当然の行為) によって説明可能なのであろうか?
データの収集
今回の調査では、2019年10月10日時点に収集したデータを使用した。食べログの掲載店舗のうち、山形県米沢市に立地し、なおかつレビュー数が2以上20以下であるものを調査対象とし、これらの店舗の得点とレビュー数を収集した。データの収集はスクレイピングを用いず、ウェブサイトを目視して収集した。
統計的な処理
以下のグラフは、店舗のレビュー数と得点の関係を示した散布図である。横軸がレビュー数、縦軸が得点である。
この図より、レビュー数が20以下の領域では、レビュー数が得点にほぼ線形に重畳されていることが分かる。これは、食べログの公式ドキュメント (前掲) のいう「評価が集まらないと点数が上がらない」という説明を裏付けるものである。
また、得点が3.00を下回る店舗が存在しないことは、顕著な特徴である。
次に、以下のグラフは、レビュー数が2以上5以下である店舗についての、得点のヒストグラムである。ヒストグラムのビン幅は0.01である。このビン幅を選択したのは、食べログの得点が0.01を最小単位として表示されるためである。
この図より、得点が3.01である店舗が顕著に多いことが読み取れる。
なお、井上明人 (前掲) の調査でも、レビュー数が25以下の領域では得点の最頻値は3.01であることが示されている。以下の図は井上からの引用。
次に、以下のグラフは、レビュー数が6以上20以下である店舗についての、得点のヒストグラムである。他の条件は前の図と同じである。
レビュー数が6以上20以下である店舗については、3.01に顕著なピークは見られない。
考察
得点が3.00未満の店舗が存在しないことと、レビュー数が2以上5以下である店舗については得点が3.01である店舗が顕著に多いことから、得点が3.00未満の店舗の得点を3.01に底上げする処理が存在することが推測できる。
ここで、レビュー数が20以下の領域ではレビュー数が得点にほぼ線形に重畳されているという特徴を思い出そう。すると、レビュー数が少ない店舗はそのままでは得点が3.00を下回ることが多く、それにより、それを3.01に底上げされる処理も多く行われていると推測される。これに対して、レビュー数の多い店舗では、得点が3.00を下回ることは珍しく、それを3.01に底上げされる機会も少ないと推測される。
実際に、レビュー数が2以上5以下のヒストグラムでは、もし3.00未満の領域にもグラフが続いているとすれば、その領域にも長く裾が伸びていて、少なくない数の店舗がそこに含まれるように見える。さらに楽観的に見れば、そのような「自然な」分布における得点が3.00未満の店舗の数と、得点が3.01のピークに積み上げられている店舗の数は、おおよそ等しいようにも見える。
一方、レビュー数が6以上20以下のヒストグラムでは、得点の分布を3.00未満の領域に延長したとしても、そこに含まれる店舗の数は少ないだろう。先ほどと同様に楽観的な見方をすれば、こちらのヒストグラムでも、「自然な」分布における得点が3.00未満の店舗の数と、得点が3.01のピークに積み上げられている店舗の数がほぼ等しいように見える。
これらの特徴から、得点が3.00未満の店舗が存在しないというデータと、レビュー数が2以上5以下の領域では得点が3.01である店舗が顕著に多いというデータを結び付け、得点が3.00未満の店舗の得点を3.01に底上げする処理が存在するという結論を得ることが自然であると考えられる。
議論
得点が3.00未満の店舗は得点を3.01に底上げするという仕様は、食べログに掲載された店舗の立場からすれば、恩恵の多い救済措置であろう。しかし、このような大胆な仕様を、ユーザーへの十分な説明なしに導入することは、ユーザーの立場からすれば不遜に感じられるかもしれない。
実際のところ、ユーザーが入力した生の得点ではなく、それを複雑に処理した得点を提示するという食べログの方針は、いささかパターナリスティックに感じられる。とはいえ、食べログにとってユーザーと店舗とどちらが重要な関係先であるかといえば、店舗を優先すべきであるのは当然である。店舗の立場からすれば、インターネットの存在に勝手に点数をつけられることは感情を著しく害する場合が少なくないし、経済的な不利益に直結する場合もある (文春オンラインの記事などを参照)。
今回の一連の騒動では、まず藍屋えんが3.6と3.8のアノマリー (異常な現象) を統計的な手法で明らかにしたうえで、それを「評価3.8以上は年会費を払わなければ3.6に下げられる」という流言を立証したものとして論じた。しかし、konkon3249は、会員店舗であるか否かという情報を付け加えることで、まったく別の解釈を示した。井上明人は3.6と3.8のほかにも複数のアノマリーが存在することを示し、食べログの得点の算出方法については多面的な理解が必要であることを示した。私の今回の調査では、井上明人が示した複数のアノマリーのうち3.01のピークについて、低得点の店舗に対する救済措置であるという解釈を示した。
一般に、統計的な処理から知識を得るためには、定性的な理解による裏付けが欠かせない。定性的な理解を欠いたまま、統計的な処理だけに耽溺すれば、今回の騒動で藍屋えんがしたように、たまたま発見した異常な現象を根拠に、安易に流言飛語を放言することになりかねない。
まとめ
食べログの得点には複数の奇妙な特徴があることが知られている。今回の調査では、そのうち3.01のピークについて、得点が3.00を下回る店舗は3.01に底上げされるという処理が存在することを示した。また、これを低得点の店舗に対する救済措置であると解釈すれば、この処理は正当な仕様であり、不正な誘導ではないことを示した。