日経BigData

今月のビジュアライゼーション

食べログの口コミデータを分析、“二郎愛”の高い都道府県はどこ?【無料公開記事】

2015.03.31大友翔一=慶應義塾大学システムデザイン・マネジメント研究科 研究員

全国80万超の飲食店に600万件以上の口コミが寄せられるグルメ情報サイト「食べログ」。今回はその中のラーメン店の店舗と口コミデータを預かり、ビジュアライゼーションを試みた。

 まずは、この画像をご覧いただきたい。何となく日本列島に見えるが、この点群(約3万8000の点)は日本の何を表すものであろうか。

食べログ掲載ラーメン店のうち、2013年2月~2015年1月に1度でも口コミが寄せられたラーメン店の分布図

 この点群は、グルメ情報サイト「食べログ」に掲載されているラーメン店のうち、2013年2月~2015年1月の2年間に1度でも口コミが寄せられたラーメン店の分布図になる。

 このように日本全国・総国民食と言ってもいいであろうラーメンに関して、今回は食べログからデータ提供を受けて、データビジュアライゼーションを行った。

 この中から口コミ内に「醤油(しょうゆ)」「味噌(みそ)」「(豚骨)とんこつ」「塩(しお)」に言及がある店舗をプロットした図を作成した。若干の“濃淡”はあるものの、どの味も全国に分布している様子がうかがえる。

左上図から時計回りに、醤油・味噌・とんこつ・塩で、各色の濃淡はコメントの中に含まれる醤油・味噌・とんこつ・塩の数に依存する

 対象期間の食べログ登録ラーメン店の総口コミ数は27万2121件に上る。その文章を取得して、形態素解析エンジンの「MeCab」を用いて分かち書きして、それをHadoopを用いた処理を簡易的に行える「Pig」 を用いて出現回数を数え上げた。

食べログのラーメン店の口コミに頻出する単語

 この処理で得られたデータにおける、主な頻出単語は右のようになる(明らかに必要のない文字や記号は削除した)。味や料理に関しての語彙は出現頻度が高いが、カウンターや見た目、場所などの雰囲気に関する単語も頻出する。

 その中でもスープの味に注目してビジュアライゼーションしたのが、上記の4つの地図になる。醤油に関して言えば、ある店舗のコメントに対して「醤油("しょうゆ"を含む)」が多いほど、その店舗に対応する円は深いオレンジ色になる。

味にこだわりがある都道府県はどこ?

 地図を使ったビジュアライゼーションでは感覚的に全体像をつかめるが、数値で比較もできるよう、都道府県別に醤油・味噌・塩・とんこつに関してのスープのスコア(指数)を算出した。単純に言及数をカウントすると、店舗数に比例するため首都圏(特に東京都)が突出してしまう。そこで、都道府県ごとの口コミに含まれるスープの味の単語の数を、都道府県ごとの合計店舗数で除算した。

 例えば、最高値は大阪の醤油スコアで6.34(小数点第3位以下で以下四捨五入)となる。この各都道府県の醤油・味噌・塩・とんこつの各スコアに対して、都道府県を日本の8地方区分にまとめ、色の情報として描画する。

醤油スコア(店舗口コミにおけるスープの味の単語の出現回数を合計店舗数で除算)の都道府県別比較

味噌スコア(店舗口コミにおけるスープの味の単語の出現回数を合計店舗数で除算)の都道府県別比較

塩スコア(店舗口コミにおけるスープの味の単語の出現回数を合計店舗数で除算)の都道府県別比較

とんこつスコア(店舗口コミにおけるスープの味の単語の出現回数を合計店舗数で除算)の都道府県別比較

 さらに、味にこだわりがある都道府県はどこか、本スコアから探った。4つの味の中でスコアが1つでも3を超え、口コミ傾向から味にこだわりがあるとみられるのは、北海道、東京都、神奈川県、京都府、大阪府、奈良県、和歌山県、福岡県の8都道府県だった。

味への言及スコアが3以上の8都道府県の比較

 その傾向を比較すると、ある意味予想通りなのが、味噌については札幌ラーメンで知られる北海道がスコア3.66と店舗の口コミで言及される比率が全国で最も高い。同様に、とんこつについては福岡県がトップ…、と思いきや3.44で4位にとどまる。とんこつは大阪府が4.69でトップとなる。大阪は醤油、塩もスコアトップであり、口コミ内で味についての言及が多いことが分かった。京都府も醤油、塩、とんこつでスコア2位となった。大阪、京都の店舗の来店客は、味へのこだわりが強いと言えるのではないだろうか。

 さらに色分けは地域別のままで、味と店の総合評価を加え、全店舗を描画した。

スープの味について口コミで言及があった店舗を味への評価(縦軸)、味に関する口コミ数(横軸)でプロットした。円の大きさは総合評価を示す

 これらからは、近畿地方では大阪、京都を筆頭に醤油と塩のコメントが多く、コメントを獲得した店は比較的味の評価が高いことや、関東では塩のコメントが入る店は、比較的味の評価が高くなりやすく、それが総合評価に結びつきやすい傾向があることなどが読み取れる。

味・出汁別に話題の店舗を探る

 続いて、関東地方に絞って、出汁について口コミで言及がある店舗の分布状況を分析した。その地図背景の色の濃度は、各行政区域内に存在する店舗の口コミによって標準偏差を算出して、その数値に応じ色調分解行った。濃い方が店舗数が多い。その地図上に、出汁ごとに口コミで言及がある店舗を点でプロットした。緑色が鶏、茶色が煮干、青色が魚介である。ここでは一例として、醤油味の地図を示したい。

背景の色の濃さは、行政区域別の醤油の店舗数の多さを示す。各店は出汁について口コミで言及があったラーメン店の場所。緑が魚介、茶色が煮干し、緑色が鶏となる

 緑の点が広範囲に広がっていることから、鶏を出汁にしたラーメン店は全国に1万2525店と数も多く、広いエリアにわたって出店されていることが分かる。一方、煮干は都心部に特有の出汁、あるいは煮干出汁のおいしい店(コメントされる店)は、都心部に集約される傾向があることがうかがえた。

 この口コミから味や出汁別に話題のおいしいラーメン店を抽出できるのではないか。そんな試みをするために、一例として、醤油(しょうゆを含む)と魚介(魚を含む)の言及数と、店舗の総合評価の値とを積算した独自指標の上位30店舗を抽出した。その結果をもとに、上位30店舗の抽出してマッピングした。その指標の精度は…、実際に食べてみて検証したいと思う。

日経ビッグデータが独自選定した「醤油味、魚介出汁で話題のラーメン店30」(関東地方)
おおぜき中華そば店、カッパ64、せたが屋、ソラノイロ、たんたん亭、なな蓮、はな火屋、はやし、ひるがお、むぎとオリーブ、めん処羽鳥、ラーメン チキュウ、ラーメン暁、らぁ麺やまぐち、井上、一条流がんこラーメン 総本家、金色不如帰、江戸前煮干中華そば きみはん、支那そば晴弘、中華そば 青葉、潮、鶴若、東京いまむら、東京駅 斑鳩、無銘、鳴龍、麺屋 ひょっとこ、麺屋 翔、麺処 ほん田

醤油と魚介に関する口コミが多く、総合評価が高いラーメン店の地図(福生市の「カッパ64」除く)

二郎愛が高い都道府県は?

 最後に、熱狂的な愛好家が多いラーメン「二郎」についても分析した。東京都港区三田に本店を構え、たっぷりの豚の脂や野菜の盛り具合が特長だ。

 「二郎」「次郎」「ジロー」で口コミを検索した場合、有意な頻出単語の中で70位に上がるほど、その影響は大きい。その口コミ言及数を店舗別にマッピングしたのが下の日本地図。色が濃いほど言及数が多く、店舗が存在しないはずの全国各地に分布していることが分かる。

口コミで「二郎」「次郎」「ジロー」に関する言及がある店舗の分布。色が濃いほど言及数が多い

 この口コミ数を都道府県別に集計して、各地域のラーメン店舗数で除算して「二郎指数」を算出した。この指数が高いほど、店舗の口コミにおける「二郎」登場頻度が高く、“二郎愛”が高いと推測できる。二郎本店がある東京が最も高いのは当然かもしれないが、以下は、京都、奈良、大阪と近畿圏が上位に入ったのが目に付く。あなたが暮らす都道府県は何位だっただろうか。

二郎指数ランキング
二郎に関する口コミ言及数の都道府県別の合計を、同地区のラーメン店舗数で除算した

利用したライブラリとデータについて

 前回 に続き、QGISと今回はHadoopPigやpythonとpandas、Rとggplot2というライブラリを利用したデータ処理を行った。また、国土数値情報から行政区域のデータを使用してビジュアライゼーションを行った。

 近年ではオープンソースソフトウエアや、ビジュアライゼーション・統計解析用のライブラリなども充実し、今後もさらに整備されていきそうだ。商用解析にも積極的に利用されていくことだろう。また、各種WebAPIやライブラリが日々新たに公開・更新され、インタラクティブな、触って楽しいグラフなど様々な表現方法が可能になる。自社の所有するデータの活用方針の策定、必要な技術の習得や人材育成などが、今後の企業戦略の重要な要素の一つになると言える。

 最後になるが、食べログの大変貴重なデータを預かって利用させていただいたことに御礼申し上げたい。