mutanのblog

『睡眠時無呼吸症候群患者』大きな声じゃ言えないけど一応、一級建築士。けれど本業そっちのけの雑記ブログ

東京vs大阪 ランダムに検索した歌詞でテキストマイニング。県民性はどう表れる

テキストマイニングで歌手別歌詞を集積して分析をしていると、ふと曲のタイトルにつく地名で歌詞ならではの県民性が抽出されるのではないかと興味が湧き、それならばと永遠のライバル東京vs大阪(大阪が一方的にライバル視していることは否めない)

テキストマイニングをやってみようというおはなし。

 

 

テキストマイニングとは

大量の文章データ(テキストデータ)から、有益な情報を取り出すことを総称してテキストマイニングと呼ぶそうだよ。マイニングって採掘って意味があるよ。

分析方法

より多くの歌詞を集めるために簡単に歌詞をテキスト化できるLycs Masterというツールを使い曲のタイトルに東京・大阪と入れランダムにでた検索結果を集積し分析する。歌詞の抽出は「歌GET」から

www.kenichimaehashi.com

それからAIテキストマイニングbyユーザーローカルという無料でテキストを分析できるツールで単語の頻出頻度や感情分析を行う。

 

textmining.userlocal.jp

歌詞の世界におけるケンミンショーのはじまり、はじまり

東京で検索されたタイトル

f:id:Mutan:20220331140600p:plain

東京で検索されたタイトルの一部抜粋

大阪で検索されたタイトル

f:id:Mutan:20220331140653p:plain

大阪で検索したタイトルの一部抜粋

東京の曲目は74曲

抽出されたタイトルは年代も性別もジャンルも様々、矢沢永吉やしきたかじん石川さゆり宇多田ヒカルとこれだけ違う曲目から何があぶりだされるのか、楽しみだね。

東京でイメージされるものはなんだろう?

大阪の曲目は69曲

こちらも負けず劣らずウルフルズ関ジャニ∞和田アキ子青江三奈と多岐にわたるタイトルです。

森喜朗86代内閣総理大臣は首相就任前に大阪人の人間性について

「言葉は悪いが、大阪はたんつぼだ」

と発言されたことがあります。はたしてその言葉が歌詞で実証されるのか、

さあさ、お立ち会い。ご用とお急ぎでない方は ゆっくりと聞いておいで。

 

東京と大阪の単語の頻出頻度を見比べてみる

f:id:Mutan:20220331145700p:plain

東京・大阪どちらにも共通する単語に演歌や歌謡曲が漂っている

当然の結果ではあったけどお互いにいちばんに多い単語は共に大阪・東京なんだなあ。東京も大阪もランダムに検索した結果、タイトルに地名が付くジャンルは歌謡曲、もしくは演歌が多いんだろうことにあらためて気づく。あなた・雨・夜・男女、そして極めつけには逢う

「大人の男女が雨の夜に街で逢い契りを交わす」一節が簡単に想像できてしまう。

J-POPやロックではありきたりな歌詞は好まれないが歌謡曲や演歌は斬新を嫌い月並みを好む。今やCDも衰退しサブスクに移行している時代にサービスエリアの片隅に演歌や歌謡曲のみ店頭にあることに合点がいく。若い年ごろには変化を必要とするが歳を重ねればそれを拒みありきたりに味わいを感じる。

じゃあ、東京と大阪の歌詞の違いはどこにあるんだろう?

f:id:Mutan:20220331145818p:plain

大阪から見てみると関西弁の「あかん」や「好きやねん」はわかりやすいところ、目につくのは、憎い、憎らしい、そして東京に比べて形容詞が多いところ(緑)は表現力の豊かな大阪のひとをあらわしているんだろうか。

東京はというと形容詞が少ない分動詞(赤)が多い。

今、比較して気づいたことに大阪のひとのイメージは口は達者だけれど本当の想いは口にすることをためらう純情な者としての表現が数たくさんの形容詞が使われているように思う。

森喜朗氏の「たんつぼ」発言には程遠く儚く情緒的だね。

そして大阪に関して言えば大阪とタイトル付ける時点、スマートなものを望まず、コテコテだったり、人情的な歌詞にするワードかもしれない。

その点、東京は愛す、燃える、咲く、輝く、踊ると情熱的で直接的に感じる。

そしてトーキョー・ジプシー・ナイト・パーラーとカタカナが多く少し古びた都会的なイメージを感じた。

このことからも今回のテキストマイニングでの結果は東京・大阪共に歌謡曲・演歌のジャンルが多く、それらは郷愁的でムーディーで男女のなやましさを表現しているとひとつひとうを検証することなくひとまとめにして乱暴に論じてみた。

おしまい。