「平手友梨奈 分析」はじめに
皆さんこんにちは、こんばんは。
techblogchan( @techblogchan )です。
以前私が書いた記事でこのようなものがあります。
今回はこちらの記事で宣言していたとおり
欅坂46 平手友梨奈さんについての別の分析を行っていこうと思います!
「平手友梨奈 分析」手法
Word2vec
今回使用する分析手法は「Word2vec」という手法です。
詳しく説明するとニューラルネットワークの話をしないといけなくなってしまってそれだけで1記事になってしまうので、例のごとく今回も省略させていただきます。*1
私からは
- どんなことができる様になる手法なの?
- どんなタイミングで使用されるの?
の2点だけ説明します。
どんなことができるようになる手法なの?
こちらの手法は簡単に言うと
『単語をベクトル化する手法』
ベクトル化するとなにが出来るようになるのかというと
具体的には以下のことが可能になります。
- 単語同士の意味的な近さを測ることが可能になる
- 単語の本当のニュアンスを客観的に知ることが出来る
単語の「ニュアンス」を知れるというのはとても凄いことで、今回の分析はこれを利用するんだ。
あとでまた説明するね!
どんなタイミングで使用されるの?
使用方法は多岐にわたるのですが、中でもよく使用されるのは
「単語同士の加減演算」
有名なものだと
「王様」 - 「男」 + 「女」 = 「女王」
みたいなのが有名です!
先程「単語同士の意味的な近さを測ることが可能になる」と言いましたが、それが上記の方程式が成り立つようになる理由です。
【もっと詳しい説明はこちらへ】
Word2Vec:発明した本人も驚く単語ベクトルの驚異的な力 - DeepAge
「平手友梨奈 分析」目的
目的
『平手友梨奈にとって〇〇とは?』
平手友梨奈さんは謎多き方なので、本人が何を考え何にどう感じているのかは不明な部分が多いです。
なので彼女のブログ(彼女自身の言葉で綴られているから)を用いて、AIに彼女のブログのデータを学んでもらい、そこから分析しようというわけです!
なんでWord2vec?
なぜ、Word2vecを用いるとその人が〇〇をどう捉えているのかが分かるのでしょうか?
それは
『ベクトル化することによって距離(意味)の近い単語が明らかになる』
からです!
例えば
「私はパンを食べる」
「私はご飯を食べる」
という文があった時に、Word2vecはその単語の周辺単語を見て学習するので
『「パン」と「ご飯」は似たような文脈で使用される単語なんだな』
と理解するのです!
つまり、これを応用すると
『その人がその単語と似たような使い方をしている単語』
が分かります。
そして
『その人がその単語をどのような意味を持って使用しているか』
も分かるということです!
「平手友梨奈 分析」Word2vecの実装
分析結果の共有記事だから省略するね!
要望があればWord2vecのコード解説の記事を書こうと思います!
「平手友梨奈 分析」結果
平手友梨奈にとって「ダンス」とは?
結果
順位 | 単語 | スコア |
---|---|---|
1 | 不安 | 0.5517 |
2 | ねる | 0.5359 |
3 | 楽しみ | 0.5354 |
4 | わたし | 0.5328 |
5 | みなさん | 0.5269 |
考察
1位「不安」
3位「楽しみ」
ダンスを披露するのは不安だけど楽しみということなのでしょうか?
2位「ねる」
もちろん長濱ねるさんのことだと思われます。彼女とダンスで何かしら合ったのでしょうか?彼女はダンスリーダー的なポジションじゃないと思うので、少し不思議です...
ピンときた方はコメントください!
4位「わたし」
5位「みなさん」
ダンスを通じて平手友梨奈さん自身とファン(観客)が繋がっていたり、一体感を感じているのでしょうか?
平手友梨奈にとって「ライブ」とは?
結果
順位 | 単語 | スコア |
---|---|---|
1 | みなさん | 0.5308 |
2 | 感謝 | 0.5174 |
3 | わたし | 0.5015 |
4 | スタッフ | 0.4824 |
5 | 欅坂46 | 0.4818 |
考察
これは(ファンの)みなさんやスタッフさんに感謝の念があるのだなぁとしっかりわかりますね!
わたしや欅坂46全体を応援しにライブに来てくれたり、設営をしてくれていることへの感謝なのではないかなと思いました。
「平手友梨奈 分析」まとめ
第1弾に続く「平手友梨奈を自然言語処理で分析してみた」シリーズの第2弾でしたが、どうだったでしょうか?
平手友梨奈さんのブログをこれまで分析してきて感じているのは、彼女はとてもメンバーやファン想いなのだなと。
そして自分自身にとても厳しい方なんだろうなと思いました。
さて、今回は「Word2vec」を使って分析をしましたが、実は似た名前の手法で「Doc2vec」というものもあります。
こちらは主に文書同士の類似度を測るための手法ですが、このようにまだまだ自然言語処理の分析手法というのは存在していますので、面白そうな分析が思いついたらまた行いたいと思います!
それでは、また別の記事で〜
techblogchan( @techblogchan )でした。
*1:詳しく知りたい方は「Word2vec 仕組み」などでググってみてください。