AIという言葉自体、ご存じの方も多いでしょう。しかし、AIが実際にどのように機能するのかまでは、あまりご存じない方も多いのではないでしょうか。そこで今回はM1グランプリの順位をAIで予測し、見事に的中させたことで脚光を浴びた、筑波大学の真栄城教授にAIについて教えていただきました。
取材にご協力頂いた方
筑波大学 図書館情報メディア系 教授
真栄城 哲也(まえしろ てつや)
博士(情報科学)。ウィズダム・サイエンス、システム学、感性情報学を専門分野とする。
AI および感性に関する研究成果の1つとしてM1 グランプリの結果の予測があり、2015年から連続して予測に成功している。
人口知能(AI)とは?
エモーショナルリンク合同会社取材担当(以下EL):AIとは、いったいどのようなものなのか大まかに教えていただけますか?
真栄城教授:AIとは基本的に、過去に起きたことをシミュレーションするもので、何か新しいものを作り出すことはできません。
過去の事例から、それがどういうものかを推定するためにAIが利用されるので、人間のように新しい発想だとか新しい商品を作るだとかそういったことはできません。
また、AIは入力されたデータやルールの範囲外のものを処理することもできません。
つまり、AIに何を覚えさせるかは人間が決める必要があり、覚えさせたものの範囲外のことはできません。
EL:AIのイメージをもっと簡単につかむために、何か身近なものに例えることはできますか?
真栄城教授:そうですね、AIはいわゆるお役所仕事に近いとも言えますね。
EL:お役所とは、省庁とか区役所とかのことですか?
真栄城教授:そうです。なぜなら、彼らは前例やルールに従って物事を進めることには長けていますが、今まで遭遇したことなく、ルールのない状況に対応するのは苦手ですよね。
EL:確かに、役人が独自判断で物事を進めていくことは、あまり想像できませんね。
真栄城教授:今回のコロナを見ればわかる通り、初期の対応がボロボロだった訳ですよね。
このように、過去に事例がないことについては、対応ができません。
AIも彼らと一緒で、AIの中に過去のデータが入っているのなら対応可能ですが、データが入っていないもの、つまりそこに蓄えられているデータの範囲外のものについては、全く対応できません。
EL:AIはデータさえ入れれば、独自に様々な処理をしてくれるというイメージを持っていたのですが、AIは新しいものに対する対応力を備えていないのですね。
真栄城教授:そうですね。だから、そういう意味で新しいものを作ることはできず、処理できるのは過去の事例の範囲内にとどまるわけですね。
EL:AIはなんだか万能なものと思っていましたが、処理できる範囲が限定されているということですね。
真栄城教授:ただ、もちろん人間よりも大量のデータを格納することができます。
ですので、やり方がわかっているとか、こういう状況の時はこうなるとかっていう組み合わせがある場合は、人間よりはるかにうまく機能します。
AIにはルールが必要
EL:確かに、AIがチェスで人間に勝ったなんていう事例もありますからね。
真栄城教授:チェスだとか、将棋だとか囲碁でAIが人に勝ったなどの事例はありますが、あれは勝てて当然なんですね。
EL:当然というと?
真栄城教授:それぞれのゲームには決まったルールがあり、その枠組みの中なら人間よりもAIの方がはるかに速い処理が可能です。
AIは人間よりもはるかに多くの組み合わせを素早く検討し、最適解を導き出せるので、当然人間に勝てるということになります。
EL:確かに、処理速度の面では人間は太刀打ちできませんよね。ルールの範囲内のことならAIはその能力を十分に発揮できるとのことですね。
では、既存のルールからルール自体をいろいろと組み合わせるなどして、ルール自体を拡張する、なんてことはできるのでしょうか?
真栄城教授:いいえ、できません。例えばチェスはルール上、将棋のように相手から取った駒を使うことはできません。
しかし、将棋のように相手から取った駒を使えるようにすると、AIは独自にそのルールに対処していくことはできません。
EL:組み合わせを検討し、その中から独自に最適解を見つけることができるのに、ルール自体の組み合わせを独自に検討できないのは、なぜなのでしょうか。
真栄城教授:冒頭でも説明したように、AIができるのは、ルールの範囲内の処理に限られ、新たな発想をすることができないからです。
もし、ルールの変更や拡張をしたい場合は、変更や拡張のための新たなルールを人間がAIに入れてやる必要があります。
EL:例えば、足し算のルールをAIに入力して、足し算のパターンならAIが独自に検討できるのですよね。
であれば、足し算のパターンから掛け算も、AIが自分で覚えたりとかできるのでは?と考えてしまいます。
真栄城教授:それも、できませんね。3+3+3+3ていうのを3×4っていうことまで持っていけるかどうかっていうことですよね。
このような新しいルールをAIが独自に作ることは、まだできませんね。
AIの扱うデータ
EL:では、AIに入れるデータについて教えてください。AIに入れるデータは、どのような形式のものが使われるのでしょうか?
画像をどうやってAIに取り込むのかなど、気になるところです。
真栄城教授:AIに使われるデータは、全て数字です。画像データも実は数字で、画像の色が数値になっています。
最も多く使われるのは三原色ですね。それぞれの色の度合いによって、1つのピクセル(画素)を表しています。
EL:画素は、画像を構成する最小単位のことですね。デジカメなんかでよく耳にする単語ですね。
真栄城教授:例えば、そのデジカメで1,000万画素といったら、1,000万個の数字の羅列になります。
ですから、1つの数値というよりも、1,000万個の数字をひとまとめにして扱うっていう感じです。
EL:なるほど、画素がたくさん集まったものを、ひとつの画像として私たちは認識しているのですね。
真栄城教授:そうですね。人がモニターやディスプレイで見る場合、縦横にあわせて、それぞれのディスプレイの数字に応じた色を表示させます。
そうすることで、人は画像というふうに認識するわけですね。このように、AIでは画像も数字として扱うことになります。
EL:他にも数字で扱われるものの例を、教えていただけますか?
真栄城教授:音声や音とかも全部一緒ですね。1秒間に何千回、何万回のその時の音の強さっていうのを数字に変換しています。
ですから、音も全部数値として扱います。
AIで感情分析
EL:AIに入れるデータは、すべて数値データが利用されているのですね。
画像や音声のイメージはつかめたのですが、感情分析はどうでしょう?先生が以前M1の順位をAIで予測し、見事に的中させたことが話題になりました。
この場合は、笑いをAIで分析したのでしょうか?ただ、笑いを分析させるとなると、どのように数値データをとるのかなど、その方法に興味があります。
感情分析など、一見すると数値化が難しそうなデータの分析方法について、教えていただけますか?
真栄城教授:まず、例えばフィギュアスケートの場合を考えてみましょう。フィギュアスケートの点数評価の場合、芸術点と技術点というのがあります。
技術点はジャンプを何回したとか、数値にできるものが使われていますが、芸術点は曲にあった踊りをしてるとか、体の動きが綺麗だとか、感覚的な判断がされています。
両方を足してフィギュアスケートの点数を出し、順位を決めているのだと思います。
EL:芸術性は感覚的な判断が多いため、数値化が難しそうですね。
真栄城教授:普通はそのように考えますよね。漫才でもフィギュアスケートでも芸術的な側面は、その人の感性とか感情に訴える部分が大部分を占めていると。
つまり、数値にできる部分は少ないだろうとイメージされますよね。ところが、実際のところかなりの部分が数字に変換できます。
EL:もう少し詳しく教えていただけますか?
真栄城教授:まず、数字によって人が感じているものを再現することは可能です。
通常、人が感じているものの中で、感性に関わる部分を、一般的にかなり大きく見積もってしまいます。
本来、感性に関わる部分は少ないにもかかわらず、ものすごく大きな割合を占めていると考えてしまいます。
EL:確かに人が何かを感じる時は、その多くが感性によるものだと考えがちですよね。
真栄城教授:言い換えると、感性とか感情を調べるときに人がどう感じているのかは、そんなに扱わなくても、数字にできる部分だけで再現することは可能です。
つまり、数値として計測できる部分だけで、人の感性や感情はかなりの精度で調べることができます。
EL:「人がどう感じているのかは感性や感情によるもの」という前提に立つと分析が非常に難しいように思えますね。
しかし、実際は数値化できる部分のみで、人の感性や感情の輪郭をとらえることができるとなれば、AIで分析ができるということですね。
真栄城教授:漫才の場合でいえば、数値にできる部分の特徴をリスト化して、リストの中でうまく使えるものを試すことで、精度の高いAIのモデルを作ることができます。
EL:感情となると、ついついとらえどころのない感性や感情に注目してしまいますが、数値によってとらえるという発想自体面白い見方ですね。
AIとデータ数
EL:となると、データを扱う分析の方向性は、人間がAIに示してやる必要がありそうですね。
やはり、どのデータを扱うかなどの選別は、すべて人間が行う必要があるのでしょうか?
真栄城教授:先ほどの漫才の場合は、データ数が少なく1,000とか2,000です。
よくあるAIだと場合によっては数百万とか、ものすごい数のデータがあるので、データ数が多い時は、人間がデータの特徴を見なくても問題ないでしょう。
しかし、データ数が少ない場合、そのデータをAIに入力するだけでは、精度の高いAIを作ることはできません。
ですので、データ数が少ない場合は、分析するデータの特徴の数を人間がある程度絞ってやらなければなりません。
EL:なるほど、だからこそM1グランプリの分析の際、人間がデータの特徴の数を絞ってあげたわけですね。
真栄城教授:そうですね。M1グランプリなら決勝進出した10コンビの10年分のデータを集めたとしても、100個にしかなりません。
AIで扱うデータ数としては、本当にゴミみたいな数です。このような感性とか感情を扱う場合は、データ数の問題が必ず出てきますね。
というのも、人それぞれに好みがあるからです。
EL:どういうことでしょうか?
真栄城教授:例えば、1人の人がいいと思うとか、少数のグループの人たちがいいと思うデータの数は、どうしてもデータ数が限られてしまいますよね。
データ数自体が限られているため、AIを作ろうとしたときに、大量のデータを集めるのが難しいということですね。
EL:そうですね。もともとのデータ自体が少ない場合、集めようがありませんからね。
少ないデータの中でも取り扱うデータの特徴を人間が絞るという点について、もう少し詳しく教えていただけますか?
真栄城教授:例えば、大昔から現在までのいわゆる美女の顔の平均を取ると、普通の顔になるんですね。
時代ごとに美女の特徴は異なり、室町時代ぐらいだと顎がちょっと膨らんだ人が美女と思われていたとか、今だと痩せているほうがいいとか、そういう時代ごとの好みみたいなものがあります。
また、人それぞれに好みがあるので、いわゆる美女って言われるものを全部集めてAIを作ったとしても、誰の好みにもあわない美女識別AIができてしまうんですよ。
EL:確かに、太っている人が好まれる時代もあれば、痩せている人が好まれる時代もあるため、全てを合わせると普通の体形の人が好まれるという当たり前の答えが出てきそうですよね。
また、個々人の好みをいくら分析したとしても、多くの人が好む結果を導き出せるとは考えられませんよね。
そこで、人間がある程度分析するデータの特徴を絞ってやらなければ機能するAIを作ることは難しい、ということになるわけですね。
となると、AIが活用できる場面は、ほぼデータ数に依存するということになるのですかね。
真栄城教授:そうですね。少ないデータ数で、上手くいく方法がまだないのが現状です。
例えば、グーグル翻訳もデータ数が少ない時は全然駄目でしたね。しかし、ある程度のデータ数を超えると、数千万とか数億とかになると、急にある程度使えるAIになってきました。
ですから、大量の事例が要求されるということは、確かにAIを利用していく上での1つのネックとなるでしょうね。
今後AIが活躍する場面
EL:では今後、私たちの実生活に関わる分野で、AIはどのように活用されていくとお考えになりますか?
真栄城教授:まず、AIを活用して新商品を開発するのは、難しいと思いますね。
いわゆるマス(大衆)に受け入れられるものではなくて、どんどん個別化、いわゆるパーソナライズされていくと思います。
あるグループの人たちはこういうものが好きだ、というのがわかれば、そのグループの人たちと似た生活や環境にいるグループの人達だったら、どういうものを好むのか、というのを推定するために活用されていくのではないでしょうか。
EL:なるほど、AIの進化していく方向性としては、一般化というよりもむしろ個別化ということになりそうだということですね。
AIによって私たちの生活は、ますますデジタル世界と切り離せないものになっていきそうですね。
まとめ
AIは万能というイメージが先行してしまいがちですが、基本的にAIは新しいものを作り出すことはできず、過去のデータからシミュレーションする際に利用されます。
人間のように新しい発想ができないため、AIにはデータやルールを入力する必要があります。
したがって、データやルールの範囲外のものを処理することはできません。しかし、データやルールの範囲内のものであれば、人間よりもはるかに高い能力を発揮します。
このようなAIの能力が、個別化の方向で活用されていくのであれば、私たちの生活はますます便利なものになるでしょう。
AIの活躍によって、デジタル化の波はさらに本格的に波及していくのではないでしょうか。
(取材・執筆・編集/エモーショナルリンク合同会社)