対談 CONVERSATION

行動から人の内面状態を読み取るAI!?岡田将吾の気になる研究 前編

長谷川茂雄

人と人とのコミュニケーションに必要なものは、言語だけにあらず。視線やジェスチャー、表情といった非言語情報も不可欠であることはいうまでもない。岡田将吾氏は、それを社会的信号処理という新しい領域に基づいた研究を通して読み取ることを実践する先駆者のひとり。同氏の試みは、人間の内面の状態を理解するためのAIの新分野として世界から注目を浴びる。これらの研究は認知症の初期症状などを読み取る手がかりにもなるという。編集長・杉原が、最先端の研究の現状とその先に広がる未来について伺った。

人の行動から内面状態を理解するという試み

杉原:もともと岡田さんは、大学でいわゆるAIに関する研究をされていたんですか?

岡田:そうですね。人工知能を基本に、修士、学士と約5年間研究をしまして、少しずつ人の行動を予測するとか、人の行動からコンテキストを推定するということにフォーカスするようになりました。 例えば、この人のしゃべり方や使う言葉の特徴がこうなら、この人はロボットとのおしゃべりを楽しんでいるとか、いくつかの行動から、人の内面を予測するというような研究です。

杉原:今日は、話していて僕の思惑がバレるかもしれないから、サングラスか何か掛けたい気分です(笑)。

岡田:いや、僕自身は(内面を予測することは)できないですよ(笑)。システムにはできてしまうことがありますけどね。

人の行動から内面を読み取るという研究を続ける岡田氏。「最近は、手の動きと感情の関係性が気になる」という。

杉原:ならよかったです(笑)。岡田さんのそういった研究は、AIなどを通じて出口がたくさん出てきたという段階ですか?

岡田:そうですね。最近は動作を測るセンサーが安くなったりもして、状況が変わってきましたし、企業でも自分たちのような研究をしているところが出てきました。そういうプロジェクトに自分が加わることも増えてきて、出口は広がったと感じています。

杉原:もともと岡田さんがAIに興味を持ったのは、どういった経緯でしょうか?

岡田:最初は大学で物理をやっていたのですが、物理の世界っていろいろと難しくて挫折してしまいました。それで物理の先生にはちょっと失礼なんですが(笑)、もう少し目に見えてわかりやすいことがやりたいと思って、ロボットに顔の認識や画像の認識をさせて動かすという研究をやっている研究室に入ったんです。AIを研究し始めたのは、そこからですね。

杉原:岡田さんのような分野の研究者は、日本にどのくらいいらっしゃるんですか?

岡田:もちろん産官学で人工知能の研究をされているグループは山ほどありますけど、ピンポイントで、人の行動から内面状態を理解するみたいなことに焦点を当てているのは、僕たちと数えるくらいしかないです。

こちらは、2018年にジョージ・アンド・ショーン合同会社(現株式会社)と岡田研究室が共同で開設したG&S Labのイメージビジュアル。IoTデバイスであるbiblle(ビブル)を活用して、行動学習に特化した機械学習プログラムの開発を行っている。

もう多くの企業ではAIが採用面接をしている!?

杉原:表情から何かを読み取るということは、なんとなく僕もイメージできるんですが、そこから購買意欲だったり、そこに出口を見つけていくというのは、なんだか大学でやる研究っぽくないなと思いますね(笑)。

岡田:そう言われれば、そうかもしれないですね。

杉原:僕自身のイメージでは、大学の先生は研究を突き詰めて、あとはアウトプットを第三者に見つけてもらう、そんなスタイルが多いなと常々感じているんですよ。それが出口までしっかりとしていて、岡田さんの研究は面白いなと思います。

岡田:そう言っていただけるとありがたいです(笑)。確かにそれは狙っていて、研究室でコンピューターの前に座って突き詰めるのではなく、実際のインパクトのあるデータに対して、なんらかの回答を出していくほうが、世の中的にも出口がわかりやすいですし、そういうことは意識していますね。

岡田氏の研究に興味津々の杉原。感情という抽象的なものを数値化するという試みには、シンパシーを感じているようだ。

杉原:世界的にはどうなんですか?

岡田:コンピューティング分野の国際会議のような場には、アメリカ、ヨーロッパの有名大学の研究者が集まってきますが、そこでは感情を理解するという研究が一番多いように感じます。コンピューターにいろいろな感情を理解させるということが基本ですけど、話している声や内容、表情からコミュニケーションのスキルを推定するということも盛んになってきてはいます。AIによる企業の採用面接みたいなものもそうですね。

杉原:確かにそういう面接は、実際にあるようですね。

岡田:面接で一言、二言答えたことから推測して、その人(のスキル)を判定するということですよね。あらゆる企業は、もうAIを様々活用しているのですが、採用には特定の人しか受からないとか、雇用差別・公平性の問題が出てきたりもしています。自分も就職面接のように実際に多くの人を呼んで、はじめて会った学生同士でディスカッションをしてもらい、そのビデオを人材派遣の会社に送って、人事の採用担当者に点数をつけてもらうという試みをしたことがあります。同じようにAIにも判断してもらったら、熟練の採用担当者と同じように人を選ぶのかどうかを検証しました。その実験は、学会でも良い評価をもらいましたが、アプリケーションとして見た場合、考慮すべき課題が多いと感じます。ですので、そういうスキル判定の技術を使って、スキルを上達させるための訓練に活かすことを、これからはやっていきたいですね。困っている人が喜ぶようなアプリとして機能できればと思っています。

感情を数値化するには、大きな課題がいくつもある

杉原:なるほど、それは興味深いですね。もうひとつお聞きしたいのが、“感情”っていうのは数値化も可視化もしにくいのではないか、ということです。実際に研究は進んでいるんでしょうか?

岡田:そうですね、難しいところも確かにあります。いま主にやっていることは、心理学者たちがこれまでに作った評価指標に則って、実験後に、いまあなたの感情はいくつでしたか? というように被験者に問いかけたり、第三者に被験者の映像を見せて、被験者の感情状態はどうなっていると考えられますか? というようにアンケートを書いてもったりする手法なんです。それをもとに人工知能が答えを導き出すわけですから、そもそものアンケートの答えが間違っていると、人工知能的にはもう破綻してしまう。そこが弱点でもありますね。

杉原:まず、ちゃんとしたデータを取ることが難しいんですね。

岡田:正解のデータがしっかりと作れなければ、人工知能は動けませんから。正直、感情って自分で数値をつけるのは難しいですよね。

杉原:自分でも自分の感情が一番わからないこともありますよね(笑)。

岡田:そういうものなんですよ(笑)。

杉原:以前の心理学者の研究だったり、研究論文なんかを追っかけながら、感情を紐解く要素を分析していくという手法はもちろんわかりますが、IoTを使ったデータ集めというのは、どうなんでしょう。世界的にはビッグデータは集まってきているんですか?

岡田:それも難しいところではあるんです。GAFAは、画像・音声を含めWeb上でたくさんの情報を集めていますが、普段の人同士の会話や、自然に対面コミュニケーションしているときのデータを膨大に集めるのは、まだまだ実際には難しいですよね。例えば感情データを集めるために、誰かが怒っているところをずっとビデオで撮るわけにもいかないですし、これからデータを取るので怒ってください、っていうのもおかしいですしね(笑)。多くの人が、AI speakerと友達のように頻繁に話す未来が来たら変わるかもしれませんが、AIの対話機能レベルから言って、それはもう少し先になりそうです。

杉原:確かにそうですね。

岡田:だから、自然にそういうデータをどうやったら取れるのか? っていうのは自分たちの研究の大きな課題ですね。

杉原:ライフログ的なところですね。とはいえ、無理やりIoT的な要素をくっつけたものを開発して使ってもらっても、結局使わなくなりますしね。

岡田:そうですよね、スマートウォッチとかもその一例だと思います。

杉原: スマートウォッチが出た当初はすぐに買いましたけど、3日後にはこれまで使っていた普通の時計が恋しくなってしまいました(笑)。でもいまは、Apple Watchなどがセンシングに使われていますよね。睡眠だったり、バイタルだったり。そういう使われ方をしているのは有意義だと思います。

岡田:そうですね、そのような使い方は興味深いです。最近私たちもスマートウォッチのようなセンサを使った研究を始めています。とはいえ自分たちの研究は、いまはデータを採取するのにビデオの前に人を座らせなきゃならないので、常に記録するのが難しい状況です。なので、毎日何かを記録すれば、健康がチェックできるとか、そういう多くの人に受け入れやすいアプリなどを通して、効率よくデータを取る方法を模索して行こうと思っています。

後編へつづく

岡田将吾(おかだ・しょうご)
国立大学法人北陸先端科学技術大学院大学(JAIST)准教授。2008年東京工業大学大学院知能システム科学専攻博士課程修了。京都大学特定助教、東京工業大学大学院助教、IDIAP research institute 滞在研究員等を経て、2017年より現職。「社会的信号処理に基づく人間の行動やコミュニケーションの理解」を主要テーマに、AIの新たな領域の研究に取り組む。専門は、マルチモーダルインタラクション、データマイニング、機械学習、パターン認識ほか。

(text: 長谷川茂雄)

(photo: 増元幸司)

  • Facebookでシェアする
  • LINEで送る

RECOMMEND あなたへのおすすめ

対談 CONVERSATION

テレビゲームの枠に収まらない、本当のeスポーツとは!?犬飼博士がつくりたい未来【後編】

前編ではeスポーツが生まれた背景や現状を語り合った。そして今後は、eスポーツは一般的なスポーツのなかに溶けていくだろうと予測。後編では具体的な未来予想図を展開。犬飼氏が構想する『IT体育館』の可能性について話が展開していく。

人の動きを解析すると未来が見える

杉原:僕は人の動きを解析することが好きなので、リアルイム身体情報を測定してクラウドにストックしていくという犬飼さんの『IT体育館』構想に共感するんです。RDSは車いすレーサーの開発をしているのですが、「人間が45分くらい座り続けるとどんな動きをするのか」、「何回減圧するのか」といったことから、その人の身長や体重、年齢が予測できて面白いんです。

犬飼:そういう研究データはみんな欲しくて仕方がないんですよ。たとえば、『アナグラのうた消えた博士と残された装置』という科学展示が、日本科学未来館にあるんですけど。それは、「空間でどういった情報を取って、どう利用すれば、どう幸せになるか」という空間情報科学に関する展示なんです。面白いのは、僕たちがそれを作っている様子を、京大の先生がさらに研究している。つまり、入れ子構造になっているんです。京大の先生たちは、僕らの会議や制作風景をすべてビデオに録画した後、「犬飼が立ち上がった」「◯◯と喋った」とかを全部書き出して、「犬飼が立ち上がると議論はこう変わる」とか「何分くらいでこう変わる」とかを解析して論文にしているんです。そういうことを自動化させたい。

杉原:そんな研究があるんですね。

人間のためではなくて、
テクノロジーが成長するためにやっている

犬飼:最終的には意思決定に使いたいんですよ。AIがディープラーニングした過去のデータと、リアルタイムで起きていることを対峙させれば未来予想ができる。そうなると、未来の選択肢はAmazonのおすすめ商品みたいに表示される。つまり、「今日の会議は何をする?」という時点で、すでに「結論」が出ている。未来の会議は、その結論に対しての意思決定の場になっていく。

杉原:会議室に入ってきたときの雰囲気やサーモグラフィーだったりを踏まえてですよね。

犬飼:今日のような対談も、最初から結論の記事ができあがっている状態。それが対談のなかでリアルタイムに変化していく。

杉原:そのためのデザインや構造はすでにあって、あとはどう数値化、AI化して使えるコンテンツにするかということですか?

犬飼:いまやっているのは入力部分です。発見のための「眼」を作っている感じ。それは人間のためではなくて、テクノロジーが成長するためにやっているんです。そういうと反感を買うんだけど、僕は「人のために働く」とか「ホスピタリティ」とかいうのがすんなり理解できない人間だから。

杉原:その感覚は僕も少しわかるところがあります。RDSで車いすを作ったり、『HERO-X』のようなメディアをやっていると、「いろんな人の助けをしていて偉いですね」とか言われることがあります。でも、僕はただ「無いものを作りたい」だけなんですよね。時速50kmのスポーツカーみたいな車いすがあったら面白いとしか思っていない。

犬飼:そこには、時速50kmの車いすがあるだけですよね、ただ作ってみたいだけ。

杉原:頭の中に描いている未来をやらないと気持ち悪い。やらないなら、キレイさっぱり消し去りたい。

犬飼:そう、「思いついたから」って結構重要で。思いついたから、作らなければいけないから、作るだけ。「誰のために作っているのですか?」と聞かれたら考えるけど。

杉原:コンクルージョンが大事だと思っていて、イントロは誰かが書いてくれればいいかなと思っています。

犬飼:とはいえ、こういう場所に呼ばれたからには、「自分の言葉で話せ」「批評は自分でしろ」とか、そこも含めてやらないといけない。

東京オリンピックの開催が
決まってから空気は変わった

杉原:eスポーツのプラットフォーム化は、今後どんどん大きくなりますか?

犬飼:はい。先ほどもお話したように、まずは『IT体育館』を作りたいんです。過去のデータと、リアルタイムを対峙させて未来予想をすると言いましたけど、そこにみんなが気づき始めたときに、そういうソリューションを提供したいと考えています。

杉原:多くの人が共鳴して、一緒にやっていくイメージですか?

犬飼:2010年くらいから、苦労して自力でやっていますけど、いまだに始まってない。「いつ儲かるんですか?」と聞かれるから事業計画を書くんだけど、僕がヘタクソなのかそこから動かない。でも、2013年、東京がオリンピックの開催地に決まって、そこから急に空気は変わりましたね。それまでeスポーツなんて誰も興味を持っていなかったですから。日本のターニングポイントだと思いますよ。結局、オリンピックでスポーツへの関心が生まれて、次のスポーツを探したときに、具体的に使えるのがeスポーツだけだったということなんでしょうけど。

杉原:従来型のスポーツとのギャップが面白かったんですかね。

犬飼:2020年までに何かしら投資するに値するものが、そこしかなかったんですよ。「eスポーツ=テレビゲーム」としてくくれば、ゲームプレイヤーの10%が真剣に取り組めば幾らになると試算できる。「超人スポーツ」みたいなものに投資が集まらないのは、その市場がそもそも文化になっていないから。酔狂なエンジェル投資しかあり得ない。

IT体育館が普通になると、
次にくるキーワードは「作る」

杉原:犬飼さんたちは、新たな市場を作ろうとしているんですね。

犬飼:いまはニーズを先に作ればいいと思っているんです。スマホが当たり前の時代になって、次はデータを取ることが当たり前になって、情報が取れる体育館が当たり前になり、取れない体育館に違和感を覚えるようになったら、みんながIT体育館を欲しがるようになる。実際、山口の情報芸術センターでは2015年からやり始めていて、子どもたちは学校にある旧来の体育館に違和感を感じ始めているんです。IT体育館が普通になると、次にくるキーワードは「作る」になんですよ。

杉原:どういうことですか?

犬飼:スポーツ庁のスポーツ基本計画では、「する・見る・支える」をキーワードにしている。するスポーツ、見るスポーツ、支えるスポーツという三角形。その面積を大きくすることで、人々が健康になって、医療費も下がって、健康寿命がながくなるという説明。それを一緒にやっているのが超人スポーツをやっている人たち。

僕らは、そこに「作る」という縦軸を作って立体的に増やしていきましょうという提案をしているんです。やる種目が増えればスポーツ人口が増えるという考え方です。というのも、eスポーツがスポーツに与えた影響のひとつに、スポーツデベロッパーが増えたことが挙げられるんです。テレビゲームでいえば、ゲームクリエーターが増えたのと同じ。問題点としては、スポーツクリエーターには給料や賞がなく、社会的評価もないということ。さらに、新しいスポーツを作ったあとに、それは誰のものかっていうことになる。スポーツって誰のものでもなく、パテントもとれない。

杉原:確かにそうですね。

犬飼:そこで僕が提案しているのは「デベロップレイヤー」、デベロップとプレイをかけた造語です。新しいスポーツを考案して、プレイしながらルールを決めている途中の段階では、「デベロップ」と「プレイ」の境界線がないわけです。プロトタイピングに近い。ITの世界のように、プロトタイピングをアジャイルに作っていき、ちょうどいいところが見つかったら人にプレゼンする。作りながら遊ぶ体験ですよね。とはいえ、これもまだどうマネタイズするのがいいのか、回答は出てないんです。僕たちはまだアイデアがないので、それが「作る」の次にくるキーワード。

杉原:そう考えると、「スポーツ」というワードを使ったほうがいいのか、面白いものが生まれるならスポーツと呼ばなくてもいいのでは? ということになりますよね。

犬飼:そうなんですよね。「スポーツ」や「遊び」という言葉が使いにくくなってしまったので、新たに自分で「運楽」という言葉を作っちゃったんです。運楽の中に、スポーツや音楽があるような感じです。

杉原:なるほど。音楽のなかに、さらにジャズやヒップホップがあって、演歌もあってみたいなものですよね。

犬飼:そうそう、プレイヤーも観客も楽しんでいるに過ぎないというのは、音楽ではすでに起こっている。

杉原:もしかしたらeスポーツはジャズに近いのかもしれない。

犬飼:即興的に作っていくという意味ではジャズに近いかもしれないですね。僕らのやっている『運動会ハッカソン』※1とか、『未来の運動会』2とかね。
——————
1 伝統的な運動会の道具、紙、棒、ボールからドローン、コンピューターなど、使う道具の制限をなくした状態で、みんなで新しい運動会の「種目」や「出し物」を作る試み。
2 『運動会ハッカソン』で生まれた、新しい競技で楽しむ運動会のこと。
——————

杉原:それをテレビのショーとしてやるのか、YouTubeとしてやるのか、ジャズバーでやるのか。

犬飼:そうそう、IT体育館をそういう場所にしたいんです。そういう場所を用意しておけば、コンペティティブな環境が生まれて、そのうちにすごい奴が現れますから。

杉原:xでも、eスポーツというものをテレビゲームの大会では終わらせず、ここまで広げて考えている方は少数派ですかね。

犬飼:そんなに難しくないし、便利で普遍的な捉え方だとおもうんですけどね。でも、eスポーツ=テレビゲーム大会のような認識になってしまったことには、僕も反省があるんです。2005年頃は、「eスポーツって何ですか?」と聞かれたら、みんながわかりやすいように「たとえばテレビゲームをスポーツとしてとらえるようなことです」と答えていたので。

杉原:今後、犬飼さんの考えるeスポーツが普及していくと、「ゲームばかりやっていないで、少しは体を動かしなさい!」という定番文句が家庭から消えていきそうですね(笑)

犬飼:『ポケモンGO』をやって、15km歩いている子どもを否定できないですよ。「お母さん、僕は今日ポケモンがんばったよ。」って言ったら、「ゲームばっかりしてないで外で遊びなさい」と、なぜか怒られてしまう矛盾と戦ってきた人生なんです。僕はお母さんに苦言を言われる理由がわからなかった。そこを説明したくて、苦肉の策で生まれたのがeスポーツでもあるんです。

前編はこちら

犬飼博士
1970年、愛知県一宮市生まれ。運楽家/遊物体アソビウム/ゲーム監督。映画監督山本政志に師事後、ゲーム業界にて『TOY FIGHTER(アーケードゲーム)』、『UFC(ドリームキャスト)』、『WWF RAWXbox)』といった作品を制作。2002年より、スポーツとゲームを融合する「eスポーツ」の事業を開始。『World Cyber Games』、『Cyberathlete Professional League』、『Electronic Sports World Cup』といった国際eスポーツ大会の日本予選をオーガナイズ。2007年度文化庁メディア芸術祭にて、ゲームソフト『Mr.SPLASH!』が審査員会推薦作品に選出。2012年には、日本科学未来館で常設されている『アナグラのうた 消えた博士と残された装置』に参加。2013年には、YCAM公募企画『LIFE by MEDIA』国際コンペティションや、文化庁メディア芸術祭エンターテインメント部門優秀賞などを受賞した『スポーツタイムマシーン』を発表。

  • Facebookでシェアする
  • LINEで送る

PICK UP 注目記事

CATEGORY カテゴリー