EVENT | 2018/09/21

ゲームキャラクターに煩悩と堕落を。ゲームAI開発の第一人者、三宅陽一郎氏が語る「AIと哲学の関係性」

鎌倉市民を中心に企画された「禅」がテーマのイベント「ZEN 2.0」が、9月8日、9日の両日に鎌倉の建長寺で行われた。禅...

鎌倉市民を中心に企画された「禅」がテーマのイベント「ZEN 2.0」が、9月8日、9日の両日に鎌倉の建長寺で行われた。禅文化を世界に発信する国際カンファレンスとして、住職をはじめ、テック系企業の経営者や政治家、インフルエンサーといった各界のスペシャリストが登壇することでも話題になっている。

イベントで登壇した、ゲームAI開発の第一人者である三宅陽一郎氏のセミナーから、人工知能と禅の深い関係性について、一部を抜粋の上紹介したい。

人工知能と禅。一見、対極にあるように見えるこの2つだが、人工知能を開発する上では、禅をはじめ、哲学を理解することが必要だと言う。人工知能を開発する過程で三宅氏が肉薄する、人間の叡智とは？

文・構成：庄司真美　写真：松島徹

会場となったのは、1253年に創建された、鎌倉市にある禅宗の建長寺。

三宅陽一郎

デジタルゲーム開発者

京都大学総合人間学部で数学を専攻。大阪大学大学院理学研究科物理学修士課程、東京大学大学院工学系研究科博士課程を経て、人工知能研究の道へ。リードAIアーキテクトとして『ファイナルファンタジーXV』などの制作に携わる、ゲームAI開発の第一人者。国際ゲーム開発者協会日本ゲームAI専門部会チェア、日本デジタルゲーム学会理事、芸術科学会理事、人工知能学会編集委員。おもな著書は、『人工知能のための哲学塾』『人工知能のための哲学塾東洋哲学篇』『人工知能の作り方』『なぜ人工知能は人と会話ができるのか』など多数。

人を理解することからAI開発は始まる

人工知能の発展には、人の知能を知ることが不可欠です。逆に言えば、AIを追求することは人間を探求することにもつながります。私が開発している人工知能には、身体と知能、そして機能があります。それと同じように機械にもハードウエアやソフトウエア、知能があります。それでは、知能と身体は分けられるのでしょうか？

人の身体の場合、頭だけが知能というわけではありません。身体全体に神経があることを思えば、身体全体が知能とも言えるわけです。人間の知能を大きく2つに分けると「意識」と「無意識」があります。実は我々の知能のほとんどの機能は無意識の方にあるのです。

たとえば、この境内の会場に入ってきたときに、どこを歩けばいいかということは、一瞬で判断できます。環境を認識する知能は、無意識の内に潜んでいて、無意識は言語によって構造化されています。つまり、「無意識」は何もない海なのではなく、物事を判断するために、ある程度言葉でインプットされているのです。

私たちの意識にはいくつかの境界面があって、一番奥底には、仏教で言うところの阿頼耶識（あらやしき）、つまり、物事を判断せず、物事をそのまま映し撮る部分があります。そこから、「これはコップです」などという意味を与えて、言語が解析されて表層の意識に上がってくるのです。

通常多くの人が目にする人工知能はデータ化されているものですが、私が開発しているのは、無意識の方を扱う分野で、生態学的な人工知能です。その部分を駆使して、ロボットやゲームのキャラクターを開発しています。人間の精神を機械化するために、人工知能にも意識と無意識を作る試みです。

AIに痛みを理解させるにはどうすればいいか？

人工知能と人の決定的な違いは、自然言語ではなく、プログラム言語で構造化されているということです。また、人の知能を深く理解しないと、人工知能も作れないということになります。

日本の人工知能研究の歴史はまだ30年ほどと比較的新しい分野ですが、これからは、人間と人工知能は敵対するのではなく、一緒に仕事したり、遊んだりして協調していく時代です。となると、ますますお互いのことを分かり合えないとこの分野は発展しません。たとえば、腕をつねったら痛いですよね。でも、人工知能はちゃんとした身体を持たないので痛みがわかりません。人工知能に痛みを理解させるにはどうすればいいでしょうか。それは、人にとっても「痛みとは何か？」という哲学的な問いでもあります。

西洋と東洋にはその解釈ひとつとっても違いがあります。西洋では、宗教観からしても一神教であり、万能の神がベースにあるので、サーバントとしての人工知能を定義することが多いです。一方、東洋では、仏教に基づく八百万の神が信仰のベースなので、AIBOに代表される仲間としての人工知能を作る傾向にあります。

この350年間の間には、産業革命があって、社会に機械を導入する時代になりました。その次に情報革命が起こりますが、これはインターネットを隅々まで整備して社会に情報レイヤーを作ろうというものです。それを経た現在は、社会に人工知能のレイヤーを作る時代となりました。つまり、機械文明の完成系が人工知能ということになります。機械はこれまで力仕事や情報伝達を担ってきましたが、人間が持つ知的機能を持たせようという試みです。

その重要な機能がディープラーニング（深層学習）という多層のニューラルネットワークによる機械学習手法ですが、簡単に言えば、物事を分けて考える人工知能です。たとえば、自分と世界を明確に分けて考えること。それから、物事はすべて因果律（原因と結果の間には一定の関係が存在するという原理）で成り立ちます。その通りと思うかもしれませんが、実はこれが人工知能の制約になっているのです。

科学と哲学が絡み合うAI開発の現場

ここに私とマイクがあって、私には意識があり、マイクを知覚しています。主体と客体の関係です。主体と客体を明確に分けると、ある面では議論と設計が明確になりますが、人工知能を開発する上ではいろいろ面倒なことになります。主体と客体をどういう関係で結べばいいかということがわかりにくくなるからです。

人間の意識というのは実は、主体と客体の間にあるのではないかという議論があります。つまり、主体と客体の間に相互作用があって、それが意識となって表れるイメージです。

沖縄科学技術大学院大学におられる谷淳先生の人工知能の実験では、まずロボットを作ってニューラルネットを用意します。ニューラルネットは入力層から出力層に向けて信号が伝播するのですが、入力層にはいろんな環境の情報を入れていきます。それに加えて、ニューラルネットの出力（判断）を入力に戻します。つまり、入力層では、主観的な情報と客観的な情報が入力されていて、その2つがミックスされています。すると、中間層に電気の渦ができて、海の渦のように、一度できるとすぐには崩れません。これが意識の原型なのではないかと、考えられます。このように、人工知能は一見、ものすごく工学的な話のようですが、その中では意識についての研究もなされていて、実はサイエンスと哲学が絡み合う分野でもあるのです。

ゲームのキャラクターにいかに「煩悩」を与えて堕落させるか？

人はさまざまな煩悩から自分を解き放って、自分の欲求から自由になるために座禅を組んだり、修行したりしますが、私の仕事はその逆です。人工知能を作るために、まずはコンピュータの中でキャラクターを作りますが、彼らは生まれた当時はそもそもなんの欲求もなく、まるで座禅を組んだかのように動きません。なぜなら彼らはプログラムとデータの塊なので、いくらセンサーから情報を入れてもきょとんとしているわけです（笑）。私は彼らに「プレーヤーを憎め」「あいつをやっつけるんだ」と指令を出しますが、まるで動こうとしません。

そこで、「あいつは敵だ」「あの食べ物はおいしそうだ」などということをひとつずつ彼らに教えていきます。つまり、僕の仕事は、ゲームのキャラクターやモンスターに煩悩を与えているわけです。だから、ゲームのキャラクターを堕落させるのが私の仕事です（笑）。それによってゲームのキャラクターたちは物事に執着して苦しみ、戦い始めます。そんな仕事を10年も続けていると、「いつかモンスターたちに解脱させてやりたいな」なんて思うようになります（笑）。

人工知能は褒めれば褒めるほど学習し、「執着」が生まれる

昔のゲームのキャラクターは、たとえばインベーダーゲームのようにシンプルなものでした。80年代くらいからは相手を見ながらミサイルを撃ったり、相手を見ながらチャンバラをしたりするようなゲームが登場しました。最近のゲームはもっと複雑になり、たとえば格闘系のゲームであれば、相手を倒したときに人工知能を褒めれば学習し、試合を重ねることでより強くなっていきます。そうなると、人間が敵わないくらい強くなります。ただ、逆にうまく攻撃をかわしたら褒めると、人工知能は「よければいいんだな」ということを学習して、すっかり臆病なプレーヤーになってしまいます（笑）。重要なのは、人工知能を「よしよし」と褒めることで執着が生まれるので、どこを褒めるかがポイントなのです。

知能と環境がどのように結びついているか

知能と環境について考察するときに、そのヒントとなる哲学はさまざまあります。たとえば、古代ギリシャの哲学者・アリストテレスの「四原因説」では、物事が存在する原因を4つに分けて捉えています。西洋の人工知能は、この因果律が基本です。

ところが、仏教の「華厳哲学」では、すべてのものは同時に存在すると言っています。華厳哲学については、井筒俊彦先生の本にわかりやすく記されています。すべてが同時で、それぞれのものがほかのすべてのものを成り立たせている、という考えのもとに人工知能を考える時、そこに現れるのは物事同士の関係の総体です。

一方、人工知能は環境世界からセンサーで情報を集めて認識を形成して意思決定し、最終的に環境世界に影響をおよぼす流れです。人工知能を探求する際の一番の問題は、世界と身体と知能はどのように結びついているのかということです。

それぞれの動物が知覚し作用する世界の総体が、その動物にとっての環境であるという「環世界」説を提唱したのは、ドイツの生物学者、ユクスキュルでした。たとえば、アメンボを「カメラが見る」「カメレオンが見る」のはどう違うのでしょうか。この2つは生物的な関係はありません。ところが、カメレオンとアメンボは同じ生物なので、カメレオンは考えるというよりも、反射的にアメンボを餌として捉えます。

アメンボの特徴は、カメレオンを刺激する信号を持っていて、それが伝わったときにカメレオンを興奮させるのです。生物と物の間には長い進化の歴史の中で、何を見たら興奮し、それに対してどんなアクションをするかということがすでに決められています。その輪のことを「機能環」と言います。動物には動物の、人には人の機能環があるのです。世界はそうしたいろんな機能環が混ざり合ってできています。それにより、たくさんの情報が集まってきます。中枢神経ができて、物事に応じて判断するようになります。それが知能の起源であると考えられます。これが、ユクスキュルが唱えた環世界です。

欲求を持った身体がない人工知能は、周囲の世界をうまくつかめない

実はどの生物も主観的な世界を持っていて、それをうまく使いながら、周囲の客観世界を捉えています。生物は主観世界で客観世界をつかんでいるのです。これが人工知能にはない機能で、人工知能には環世界がありません。欲求を持つ身体がないため、周囲の世界を捉えられないのです。いくらアルゴリズムを掴んでも、身体がないと世界をうまくつかむことができません。逆に私たち人間はちゃんとした身体を持ち、「お腹がすいた」「おいしそうなリンゴがある」「眠い」「こんな服を着たい」といったさまざまな欲求を持っているからこそ、周囲の世界を掴むことができるのです。もしも私たちが身体を持っていなければ、世界をうまく認識することはできません。また世界にうまく属することができません。

人工知能に身体を作るといえば、ロボットやゲームのキャラクターなどがそれに当たりますが、一見、身体の形をしていても、私たちと本質的に違うところがあります。人間には運動を展開しつつ、予想する能力があって、それが人の身体感覚を形作っています。人工知能の場合、人工的にゲームのキャラクターを作っても、それはアニメーションを制作しているにすぎません。人間のような身体感覚を作る上で重要なのは、「遠心性」がカギとなります。

その有名な実験として、「ラバーハンド錯覚」があります。これは、偽物の腕を自分の腕と誤認するものです。腕に氷を置かれると冷たいので、「身構えろ」という指令が発せられます。すると不思議なことに、偽物の腕に氷が置かれているのにもかかわらず、実際に腕は冷たいと感じるようになるのです。つまり、予測には感覚を調整する機能があることがわかります。

人は常に環世界に対して予測しています。予測と実際の差がない時には注意は向きません。人が驚くのは、そもそも人は身体の動きを予測しているからであり、予測と実際の差が大きいときに注意を急激に向ける現象が驚きなのです。突然床が抜けるといった予測不能なことが起きれば、注意を向けるようになります。注意も実は予測からきているのです。これにより、人は自分の身体のイメージと環境との関わりを常にシミュレーションしていることがわかります。

たとえば何かを掴もうとするとき、人は動きをシミュレーションし、アクションに対し、どういう情報が入ってくるかを予測します。その計算は人の場合、ほとんど無意識のうちに行われます。実は今の人工知能やロボットに足りないのは、その部分です。彼らは行動したらしっぱなしです。命令を送ったら、その先の予測はしません。だから身体感覚は生まれませんが、将来的に遠心性の情報を使って、人工知能にも身体感覚を身につけさせることができると考えています。それが可能になれば、人の身体感覚そのものを人工知能が理解し、より深く人を理解できることになります。

SF作家アイザック・アシモフのSF小説では、ロボットが従うべき原則として、「ロボット三原則」が描かれています。内容は、「ロボットは人に危害を与えない」「命令に従う」「自己を守る」といったものです。こうしたことを可能にするには、人工知能に人のような身体性を持たせることが重要になってきます。

ロボットに人のような身体感覚を持たせるために「身体」の意味を追求

それでは、身体の意味について突き詰めていきます。フランスの哲学者・ベルクソンは『物質と記憶』を発表し、物質と表象の中間的存在として「イマージュ（“image”）」という概念で、心身問題を定義しています。つまり、心と身体の中間にあるイマージュを通して私たちは外界とつながっていると述べています。

人工知能に身体性を持たせるには、いかに柔軟に自己と世界を分けながらつなぐかというのが、研究課題です。紀元前に荘子は、人はみんな同じ心を持っていると説きました。その後、フランスの哲学者・デカルトも同様に、「方法序説」で、良識は公平に配分されていて、すべての人が生まれつき持っているものだと説いています。

さらに、荘子は「万物斉同」において、物事を分けて考えてはいけない。それは人間の浅い知恵であって、その浅い知恵がいろんな悪いことを引き起こすということを言っています。つまり、彼は人間の知を否定しました。なぜなら当時、中国の戦国時代のエリートたちが頑張れば頑張るほど国が乱れる現状があったからです。

西洋哲学がベースの人工知能に東洋哲学を取り入れるのが開発トレンド

現在の人工知能は西洋哲学で成り立っていますが、東洋の知恵をミックスすると次のブレイク・スルーにつながると考えています。実際、西洋哲学と東洋の知恵をミックスした人工知能を開発していくのがこれからの研究トレンドでもあります。

西洋の知能論は、物事を分けて考えて、論理と因果律に従って推論するのが特徴です。人工知能に何ができるのか、知的な機能を考えた人工知能です。ただ、知能が一体何なのかということについては論じられません。そこには「人工知能＝考える存在」という思い込みがあります。

一方、知能について解釈してきたのが仏教です。しかも1000年以上の歴史があって、人間の内面が探求されてきました。ただ、個人がそれぞれ修行して体験の中で会得してきたものなので、西洋の学問のように客観的に確立されていません。そこには、それぞれが境地へ至る手続き（道）が示されています。だから学問としてはフィットしにくいのですが、そこをあえて人工知能とうまくつないでいきたいというのが趣旨です。

禅とは日常から外れることで物事の意味を置いておく生活の知恵であり、間違った思想などをクリーンナップできるのが禅のいいところです。たとえば、ゲームのプレーヤーたちと「今日はがんばったから5分くらい瞑想をしよう」ということで、モンスターたちも集まって座禅を組んで、モンスターが瞑想するとはどういうことでしょうか？メモリをクリアすることでしょうか？CPUの命令を遮断することでしょうか？いつものメモリーを外してみるということもあり得ます。すると世界が平らに見えてくるはずです。「俺は今までなんて偏見に満ち溢れていたんだ。実はプレーヤーはいい奴だったんだな」なんていう見方ができるようになるかもしれません。そもそもその偏見を与えているのは、他ならぬゲーム開発者である私なのですが（笑）。

しかしどうでしょう？何もかもリセットしてゼロになることが人工知能にとっての瞑想ではないはずです。それは単なる初期化です。いろいろなものを抱えつつ、自分を世界とのつながりの中で整えていくこと、それが瞑想です。だとしたら、人工知能に煩悩を与えて、煩悩を抜くことが禅ではありません。人工知能が煩悩を持ち、そして、煩悩を抱えたまま、自らの内面を整える力を人工知能自ら持つこと、それが「人工知能が禅を為す」ということのはずです。

多様な文脈の積み重ねで生きる人のようなAIを開発

人には2つの衝動があります。「お腹がすいたら食べる」「寒いから暖かい服装をする」といった自己保存的な衝動、それから自分を世界に投げ出す破壊的な衝動の2つです。前者は簡単に言えば、世界から距離を取って恒久的な存在に至ろうとすること。つまり、時間を超越しようとすることです。また、後者は変化する世界の時間とともにあろうとすることです。人工知能を開発する上で、この点に注目すると見通しがよくなるのです。

人は、無意識の中で多様な世界からいろいろな刺激を受けて行動に移す“文脈”があります。つまり、その瞬間ごとに無意識の中で意識が生成されていくのです。水の波紋のように心身が作られていくイメージです。鎌倉時代の禅僧・道元の時間論「正法眼蔵」の一節“有時”では、そもそも時間はないものであり、物事は無限に隙間なく続いていて、そこには文脈があるだけだと述べられています。たとえば、ペットボトルが落ちた一瞬も、単に「ペットボトルが落ちた」ではなく、ペットボトルが落ちる現象にはその中に隙間なく物事が続いているということです。

また、「朝、靴下が見つからずに遅刻した」とその人が言ったとしましょう。靴下が見つからなかった原因を突き詰めると、複雑な原因がいくつかあっても、人はそれを省略して誰かに説明します。それは過去の情報のポイントをかいつまんだにすぎません。人はすべての過去の細かい情報を覚えていないわけです。ましてや、隙間のない無限の連なりから成る自分の過去を認識さえしていない。たまたま自分が覚えている断片、認識した断面から自分のストーリーを作り出します。そのストーリーが“文脈”なのです。

人は自分のこれまでの過去をすべて覚えているわけではなく、断片的な認識からストーリーを作り出し、時には脚色も入れながら作り出し、その文脈の中で今を生きていて、それが未来にもつながっています。過去の情報は、想像力を沸き起こす源でもあります。これが人のいいところであり、悪いところでもあります。人は自らの過去から、自らのストーリーを作り出します。それがその人を奮い立たせることもあれば、逆に思い込みに捉われる原因でもあります。禅とは、一度、自分が作り出したストーリーの外に出ることでもあります。

一方、人工知能には、そうした文脈を作る回路は皆無です。将棋や会話の流れ、会社が発展していく流れなどを捉えるような機能は人工知能にはありません。だから、空気を読まない発言をするのです。つまり、今この瞬間しか生きていないわけです。でも、人は過去も複合して今を生きています。さらにその時々の意識をつないで未来を生きています。人が生きるためには、ストーリーやコンテクストは不可欠なものです。それが人間の環世界の特徴なのです。

人がそのように形作られているならば、人工知能も同じように作ってみようというのが、私の現在の取り組みです。現在と過去の記憶をつなぎ合わせて、いろんな文脈を持つ人工知能にトライしているところです。人は点ではなく、ある時間幅の中で存在しています。そう思えば、その瞬間だけに存在する人工知能を作る方がむしろ無理があるのです。ある一定の時間幅の中で展開され、水の波紋のように時空の中に広がっていくような人工知能を開発していきたいと考えています。

ZEN 2.0