東京大学総合研究博物館 The University Museum, The University of Tokyo
東京大学 The University of Tokyo
HOME ENGLISH SITE MAP
東京大学総合研究博物館ニュース ウロボロスVolime23Number2



小石川分館 建築博物教室
ことばのアーキテクチャ
―人工知能による言語の理解:実施報告

松本文夫(本館特任教授/建築学)

 小石川分館の建築博物教室では、さまざまな分野の研究者により「アーキテクチャ」(構成原理、設計思想)という切り口で先端研究の講演が行われ、モバイル展示がつくられてきた。2018年6月2日の教室では、「ことばのアーキテクチャ―人工知能による言語の理解」と題し、近年めざましい発展がみられる人工知能研究の基本理念と先端事例について、東京工業大学/産業技術総合研究所の高村大也先生にお話しをいただいた。本稿ではその講演の概要を報告するとともに、末尾に筆者の考察を付記する。
 人間の知能は「言葉」と密接な関係をもつ。人工知能の技術は、「言語を理解する」あるいは「言語で伝える」ことを目指すが、これはコンピュータにとってかなりの難問だという。本講演の目的は、人工知能の根幹をなす機械学習の考え方、文章に含まれる感情を捉える技術、文章を生成する技術など、自然言語処理の研究を紹介することにある。同時に、身近な事例を通して「言語の理解」の難しさに触れ、それに立ち向かう先端的な研究動向を知る機会にもなった。
 鉄腕アトムやドラえもんといった人気キャラクター、サーモスタット制御やロボット掃除機などの実用技術によって、人工知能はこれまでも身近な存在であった。近年その影響が社会生活の多くの分野に及び、人工知能脅威論も語られるようになってきた。まずは講演の導入部として、現在の人工知能研究の広がりが紹介された。機械学習、自然言語処理、画像認識、音声認識、ヒューマンインターフェイス、ニューラルネットワーク、データマイニング、エキスパートシステム、マルチエージェントなどの基礎系・応用系の研究分野がマップで示された。高村先生の専門である自然言語処理は、人間の言語をコンピュータで扱う中核的な研究分野であり、機械翻訳、文章校正、自動要約、評判分析、質問応答システム、情報抽出、会話ボットなどの展開があるという。
 次に、人間と人工知能のわかりやすい対話事例によって、自然言語処理の全体の流れが示された。ドライブ中に運転者が「お腹が空いたから、どこかに入りたい」と発言し、それに対して人工知能が「5分くらい走ると○○というイタリアンレストランがあります」という返答をしたケースを考えてみる。このやり取りでは、発言を聴き取り、「お腹が空く」という慣用表現を理解し、空腹状態であることを認識し、空腹時に食事をとることを知り、レストランで食事できることを知っていることが必要となる。さらに店舗を提案するために、現在の位置情報を把握し、インターネットの情報を活用し、口コミで良い評価の店を選択するといった判断も求められる。すなわち、人工知能が反応を返すまでに、文の解析、意味解析、世界知識、現状認識、推論、データベース参照、価値評価、重要性判定、文の生成といったプロセスを経ているのである。何気ない日常的な対話のように見えても、「言語を理解する」および「言語で伝える」ために、実に数多くの検討と処理が重ねられていることがわかる。ここに、人間の言語をコンピュータで扱うことの難しさの一端が見いだせる。
 データをもとにコンピュータに学習させることを「機械学習」といい、人工知能の基幹的な研究課題の一つである。機械学習はデータから処理方法などを導く枠組みであり、これを言語処理に用いる場合は、言語を数学的に表現することになる。機械学習の方法として、分類、クラスタリング、回帰、構造予測などが紹介された。ここでは、最も基礎的な分類器であるナイーブベイズ分類器を用い、前出の対話事例における「口コミが好意的か批判的かを自動分類する」という課題を通して、確率分布モデルによる学習プロセスが説明された。次に話題となった「ニューラルネットワーク」は、人間の脳神経系を模した機械学習のモデルで、対象のデータを入力し、データを受け渡して、人間が欲しい出力を得る仕組みである。画像や音声や自然言語に対して高い学習性能を発揮しており、自然言語の分野ではニューラルネットワークによる「文の生成」も行われるようになっている。他言語への翻訳をはじめとして、学習結果に基づく文の生成、たとえば天気予報データからのコメントの生成、スポーツ実況データからの速報テキストの生成といったことも試行されている。
 引き続き、人工知能の現在とこれからについて話しがあった。人工知能は昔から研究されてきたが、今のAIブームのきっかけは2005〜2006年頃にあるという。ニューラルネットワークを多層化した「ディープラーニング(深層学習)」が注目され、人工知能の成果が社会に広く普及する契機となった。人工知能にできることが急激に増え、画像認識、音声認識、翻訳や会話ボットの質が向上した。技術の応用範囲も拡大し、車の自動運転、医学・薬学、防犯技術、農業などへの応用が期待されている。一方で、技術の普及に伴って人工知能と人間社会の関係のあり方についての議論も活発化し、人工知能脅威論も語られるようになる。(ちなみに、高村先生はシンギュラリティ(技術的特異点)については、多くの研究者と同様に切迫的な危機段階ではないと判断されている) 人工知能の研究は、機械学習→ニューラルネットワーク→ディープラーニングと先鋭化している。しかし、現在のAIブームの活用実態では、企業や組織でディープラーニングが使われているケースは稀で、機械学習も十分に生かされていないことが多いという。研究者らが切り開く分野はまだまだ無数にあるように思われる。その研究の根幹にある問題意識は、冒頭にあげた「理解する」あるいは「伝える」とは何か、ということであろう。その困難な問いに向き合う研究の一端を知ることができた。
 本講演に合わせてアーキテクトニカ・コレクションとして展示されたのは、「語彙ネットワーク模型」である(図1)。ノード(球)は単語に相当し、関連する単語同士がエッジ(枝)によって連結されている。ノードの色は単語の感情極性に対応し、好ましい極性の単語は明るい色で、好ましくない極性の単語は暗い色で、全体として白から黒のあいだのグラデーションで表現されている。いわば、単語同士の相関関係と意味のポジティブ度の分布を示す立体模型といってよい。この模型のノード数は82であるが、実際には例えば数万にもなる。人間はこの膨大なグラデーションのネットワークを日常的に使いこなしており、人工知能においては感情極性の伝播と推定に役立てることができる。今回の講演の聴講者は75名であり、この分野への関心の高さがうかがえた。質疑応答も活発に行われ、講演中はもちろんのこと、講演終了後も質問者が列をなす状態であった。

 高村先生の講演を通して人工知能について多くを学び、また筆者なりに考えるきっかけを得た。そのポイントは三つある。第一に、人工知能の目的である。人工知能が人間の知性を置き換えるものか、あるいは人間の知性を支援・強化するものか。人知の置換と考えれば、人工知能は未知なる脅威となりうる。しかし、実際の人工知能の研究を知れば、着実な足取りで問題解決を試行していることがわかる。社会全体への憂慮は消し去れないが、人工知能によって個々の生き方が開かれる可能性があるのではないか。第二に、創造への関与である。対話事例のプロセスでは、解析・認識などの「受容」から、推論・生成などの「創出」への展開があった。この「創出」の可能性に大いに興味がある。デザインや創作ができ、仮説形成や価値創造に結びつく人工知能に期待したい。すなわち、可能性を限定するのではなく拡張するような使い方である。第三に、方法論の活用である。たとえばディープラーニングで行われているような繰り返しによる精緻化は、デザインや制作現場のプロセスに直感的に重なるものがある。機械学習で使われている数学的な方法論が、逆に人間の日常的な行為にリモデル化して導入できるのではないか。いわば、人工知能による知の外部化に逆行する「知の再内部化」ともいえる。時間とともにAIのAが徐々に消えて、新たなIが立ち上がるかもしれない。
 建築博物教室では幅広い分野のアーキテクチャを学んできた。今回の「ことばのアーキテクチャ」は、私たちがそれらの構成原理をとらえる思考の原点に関わるテーマであった。アーキテクチャの多様性を問うなかば抽象的な試みの蓄積が、学習の深みとなって新たな理念の創出に結びつくことを期待したい。

開催概要
東京大学総合研究博物館小石川分館
建築博物教室 第16回
「ことばのアーキテクチャ――人工知能による言語の理解」
日時:2018年6月2日(土) 13:30-15:00
講師:高村大也(東京工業大学教授、産業技術総合研究所人工知能研究センター知識情報研究チーム長/自然言語処理・人工知能)


ウロボロスVolume23 Number2のトップページへ


図1 語彙ネットワーク模型:ノードは単語に相当し、関連する単語同士が連結される.ノードの色は単語の感情極性に対応する(高村大也+東京大学総合研究博物館).