汎用人工知能と、特化型天然知能。 - 小学校笑いぐさ日記

汎用人工知能と、特化型天然知能。

 最近読んだ本から、人工知能について知ったり考えたりした話。
 
働きたくないイタチと言葉がわかるロボット  人工知能から考える「人と言葉」
働きたくないイタチと言葉がわかるロボット 人工知能から考える「人と言葉」
 
 人工知能に言語を学ばせるとはどういうことかについて、音声認識の技術から、言葉の「意味」の理解に関する技術までを概観した本。
 
「自分たちの代わりに働いてくれるロボットが欲しい」
 と考えたイタチ村のイタチたちが、開発の過程で様々な困難に直面し、トラブルを引き起こしていく……というストーリーと、ちょっと詳しいコラムが交互に出てくる、一般向けのやさしい本です。
 
 筆者も断っていますが、筆者の専門である言語理解の話が中心なので、それ以外の部分(ロボット工学的な問題とか)はざっくりしています。
 
 単語の意味をベクトルで表現する手法、なんて話はこの本で初めて知りました。
 
 この本を読んで「そうか、なるほど……」と思ったのは、
「複数の言語を教えると誤認識が増える」
 という話。
 
 古い笑い話があります。
 
 外国人観光客が、日本の農村を訪れて、畑の脇に積んである、収穫したばかりの里芋を検分していると、離れたところで作業していた農家の人が大声でこう言います。
「What time is it now !?」
 それで観光客は今何時か教えるのですが、どうも話がかみ合わない。
 
 というのも、本当は農家の人は「掘った芋いじったな!?」と言っていた……という。
 
 こういう誤認識は、もちろん音声言語だけの話ではありません。
 
 例えば、郵便番号を認識する機械なら、0〜9までの数字だけ知ってれば事足ります。
 汚い字で書かれた番号に、「これは2だろうか3だろうか?」と判断に悩むことはあるでしょうが、まあそれくらいのものでしょう。
 
 しかし、もし、この機械に、平仮名やアルファベットを教えてしまうと、
「これは0なのか? oなのか?」
「3なのか? ろなのか?」
 とか、無意味に迷うことが増えてしまいます。
 
 つまり、機械に教える言語を増やせば増やすほど、認識精度は下がっていく。
 そうしないためには、最初から「日本語しか知らない機械」「英語しか知らない機械」というように、特化させる必要がある……というのです。
 
 だから現状では、例えば
「英語でも中国語でもスワヒリ語でも聞き取って、日本語に翻訳してくれる機械」
 というのは現実的でない、と。
 
 ……で、ここからは完全に本の内容とは離れた想像になってしまうのですが、こういう問題は言語に限らないのであろうなあ、と。
 
 IBMのワトソンを各社の業務に利用するにあたっては、それぞれの業務に適合するよう特化させる必要があるのだそうです。
 医療関係なら医療だけ、金融関係なら金融だけ、というように。
 
 以前は、
「なんでそんな面倒なことをするんだろう? 色々な分野を一つの『ワトソン』に覚えさせて、医療にも金融にも法律にも天文学にも、あらゆる分野に詳しいAIを作ったらいいのに……」
 と思っていたのです。
 
 しかし、なるほど、複数分野を一つのワトソンに学習させると、精度が落ちてしまうのだろうな、と理解しました。
(まあ、学習に使った顧客の情報を外部に漏らさないため、ということもあるのかも知れませんが)
 
 自分としては、様々な学術分野に精通し、それらを組み合わせて新しい知見を生み出すことのできる超AI……というようなものに憧れるのですが、それはまだ先の話なのかも知れません。
 おそらく、いずれ人工知能が政策立案とかに携わるようになっても、
 
建設監督AI「産業政策AIからの通達で、今期のCNT割り当ては削減するって」
宇宙開発AI「はあ!? ただでさえ工期遅れてるのに!?」
建設「その代わり来期は割り当て増やすし、今期もSSTOは優先使用していいそうだ」
宇宙「あンの政治BOTども……! 宇宙開発ってのはタイミングが重要なんですよ! 適切な時期を逃したら、後からどんなに資材増やしても巻き返しがきかないんです! 医療用こそ後回しにしたらいいのに……!」
(この間0.02秒)
 
 とかなんとか、専門分野が違う「特化AI」同士が互いに相手の無理解を嘆くような状況が続くのかも知れない、などと妄想しました。
 
 ……それにしても。
「AIがブームだけれど、それは特化型の人工知能に過ぎず、真のAI……汎用人工知能にはほど遠い」
 なんてよく言われますが、ではそもそも人工「でない」知能、我々自身の知能はどの程度「汎用」なんでしょう。
 
 私たちの中には、日本語を解する人も、英語や中国語、スワヒリ語、フランス語、ブルンゲ語、タイ語、その他もろもろの言語を話す人がおり、中には2つ、3つ、あるいはもっと多くの言語を解する人もいます。
 しかし、それら「全て」を理解している人はおそらくいません。
 
 私たちが日常生活で安定して会話できるのは、要するに、私たちが乏しい数の言語しか知らないからです。
 2つの言語が混在する状況では
「掘った芋いじったな!?」
 が誤って認識されかねないように、もし人々が全ての言語を理解してしまったら、おそらく人類はバベルの塔以来の大変な混乱に陥るのではないでしょうか。
 幸か不幸か、それを実験することは不可能ですが。
 
 同様に、私たち個々人は、それぞれ乏しい分野の知識しか持っていません。
 群盲象を評すの喩えがあるように、人類の知識全体という「象」に対して、私たち一人一人は汎用でもなんでもない、全くの「特化型知能」のように思えます。
 
 まあ、だからと言って、ワトソンが人間と同等の汎用性を持っているか、と言えば全然そうじゃないわけですけれども。
 とはいえ、
「今のAIは汎用知能じゃないから人類は安泰!」
 などと威張っていていいのかな、と思います。
 
 ただ単に人類に優越するだけなら、AIにとって汎用性なんてそれほど必要ないのかも知れません。