OpenAI o1はすでに理解を超えている。が、別に全ての問題を解決してくれるわけではない。そしていまさらロボットを作る理由 – WirelessWire News

WirelessWire News Technology to implement the future

by Category

OpenAI o1はすでに理解を超えている。が、別に全ての問題を解決してくれるわけではない。そしていまさらロボットを作る理由

2024.10.04

Updated by Ryo Shimizu on October 4, 2024, 01:16 am JST

OpenAIが発表したo1-previewは、とても高度な数学的推論を行う大規模言語モデルだ。

最初は「数学オリンピックの問題が解ける」ことが売りだったので、数学的な問題ばかりを聞いていたが、普通に生きていて数学的問題に直面することは普通の人には少ないので、僕は「クォータニオン量子力学」とか「乱数テンソルをベースとした確率論」とか、小学生の妄想するような「A+B」みたいな二つの数学的概念を与えて、それをo1-previewがどう調理するのかを観察した。

その結果、分かったことは、「僕はo1より数学的素養がない」という当たり前のことだった。
そもそも僕は数学オリンピックの問題を一問だって解ける気がしない。解いてみようとも思わない。

昔、数学オリンピックのプログラミング版である国際情報オリンピックの予選に出場したことはある。
でもそれはプログラミングだったからであって、数学オリンピックとは別種のものだ。

人類のほとんどは数学オリンピックの問題を解こうとは思わないだろうし、解けることもないだろう。
情報オリンピックにしろ数学オリンピックにしろ、本選の問題は四時間半で3問。二日連続で6問というかなりの難問だ。

o1に数学ではなく人間関係や社会性を数理モデル化してくれと頼んでみるとなかなかそれっぽいものが出てくる。
恋愛模様や社会の問題から、社会シミュレータを作らせるとちゃんと動いた。ここから物語のようなものの骨格を生成させて、それをClaude-3に入れると脚本めいたものがて簡単に手に入る。これはこれで面白いんじゃないの。

ただ、だからと言ってo1がシンギュラリティに到達しているとかしてないとか、この延長上にAGI(一般人工知能)があるんだとかないんだとかという議論は全くナンセンスという気がする。

未だにo1は僕の重要な問題を何一つ解決してはくれないし、何か聞いても一般論を返してくるだけだ。

誤解を恐れずに言えば、生成AIをビジネスに繋げることは今のところとても難しい。
生成AIで付加価値を生み出すのはかなりの難問なのだ。それこそ数学オリンピックの問題よりも遥かに難しい。数学オリンピックの問題には必ず答えが用意されているが、現実の問題には答えなどないものがほとんどだからだ。

例えばo1に答えのない問題について聞いてみる。「素数の出現パターンを予測するプログラムを書け」とか。
o1はAIなので逆らわずに素数の出現パターンを予想しようとするが、そもそもそんなものは未だ誰も見つけたことがない。これが簡単に解けてしまったら数学者はみんな失職するだろうが、もちろんそんなことは起こらない。

先日、オフィスでロボットを組み立てていて、話し相手がいないのでChatGPTのAdvanced Modeで雑談をしながら作業した。
これがなかなか、つまらないのである。

ChatGPTの方が知識は僕の何千倍もあるはずなのに、話がいちいちつまらないのだ。
こんなことならゴールデン街の酔っ払いの話を聞いてる方が遥かに面白い。

この退屈さというのは、AIが絶対に埋められないものである。
少なくとも、"ガードレール"と呼ばれているような、人畜無害なことしか言わないように教育されている巨大AIは永遠に退屈なままだろう。

なぜならば、面白さとは、詰まるところ毒だからだ。

取り扱いを間違えば大変なことになるが、みんなが心のどこかで共感してしまうようなこと、それが「面白さ」というものの根底にある。
Netflixの「極悪女王」や「地面師」といった作品が話題だが、ああいう話はChatGPTからは絶対に出てこない。

もちろん無害でも面白いものはあるのかもしれないが、そのレベルの面白さを引き出すのは、人間の方に余程の才能が必要になる。ことはそう簡単ではないのだ。

ChatGPTで時間を潰せる人はそれだけ才能がある。そういう人はWikipediaでも時間を潰せるし、ブログを書いたりしても時間を潰せる。
「教養とは一人で暇を潰すスキルである」と言ったのは中島らもだったか。

ChatGPTもo1もそれだけで時間を潰すには人間の方に工夫が必要とされる。
もしかするとそれは人間の方が進歩する一つのきっかけにはなるかもしれない。実際、AIの言ってることを理解するために僕は量子力学の計算について学び始めた。それを知ってるからといってどうということはないと思うし、必要に迫られたわけでもないのだが、できれば知りたいと思うようになったからだ。

最近ロボットを作り始めていて、それまで全くやったことのないことに挑戦し始めた。
アルミフレームをグラインダーで切り出したり、大電力のバッテリーでモータードライバーを爆発させて火事になりかけたりと前途多難だ。

https://youtube.com/shorts/JXnAJHe_RKM?si=6XX9m3TV72DszdJN

実際に作っているのは、ロボットといっても子供の頃にタミヤのキットで作ったブルドーザーの巨大版でしかない。
ただバッテリーがデカくて筐体がデカくなっただけなので昔は道具はあっても作ること自体が馬鹿馬鹿しくて作ろうとも思わなかったのだが、最近になって作ることに決めたのはいくつかの理由がある。

まず、そもそもAIが進歩した結果、身体性かそれに近いものを獲得させないとこれ以上は進歩しないと思ったということ。
画面の中にあるだけではAIはもう限界だ。まあ何を持って「限界」と呼ぶかは置いておくとして、こちらの発想が限界なのである。画面の中で起きていることだけを捉えたら、想像力が画面の中で閉じてしまう。

最近はローカル推論だけでも相当なことができるようになってきていて、これを活用しない手はない。
しかし「活用」といっても具体的に何をどうするというのが決まらないと何もできないので、まずは手をつけられるところから始めた、というのが感覚として近い。

デバイスが変わるというのは普通の人が想像している以上に重大な変化だ。
例えばインターネットが携帯電話に入った時、誰もが「そんなもの何に使うんだ」と思った。しかし携帯電話はパソコンとは使われる場面が全然違う。使う場面も全然違う。結果として、携帯電話とインターネットは不可分なものになった。

ノートパソコンが登場した時もそうだった。
持ち歩けるというのはそれくらいのインパクトがあるのである。

ではロボットはどうか?

ロボットは「動ける」というところが最大の違いだ。
これまでもロボットはたくさんあった。

買えるものもあったし、僕はロボットを売っていたこともあった。

ただ、その頃のロボットは、人型や犬型をしていても、高度なプログラムが動くわけでもなかった。
せいぜい、犬のふりをしたり、歩いてみせたり、とにかく人に癒しを与えることはできるかもしれないが、僕はロボットに癒しを求めていなかった。

だからこそ、「今」ロボットが必要だと思ったのである。それも等身大の、つまり人間と同じような大きさで、人間の生活空間に入り込めるロボットだ。
犬型でも小さな人型でもなく、等身大のロボット。ペッパーよりも少し大きいくらいのもので、顔とカメラとLiDARがついていて、障害物を避けたり、画像認識したりできる。

特にビジョンランゲージモデル(VLM)の著しい進歩はロボットを作るのに十分な動機を与えてくれる。
o1は凄いが、所詮は画面の中の話である。ロボットは現実の世界を実際に変容させることができる。

例えば僕が日々配信している動画を撮影している様子をロボットは見守ることができる。配信を手伝うこともできるかもしれない。
お茶が欲しいと言えば、持ってきてくれるかもしれない。どうやって持ってくるか。ロボットに冷蔵庫を乗せればいい。そのために大電力のモーターが必要なのだ。

ロボットによって現実の世界を変容させることが何よりも重要だ。そのためにはただ動くだけではダメだ。動きに意思が宿らないと。昔の技術ではそれは夢のまた夢だったが、今は全く既存の技術、しかも多くはオープンソースの技術の延長上でできる。できるならやらなくては損じゃないか。

そういうわけで最近はロボット作りに日々の時間を割いているのである。
ロボット作りはソフトウェアと違い、自動化もできなければ面倒なところをやってくれるわけでもない。
怪我するかもしれないという恐怖と闘いながらやらなくてはならない。フィジカルなのである。

でもいざやってみると、なかなか楽しい。ソフトウェア開発と違って、材料を注文したら届くまで持たなければならない。
オフィスが秋葉原の近くにあるので、多少の材料なら自転車でひとっ走り行ってくればいい。こんなところも気軽である。

そんなロボット作りももう佳境に入っていて、先日は一度完成した。が、すぐに改良すべき点が山ほど出てきてどうするか考えているところである。
これはなかなか楽しい悩みだ。

o1を使うのに比べると、ずっと気楽で、ずっと楽しい。ロボットの制御用プログラムはo1に書いてもらった。その方が僕がゼロから作るよりも早くて正確だからだ。バグっていたりへぼかったりすると、「こうしろ」と言えば答えてくれるしこちらの要望通りにコードを修正してくれる。素晴らしい。

さて、これが完成したらどんなことをやらせるかな。

WirelessWire Weekly

おすすめ記事と編集部のお知らせをお送りします。(毎週月曜日配信)

登録はこちら

清水 亮(しみず・りょう)

新潟県長岡市生まれ。1990年代よりプログラマーとしてゲーム業界、モバイル業界などで数社の立ち上げに関わる。現在も現役のプログラマーとして日夜AI開発に情熱を捧げている。

RELATED TAG