orangeitems AI News

orangeitems AI News

気になるAI Newsと考察を書いておきます。

巨大企業すらすり抜けるAIの回答は、社会を混乱に導くか

www.cnn.co.jp

ニューヨーク(CNN) 米アップルが導入したばかりの人工知能(AI)機能で英BBC記事を誤って要約した速報ニュースが通知されるトラブルがあり、国際NGO「国境なき記者団」がアップルに対してこの機能の削除を求めている。

問題のニュース速報は先週、「Apple Intelligence」で生成されてユーザーにプッシュ通知された。BBCの記事が誤って要約され、米医療保険大手ユナイテッドヘルスケアの最高経営責任者(CEO)射殺事件のルイージ・マンジオーニ容疑者が、自分を銃で撃ったという内容になっていた。

BBCはアップルに連絡を取ってこの機能に関する懸念を伝え、問題の修正を求めたと報じた。アップルが苦情に対応したかどうかは確認できなかったとしている。

AIをビジネスに結びつけることが、日々どんどん簡単になってきている。最終的には人間が制御できなくなり社会は混とんとした状態に陥る。これはSFではよくあるストーリーだが、その直前まで来ていることがわかる象徴的なニュース。

最後は、人間が決断しなければいけない。これは核ミサイルでも同じ話で、核ミサイル自身が発射を決めるわけじゃない。人間に決断は委ねられているが、AIも同様。決断までAIに委ねるようになると、責任が負えない決断が各所で行われ、人間の意思に反して社会が動き出すようになる。

このAIのフェイクニュースを信じて民衆が誤った認識をするようになったとき、現実に起こる結果は「人間ではない存在」によってもたらされることになる。自由意思がある、と言っても、それが誤った情報によるものだとしたら、人間の持っている意思などなんてか弱いものだろうと思うわけである。

誰が承認してこのフェイクニュースを流した?、というのがアップルという巨大な企業をすり抜けるとすれば、かなり危機的な状況の一歩手前なのかもしれない。

ImageFXの評価

ImageFXはGoogle謹製の画像生成SaaSで、今、無料で使える。そのエンジンが先日紹介したImagen 3になっていて、すんごい画像が作れるぞってXで話題だったので使ってみた。

結論として、

・品質はすごくいい。

・出るのが遅い。

・ものすごく倫理を気にしている。

という状態。

世の中の芸術作品、実際なところ、際どい表現のものも多くて、フィクションだからこそ自由な想像で面白いものができる。

画像生成も、フィクションだからこそ色々な表現をしたいにもかかわらず、結果として平凡な表現しかできない。

現実ではNGなこと、画像生成でもNGだとしたら、それは単に画像生成などせず、現実にあふれるたくさんの絵や写真、具体的にはインスタやTikTokでもぼんやり眺めていればいい。

リアルだリアルだ言ってるけど、そんなにリアルが好きならリアルを見ていれば?。

これならStable Diffusionで遊んでた方がましだな、と思ってこのImageFX、何回かやってそっ閉じしている。

ChatGPTやGeminiでもそうだけど、ぶっ飛んだ想像を嫌うんだよね。だから、芸術方面には全く向いていないと思う。芸術的でないおかげで、面白みみたいなものが失われているのが、人間の道具としては大いに足りないものになっていると、思う。

あと、遅いってのも、人の思考を阻害するポイントであり、これもなんとかしてほしいものだ。品質を落としてでもスピードが欲しい。

そういった話はまだStable Diffusionが上なので、どうにもこうにも利用に足りない印象だ。このまま倫理に強く縛られて、画像生成は成長するのだろうか。

社内ファイルサーバーをAIエージェントにつなぎこめたら世界は変わる

japan.zdnet.com

 グーグル・クラウド・ジャパンは12月17日に説明会を開催し、米Google Cloudが提供を発表した法人向けAIエージェント「Google Agentspace」や、情報整理ツール「NotebookLM」の企業向け強化版「NotebookLM Enterprise」について解説した。

 執行役員 テクノロジー部門 兼 事業開発本部の寳野雄太氏は「89%の従業員が6種類以上のデータソースから情報を探索している」という調査結果を引用し、従業員はさまざまなSaaSから情報を収集し、生成AIサービスに読み込ませなければいけないというニーズがあると説明した。

いや、SaaSから情報を読み込むんじゃなくて、社内のオンプレミス、特にファイルサーバーからデータを読み込んで学習するだけで、世界は変わりそうなのに。

おそらくコネクターを会社のモデルに用意し、様々なデータソースにつなげることで、ローカルな情報を理解、生成できる有用なエージェントになるというのは、2025年のトレンドになることは間違いない。コネクターのつなぎ先の中でも、ファイルサーバー、はきっと日本の会社における最大のデータソースだと思う。

あとは、ファイルサーバーに無制限にアクセスできたら、末端の社員が秘密の情報をAIエージェント経由でアクセスできてしまう。ということは、AIエージェントもアクセス権ごとにわけなければいけない。機密情報にアクセスできるAIエージェントは、機密情報にアクセスできる人間としかアクセスしてはいけない、という制御をしなければいけない。

ただ、人間でもそういうことはできているので、単に時間の問題だと思われる。

Google「Veo」と「Imagen 3」、土俵には乗ったが

www.watch.impress.co.jp

Google Cloudは4日、最新の動画生成モデル「Google Veo」と、高品質な画像生成モデル 「Imagen 3」をGoogle CloudのVertex AI上で提供開始したと発表した。

Veoは、企業がテキストや画像のプロンプトから高品質な動画を生成できるAIモデル。企業のクリエイティブ アセットを簡単に映像へ変換できるようにする。

リンクは下記の通り。

Veo 2 - Google DeepMind

Imagen 3 - Google DeepMind

Veo 2は使えるのは来年とか。制限はあるんだろうけど無料とか言うし出てみたら使ってみたい。Imagen 3はGemini上で使えるんだけど、まあ規制がものすごくて、人間の写真出すの大変。実は、あまりこの分野、発展していないのかも、って思うことも。

私がよくわからないのは、何をするためなんだろうね、ってこと。AIで動画や写真を作ったとて、何かいいことある?。

テキストの生成はとても社会に影響を与える形で進んでいるけど、この画像やら映像やらってのは、明日の私たちに何か恵みを与えてくれるのかしら。

ChatGPT検索は、Google検索を置き換える品質に感じる

ascii.jp

 OpenAIは現地時間12月17日、有料ユーザーのみが利用できたChatGPT検索機能(ChatGPT Search)を無料ユーザーにも開放すると発表した。あわせて、AIと自然な音声で会話ができる「高度な音声」を使った検索機能も来週中に展開する予定だ。

音声については私の中でニーズがないのでどうでもいいけど、この検索機能はかなり使える。

下に「検索する」というボタンが付いたが、これを押すといい感じのWebサイトから情報を引き出してくれる。

ChatGPTと言うと、学習済みの情報からしか答えを出せないので、少々古いってのがデメリットだったが、これで、最新の情報が得られるというわけ。

しかもGoogle検索みたいに、ページに入って調べないといけないのと比べると、こちらは結果を調べてまとめてくれる。かなりインテリジェンスに。

Bingでは先行して似たようなことをやっていたが、モデルが新しいのもあって、検索結果、そしてまとめ方が非常に秀逸。この辺はGemini2.0にはできない。

中々ChatGPTの、こなれた日本語の感じを他の陣営は出せていないので、どうにも日本ではiPhoneのようにChatGPT一強の雰囲気が出てきたように思う。Googleもがんばっているけど・・。Google検索を持っているからこそがんばってほしいね。

今AIができていることをよく考えよ

www.watch.impress.co.jp

Googleは13日(現地時間)、自分専用のAIデータベースを作れる「NotebookLM」を強化した。UIを刷新し、最新のGemini 2.0 Flashに対応。また有料版の「NotebookLM Plus」も新機能を追加し、スタートした。

NotebookLMは、Geminiで構築されたデータベースツール。ローカルで用意したデータをもとに、大規模言語モデル(LLM)が回答や要約などを行なう「AIリサーチアシスタント」となる。新たにユーザーインターフェースにおいては、ソースごとのコンテンツ管理に対応。「ソース」「チャット」「Studio」の3つのパネルが用意される。

AI関連における今のGUIなんてどんどん変わるし、上記のサービスだって中身はすぐに変わる。これらの機能を使いこなすうんぬんが問題じゃなく、何を今、Googleが目指しているかについて、思い知るべきことがある。

人間がどれだけ「要約」に費やしているか、だ。文をまとめるだけじゃなく、グラフにするにしろ、音声で報告するにしろ、誰かにソース情報を伝えるために、要約している。

大事なのは、「判断」はAIは決してしていないこと。

それなのにAIのこのようなサービスが表にどんどん出ているのは、判断はしない/要約はする、つまり「まとめる」という仕事が世の中にはびこっているからだ。

今、判断をせず、まとめることを仕事に持っている人は、とても真剣に将来を考えた方がいい。その仕事はAIがやるようになる。しがみついていても引きはがされる。

「こんなローカルな、誰も知らないようなウチだけの情報で、AIが働けるわけない」みたいな、新参者を追い出す古参みたいなことを言ったって、AIは優秀なのである。バックボーンを知らなくても、かなり優秀な答えを一瞬で出せるようになってきた。

人間は「まとめる」の先に行かなければならない。AIが瞬時に要約した内容を理解し、「判断」する、というのがポストAI時代、人間の仕事になるはずである。

AIへの古い価値観「推論コストが高い」

wired.jp

テック界の超リッチな大物同士が競い合うこの不均衡なエコシステムはNVIDIA(エヌビディア)を潤わせる一方で、アプリ開発者を身動きがとれない状況に追い込んでいる。低コストかつ低性能のモデルを使用してユーザーを失望させるか、高額な推論コストを支払って破産のリスクを負うかの二択しか残されていないからだ。

このニュースが言っていることが典型的だと思ったので取り上げる。AIの価値は推論コストで決まるもんじゃない。

それは、「ITサービスはITエンジニアの労働時間の和で決まる」と言っているのと同じだ。ITエンジニアを多く雇うIT会社だけが富み雇えない会社はチャンスがない、という意見と同等である。

そうじゃない、「AIが推論してくれる結果」が価値なのだ。その価値を安定的に出すために、各社が資本を投入している。

最終的にはものすごいモデルができるが、これはやはり大資本の投資結果によるものであり、それらを多くの人が使うから結果安くなっていくという類のものだ。

自分の家の真下から石油が噴き出すような話じゃない。

今パソコンが欲しいからって、ラズベリーパイを買ってきて本格的なエンタープライズサービスができるとは思わないだろう。

AIは推論コストが高いから民主的ではない、と考えるのは違う。すぐにチャットインターフェースではない、AIエージェントなAIが現れ、もっとたくさんの人が利用するケースが増える。そうしたときに皆が小銭を支払えば、安価に利用できることが可能になる。

ローカルでAIを動かしたい派にはたまらなく退屈な時代だろうが、ここはもう、大資本が磨くAIを享受し利用する方にまわることを考えるべきだ。今のコストなんて将来は微々たるものになる。昔、遠距離電話が1分100円していたのと同じ理屈である。

Gemini 2.0に透ける「AIエージェント」の野望

良い記事を見つけたので引用。

japan.zdnet.com

AIエージェントの野望

それでは、エージェントに話を戻そう。Googleはエージェントについて、「アクション実行機能」を備えたユーザーインターフェースを提供すると説明している。Pichai氏はブログ投稿で、AIエージェントについて、「ユーザーの周囲の世界について、より多くのことを理解し、数歩先まで考えることができる。そして、ユーザーの監督の下、ユーザーに代わってアクションを実行することが可能だ」と述べた。

記事中に「AIエージェントの野望」と書いてあるので、間違いない。先日紹介したAIエージェントと、これまでの生成AI、違いはわかる?と言う記事で初めてAIエージェントという概念をご紹介したが、もうこの概念は、現在のAIが目指すマイルストーンになっている。

繰り返し言えば、AIに質問し回答してくれる、ではない。

AIにお願いすればやってくれる、なのである。

要件をお願いしたらコーディングしてくれるのはAIエージェントに近いのだが、一般の人はコーディングをして欲しいのではない。色んなめんどくさい手続きをしてほしいのだ。やり方は、AI、あなたが考えてよ、まで人々は願っている、はずだ。

AlexaやSiri、Google homeなど、音声エージェントに実装しようとして、どこもかしこも頓挫しているアレである。

さて、Gemini2.0が明確に打ち出したAIエージェント。Googleだけじゃない、その他のAIベンダーやその周辺も騒ぎだしている。

今の各社の解が最終回答なわけでもなく、ものすごくたくさんの発明的なものが目の前に現れることになる。きっと、そこで残ったものが、SQLやTCP/IPのような存在になって行くと思われる。だから、今、大資本が熱狂して投資し、次々と発表が行われている、という次第である。

AIは、石油のようになる

jp.reuters.com

[ワシントン 13日 ロイター] - 米政府は中国に対する新たな半導体規制として、人工知能(AI)半導体へのアクセスを世界的に管理するゲートキーパーの役割を、グーグル(GOOGL.O)やマイクロソフト(MS)(MSFT.O)などに与える方針だ。規制案の内容を知る関係者2人がロイターに語った。

結局このニュースが何を言うかというと、今後AIを持てる国と、持てない国で格差が広がると言うことである。それは軍事的にも経済的にも文化的にも。

世界は資源の奪い合いが本質だ。兵器を使った戦争は目に見える形だが、経済でも文化でも平和的に戦いは日々行われている。二回の対戦を経て、化石資源を多く保有する国家がどうやっても優位であることがわかった。だから、石油資源を多く持つアラブではいつでも戦いが絶えない。アラブでアラブの人々が戦っているのではなく、裏で支援しているのは世界の国々である。

しかし、石油以上に、影響を与える物質が登場したらどうなるか。これをAIに定めたのがアメリカである。このニュースはあたかも、AI資源はアメリカが所有し、同盟国だけに配ると言わんばかりである。

AIを持っている国が、持っていない国に比べてどう秀でていくかは、まだ一般の国民は核心に触れていない。触れていないが、国家中枢ではすでに情報を持ち、それに従って着々と資源の囲い込みを始めているというわけである。

きっとアメリカの非同盟国はまだ、「AIごとき我が国でも模倣できる」と思っているに違いないが、もう今現在においてかなりの差がついており、かつその差を埋められない何らかの規制を決めているのは間違いない。

AIエージェントと、これまでの生成AI、違いはわかる?

news.yahoo.co.jp

生成AIの進化が目覚ましく、人間が命令したことは何でもやってくれる「AIエージェント」が2025年には登場してきそうだ。これまでの生成AIは「何かについて教えてください」と検索や質問をすると、即座に返事が返ってきていたものの、答えの実行まではしてくれなかった。一方AIエージェントは検索、質問の返事をするだけでなく、手続きの申請や問題の解決までやってくれる。

検索や質問の結果、優れた返事は返ってくるが、何かをやってくれるわけじゃない。

この限界を超えようとしているのがこのAIエージェントの凄いところ。何かをやってくれないからこそ、生成AIと人間は仲良くやってこれそうだったけど、何かをやってくれるようになるとどうなるか。

何かをやる、という仕事の人は不要になる、ということだね。

特に、不人気職種ほど、AIエージェントに任せようということになる。文句も言わず、しかも24時間、機嫌よく働いてくれるわけだから、人間より全然いい。病まないし、疲れない。

この話を聴いた人が憂鬱になる必要はない。今度は、AIエージェントを育てる役割の仕事が生まれる。一度育てたら半永久的に使えるけど、今度は定期的にアップデートをしなければいけない。新しい仕組みなどには対応して行かなければいけないから。

おっと、これは人間と同じ発想だよね。人間だって学ばなければ、「使えない人」になってしまう。

AIエージェント、ぜひ実用化できてほしいし、どう成立させるかが2025年のカギとなるのは間違いない。私も今すぐ欲しいくらいだ。