サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
やろう!確定申告
www.techno-edge.net
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。 先週の生成AIクローズアップでは、Google DeepMindが開発したAIシステム「AlphaGeometry2」が国際数学オリンピック(IMO)の幾何学問題において金メダル相当を達成した研究報告を取り上げましたが、今回はコーディングで良好な成果を示しているOpenAIの「o3」が国際情報オリンピック(IOI)で金メダルを達成した研究報告「Competitive Programming with Large Reasoning Models」に注目します。
統合型チャットAIサービスであるPerplexityが新サービスをリリースしました。「Deep Research」オプションの追加です。 ネット上にあるさまざまな文献を調査し、深堀したレポート記事を提出する機能は、Gemini AdvancedのDeep Research、OpenAIのdeep researchが公開されており、特にdeep researchの性能が注目を浴びていますが、そこにPerplexityが切り込んできた形となります。 PerplexityはLLMが弱かったネット検索を補完するサービスとして注目を浴びてきましたが、ChatGPT、Geminiともに検索機能を強化しており、対抗を余儀なくされたという見方もできます。 現在のところ月額3万円(200ドル)のProユーザーのみが使えるOpenAI deep researchに対し、Perplexityは無料ユーザーでも1
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 ハリウッドスターのスカーレット・ヨハンソンが、自身の肖像を無断で使用し、カニエ・ウェストに反対するAI生成動画が拡散されていることに関し、AIの誤った使い方を制限するよう米国政府に要請しています。 SNSに拡散されている問題の動画では、AI生成で描かれたヨハンソンをはじめ、スティーブン・スピルバーグ、マーク・ザッカーバーグ、ジャック・ブラック、ドレイク、ジェイク・ギレンホール、アダム・サンドラー、レニー・クラヴィッツなどの、ユダヤ系のスターやアーティストが、中指を立てた手に六芒星(ダビデの星)、その下に「KANYE」と記したデザインのTシャツを来て登場し、「反ユダヤ主義との戦いに参加しよう」と呼びかけています
アドビが2月13日、AI動画生成サービス「Firefly Video Model」を一般公開しました。1920×1080の解像度で5秒間の生成が可能。テキストプロンプトだけでなく、Start FrameとEnd FrameをサポートしたImage to Videoも使えます。 このほか、アスペクト比(縦と横)、カメラコントロールのオプションもあり、最近の動画生成AIのトレンドは押さえているようです。 無料枠では2回分の生成が可能で、基本的に有料。月額1580円、4780円のコースがあり、それぞれ5秒×20回、5秒×70回の生成ができます。 なお、Adobe CC会員とは別に支払う必要があります。Firefly Discordの情報によれば、Adobe CC会員向けにはFireflyで使えるクレジットが与えられるそうですが、現状ではそうなっていません。 また、アップロードする画像についてはコ
ITジャーナリスト/Publickeyブロガー。IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。 オライリーメディアの創立者ティム・オライリー氏が、同社のブログに「The End of Programming as We Know It」(私たちが知っているプログラミングの終焉)という記事を公開しました。 その冒頭には次のように書いてあります。 There’s a lot of chatter in the media that software developers will soon lose their jobs to AI. I don’t buy it. メディアでは、ソフトウェア開発者は近いうちにAIのせいで職を失うだろうという話が盛んに流れている。しかし私はそうは思いません。 生成AIの進化は、人間がタスクを与えると自律的
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 世界で最も難しいAI試験という「人類最後の試験」(Humanity’s Last Exam)において、これまでの最高得点はDeepSeek R1の9.4%でしたが、o3-mini-highが13%を獲得し抜き去りました。 しかし、数日後にdeep researchが26.6%を獲得しトップに躍り出ました。deep researchは2月3日に発表された、ChatGPT Proユーザーに提供中のリサーチ機能です。調査/分析能力の高さがSNS等で話題になっています。 AIアプリストア「Spaces」がHugging Faceに登場しました。ユーザーはAIアプリを共有でき、検索して探すことができます。現在、50万個(執筆現在)のAIアプリが収容されていま
ながらくうわさが続いてきた iPhone SE 4(仮)の話題。
ChatGPTの応答が昨日あたりからちょっとおかしいことに気づきました。馴れ馴れしすぎるのです。
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。 今回は、国際数学オリンピックで金メダル相当のパフォーマンスを達成したモデルを提示する論文「Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2」に注目します。 Google DeepMindが開発したAIシステム「AlphaGeometry2」(AG2)は、国際数学オリンピック(IMO)の幾何学問題において画期的な成果を上げました。2000年から2024年までのIMO幾何学問題の
Tech Journalist. Editor at large @TechnoEdgeJP テクノエッジ主筆 / ファウンダー / 火元 任天堂がマウス兼用ゲームコントローラ発明を特許出願していたことが分かりました。 出願文書中の図では、Joy-Conの L / ZL (R / ZR) ボタンが左右のマウスボタンになるマウスとしての持ち方や、片方のJoy-Conは従来どおりに、もう片方はマウスとして使い、PCのようなマウスエイム+左手コントローラに近い操作ができることを示しています。 4月に詳細発表を控える次世代機 Nintendo Switch 2 は正式な公開以前から、マウスにもなる新型 Joy-Con 搭載説がありました。 1月の予告映像はSwitch 2本体と新型Joy-Conを初公開しつつ、具体的な情報は伏せたまま。しかし新型 Joy-Con が本体との接合面を下に滑るような演
テクノエッジ編集長。Wikiの「スマートフォン」ページに略称“スマホ”考案者として記述あり。週一以上ライブへ通う音楽好き。ヨボヨボのハタチ 昨年(2024年)末、表参道のポップアップでシークレット展示していたCOFO Chair Pro 2に座ってみたら居眠りしちゃうほど快適だったので(マッサージ師による肩揉みサービスがあったこともあるかもしれません)、クラファン開始後ちょっと気になってました。 しかし、私はコロナ禍にウン十万円もする某高級ワーキングチェアを奮発して買ってしまったので、こういうのは値段じゃないとわかりつつも特に不満もないのでまぁいーかと思っていたら、まぁどーぞと試用の機会をいただき数ヵ月ほど腰かけてみて改めて「フハッ」となっています。 COFO Chair Pro 2はMakuakeですでに6000万越えの支援を達成した注目のチェアで、姿勢の矯正と包み込むような快適性を重視
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 『Formula 1: 栄光のグランプリ』で米国にF1ブームを巻き起こしたNetflixが、2026年以降のF1テレビ放映権を獲得すべく、入札の準備をしている模様です。 現在、自動車レースの最高峰であるF1世界選手権レースのテレビ中継は、米国ではESPNが放映権を持っており、独占的に放送を行っています。しかし、その権利は2025年末までとなっており、2026年以降の放映権については今年のうちに入札が行われる予定です。 F1の放映権料は毎年値上げされる仕組みになっており、ESPNが最初に放映権を取得した2018年には年間500万ドルだったところが、現在では年間9000万ドルにまで膨張しています。とはいえ、これは
香港科技大学などが開発したオープンソースのAI作曲ソフト「YuE」が発表されて数日経ちました。筆者はWindowsでのインストールができずにWSL2のLinux環境で実行できるようになりましたが、いまだに一定のスキルは必要なようです。
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 OpenAIのo1推論モデルに匹敵するオープンウェイトモデルとして注目を集めている「DeepSeek-R1」について、Unslothチーム(エンジニアのDaniel Han氏とMichael Han氏の兄弟チーム)は671Bパラメータのモデルを効率的に量子化することに成功し、元の720GBから131GBまで80%のサイズ削減を実現したと発表しました。 単純にすべての層を量子化すると精度が低下する問題が発生してしまうため、同チームは選択的な量子化アプローチを採用しました。具体的には、モデルの重要な部分を4ビットや6ビットなどの高いビット数で量子化する一方、モデル全体の約88%を占めるMoE層を主に1.5ビット程度で量子化することで、モデル全体として平
需要のわからない記事を作る自由物書き。分解とかアホな工作とかもやるよー。USBを「ゆしば」と呼ぼう協会実質代表。 時計が好きというと、高確率で腕時計だと思われてしまいますが、自分の好きなのは懐中時計。しかも、100年くらい前の古い機械式です。中でも、ガラと呼ばれたりする壊れかけや、完全に壊れたやつが大好物でして、分解やニコイチで修理っぽいことをしたりと遊んでいました。 もう少し大きな置き時計まではいじったことがありますが、さらに大きな掛け時計は触ったことがありません。理由は簡単で「大きいから」。掛け時計くらいの大きさになると結構なスペースが必要となってしまうため、作業場所の確保が難しいのです。 とはいえ、これはあくまで機械式の場合。掛け時計といっても1970年代くらいからクォーツ時計が普及し始め、ムーブメントが小型化していきます。1980年代には汎用化され、製造メーカーが異なっていても、ほ
OpenAIがChatGPTの新機能としてdeep researchを投入しました。筆者が常日頃考えているテーマを深掘り検索してもらいました。同様の機能はGoogle Geminiもあるのでそちらにも同じ質問を投げました。
先週の土曜日早朝、AI研究家の清水亮さんが興奮して「o3-miniすごい」「自分だけではそのポテンシャルを実感できないからハッカソンやろう」と言ってるのに居合わせ、自分もそのハッカソンに出ることになりました。
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。 今回は、OpenAIが1月31日(現地時間)に発表した「o3-mini」を取り上げます。 o3-miniは2024年12月にプレビューされており、o1の進化版になります。今回リリースされたのはminiという軽量版で、「o3」は今後登場予定としています。 o3-miniはすぐに回答せず、いろいろ考えてから出力する思考過程を生成するモデルで、科学、数学、コーディングなどで優れた性能を発揮します。画像には未対応で文章のみです。 o3-miniには推論レベルを高く設定した「o3-m
サンフランシスコベースのスタートアップ Riffusionが同名のAI作曲サービスのパブリックベータを公開しました。 Riffusionは元々Stable Diffusionの画像から音楽を生成するというちょっと変わったプロジェクトから2年前にスタートしたのですが、それがText to Musicのメインストリームサービスとなって登場。今回は「FUZZ」という新しい生成モデルを使っています。 これがいきなりなかなかの出来。プロンプトに日本語も使えて日本語歌詞の楽曲も生成できて、品質も高いのです。品質で言えばSunoやUdioを一部凌駕しているかもしれません。 完成度が高いのに現在のところ無料で無制限という大盤振る舞いなのです(パブリックベータなので)。 まず、Sunoでよく使っているプロンプトを使ってみました。 J-POP, Japanese lyrics, female vocalist
スマホとSIMを求めて世界を取材中。メディアへ執筆多数。海外・中国通信関連の記事や講演承ります。noteや動画配信もやってます。 キーボードを使っている途中でタッチパッドを使う、あるいは指をホームポジションからずらさずにテンキーを使う、なんてことができたら最高に便利ですよね。「AutoKeybo」(オートキーボ)は、ジェスチャー操作でキーチェンジが行える、魔法のようなキーボードです。 キーボードは左右に分割されていて、両手を自然な位置に置けるように“ハの字”に配置されています。そして、QWERTYキーボードの下にもう1段、キーボードのようなものがあるのがわかるでしょうか? 写真向かって左側(右手側)の下にあるのがタッチパッド、右側(左手側)にあるのがテンキーです。AutoKeyboは、この上下2段のキーボードを自然な操作で切り替えながら使えるのです。 よく見ると、左右に分かれたキーボードの
AI作曲においていい曲を生み出すためのカギになるのは、音楽スタイルの選択もありますが、良い歌詞であることが重要です。 良い歌詞であれば、AIシンガーが頑張って感動的・エモーショナルな歌唱をしてくれるし、曲も盛り上がります。 Sunoは一発でけっこういい歌詞を作ってくれることが多いですし、ChatGPT、Claudeなどはなかなか優れた作詞家ですから、任せとけばいい……。そう思ってました。SunoのLyrics Editorを体験するまでは。 Sunoに新たに装備された歌詞エディタが実に優れものなのです。 新しいSunoの歌詞フィールドには、自分で歌詞を書き込む最大3000字までのフィールドの上に、「Write with Suno」の文字列と、その右に「Full Song」「By Line」のボタンがあります。 Full Songは1曲まるごとの歌詞をプロンプトで生成するモード。By Lin
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第80回)では、1枚の画像やテキストから高解像度のテクスチャ付き3Dアセットを生成するAIモデル「Hunyuan3D 2.0」や、ByteDanceのブラウザを自動操作するAIエージェント「UI-TARS」を取り上げます。
生成AIグラビアをグラビアカメラマンが作るとどうなる? 連載記事一覧 ImageFXなど外部サービスの生成AI画像の出来は!?本連載では基本的にローカルで生成出来るモデルなどを主にご紹介しているが、今回は箸休め的にImageFXなど外部サービス系はどうなの?と、Promptを同じにして各社比較してみた。 ピックアップしたのは ImageFX (Google) https://labs.google/fx/ja/tools/image-fx ImageCreator (Microsoft) https://www.bing.com/images/create Grok2 https://x.com/i/grok KLING (Kolors 1.5) https://klingai.com Recraft V3 https://www.recraft.ai Midjourney https:/
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 OpenAIは、中国DeepSeekが同社のAIモデルを強化するために、OpenAIのデータを「抽出(Distrill)」した証拠を掴んだと主張しています。 AIモデルは、その強化に膨大な量のデータを使って強化学習させる必要があり、その性能を向上に伴い必要になるエネルギー消費やコストは莫大になっています。そのせいで、主要なAI関連企業は専用の原子力発電所を建設する計画を打ち出しているほどです。 しかし、突如出現したDeepSeekのAIモデル「R1」は、はるかに少ないコストやリソースしか使っていないにもかかわらず、OpenAIやGoogleなどの大手企業と同等の成果を達成したように見えました。そして、そのせい
スマホとSIMを求めて世界を取材中。メディアへ執筆多数。海外・中国通信関連の記事や講演承ります。noteや動画配信もやってます。 例年、ラスベガスで開催されるCES 2025にはスマートフォンやケータイを相手先ブランドで開発・製造するODM・OEMメーカーが多数、出展します。おもに低価格モデルの製造を手掛ける各社の製品から、市場のトレンドが垣間見えます。 QWERTYキーボード付きのスマートフォンは、ほぼ絶滅し、ClicksのiPhone用キーボードカバー程度が最近、話題になるくらいでした。そもそもスマートフォンは画面サイズが大きいので、ソフトウェアキーボードでも問題なく文字が打てます。一方、フィーチャーフォンは画面サイズが3インチ程度で、その下についている10キーでの長文入力はややつらいということもあり、まだキーボード付き端末が存在するわけです。 QWERTYキーボードを付けるとサイズが
まずは最初にできた楽曲を。 では、ローカルマシンへのインストールに時間を巻き戻します。 YuEは非常に重いソフトで、現時点ではNVIDIAのかなり強力なGPUが必要です。また、インストーラは付属しておらず、ターミナルでコマンドラインを駆使する必要があります。 筆者はGitHubページにあるインストール方法に従って数時間トライしてみましたが、ライブラリやバージョン関連の問題が多発し、先に進めない状態になりました。 現時点では、Makiさんによる解説記事がいちばんまとまっています。筆者はMakiさんが成功したというXでの投稿を見て、「できるんだ!」と試行錯誤を続けた次第です。 ・YuEを使って音楽生成を始めよう! また、公式認定の解説動画も公開されました。 動画ではスムーズにインストールされていますが、筆者はけっこうつまづいています。 まず筆者の環境から、Windows 11マシン(Core
Apple が AirPods / AirPods Pro / AirPods Max のサポートページを更新し、ファームウェアアップデートの(準備)手順を追加しました。 AirPods / AirPods Pro のファームウェアアップデート方法手順は、 WiFiに接続した iPhone / iPad / Mac のBluetooth接続範囲にAirPodsがあることを確認 AirPodsを充電ケースに収めフタを閉める 充電ケースをケーブルで電源に接続する 充電ケースのフタを閉めたまま、最低30分間待つ フタを開けて iPhone / iPad / Macに再接続、ファームウェアバージョンを確認 充電ケースがない AirPods Maxの場合、直接電源に接続する以外は同じです。 AirPods / AirPods Pro / AirPods Max のファームウェアバージョン確認方法設定
歌詞と音楽スタイルを入力すると、ボーカル入り楽曲を生成できるAI作曲ソフトにおいてはSunoが頭一つ抜けていて、Udioがそれを追う形です。オープンソース版としてはStable Audioなどがありますが、まだ質が低く、歌唱もできない状態。 そこに、オープンソース版でSuno並に品質が高くて歌もうたえるAI作曲ソフト「YuE」が登場。Multimodal Art Projectionと香港科技大学(HKUST)が共同開発したものです。 Yueとは、音楽を意味する中国語。英語、中国語(広東話・普通話)、日本語、朝鮮語をサポートしています。 GitHubでコードを、チェックポイントはHugging Faceで公開しています。現行バージョンでは30秒の楽曲を生成するのにRTX 4090でおよそ6分かかります。 生成可能な曲の長さは最長で5分。Sunoが4分なのでそれ以上ということになります。 現
テクノエッジ編集長。Wikiの「スマートフォン」ページに略称“スマホ”考案者として記述あり。週一以上ライブへ通う音楽好き。ヨボヨボのハタチ 名称Mi Band時代から総数何本、アリエク等で中国製バンドを取り寄せたことか……。どれも安いんですが、割りの悪いガチャでしたね。結果的に純正以外、ろくなものなかったので(私の引きが弱かったのかもしれませんが)。しかし、そんな状況も変わりました。 Apple Watch用バンドも手掛ける国内アクセサリーメーカーのJINから、品質の高いXiaomi Smart Band 9 / 8向け交換バンド(ベルト)が発売されたのです。種類は3つ、各2カラーを用意。 マグネティックシリコンバンドシリコン素材は、付属の純正品よりもしなやかな印象。輪に通してからマグネットでピトッと止める仕組みで、時間帯によって微妙に変わる腕の太さに柔軟に対応してくれます。手触りサラサラ
次のページ
このページを最初にブックマークしてみませんか?
『テクノエッジ TechnoEdge』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く