GPT-5.4まとめ:新機能・料金・Claude/Gemini比較まで徹底解説
GPT-5.4はネイティブComputer Useを搭載し、OSWorld 75%・GDPval 83%を達成。Claude Opus 4.6やGemini 3.1 Proとの性能差と料金体系を比較した。
113 posts
GPT-5.4はネイティブComputer Useを搭載し、OSWorld 75%・GDPval 83%を達成。Claude Opus 4.6やGemini 3.1 Proとの性能差と料金体系を比較した。
Google Workspace全サービスをコマンド1行で操作できるCLIツールgwsが登場。Claude CodeやCodexとの連携方法とインストール手順を解説
GPT-5.3 Instantはハルシネーション最大26.8%低減と会話トーン改善が柱。ベンチマークより使用感を重視したOpenAIの方針転換と、日本語性能の現状を整理した。
Google Antigravityは複数エージェント並列実行とブラウザ操作を内蔵した新世代IDE。GEMINI.md・Rules・Workflows・Skillsの基本を解説
ARC-AGI-2で77.1%を記録しArtificial Analysis総合1位のGemini 3.1 Proは、Opus 4.6の半額以下で利用可能。ベンチマーク詳細と実務での評価を整理する
2026年春節に中国AI5社がフロンティアモデルを一斉公開。Qwen 3.5・GLM-5・MiniMax M2.5・Kimi K2.5のベンチマーク比較と、DeepSeek V4のリーク情報を整理し、API料金や試し方まで網羅する。
AppleとGoogleのAI提携で2026年中にSiriが大幅進化する。Geminiベースの新モデルによる画面認識・アプリ横断操作・自然な対話の実現時期と、日本語対応の見通しを整理した。
Claude Sonnet 4.6は無料プランのデフォルトモデルでありながら、上位Opus 4.6に肉薄するベンチマークスコアを記録。API価格据え置きでAdaptive Thinkingも搭載された全方位アップグレードの詳細を解説
Gemini 3 Deep ThinkはARC-AGI-2で84.6%を記録し、人間の平均60%を大幅に上回った。2ヶ月でスコア倍増の背景と研究成果を解説する
GPT-5.3-Codex-Sparkは毎秒1,000トークン超を実現した超高速コーディングモデル。Cerebras専用チップで動作し精度と速度のトレードオフを解説
GLM-5はSWE-benchでClaude Opus 4.5に3.1pt差、BrowseCompでは全モデル1位。API価格はOpusの6分の1でMITオープンウェイト公開
ChatGPT Deep Researchが基盤モデルをo3からGPT-5.2に刷新。検索ソースの指定、リアルタイム進捗追跡、途中介入、フルスクリーンレポートなど新機能を実際の使用画面とともに解説する。
iPhoneのアクションボタンにChatGPTの音声モードを割り当てると、ボタン一押しでAI対話を開始できる。コントロール方式とショートカット方式の両方の設定手順を解説する。
Claude CodeのFastモードはOpus 4.6の出力速度を最大2.5倍に高速化するが、トークン単価は通常の6倍でサブスク外課金となる。有効化手順、Effort Levelとの違い、コストを抑える実践的な運用法を整理した。
Claude Codeの新機能「Agent Teams」は、複数のAIエージェントを並列稼働させてチームとして協調作業させる仕組みである。セットアップ手順、Subagentsとの違い、並列コードレビューやクロスレイヤー開発など実践的なユースケースを解説する。
Claude in PowerPointは編集可能なネイティブオブジェクトとしてスライドを生成する初の実用的AIツールである。テンプレート準拠・グラフ作成・翻訳まで、Proプラン対応の全機能を紹介
GPT-5.3-CodexはTerminal-Bench 2.0で同日リリースのClaude Opus 4.6を12pt差で上回り首位。自己改善に関与した初のモデルである
Claude Opus 4.6はOpus初の100万トークン対応、Agent Teams、PowerPoint統合を搭載。主要ベンチマークのスコアとAPI価格、GPT-5.3-Codexとの同日リリースの背景を整理
Mistral AIのVoxtral Transcribe 2は1時間27円でWhisper超えの精度を実現。バッチ・リアルタイム両対応で話者識別も標準搭載
Anthropicが公開した「Claude Coworkプラグイン」は、契約レビューや財務分析など専門業務をAIで自動化し、SaaS株約42兆円の暴落を引き起こした。全11プラグインの概要と、Legalプラグインの実際の操作手順を解説する。
OpenAI Codexデスクトップアプリは複数AIエージェントをGit Worktreeで並列管理できるmacOS向けツールである。期間限定で無料ユーザーにも開放中
Claude in ExcelはProプラン(月額$20)から利用可能。ワークブック全体を理解した上で数式修正・ピボット作成・財務モデル構築まで自動実行する。導入手順と6つの実践シナリオを解説
Claude Coworkはローカルフォルダに直接アクセスし、経費精算Excel作成や資料統合を全自動で実行するAIエージェントである。Mac・Windows対応のセットアップ手順とプロンプトテンプレート集を紹介
OpenAI CodexのAGENTS.md・Skills・Rules・Custom Prompts・MCPの全機能を体系的に整理した初心者向け導入ガイド。Claude Codeとの対応表や仕様駆動開発にも言及
Claude CodeにMCP(Model Context Protocol)を導入すると、Web検索・最新ドキュメント参照・GitHub操作・ブラウザ自動化が可能になる。定番4選(Jina AI・Context7・GitHub・Playwright)の導入手順とスコープ管理を解説する。
月額1,500円の新プラン「ChatGPT Go」の機能詳細とFree・Plus・Proとの比較表、さらにOpenAIが掲げる広告導入5原則と95%の無料ユーザー問題など方針転換の背景を解説する。
Markdownファイル1つでClaude Codeに専門知識を教え込めるSkills機能の仕組みと自作手順を解説。OpenAIも採用し業界標準化が進む注目の拡張機構である
Claude Codeを使いこなす鍵は、CLAUDE.md(常駐ルール)、Skills(手順書)、Subagents(分業)、Hooks(強制処理)の4概念にある。初心者がつまずきやすいポイントを整理し、1週間で実践できる導入ステップを解説する。
Alibaba発のQwen Image Layeredは1枚の画像を前景・背景・テキストなどのレイヤーに自動分解するモデル。Hugging Faceデモの使い方とvast.aiでGPUを借りて本格運用する手順を解説する。
GPT-5.2は44職種の実務タスクで人間の専門家を超える性能を達成。実際にExcelガントチャートやパワポスライドを生成させた結果を検証
480Bパラメータの巨大モデルQwen3 CoderはコーディングベンチマークでClaude 4 Sonnetに迫りつつAPI価格は約3分の1。Qwen Code CLIやCerebras Codeでの無料利用法を含め、開発者向けに実力を検証する。
Ollamaが待望のチャットUIアプリをリリースし、DeepSeek・Llama・Gemmaなどのオープンソースモデルをローカルで誰でも快適に使えるようになった。PDF・画像の読み込みにも対応
中国Z.aiの新モデルGLM-4.5はDeepSeek R1を大幅に上回りClaude 4 Opusの20分の1の価格。MITオープンソースで無料利用可能
Googleのノーコードアプリ開発ツールOpalは日本語指示だけでAIワークフローを構築できる。VPN経由で日本から利用する具体的手順を解説
Gemini 2.5 Pro・Flash・Flash-Liteの3モデルを音声文字起こしとSVG生成で実測比較。無料で使えるGoogle AI Studioでの利用法も解説する
ChatGPT Connectors(コネクタ)の全4種類(検索・Deep Research・Synced・Custom)の使い方を解説。Google Drive・Dropbox・SharePointなどの社内データにAIが直接アクセスし、検索やレポート生成を自動化する方法を紹介する。
ChatGPTの音声モードを英会話講師として活用するコピペ用プロンプトを公開。日常英会話からTOEFL・IELTSスピーキング対策まで、月額3千円で好きなだけレッスンできる具体的な方法を紹介する。
Gemini 2.5 ProとGroq Whisperを使った無料AI文字起こしの手順と、ChatGPTで議事録に自動整形するワークフローを解説する
Alibaba Qwen3は0.6Bから235B MoEまで8モデルを展開し、ベンチマークでDeepSeek R1を上回る。思考・非思考モードの切替機構やApache 2.0ライセンスの商用利用メリットを解説する。
OpenAI o3とo4-miniは検索・Python・画像生成などのツールを自律的に連鎖実行できる初の推論モデルである。ベンチマーク結果や実際の活用例を交えて全機能を紹介する
Metaが公開したLlama 4 ScoutとMaverickはMoEアーキテクチャで最大1000万トークンのコンテキストを処理できるマルチモーダルモデルだ。性能・構成・利用方法を解説する。
stdio専用MCPサーバーをSSE/WebSocketに変換するSupergatewayの導入手順を解説。Docker環境からもMCPツールに接続可能になる
Chatbot Arena世界1位のGemini 2.5 Proは音声文字起こしや画像OCRも可能な推論モデルである。Google AI StudioやLibreChatで無料利用する手順を解説
GPT-4oネイティブ画像生成「4o Image Generation」の全機能ガイド。正確な文字描写、キャラクター同一性の維持、透過PNG生成、部分編集など、DALL-Eでは不可能だった実用レベルの画像生成をサンプル付きで解説する。
GPT-4oベースの新音声モデル3種が登場。文字起こし精度はWhisperを上回り、TTSは感情表現まで制御可能。Colabノートで無料体験できる
Model Context Protocol(MCP)を使えばClaudeやGPT-4oにファイル操作・Web検索などの機能を追加できる。ClaudeデスクトップとLibreChatでの実装手順をステップバイステップで解説する
PDFやPowerPointをMarkdownに高精度変換できるLlamaParseの使い方を解説する。表・数式・図表も構造を保ったまま変換でき、月2万クレジットまで無料で利用可能だ。
OpenAI史上最大のモデルGPT-4.5はハルシネーション率を半減し文章の自然さも向上。月200ドル不要のAPI経由で試す方法も紹介
Anthropicが公開したClaude 3.7 Sonnetは、即時応答と拡張思考を切り替えられる初のハイブリッド推論モデルである。SWE-benchで最高性能を記録したベンチマーク結果、料金、Web版・API・Perplexity経由での利用方法を解説する。
xAIのGrok 3はChatbot Arena総合1位を獲得。Deep SearchとThinkモードが無料で使え、APIも月150ドル分の無料クレジット付きで提供される。
NotebookLMはGemini 2.0 Flash搭載で要約精度が向上し、Google One AI Premium(月2,900円)でPlus版も利用可能に。AIが資料を対話形式で読み上げる音声概要機能の実力も検証する
ChatGPTとGeminiのDeep Research機能を金融・政策・日常の3テーマで比較検証。月額200ドルのChatGPTは論理的分析力で圧勝、月額20ドルのGeminiは情報収集の広さで健闘した
Replit AgentはiPhone・Androidからノーコードでアプリ開発ができるAIツール。三目並べや筋トレ記録アプリの作成実例を通じて、無料プランの制限や実用性を検証する。
URLを指定するだけでWebページをMarkdownやテキストに変換できるJina Reader APIの使い方を解説する。LLMプロンプトへの情報入力やRAG構築に役立つ無料ツールだ。
ChatGPT「Deep Research」はo3モデルが最大30分かけてWeb検索を繰り返し、引用付きリサーチレポートを自動生成する機能である。投資メモや学術調査など活用例とベンチマーク結果を交えて使い方を解説する。
o3-miniはChatGPT無料ユーザーでも使える推論モデルで、Livebenchランキング1位を獲得。API料金はGPT-4oより安く、コーディング性能はo1を凌駕する。使い方・ベンチマーク・料金を総まとめ
中国サーバーを経由せずDeepSeek R1フル版をAPI利用できる米国プロバイダ、Together AIとFireworks AIの料金・設定手順を比較する
米国サーバーでホストされたDeepSeek R1をPerplexityで安全に使う方法を解説。検索オフのWritingモードでR1単体利用も可能である
DeepSeekの低コストAIモデルがNVIDIAのGPU独占体制を揺るがす構造を、投資家兼エンジニアの論考をもとに解説する
ChatGPT Canvasが大幅強化され、HTML/Reactコードの即時プレビューとo1モデルに対応した。無料プランでも利用可能で、プロンプト一発でインタラクティブなチャートやToDoアプリ、ブラウザゲームまで開発できる。
PocketPal AIアプリでDeepSeek R1蒸留モデルをiPhone・Androidのローカル環境で動かす手順を解説。オフラインでも動作する
DeepSeek R1の蒸留モデル6種をOllamaでMac Book Airに導入する手順を解説。8Bモデルは一部ベンチマークでGPT-4o超えの性能を示す
OpenAI o1比96%オフのAPI価格でo1同等性能を実現したDeepSeek R1の使い方をWeb・アプリ・API別に解説し、o1との実力差を検証する
OpenAI o3はARC-AGIで87.5%を達成したが、高負荷モードの推定コストは1問約50万円。ARC-AGI開発者François Chollet氏の分析から、o3の推論メカニズムと莫大な計算コストの実態を読み解く
Gemini Advanced限定のDeep Researchは数百のWebページを自動探索し5分でレポートを生成する。使い方と実際のリサーチ事例3件を紹介
OpenAIのo3はARC-AGIで人間の子ども並みの87.5%を記録し、数学・コーディングでも従来モデルを圧倒。o3-miniはo1超えの性能を低コストで実現する。全ベンチマーク結果と計算コストを解説する
Chatbot Arena全ジャンル1位のGemini 2.0 Flash Thinkingを無料で試す方法と、ビリヤード問題や図形問題での人間的な推論過程を紹介する
Mac版ChatGPTの「Work with Apps」機能を使えば、Notion・VS Code・ターミナルなどの内容を自動で読み取り、コピペなしでAIに質問できる。対応アプリ一覧、設定手順、音声モードとの併用まで詳しく解説する。
ChatGPTの検索機能が無料ユーザーに開放され、マップ表示・動画埋め込み・音声モードでの検索にも対応した。Google検索を代替しうる全機能と実用的な活用例を網羅的に解説する。
ChatGPTの音声モードを同時通訳デバイスとして使うためのプロンプトと実践レポート。日本語⇔英語・中国語など数十言語に対応し、遅延数秒で外国人と自然に会話できる。ビデオ共有で看板の翻訳も可能。
ChatGPTの音声モードに追加されたLive camera・スクリーン共有機能の使い方と、海外旅行の通訳・家庭教師・表計算アシスタントなど実践的な活用アイディアをまとめた完全ガイド。
iOS 18.2で実現したApple Intelligence+ChatGPT統合の全機能を解説。Siri経由のChatGPT利用、Visual Intelligence、Writing Toolsの使い方と、日本から有効化する裏技も紹介する。
ChatGPTの「プロジェクト」機能でファイル・チャット履歴・カスタム指示を一元管理できる。議事録の要約、PDF書籍の読書サポート、Webサイト構築など実践的な活用法をデモ付きで紹介する。
Gemini 2.0 Flashはカメラ映像やスクリーン共有をリアルタイムでAIと共有できるStream Realtime機能を搭載し、無料で利用可能である
12 Days of OpenAI 4日目の発表まとめ。ChatGPTの「Canvas」が全ユーザーに無料開放され、Python実行環境の統合やカスタムGPTとの連携にも対応。対話的な共同編集・開発の活用例を解説する。
Chatbot Arenaで全カテゴリ1位を独占したGemini Experimental 1206を無料で使う2つの方法と、ChatGPT o1との性能比較結果を紹介
GPT-4o・Claude・Geminiなど複数AIモデルを自前APIキーで使えるオープンソースチャットUI「LibreChat」のDocker構築手順と活用法を解説する。
12 Days of OpenAI 2日目の発表まとめ。強化学習ベースの新手法「Reinforcement Fine Tuning(RFT)」により、わずか数十件のデータでo1-miniを専門特化モデルに仕上げられる。遺伝子疾患診断デモの結果も紹介。
12 Days of OpenAI初日の発表まとめ。o1正式版はプレビュー比で思考速度50%向上&画像解析対応、月額200ドルの新プラン「ChatGPT Pro」ではo1 pro modeが利用可能になった。
Anthropicの「Computer use」APIはAIがマウス操作・キーボード入力でPCを自律操作する革新的機能である。Dockerでのセットアップ手順とExcelデータ入力の実演結果を紹介
iPhoneのショートカットアプリでGroq Whisper APIとGPT-4oを組み合わせると、高精度な音声入力環境を無料で構築できる。設定済みテンプレートも配布している。
OpenAI Realtime APIを使えばGPT-4oとほぼ遅延なしの音声対話が可能になる。Playgroundでの試し方と英会話講師として使う具体例、ChatGPT Plusとのコスパ比較を紹介
ChatGPTの協働編集機能「Canvas」の使い方ガイド。文章の部分リライト、難易度・長さのスライダー調整、コードレビューやバグ修正、他言語への移植まで、ワンクリックで実行できる編集機能を網羅的に紹介する。
ChatGPTの「Advanced Voice Mode」を実際に試したレビュー。応答232ms・割り込み会話・感情表現など従来の音声モードからの進化点と、同時通訳や語学学習への実用的な活用法を紹介する。
ChatGPTはメール下書き・Excel関数生成・画像OCR・データ分析など業務の幅広い場面で即戦力になる。6つのビジネス活用パターンを具体例とともに紹介する。
GPT-4o・Claude・Gemini・Perplexityなど複数LLMからプロンプトごとに最適モデルを自動選択する「Not Diamond」と、そのチャットUI「AI Router Chat」の使い方・ルーティング精度を実際に検証する。
Groq Whisper APIは従来比212倍の速度で音声を文字起こしし、料金は1000分あたり0.5ドル。スター・ウォーズ全編を約7分で処理した実測結果も紹介する。
GPT-4o miniはGPT-4 Turbo並みの性能でコスト30分の1。ChatGPTで無料利用可能で、Claude 3 Haikuとの比較でも全面的に優位
Claude 3.5 SonnetはGPT-4oを上回るベンチマーク性能とArtifacts機能が特徴だ。無料での利用方法や料金体系、GPT-4oとの使い分けを整理した。
無料ユーザーも使えるChatGPT GPTsの中から、PDF要約・Excel関数生成・マインドマップ作成・画像生成プロンプト最適化・コードレビューなど、仕事と勉強に本当に役立つ厳選15個を実際の使用例つきで紹介する。
Cohereの多言語LLM「Aya 23」8BモデルはMacBook Airでもサクサク動作し、Llama 3 8Bより安定した日本語出力が得られる。Ollamaでのインストール手順とチャットUI連携方法を解説
Gemini Advancedにスプレッドシートを読み込ませ、日本語の指示だけでピボット集計・グラフ作成・スプレッドシート出力まで完結させる手順を解説する
Gemini AdvancedのGmail・Docs・Sheets・Slides連携機能を日本から使う方法を解説。メール代筆やスプレッドシート自動生成の実力を検証
ChatGPTのデータ分析機能でExcelやCSVからインタラクティブなグラフを生成する方法を実演付きで解説。Google Drive連携、列・行の選択分析、日本語フォントの文字化け対策まで網羅する。
Google AI StudioとGemini 1.5 Proを使えば、高精度な音声文字起こしから議事録生成まで無料で完結する。Pro・Flashの精度比較も実施
GPT-4oはテキスト・音声・画像・ビデオを単一モデルで処理し、応答速度0.32秒を実現。無料ユーザーへの開放、Macデスクトップアプリ、API半額化など全アップデートと実生活での活用例を網羅する。
ノーコードLLMアプリ開発ツールDifyをDockerでMacにセルフホストし、RAGチャットボットとDALL-E 3画像生成エージェントを実際に構築する手順を解説
OpenAI公式サンプル「Assistants API Quickstart」をMacにインストールし、GPT-4 Turboとのチャット・PDF読み込み・コード実行を従量課金で利用する手順を初心者向けに解説。ChatGPT Plus月20ドルを払わずにGPTsと同等の機能を使える。
文系社会人がプログラミング・数学・統計をゼロから学ぶための厳選19冊を紹介。中学数学の復習からAI・機械学習の基礎まで段階的にカバーする
Microsoftの小型モデルPhi-3 Mini(38億パラメータ)とMeta Llama 3 8Bを4つのプロンプトで比較検証。Ollama+ChatbotUIでのローカル導入手順と、各モデルの日本語・推論性能の差を明らかにする。
Open WebUIはDocker一発でインストールでき、Llama 3やGPT-4をChatGPT風UIでローカル利用できる無料アプリである。Mac向けの導入手順をゼロから解説
GroqのLPUはLlama 3を毎秒800トークンで推論する専用チップだ。無料APIの取得手順からChatbotUIとの連携まで、実際の導入方法を解説する。
Llama 3 8BをMacのローカル環境で動かす手順をOllamaとOpen WebUIを使って解説する。M1以降のApple Siliconなら快適に動作し、API不要で完全オフライン利用が可能だ。
Claude 3 Opus・Sonnet・HaikuをGoogle Colabのチャット風UIで従量課金利用する方法を解説。初回5ドル無料クレジットで月額契約なしに最上位モデルを試せる
GPT-4 Turbo・DALL-E 3・Whisper・TTSなどOpenAI全モデルをGoogle Colabで動かせるノートブックを公開。プログラミング不要、APIキーだけで即利用可能
GPT-4o・Claude 3・Gemini等の主要LLMを月額サブスクなしのAPI従量課金で一括利用できるオープンソースアプリ「ChatbotUI」の導入ガイド。ブラウザ版とMacローカル版の両方の使い方を解説する。
Perplexity AIはClaude 3 OpusやGPT-4を搭載したAI検索エンジン。Pro Searchの精度、画像生成、ファイル解析など全機能を網羅し、$10割引の紹介リンク付きで始め方を解説する。
Claude 3 OpusはGPT-4を複数ベンチマークで上回り、日本語性能も高い。無料APIクレジットの取得方法とGPT-4との具体的な性能差を解説する。
Gemini Pro APIはGoogle AI Studioから無料で試せる。APIキーの取得からPythonでのチャット実装、安全フィルターの設定まで実践的な手順を解説する。
Google BardのExtensions機能でGmail検索・YouTube要約・ホテル検索などが可能に。英語版を日本から使う方法と全機能の使用例を紹介
GPT-4 TurboとGPT-4VのAPIをGoogle Colabで手軽に使えるノートブックを無料公開。プライバシー保護とコスト削減を両立できる
Prompt Perfect、Zapier、Ask Your PDF、Wolframなど厳選16個のChatGPTプラグインを、情報収集・生産性向上・デザインなど用途別に紹介。インストール手順と複数プラグインの組み合わせ活用法も解説する。
GPT-4のAPIをGoogle Colabのチャット風UIで手軽に使える無料ノートブックを公開。月額契約不要の従量課金で、プライバシーを確保しつつ最上位モデルを活用する方法を解説