#llama

9 posts

AI News Apr 6, 2025

Llama 4 Scout / Maverick 完全ガイド：GPT-4oを超えるオープンソースモデル＆マルチモーダル対応！

Metaが公開したLlama 4 ScoutとMaverickはMoEアーキテクチャで最大1000万トークンのコンテキストを処理できるマルチモーダルモデルだ。性能・構成・利用方法を解説する。

Llama 3.3 70Bは従来の405Bモデルに匹敵する性能を6分の1のパラメータ数で実現したMetaの最新オープンモデルだ。ベンチマーク比較とローカル実行方法を解説する。

PocketPalはiPhone・Androidでローカル動作するLLMアプリ。Llama 3.2 3BをiPhone 12 miniで実行した応答速度や精度を検証し、オフラインAIチャットの実用性と導入手順を解説する。

AI Apps Aug 4, 2024

GPT-4o・Claude・Gemini・Perplexityなど複数LLMからプロンプトごとに最適モデルを自動選択する「Not Diamond」と、そのチャットUI「AI Router Chat」の使い方・ルーティング精度を実際に検証する。

Metaの大規模オープンモデルLlama 3.1を405B・70B・8Bの3サイズで比較し、GPT-4oやClaude 3.5 Sonnetとの性能差やGroq・Vast.aiでの実行方法を解説する。

Microsoftの小型モデルPhi-3 Mini（38億パラメータ）とMeta Llama 3 8Bを4つのプロンプトで比較検証。Ollama＋ChatbotUIでのローカル導入手順と、各モデルの日本語・推論性能の差を明らかにする。

Open WebUIはDocker一発でインストールでき、Llama 3やGPT-4をChatGPT風UIでローカル利用できる無料アプリである。Mac向けの導入手順をゼロから解説

GroqのLPUはLlama 3を毎秒800トークンで推論する専用チップだ。無料APIの取得手順からChatbotUIとの連携まで、実際の導入方法を解説する。

Llama 3 8BをMacのローカル環境で動かす手順をOllamaとOpen WebUIを使って解説する。M1以降のApple Siliconなら快適に動作し、API不要で完全オフライン利用が可能だ。