AI活用レビュー

Gemma 4ローカル導入|0円で自分専用ChatGPTを作る手順と正直な限界

REVIEW
Gemma 4 ローカル導入ガイド
0円で自分専用ChatGPTを作る手順と正直な限界
0円ローカルAIOllama

Googleの「Gemma 4」を自分のPCに入れると、月額0円・制限なし・完全オフラインでAIチャットが使えます。

非エンジニアでもClaude Code(AIにファイル操作やコマンド実行を頼めるツール)に頼めば、導入からブラウザ画面の構築まで全部できる。

ただし「ChatGPTの代わりになるか?」と聞かれたら、正直7割。

日本語の精度や複雑な指示への対応では、まだクラウドAIに届きません。

この記事では、非エンジニアの私が実際にGemma 4をローカルPCに入れた全手順と、使ってみてわかった「できること・できないこと」をまとめます。

この記事は月額無料でAIを使い倒したい人・社内データをクラウドに送りたくない人向け(プログラミング経験ゼロでも、Claude Codeが使えれば読めます)。

Gemma 4(ローカル導入)評価まとめ

料金 完全無料(Apache 2.0ライセンス)
使いやすさ ★★★★★
日本語対応 ★★★★★
おすすめ度 ★★★★

私の使い方: RTX 4070 Ti SUPER(VRAM 16GB=GPUの作業メモリ)の環境で、Gemma 4の26Bモデルを運用しています。

Open WebUI(ブラウザ型のチャット画面ツール)経由で、チャットとWeb検索を実行。

大量データの分類やオフライン時の壁打ちに使っています。

ブログ記事のような長文生成はClaudeに任せて、Gemma 4は「精度より量」の作業専用です。

そもそもGemma 4って何?Googleが無料で配る理由は?

料金
完全無料
Apache 2.0ライセンス
商用利用もOK
性能
AIME 89.2%
前世代Gemma 2は20.8%
4倍以上の性能向上
開発元
Google
DeepMind開発
140言語対応
戦略
Android方式
無料で配ってユーザーを獲得
クラウドへ誘導

ざっくり言うと、Googleが出した「自分のPCで動くAIモデル」です。

Apache 2.0(中身を改変・商用利用してもOKな配布ライセンス)で公開されていて、完全に無料。

商用利用もOK。

改変もOK。

太っ腹すぎないですか。

でもこれ、慈善事業じゃないんです。

Androidと同じ戦略。

AndroidってOSは無料ですけど、結局みんなGoogleのサービスを使うので、Googleが儲かる仕組みじゃないですか。

Gemma 4も同じ構造。

無料で配る。

みんなGemmaベースで開発する。

本番はGoogle Cloud(Googleが提供する有料サーバー)で動かす。

インフラ代で稼ぐ、という流れ。

あと、中国のDeepSeekやQwenがオープンモデル(無料配布の高性能AI)でガンガン開発者を囲い込んでいます。

アメリカ企業として対抗する意味もある。

めちゃくちゃ戦略的な話です。

性能はどうかというと、Google公式発表によれば、数学のベンチマーク(AIME 2026)で前世代Gemma 3が20.8%。

Gemma 4は89.2%。

4倍以上。

桁が変わっています。

ただし、ClaudeやChatGPTの最上位モデルにはまだ届かない。

「一流の一歩手前」くらいの立ち位置です。

それが無料で、しかも自分のPCだけで動く。

そこがすごいんです。

ローカルAIとクラウドAIは何が違うのか?

普段使っているClaude、ChatGPT、Gemini。

これ全部「クラウドAI」です。

入力したテキストは、どこか遠くのサーバーに送られて処理されている。

だから月額がかかるし、回数制限もある。

ローカルAIはその逆。私のPC内で計算が完結します。

比較項目 クラウドAI(Claude/ChatGPT等) ローカルAI(Gemma 4)
処理場所 企業のサーバー 自分のPC内
月額費用 有料(月2,000〜3,000円〜) 0円
利用制限 あり(回数・トークン上限) なし(使い放題)
データの外部送信 あり(サーバーに送られる) なし(PCから出ない)
ツール連携 あり(道具箱が内蔵) なし(素手=チャットのみ)
文章の品質 高い 7割程度
オフライン動作 不可 可能

ただし、大きなトレードオフがあります。

Claude Codeって、AIの中に「道具箱」が入っているんです。

ファイルを読む道具、コマンドを実行する道具、ネット検索する道具。

だからファイル操作もコード実行もWebブラウジングも全部できる。

Gemma 4は「素手」です。

頭はいいけど、手足がない。

チャットはできるけど、それ以外は自分じゃ何もできない。

この違い、触ってみるまで全然わかりませんでした。

Gemma 4ローカルAIはどんな場面で使えるか?

📊
大量データ処理
CSV1000件分類が0円
クラウドAIならトークン課金で数千円
ローカルなら何回やっても無料
✈️
オフライン
新幹線・飛行機でもAI
ネット接続不要
移動中でもAIが使える
🔒
プライバシー
顧客データがPCから出ない
外部サーバーに一切送信しない
情報漏洩リスクゼロ

たとえばCSVに入った1,000件のデータを「ポジティブ/ネガティブ」に分類したいとき。

Claude APIで回すと、モデルやトークン数次第で数千円かかります。

ローカルのGemma 4なら、同じ処理が0円。

時間はかかる。

でもお金はかからない。

「精度より量」の作業には、かなり向いています。

あと、オフライン作業。

新幹線でトンネルに入ったら通信が切れる。

飛行機のWi-Fiは微妙。

でもローカルAIはネット不要なので、どこでも動く。

移動中に下書きのたたき台を作ったり、アイデアの壁打ちをしたり。

「圏外でもAI」って、地味にありがたいです。

そして、仕事で一番ありがたいのがプライバシー。

顧客リスト、社内資料、未公開の企画書。

AIに読ませたいけど、クラウドに送るのは怖いですよね。

ローカルAIなら、データが私のPCから一歩も出ない。

情報セキュリティを気にする仕事ほど、ローカルAIの恩恵がでかいです。

Gemma 4に必要なスペックは?

✅ 導入前チェックリスト

GPU VRAM 6GB〜(E4B)/ 16GB〜(26B)
E4Bは軽量モデル。26Bは高性能だがVRAM食い

メモリ 24GB推奨
最低16GBでE4Bは動作。26Bは24GB以上必須

Claude Code環境
セットアップはClaude Codeに聞きながら進める前提

所要時間 約1時間
ダウンロード時間含む。回線速度に依存

費用 0円
Ollama無料・Gemma 4無料・Open WebUI無料

私の環境はこんな感じでした。

項目 私の環境
GPU NVIDIA RTX 4070 Ti SUPER(VRAM 16GB)
メモリ 24GB
CPU Intel i7-14700KF
OS Windows 11(WSL2でLinux)

ポイントはGPUの「VRAM」(ビデオメモリ=グラフィックボードに積まれた専用メモリ)です。

Gemma 4にはサイズがいくつかあって、小さいモデル(E4B)なら約6GBのVRAMで動く。

これはちょっといいゲーミングPCなら余裕のラインです。

賢いモデル(26B)だと16〜18GBくらい必要で、私の環境だとギリギリでした。

GPUがないPCでもCPUだけで動くことは動くんですけど、めちゃくちゃ遅いです。

あとはClaude Codeが使える環境があれば大丈夫。

Claude Codeが「AIアシスタント兼インストーラー」になってくれるので、コマンドを覚える必要がない。

所要時間は全部で約1時間。

つまずき込み。

費用は合計0円でした。

Gemma 4のインストールはどうやるのか?

STEP 1
Claude Codeに頼む
「Ollamaを入れたい」
と伝える
STEP 2
Ollamaインストール
コマンド1行で
導入完了
STEP 3
Gemma 4ダウンロード
E4B: 9.6GB
26B: 17GB
STEP 4
チャット開始
ollama runで
即座に会話可能
  1. STEP 1: Claude Codeに「ローカルでGemma 4を動かしたい」と伝える
    操作: Claude Codeを起動して、上のひと言を投げる。
    期待結果: 「OllamaというツールでローカルAIを動かせます。インストールしますか?」と返ってくる。Ollama(オラマ)はAIモデルをPCで動かすための土台ソフトです。
    詰まりどころ: Claude Code自体が未導入なら先にClaude Code公式(claude.com/claude-code)からセットアップしてください。
  2. STEP 2: Ollamaのインストールコマンドを実行してもらう
    操作: 「お願い」と返すだけ。Claude Codeが自動でコマンドを打ちます。
    期待結果: 約2分でOllamaが入る。バージョン確認コマンドが通れば成功。
    詰まりどころ: 「パスワードを入力してください」が出ることがある(WSL=WindowsでLinuxを動かす仕組み、のパスワード)。設定した覚えがなければ、Claude Codeに「WSLのパスワードがわからない。リセットして」と頼めば、PowerShell(Windowsのコマンド画面)からのリセット手順を教えてくれる。私はここで詰まりました。
  3. STEP 3: Gemma 4本体をダウンロード
    操作: Claude Codeに「Gemma 4を入れて」と頼む。
    期待結果: 軽量版E4B(9.6GB)は約5分、高性能26B(17GB)は約10分でダウンロード完了。
    詰まりどころ: 「zstd(圧縮の解凍ツール)が足りません」エラーが出ることがある。Claude Codeが勝手に追加インストールしてリトライしてくれるので放置でOK。私はzstdが何かもわかっていません。
  4. STEP 4: チャットで動作確認
    操作: 「自己紹介して」と日本語で入力。
    期待結果: 日本語で返事が返ってくる。「おー、動いてる」となります。
    詰まりどころ: 返事が英語で返ってきたら「日本語で答えて」と明示すると切り替わります。

ここまでは順調でした。問題はこのあと。

Gemma 4を入れたら何ができるのか?

Claude Code = AI + 道具箱
● ファイル操作(読み書き・編集)
● コマンド実行(ターミナル操作)
● Web検索・情報取得
● AIが道具を使って作業してくれる
Gemma 4 = AIだけ、素手
● チャットのみ(質問→回答)
● ファイル操作できない
● コマンド実行できない
● AIの頭脳だけで勝負する形

Gemma 4が動いて、日本語で会話もできて、「よし、これでいろいろやるぞ」と思いました。

ファイル読ませたり、ネットで調べものさせたり。

……できない。

何を頼んでも「テキストで答える」しかできないんです。

Claude Codeなら「このファイル読んで」「ネットで調べて」「コマンド実行して」ができますよね。

Gemma 4は、チャットだけ。

ファイルも読めない。

検索もできない。

コマンドも無理。

さっき言った「素手のAI」ってこういうことか、と。

Claude Code = AI + 道具箱(ファイル操作、コマンド実行、検索、記憶)。

Gemma 4 = AIだけ。

道具なし。

この差、触ってみて初めてわかりました。

さすがにチャットだけじゃ物足りない。

Claude Codeに相談しました。

「ChatGPTみたいな画面でGemma 4を使いたいんだけど」と。

返ってきたのが「Open WebUIっていうのがありますよ」でした。

Open WebUIでどう進化するのか?

STEP 1
Open WebUI追加
Docker 1コマンドで
導入
STEP 2
ブラウザUI完成
ChatGPT風の
操作画面
STEP 3
ファイル読込可能
PDF・CSV・テキスト
をアップロード
STEP 4
Web検索追加
SearXNG連携で
最新情報取得
COMPLETE
自分専用ChatGPT
0円で完全自立
プライベートAI

Open WebUI(オープンウェブユーアイ)は、AIのための「画面」を作ってくれるツールです。

AI自体ではなく、AIにつなぐテレビみたいなもの。

放送局(Gemma 4)の映像を映すテレビ(Open WebUI)、というイメージ。

これを入れると、ブラウザでChatGPTっぽくチャットできるようになる。

会話履歴も保存できる。

ファイルもドラッグ&ドロップで読ませられる。

さらにWeb検索まで追加できます。

  1. STEP 1: Claude Codeに「Open WebUIをDocker経由で入れて」と頼む
    操作: 短文でこう投げるだけ。Docker(ドッカー=ソフトを箱詰めしてまるごと動かす道具)も入っていなければ「Dockerも入れて」と一緒に頼みます。
    期待結果: 自動でセットアップが進み、ブラウザのhttp://localhost:3000で画面が開く状態になる。
    詰まりどころ: Dockerの初期設定でWSL2連携の確認が出ることがある。指示通りONにすればOKです。
  2. STEP 2: モデル接続を確認
    操作: Open WebUIにブラウザでアクセスし、左上のモデル選択欄を開く。
    期待結果: 「gemma:4-e4b」「gemma:4-26b」など、ダウンロード済みモデルが選べる。
    詰まりどころ: モデルが表示されないことがある(私はここで詰まった)。Claude Codeにログ(動作記録)を読んでもらえば、「接続先の設定が間違っています」と直してくれます。
  3. STEP 3: Web検索機能を有効化
    操作: Claude Codeに「Open WebUIでWeb検索を有効にして」と頼む。
    期待結果: ddgs(DuckDuckGo検索のプログラム)の追加・環境変数(設定値)の追加・Docker再起動が走り、Web検索オプションが画面に出てくる。
    詰まりどころ: チャット入力欄の「+」ボタンから「ウェブサーチ」をONにする操作が、毎回必要だと気づくまで30分かかりました。デフォルトONにする設定はありません。
  4. STEP 4: ファイル読み込みを試す
    操作: 入力欄にPDFやCSVをドラッグ&ドロップして、「中身を要約して」と頼む。
    期待結果: ファイル内容を踏まえた回答が返ってくる。
    詰まりどころ: 大きなファイル(数MB超)はモデルのコンテキスト上限(一度に読める量)を超えて切られることがある。長文は分割して投げ込んでください。

私がやったのは「動かない」「なんかエラー出た」と伝えるだけ。

あとは全部Claude Codeがやってくれました。

最終的に完成したのが、ブラウザで開ける「自分だけのChatGPT」。

チャット、ファイル読み込み、Web検索ができる。

月額0円。

データは一切外に出ない。

Open WebUIのWeb検索はChatGPTと何が違うのか?

ChatGPTのWeb検索って、AI自身がネットを見に行ってるイメージありませんか。

じつはOpen WebUIのWeb検索は、ちょっと違うんです。

検索しているのはOpen WebUI(ただのプログラム)であって、AIじゃない。

流れはこう。

質問する → Open WebUIがDuckDuckGoで検索 → 検索結果のテキストを取ってくる → 質問と検索結果をセットでGemma 4に渡す → Gemma 4が読んで答える。

つまりAIは「検索結果を読んでるだけ」なんです。

検索そのものはAIがやっていない。

ChatGPTの検索も似た仕組みです。

けど使っていると「AIが調べてくれてる」と思い込みがちですよね。

ローカルで自分でセットアップすると、こういう裏側が見えてくる。

これを知っていると、「なんか検索結果がズレているな」というときに原因の切り分けができる。

AIが悪いのか、検索が悪いのか。

けっこう大事な視点です。

Gemma 4ローカルAIについてよくある疑問

Q. GPUがないノートPCでも動く?

動くことは動きます。

CPUだけでも処理はできる。

ただ、めちゃくちゃ遅い。

小さいモデル(E4B)ならなんとか使えます。

大きいモデルは実用的じゃないと思います。

GPUつきのPCを持っているなら、そっちで試すほうが圧倒的に快適です。

Q. Gemma 4の日本語ってどうなの?

使える。

けどClaudeと比べると、正直まだ粗い。

「1文で答えて」と言っても長文で返ってくることがあります。

指示の通りやすさは、やっぱりClaudeやChatGPTのほうが上。

それでも「日本語が通じない」レベルではないので、壁打ちや下書きのたたき台には十分使えます。

Q. セキュリティ的に大丈夫?怪しいソフトを入れて壊れない?

今回使ったOllamaもOpen WebUIも「オープンソース」のツールです。

オープンソースとは、コードが全部公開されていて、だれでも中身を確認できるもの。

私はClaude Codeにインストール用のスクリプト(455行)を全部読ませて、セキュリティチェックしてもらいました。

結果はマルウェアなし、外部への情報送信なし、ネットワーク公開はlocalhost(自分のPC内のみ)限定。

ただし、オープンソースは誰でもコードを変更できるので、入れる前に最終更新日と「Issue」(報告された問題)を確認するのがおすすめです。

判断が難しければ、Claude Codeに「このリポジトリ(コード保管庫)のコードを読んで安全かチェックして」と頼めばいい。

AIにチェックさせてからインストール。

これは鉄則にしてください。

Gemma 4の正直な限界は?

⚠ 知っておくべき限界

文章品質はクラウドAI以下
Claude OpusやGPT-5と比べると推論精度・日本語の自然さは劣る

エージェント作業は不可
ファイル操作・コマンド実行・Web検索は単体では不可能

VRAM不足で大モデルは動かない
26Bモデルには16GB以上のVRAMが必要。ノートPCでは厳しい

セットアップに約1時間
ChatGPTのように即使えない。ダウンロード+設定の手間がかかる

文章の品質は、ClaudeやChatGPTに比べると劣ります。

とくに長い文章を書かせると、質の差がはっきり出る。

「ブログ記事を1本書いて」のようなタスクは、まだクラウドAIに任せたほうがいい。

エージェント的な自動作業もできません。

「このフォルダのファイルを全部リネームして」みたいなのはClaude Codeの仕事です。

VRAMが足りないと大きいモデルが使えないのも制約です。

私のRTX 4070 Ti SUPER(VRAM 16GB)でも、31Bモデルはメモリ不足で動かせなかった。

そして、セットアップに1時間かかる。

「今すぐAIに聞きたい」という人は、ChatGPTを開いたほうが早いです。

まとめ

「ローカルLLMを入れたらChatGPTの代わりになる」は半分嘘です。

チャットはできるけど、手足がない「素手のAI」。

Open WebUIで拡張して、やっとChatGPTの7割くらい。

でも、お金がかからなくて、ネットがなくても動いて、データが外に出ない。

この3つが全部そろうのは、ローカルAIだけ。

これが「一部のエンジニアだけのおもちゃ」じゃなくなってきている。

それが大事な変化だと思っています。

Claude Codeのようなツールがあれば、コマンドを知らなくても入れられる。

Gemma 4のような高性能モデルが無料で配られる。

つまり「AIを使うためにOpenAIやGoogleにお金を払い続ける」以外の選択肢が、ふつうの人にも手が届くようになってきた、ということです。

今はまだ7割。

でもこの7割が来年には8割、9割になる可能性は十分あります。

そのとき「自分で入れたことがある」と「聞いたことはある」の差は、けっこうでかいんじゃないかな、と。

まず一回やってみてください。

「あ、AIってこういう仕組みで動いてるんだ」というのが体感でわかるようになります。

それだけでも、やる価値あると思っています。

このページに出てきた言葉

ローカルAI
自分のPC内でだけ動くAI。ネット越しのサーバーに送信しない。
クラウドAI
遠くのサーバーで動くAI。ChatGPTやClaudeなど、月額制で使うタイプ。
VRAM(ビデオメモリ)
グラフィックボード(GPU)に載っている専用メモリ。AIモデルはここに展開される。
Ollama(オラマ)
AIモデルをPC内で動かすための土台ソフト。無料・オープンソース。
Open WebUI
OllamaにつなぐブラウザUI。ChatGPT風のチャット画面・履歴保存・ファイル読込・Web検索ができる。
Docker
ソフトを箱詰めしてまるごと動かす道具。OSや環境の差を吸収する。
WSL2
Windows上でLinuxを動かす仕組み。OllamaやDockerの実行に使う。
Apache 2.0
配布ライセンスの一種。中身を改変・商用利用してもOK。
オープンソース
コードが全部公開されていて、だれでも中身を確認・改変できるソフト。
26B / E4B
モデルのサイズ表記。数字が大きいほど賢いがVRAMを食う。

参考リンク

※この記事の内容は執筆時点のものです。AIは進化が速い分野のため、最新の仕様は公式サイトでご確認ください。

-AI活用レビュー
-,

← 戻る