AI活用全般

Tailscale × Gemma 4|自宅Macを月額0円のAIサーバーにして外出先から使う方法

PICKUP
Tailscale × Gemma 4
自宅Macを月額0円のAIサーバーに
外出先からプライベートAIにアクセスする方法
Tailscalellama.cppGemma 4

Tailscale(無料のVPNサービス)とllama.cpp(ローカルでAIを動かすオープンソースソフト)を組み合わせれば、自宅のMacが「どこからでもアクセスできるプライベートAIサーバー」になる。

データはクラウドを一切通らない。

月額0円。

llama.cppの開発者本人が、この構成で自宅のMac StudioにGemma 4(Googleの無料AIモデル)を入れてiPhoneから使っている。

ローカルAI(手元のパソコン内で完結するAI)の「自宅でしか使えない」という致命的な弱点を、Tailscaleのデバイス間VPN(仮想の専用ネットワーク)で解消する方法だ。

ブラウザだけで動くので、専用アプリも要らない。

この記事では、Tailscale×ローカルAIの仕組みとセットアップ手順を、機密データをクラウドに出したくない人・自宅AIを外出先から使いたい人向けに整理する。

この記事は機密データをAIで扱いたい人・サブスク代を抑えたい人向け(ターミナル操作の経験がなくても、Claude Codeに聞きながら進めれば読めます)。

Tailscale × ローカルAIはどういう仕組みか?

💻
自宅Mac
llama.cpp + Gemma 4
← →
Tailscale VPN
暗号化・P2P接続
← →
📱
iPhone / iPad
ブラウザでアクセス
データはクラウドを通らない · デバイス間で直接暗号化通信

ローカルAIのメリットは、プライバシー。

データが外に出ない。サーバーに送られない。私のパソコンの中で完結する。

でも弱点がある。

自宅から離れたら使えない。

パソコンの前にいる時しか使えない。

スマホからは無理。

だから「プライバシーは大事だけど、利便性を考えたらChatGPTでいいか…」となる。

Tailscaleが、この弱点をきれいに解決する。

仕組みはシンプル。

私のデバイス同士を「VPN(仮想の専用ネットワーク。

離れた端末を1つのLANのようにつなぐ技術)」でつなぐ。

普通のVPNとの違いは、中央のサーバーを通さないこと。

デバイス同士が直接つながるから、速い。

しかもデータはデバイス間で暗号化されるので、途中で誰かに見られる心配もない。

つまり、外出先からスマホで自宅のAIにアクセスしても、データはクラウドを通らない。

自宅のMacとiPhoneが「同じ部屋にいるかのように」通信できる。

これ、ローカルAIの「自宅でしか使えない」という致命的な弱点を消す構造です。

Tailscale × ローカルAIはどんな場面で使えるか?

📋
出先で資料をAIに聞ける
自宅Macの中の提案書や資料を、カフェからスマホで要約・質問できる
🔒
機密データをAI分析できる
売上データや社内文書を社外サービスに渡さずにAIで処理できる
💰
月額0円で私専用のAI
Gemma 4は無料、Tailscaleも無料。使い放題でトークン制限なし

出先で「あの資料の中身どうだったっけ」をAIに聞ける

たとえば、取引先との打ち合わせ前にカフェでスマホを開く。

「昨日作った提案書の要点を3つにまとめて」と自宅のAIに聞ける。

提案書のデータは自宅のMacの中。

クラウドには一切上がってない。

でもiPhoneのブラウザから、自宅にいるかのように操作できる。

ChatGPTに貼り付けるのは怖いけど、手元のローカルAIなら気にならない。

会社の機密データをAIで分析したいけど、社外に出せない時

「売上データをAIに分析させたい。

でも社外のサービスに入れるのは情報セキュリティ的にNG。

この悩み、企業でAI活用が進まない一番の理由だと思います。

Tailscale + ローカルAIなら、データは一度も社外に出ない。

分析もMacの中で完結する。

外出先からアクセスしても、通信は暗号化されたVPNの中。

「プライバシーを守りながらAI活用」の現実的な選択肢になる。

月額0円で「私専用のChatGPT」を持てる

ChatGPTは月額$20。Claudeも月額$20。

でもローカルAIなら、モデル自体は無料。

Gemma 4はGoogleが無料で公開しているオープンソースモデル(コードや重みが公開されていて誰でも使えるAI)。

Tailscaleも個人利用なら無料。

最初にMacを持ってれば、あとはランニングコストゼロで「私だけのAIアシスタント」が手に入る。

しかも使い放題。トークン制限もない。何回質問しても追加料金なし。

正直、ClaudeやChatGPTと比べるとモデルの性能は落ちるので、完全な代替にはならない。

でも「ちょっとした質問」「文書の要約」「アイデア出し」くらいなら十分使えるレベル。

Tailscale × ローカルAIに必要なものは?

💻
母艦
Mac(M1以降)
RAM 16GB以上推奨
🔐
VPN
Tailscale
個人利用無料・100台まで
実行環境
llama.cpp
WebUI内蔵・Star 10万超
🤖
AIモデル
Gemma 4
Apache 2.0・140言語対応

まず、Apple Silicon搭載のMac(M1以降。

AppleがIntelチップから自社設計に切り替えた世代)。

これがAIの頭脳になる。自宅に置いておく母艦です。

メモリ(RAM。

AIが動く時に使う作業領域)は最低8GBあれば小さいモデルは動きますが、快適に使うなら16GB以上が目安。

Gemma 4の一番小さいモデル(E2B)なら8GBのMacBook Airでも動きます。

26Bの大きいモデルを使いたい場合は、18GB以上必要とのこと。

次に、Tailscale。

個人利用なら無料で、最大100台のデバイスをつなげられます。

Mac、iPhone、iPad、Windows、Linux、Android、ぜんぶ対応。

あとは、llama.cpp。

AIモデルを動かすためのオープンソースソフトで、完全無料。

llama.cpp開発者本人が作ったソフトで、ChatGPT風のWebUI(ブラウザで使える画面)が内蔵されています。

GitHub: https://github.com/ggml-org/llama.cpp

Star数は100,000以上(2026年4月時点)。

オープンソースのAIツールとしては最大級のプロジェクトです。

最後に、Gemma 4のモデルファイル。

Googleが無料公開しているAIモデルで、Apache 2.0ライセンス(商用利用もOK)。

テキスト、画像、音声に対応したマルチモーダルモデル(複数の入力形式を扱えるAI)で、140以上の言語に対応。

日本語も使えます。

Tailscale × llama.cpp × Gemma 4はどうやってセットアップするか?

STEP 1
Tailscale導入
Mac + iPhoneに
インストール
STEP 2
llama.cpp導入
ターミナルで
ビルド
STEP 3
モデル取得
Gemma 4の
GGUFをDL
STEP 4
サーバー起動
localhost:8080で
WebUI表示
STEP 5
外部アクセス
Tailscale経由で
iPhoneから接続

このセットアップはちょっとハードルがあります。

ターミナル(Macの黒い画面でコマンドを打つツール)を使う場面が出てくる。

でも、最近はClaude Code(AnthropicがCLIで提供するコーディング特化AI)に「この手順をやりたい。

ステップバイステップで教えて」と言えば、1つずつ教えてくれる。

だからプログラミングの知識がなくても、AIに聞きながら進めれば実行できます。

ステップ1: Tailscaleをインストール

操作: MacとiPhoneの両方にTailscaleをインストール。

Macは tailscale.com からダウンロード、iPhoneはApp Storeで「Tailscale」を検索。

同じアカウント(GoogleアカウントやApple IDでログイン可能)で両方ログインする。

期待結果: Tailscaleのアプリ画面に2台のデバイスが「My Network」として表示される。

Mac側のTailscaleアドレス(100.x.x.x形式のIP)が確認できる。

詰まりどころ: アカウントが別だとデバイスが見えない。

Macが企業向けMDM管理下だとインストールに権限が必要なことがある。

ステップ2: llama.cppをMacにインストール

操作: ターミナルで git clone https://github.com/ggml-org/llama.cpp でコードをコピーし、cd llama.cpp 後に cmake -B buildcmake --build build --config Release でビルド(コードを実行ファイルに組み立てる作業)する。

Homebrew(Mac用のソフト管理ツール)と cmake が前提。

期待結果: build/bin/llama-server という実行ファイルができている。

./build/bin/llama-server --version でバージョンが表示されれば成功。

詰まりどころ: cmake が無いと「command not found」になる。

brew install cmake で入る。

Apple Siliconだと自動でMetal(GPU加速)が有効化されるが、エラーが出たらClaude Codeにエラーログをそのまま貼って原因を聞くのが早い。

インストール前に github.com/ggml-org/llama.cpp の最終更新日とIssueタブを必ず確認する。

ステップ3: Gemma 4のモデルをダウンロード

操作: Hugging Face(AIモデルの配布サイト)からGemma 4のGGUF形式(llama.cppが読めるモデルファイル形式)を取得する。

Mac 8GBなら E2B(4bit圧縮で約5GB)、16〜32GBなら E4B、32GB以上なら 26B-A4B(4bit圧縮で約18GB)が目安。

期待結果: ~/models/gemma-4-e2b.gguf のように .gguf ファイルが手元にある状態。

詰まりどころ: Hugging FaceはGoogleモデルのライセンス同意が必要なケースあり。

同意後でないとダウンロードリンクが返らない。

Claude Codeに「私のMacのメモリは○GBです。

Gemma 4のどのモデルが良いですか」と聞けば、最適なモデルとリンクが返ってきます。

ステップ4: llama.cppのサーバーを起動する

操作: ターミナルで ./build/bin/llama-server -m ~/models/gemma-4-e2b.gguf --host 0.0.0.0 --port 8080 を実行。

--host 0.0.0.0 がポイント(ステップ5で外部アクセスするため、localhost限定にしない)。

期待結果: ターミナルに「listening on port 8080」と出る。

Macのブラウザで http://localhost:8080 を開くとChatGPT風のチャット画面が表示される。

日本語で質問して応答が返る。

詰まりどころ: モデル読み込みに数十秒〜1分かかるので、すぐ反応しなくても焦らない。

「out of memory」エラーが出たら、もう1段小さいモデルに変える。

ステップ5: Tailscale経由で外からアクセス

操作: iPhoneでTailscaleを起動し、接続状態にする。

iPhoneのブラウザで http://[MacのTailscaleアドレス]:8080 を開く(Tailscaleアドレスはアプリのデバイス一覧で確認できる、100.x.x.x形式)。

期待結果: 自宅のlocalhostで見たのと同じChatGPT風画面がiPhoneで開く。

質問を打つと自宅Macで生成されてストリーミング(逐次表示)で返ってくる。

詰まりどころ: 自宅のMacがスリープに入ると応答しない。

Macのシステム設定 > ロック画面 > 「ディスプレイがオフのときコンピュータを自動でスリープさせない」を有効化する。

Tailscaleが「未接続」表示の時はiPhone側のVPN設定を確認する。

よくある疑問

Q. Macの電源を切ってたら使えない?

そうです。

自宅のMacが起動してないとアクセスできません。

llama.cpp開発者本人はMac Studioを常時稼働させています。

Mac miniも消費電力が低いので常時起動に向いています。

スリープ設定を解除しておく必要があります。

Q. 回線速度は遅くならない?

Tailscaleは「ピアツーピア接続(デバイス同士が直接つながる方式)」なので、一般的なVPNよりは速いです。

ただし自宅のインターネット回線の上り速度に依存するので、回線が遅い場合はレスポンスが遅くなります。

Q. ClaudeやChatGPTの代わりになる?

正直、完全な代わりにはならないと思います。

Gemma 4は優秀ですが、Claude OpusやGPT-5と比べると推論の精度は落ちる。

「機密データを扱う時だけローカルAI、普段はClaudeやChatGPT」の使い分けが現実的かなと。

Q. WindowsやLinuxでもできる?

llama.cppはWindows/Linux/Macに対応しているので、原理的にはできます。

ただしGPU対応のセットアップが変わる。

Apple Siliconが一番セットアップが楽です。

Claude Codeに「Windows + NVIDIAでllama.cppを動かしたい」と聞けば手順が返ってきます。

Tailscale × ローカルAI構成の注意点と限界は?

⚠ 注意点と限界
Macのスペックに依存
メモリ8GBだと小さいモデルのみ。本格運用には32GB以上が必要
セットアップにターミナル作業が必要
ChatGPTのように「すぐ使える」わけではない。Claude Codeに聞きながら進める前提
Macの常時起動が必要
電源を切ると外出先からアクセスできない。スリープ解除設定が必要
最先端モデルには性能で劣る
Claude OpusやGPT-5と比べると推論精度は落ちる。機密データ用と割り切る

まず、Macのスペックに依存する。

メモリ8GBのMacBook Airだと、使えるモデルは小さいサイズに限られる。

大きいモデルを動かすには32GB以上のメモリが必要になってくる。

Mac Studioや上位のMacBook Proでないと、本格的な運用は厳しいかも。

あと、セットアップがChatGPTのように「アカウント作ってすぐ使える」わけじゃない。

ターミナルでの作業が必要だし、モデルのダウンロードにも時間がかかる。

llama.cpp作者本人みたいにスムーズにいくのは、当人がllama.cppを作ったからという前提もある。

「だれかわかる人いたら教えてくださいw」的な場面は、正直あると思います。

でも、Claude Codeがあれば、エラーが出てもコピペして「これ何が問題?」と聞ける。

1人で全部理解する必要はない。

Tailscaleで「私だけのAI」を持つと何が変わるか?

BEFORE — AIを借りる
● 月額$20〜$60のサブスク
● データは相手のサーバーに送信
● トークン制限・利用上限あり
● 機密データは怖くて渡せない
AFTER — AIを持つ
● ランニングコスト0円
● データは私のMacから出ない
● 使い放題・制限なし
● 外出先からもアクセス可能

今の時代、AIを使うには毎月サブスクを払うのが当たり前になっている。

ChatGPT $20。Claude $20。Gemini $20。

全部使ったら月$60以上。

しかもデータはぜんぶ相手のサーバーに行く。

Tailscale + llama.cpp + Gemma 4の組み合わせは、その構造から抜け出す選択肢。

初期投資(Mac)は必要だけど、ランニングコストはゼロ。

データは私の手元から離れない。

使い放題で、制限もない。

しかも外出先からも使える。

「AIを借りる」から「AIを持つ」へ。

この選択肢があることを知っておくだけで、AIとの付き合い方が変わると思ってます。

もちろん、ClaudeやChatGPTの品質には敵わない場面が多い。

でも「機密データだけはローカル」「普段使いはクラウド」の組み合わせなら、プライバシーと利便性の両方を取れる。

まとめ

Tailscale + llama.cpp + Gemma 4で、自宅のMacを「どこからでもアクセスできるプライベートAI」にできる。

データはクラウドに上がらない。通信は暗号化。月額0円。

セットアップにはターミナル作業が必要だけど、Claude Codeに聞きながらやれば初心者でもいけます。

まずはTailscaleを私のMacとiPhoneに入れてみる、というところから始めるのがおすすめ。

それだけで「自宅のパソコンに外からアクセスする」感覚がつかめます。

このページに出てきた言葉

Tailscale
個人利用無料のVPNサービス。複数デバイスを1つのプライベート網でつなぐ。
VPN
仮想の専用ネットワーク。離れた端末を1つのLANのようにつなぐ技術。
llama.cpp
AIモデルをローカルPCで動かすオープンソースソフト。WebUIも内蔵。
Gemma 4
Googleが無料公開しているAIモデル(マルチモーダル・140言語対応)。
ローカルAI
クラウドに送らず手元のパソコン内で動かすAI。データが外に出ない。
GGUF
llama.cppが読める形式のAIモデルファイル。圧縮されてサイズが小さい。
Hugging Face
AIモデルを配布する世界最大のサイト。多くのモデルがここで公開される。
ターミナル
Macの黒い画面でコマンドを打つツール。アプリ「ターミナル」で起動する。
Apple Silicon
Apple自社設計のチップ(M1〜)。AIの推論が高速。
ビルド
ソースコードを実行ファイルに組み立てる作業。cmake 等で行う。
Claude Code
AnthropicがCLIで提供するコーディング特化AI。エラー解決に使える。
P2P接続
ピアツーピア接続。デバイス同士が中央サーバーを介さず直接通信する方式。

参考リンク

・Tailscale公式サイト: https://tailscale.com/

・llama.cpp GitHub: https://github.com/ggml-org/llama.cpp

・Gemma 公式(Google): https://ai.google.dev/gemma

※この記事の内容は執筆時点のものです。AIは進化が速い分野のため、最新の仕様は公式サイトでご確認ください。

-AI活用全般
-, , ,

← 戻る