AI活用全般

Claude Portfolio|$50,000を人間介入ゼロで動かすAIエージェントの「確率加重分析」を業務判断に転用する読み方

この記事の要点

  • Claude Portfolioは$50,000の実資金をClaudeに丸投げした実験。注目すべきは運用成績ではなく、判断フレーム。
  • 核は「確率加重分析」。アウトカム値×発生確率を全部足して期待値を出すだけの話。
  • このフレームは投資以外の業務判断に転用できる。採用・SNSネタ選別・サブスク削減で使える。
  • 実験は2026年4月1日開始。期間が短く、運用成績そのものは判断材料にしない。

Claude Portfolioという$50,000をClaudeに丸投げする実験が2026年4月1日に始まった。
投資メディアは「市場に勝ったか負けたか」で書いている。
私の関心はそこじゃない。

面白いのは、
Claudeが内部で回している「確率加重分析」というフレーム。
これは投資以外の業務判断に転用できる構造をしている。

この記事はClaude Portfolioを「投資事例」ではなく「意思決定フレームの参考実装」として読み解く。
引用は一次ソースから取る。
出典URLは本文中に置く。

Claude Portfolioとは何か

運営はAutopilot Advisers, LLC。
SEC登録の投資顧問で、
フロリダ大学ファイナンス助教授のDr. Alejandro Lopez-Liraが監督に入っている。
Anthropicは関与していない。
完全に第三者の独立実験です。

ポートフォリオ規模は$50,000、
開始は2026年4月1日。
Russell 1000の全銘柄をスクリーニングして15銘柄に絞り、
94%($47,000)を投資、
残り6%をキャッシュで持つ。
人間の承認ゲートはゼロ。
これがちょっと尋常じゃない。

運営が公式Xで明言しているのは以下:

Claudeが正しかった。
昨日エージェントがEli Lilly $LLYに投資したのは、
口腔投与Ozempicへの潜在的FDA承認が迫っているとの判断から。
本日FDAがFoundayo体重管理製品を承認、
$500億の新市場を開放。
株価は3%上昇。

— The Claude Portfolio公式(出典: @theaiportfolios

FDA承認スケジュールを推論して仕込んでいた、
という主張。
これが本当なら、
ニュース解釈と確率推論を組み合わせて意思決定までやっている。
判断ループの中にAIが座った瞬間です。

なぜ「投資記事」ではなく「業務応用」として読むのか

競合の英文記事(Motley Fool、
DEV Community、
Finbold)はどれも「銘柄リスト」「成績」「儲かるか」で書いている。
日本語圏の解説もほぼ同じ方向。

ただ、
これだと読者は「投資の話か、
関係ない」で離脱する。
Aisola Lab読者の主軸はAIエージェントを業務に持ち込みたい層であって、
株を買いたい層ではない。

記事の本筋を切り替える。
Claude Portfolioで実装されているのは、
判断フレームの参考実装です。
具体的にはこういう構造:

  • 選択肢を50個まで絞り込む(一次スクリーニング)
  • 賛成側15エージェント、反対側15エージェントで意見を出させる
  • ブル・ベース・ベアの3シナリオを別の15エージェントが見積もる
  • 確率加重分析で期待値を計算して最終判断

これ、投資以外でもそのまま動く設計です。

Aamer Mihaysi氏(DEV Community)の書き方が一番しっくりくる:

この実験で真に注目すべきは株価リターンではなく、
AIが意思決定の実行ループに入ったという事実だ。

— Aamer Mihaysi(出典: DEV Community

株価リターンではない。実行ループに入った事実が本題。これに尽きます。

確率加重分析とはどんなフレームか

計算式はシンプルです。

E(X) = Σ(アウトカム値 × 発生確率)

「起こりうる結果」を全部洗い出して、
それぞれの「金額・効果」と「起きる確率」を掛けて足すだけ。
要するに期待値の式です。

Claude PortfolioがMicrosoft(MSFT)を買った時の判断はこう開示されている:

フォワードPER 20倍、
ソフトウェアセクター平均より34%割安。
期待リターン22.1%と算出 → 買いシグナル。

(出典: Finbold

逆にHowmet Aerospace(HWM)を売った時の判断はこう。

トレーリングPER 63.7倍(航空宇宙同業平均の2倍)、
12ヶ月目標株価が4月7日価格より2.3%上乗せのみ、
$12億の新規借入、
Boeing/Airbus向けforce majeure宣言 → 売りシグナル。

(出典: Finbold

負の要素を全部期待値に乗せて、
上振れの確率と下振れの確率を比較した結果としての売り判断。
「なんとなく下がりそう」ではない。
これが言語化された判断ロジックです。

Towards Data Scienceの一文がフレームの本質をまとめている:

An expected value calculation is only as good as its structural completeness and the accuracy of its inputs.

(期待値計算の精度は、構造の完全性と入力の正確さにしか依存しない)
出典: Towards Data Science

計算式は同じ。
差が出るのは「シナリオを何個立てたか」と「確率の見積もり精度」だけ。
ここがAIの得意領域とそのまま重なる。

業務に転用するとどう使えるか

確率加重分析は投資固有のものではない。
むしろ業務判断のほうがフィットする場面が多いです。
私が思いつく転用先を3つ書きます。

採用面接で候補者を選ぶとき

候補者A・B・Cがいるとして、
それぞれを「成功確率」と「成功時の貢献額」「失敗確率」と「失敗時の損失額」に分解する。
Claudeに「3名のレジュメと面接記録から、
この4変数を見積もって」と頼めば、
一覧で出してくれます。

これだけで「面接官の好み」を一旦ロックして、
構造で比較できる土台が出る。
最終決定は人間がやればいい。
判断の足場が透明になるのが本質です。

SNSネタの選別

毎週ネタが10個出てきて、
書く時間が3本分しかない時。
各ネタに「想定インプレッション」「炎上確率」「執筆工数」を入力して、
期待値で並べ替える。
私はこれをやってます。

勘で選ぶより明らかに外しが減る。これだけで十分使う価値ある。

サブスクの整理

月額10本くらいのサブスクがあって、
どれを切るか迷う時。
各サブスクに「使用頻度」「代替手段の有無」「解約後の損失額」を入れて期待値を出す。
Claudeに表で書かせるのが速いです。

Dr. Lopez-Lira(Claude Portfolio監督者)のインタビュー発言が刺さります:

タスクを非常に小さな部分に分割し、それを組み合わせるだけで大きく前進できる。

(出典: AI Street インタビュー

判断を「シナリオ列挙」「確率推定」「金額見積もり」「合算」の4ステップに分解する。
各ステップは小さい。
Claudeはこの粒度なら安定して動く。
これが「業務に乗せやすい」核心です。

初期ポートフォリオ構成(2026年4月時点)

確率加重分析の出力例として、
初期構成の一部が公開されている。
あくまで「フレームの実装事例」として見るのが筋。
銘柄推奨ではないです。

銘柄セクター配分判断根拠(運営発表ベース)
Vistra Corp(VST)電力10%AIデータセンター電力需要
Broadcom(AVGO)半導体10%AI推論チップ需要拡大
金関連合計(AU等)コモディティ11%マクロ不確実性ヘッジ
Eli Lilly(LLY)製薬8%FDA承認確率の事前計算
Howmet Aerospace(HWM)航空宇宙4%後に売却→Microsoftへ入替
その他10銘柄非開示計51%
キャッシュ6%機動的な追加投資用

パフォーマンスは2026年4月7日時点でClaude Portfolio +1.60%、
S&P500 -3.40%、
差は5.0ポイント。
ただ運用開始から1週間程度なので、
統計的な意味はほぼない。
Aamer Mihaysi氏も次のように釘を刺しています:

序盤のリターンは良く見える — いつもそうだ、
うまくいかなくなるまでは。
本当のテストは下落局面か相場転換時に来る。
歴史的パターンが崩れたとき、
エージェントには経験豊富なポートフォリオマネージャーが持つ制度的記憶がない。

(出典: DEV Community

この記事も「成績の話」には踏み込まない。フレームの設計が本題だからです。

賛否の声と限界

賛側で一番踏み込んでいるのはPoonam Soni氏(@CodeByPoonam)。
AIエンジニアでフォロワーの多いコンテンツ発信者です。

誰かがClaudeに$50,000のポートフォリオを管理させた。
人間の介入はゼロ。
仕組みはこうだ: Russell 1000の全銘柄をスクリーニング。
上位50銘柄が次のラウンドへ。
30エージェントが並列起動: 15は買いを主張、
15は売りを主張。
さらに15エージェントがブル・ベース・ベアをモデル化。

(出典: @CodeByPoonam

批判側はJake Nesler氏(Medium)。
同氏は$100,000規模で同種の実験をペーパートレードで行った人物です。

LLMはハルシネーション、
ナンセンス、
ルール不遵守を起こしやすい。
LLMを100%の時間、
高い賭けや低い賭けの判断に信頼することはできない。

(出典: Jake Nesler / Medium

同氏の実験は最終的に+7.6%で着地したものの、
最大ドローダウンは-22.4%。
揺れ幅は人間の判断より大きい。
これは業務応用でも同じ話で、
私の判断はこうです。
AIに渡すのは「シナリオ列挙と期待値の計算」まで。
最終決定の責任は人間が持つのが現実解。

規制面の指摘も拾っておきます:

AIエージェントに金融決定の直接的な管理を与えると、
新たなカテゴリの責任が生まれる。
既存の規制フレームワークは、
解雇も訴訟も伝統的な意味で責任を問うこともできない自律的アクターを想定して作られていない。

(出典: DEV Community

業務でAIに判断を委ねる時、
責任の所在がぼやける問題は同じ構造で出る。
ここは設計時に必ず詰めておく必要があります。

業務応用するときの設計指針

Claude Portfolioの設計から、
業務に持ち込めるエッセンスを抽出するとこうなる。

設計要素Claude Portfolioでの実装業務応用の例
初期スクリーニングRussell 1000 → 50銘柄候補50案 → 上位10案に絞る
賛否並列議論買い15体 vs 売り15体賛成3エージェント vs 反対3エージェント
シナリオ分岐ブル・ベース・ベア楽観・標準・悲観の3シナリオ
期待値計算確率加重で銘柄選定同じ式で施策選定
承認ゲートゼロ(完全自律)1段だけ人間の承認を残す

個人的には承認ゲートを1段だけ残すのが現実解だと感じています。
Claude Portfolioが完全自律でやっているのは「実験」だから。
業務でやるなら、
責任所在を考えて半委任にしておく。

料金とアクセス(参考)

Claude本体を業務判断フレームに使う場合、必要なプランの目安。

プラン月額用途
Claude Pro$20(年払い$17)個人の意思決定補助、十分
Claude Max(5倍)$100毎日大量にエージェント並走させたい層
Claude Max(20倍)$200業務システムに組み込む段階

個人で確率加重分析の足場として使うならProで足りる。
Maxは「30エージェント並列」を真似したくなったら検討する段階です。

FAQ

Q. Claude Portfolioに個人の資金を預けられますか?

預けられません。
これはThe AI Portfoliosが自社資金$50,000を運用している実験プロジェクトで、
第三者向けの預け先ではない。
Autopilotプラットフォーム(marketplace.joinautopilot.com)では別の運用商品があるが、
Claude Portfolio自体は観察対象として公開されている形です。

Q. AnthropicがClaude Portfolioを運営していますか?

運営していません。
Anthropicは無関係(非公認・非関与)。
運営はAutopilot Advisers, LLC(フロリダ大学Dr. Lopez-Lira監督下)です。

Q. 確率加重分析を業務でやるにはClaudeじゃないとダメですか?

計算式自体(E(X) = Σ アウトカム値 × 確率)は数学なので、
ChatGPTでもGeminiでも実行できる。
Claudeが選ばれているのはマルチエージェント並列とニュース解釈の精度が現状高いから、
というのが各所の評価です。
フレーム自体はモデル依存ではない。

Q. パフォーマンス数字(+1.60%)は信用していいですか?

2026年4月7日時点のスナップショット。
運用開始から約1週間。
統計的な再現性の根拠にはならないので、
判断材料として使うのは早計です。
Aamer Mihaysi氏も「本当のテストは下落局面に来る」と書いている通り、
数字を追うより設計を見るのが正しい読み方。

Q. AI判断に法的責任の問題はありませんか?

あります。
DEV Community記事が指摘している通り、
自律AIに判断を委ねた場合の責任所在は既存の規制フレームでは未整備。
業務に持ち込む時は「最終承認は人間」を1段必ず残す設計が現実解です。
完全自律はリスクが大きすぎる。

関連リンク(一次ソース)

※この記事の内容は執筆時点のものです。AIは進化が速い分野のため、最新の仕様は公式サイトでご確認ください。

-AI活用全般
-,

← 戻る