AI活用全般

Claude Portfolio|$50,000を人間介入ゼロで動かすAIエージェントの「確率加重分析」を業務判断に転用する読み方

この記事の結論

Claude Portfolioは$50,000をClaudeに丸投げした実験で、運用成績ではなく判断フレームが本題です。

核は「確率加重分析」。

アウトカム値と発生確率を掛けて足すだけの式で、採用・SNSネタ選別・サブスク整理にそのまま転用できます。

実験は2026年4月1日に始まったばかり。私は数字より設計図として読む派です。

この記事はAIエージェントを業務判断に持ち込みたい人向け(投資の専門知識は不要、確率や期待値という言葉が分かれば読めます)。

Claude Portfolioという$50,000をClaudeに丸投げする実験が2026年4月1日に始まりました。

投資メディアは「市場に勝ったか負けたか」で書いています。

私の関心はそこじゃない。

面白いのは、Claudeが内部で回している「確率加重分析」というフレームです。

これは投資以外の業務判断に転用できる構造をしています。

この記事はClaude Portfolioを「投資事例」ではなく「意思決定フレームの参考実装」として読み解きます。

出典URLは末尾の参考リンクにまとめました。

そもそもClaude Portfolioって何のこと?

運営はAutopilot Advisers, LLC。

SEC登録の投資顧問で、フロリダ大学ファイナンス助教授が監督に入っています。

Anthropicは関与していません。

完全に第三者の独立実験です。

ポートフォリオ規模は$50,000、開始は2026年4月1日。

Russell 1000の全銘柄をスクリーニングして15銘柄に絞り、94%($47,000)を投資、残り6%をキャッシュで持つ構造です。

人間の承認ゲートはゼロ。

これがちょっと尋常じゃない。

運営の公式アカウントは、Eli Lillyの株を仕込んだタイミングでFDAが体重管理製品を承認し株価が3%上昇したケースを「Claudeが正しかった」と紹介しています。

FDA承認スケジュールを推論して仕込んでいた、という主張。

判断ループの中にAIが座った瞬間です。

なぜ「投資記事」ではなく「業務応用」として読むのか

英文の競合記事はどれも「銘柄リスト」「成績」「儲かるか」で書かれています。

日本語圏の解説もほぼ同じ方向。

ただ、これだと読者は「投資の話か、関係ない」で離脱します。

Aisola Lab読者の主軸はAIエージェントを業務に持ち込みたい層で、株を買いたい層ではない。

記事の本筋を切り替えます。

Claude Portfolioで実装されているのは、判断フレームの参考実装です。

具体的にはこういう構造です。

  • 選択肢を50個まで絞り込む(一次スクリーニング)
  • 賛成側15エージェント、反対側15エージェントで意見を出させる
  • ブル・ベース・ベアの3シナリオを別の15エージェントが見積もる
  • 確率加重分析で期待値を計算して最終判断

これ、投資以外でもそのまま動く設計です。

私の見方では、本題は株価リターンではなくAIが意思決定の実行ループに入ったという事実。

ここに尽きます。

確率加重分析とはどんなフレームか

計算式はシンプルです。

E(X) = Σ(アウトカム値 × 発生確率)

「起こりうる結果」を全部洗い出して、それぞれの「金額・効果」と「起きる確率」を掛けて足すだけ。

要するに期待値の式です。

Claude PortfolioがMicrosoft(MSFT)を買った時の公開根拠は「フォワードPER 9.7倍、ソフトウェアセクター平均より34%割安、期待リターン22.1%と算出して買いシグナル」。

逆にHowmet Aerospace(HWM)を売った時の根拠は「トレーリングPER 63.7倍(航空宇宙同業平均の2倍)、12ヶ月目標株価が4月7日価格より2.3%上乗せのみ、$12億の新規借入、Boeing/Airbus向けforce majeure宣言で売りシグナル」と整理されています。

負の要素を全部期待値に乗せて、上振れの確率と下振れの確率を比較した結果の売り判断。

「なんとなく下がりそう」ではない。

これが言語化された判断ロジックです。

計算式は同じ。

差が出るのは「シナリオを何個立てたか」と「確率の見積もり精度」だけ。

ここがAIの得意領域とそのまま重なります。

業務に転用するとどう使えるか

確率加重分析は投資固有のものではありません。

むしろ業務判断のほうがフィットする場面が多い。

私が思いつく転用先を3つ書きます。

採用面接で候補者を選ぶとき

候補者A・B・Cがいるとして、それぞれを「成功確率」と「成功時の貢献額」「失敗確率」と「失敗時の損失額」に分解します。

Claudeに「3名のレジュメと面接記録から、この4変数を見積もって」と頼めば、一覧で出してきます。

これだけで「面接官の好み」を一旦ロックして、構造で比較できる土台が出る。

最終決定は人間がやればいい。

判断の足場が透明になるのが本質です。

SNSネタの選別

毎週ネタが10個出てきて、書く時間が3本分しかない時。

各ネタに「想定インプレッション」「炎上確率」「執筆工数」を入力して、期待値で並べ替える。

私はこれをやっています。

勘で選ぶより明らかに外しが減る。これだけで十分使う価値ある。

サブスクの整理

月額10本くらいのサブスクがあって、どれを切るか迷う時。

各サブスクに「使用頻度」「代替手段の有無」「解約後の損失額」を入れて期待値を出す。

Claudeに表で書かせるのが速いです。

監督者のインタビューで「タスクを非常に小さな部分に分割し、それを組み合わせるだけで大きく前進できる」という発言があります。

判断を「シナリオ列挙」「確率推定」「金額見積もり」「合算」の4ステップに分解する。

各ステップは小さい。

Claudeはこの粒度なら安定して動く。

これが「業務に乗せやすい」核心です。

初期ポートフォリオ構成(2026年4月時点)

確率加重分析の出力例として、初期構成の一部が公開されています。

あくまで「フレームの実装事例」として見るのが筋。

銘柄推奨ではないです。

銘柄セクター配分判断根拠(運営発表ベース)
Vistra Corp(VST)電力10%AIデータセンター電力需要
Broadcom(AVGO)半導体10%AI推論チップ需要拡大
金関連合計(AU等)コモディティ11%マクロ不確実性ヘッジ
Eli Lilly(LLY)製薬8%FDA承認確率の事前計算
Howmet Aerospace(HWM)航空宇宙4%後に売却→Microsoftへ入替
その他10銘柄非開示計51%
キャッシュ6%機動的な追加投資用

パフォーマンスは2026年4月7日時点でClaude Portfolio +1.60%、S&P500 -3.40%、差は5.0ポイント。

ただ運用開始から1週間程度なので、統計的な意味はほぼない。

序盤のリターンは良く見えるもので、本当のテストは下落局面か相場転換時に来る、と外部解説でも釘が刺されています。

この記事も「成績の話」には踏み込みません。フレームの設計が本題だからです。

賛否の声と業務応用での限界

賛側の代表的な要約はこうです。

Russell 1000の全銘柄をスクリーニングして上位50銘柄に絞り、30エージェントを並列起動して買い15体・売り15体で議論させ、さらに15エージェントがブル・ベース・ベアをモデル化する設計。

マルチエージェント並列の実装例として評価が集まっています。

批判側で踏み込んでいるのは$100,000規模で同種の実験をペーパートレードで行った開発者の指摘で「LLMはハルシネーション、ナンセンス、ルール不遵守を起こしやすい。

LLMを100%の時間、高い賭けや低い賭けの判断に信頼することはできない」とされます。

当該実験の最終リターンは+7.6%、最大ドローダウンは-22.4%。

揺れ幅は人間の判断より大きい。

これは業務応用でも同じ話で、私の判断はこうです。

AIに渡すのは「シナリオ列挙と期待値の計算」まで。

最終決定の責任は人間が持つのが現実解です。

規制面の指摘もあります。

自律AIに金融決定の管理を与えると、解雇も訴訟もできない自律的アクターを既存の規制フレームが想定していない、という問題が新たに生まれる。

業務でAIに判断を委ねる時、責任の所在がぼやける問題は同じ構造で出ます。

ここは設計時に必ず詰めておく必要があります。

業務応用するときの設計指針:3ステップで組む

Claude Portfolioの設計から、業務に持ち込むエッセンスを3ステップに分解します。

各ステップに「具体操作」「期待される結果」「詰まりどころ」を入れました。

ステップ1:選択肢を50個まで広げて10個に絞る

具体操作は、判断対象(候補施策、求人候補、解約候補のサブスクなど)を最低50個並べてから、明らかに条件を満たさないものを機械的に外して10個にする。

Claudeにスプレッドシート形式で出させると速いです。

期待される結果は「私が最初から考えていた3〜5案」より広い母集団から選べる状態。

詰まりどころは50個に到達しないケースで、その場合は条件をわざと緩めて20〜30個まで増やしてから絞り直します。

ステップ2:賛成3エージェント vs 反対3エージェントで議論させる

具体操作は、Claudeに「あなたは案Aの賛成派です。

短所も認めた上で、長所を3つ挙げてください」と役割を与えて3回走らせ、同じことを反対派でも3回やる。

合計6本の議論が並びます。

期待される結果は、私1人で考えると出てこない反対側の論点が3本必ず手元に揃う状態。

詰まりどころは賛成派が反対派と同じ内容を返してくる現象で、その場合は「賛成派は数字に強い分析担当、反対派はリスク管理担当」のように属性を分けると分離します。

ステップ3:3シナリオ×期待値で並べて、最終承認は人間に残す

具体操作は、楽観・標準・悲観の3シナリオごとに「結果額」と「発生確率」を見積もって期待値を出す。

Claudeに表形式で出させて、最後に人間が「この案でいく」を承認する1段を残します。

期待される結果は、判断の根拠が表として残り、後から「なぜこの案を選んだか」を5分で説明できる状態。

詰まりどころは確率の見積もりが甘くなる点で、その場合は過去の類似ケース3件をClaudeに調べさせて確率の校正に使います。

設計要素Claude Portfolioでの実装業務応用の例
初期スクリーニングRussell 1000 → 50銘柄候補50案 → 上位10案に絞る
賛否並列議論買い15体 vs 売り15体賛成3エージェント vs 反対3エージェント
シナリオ分岐ブル・ベース・ベア楽観・標準・悲観の3シナリオ
期待値計算確率加重で銘柄選定同じ式で施策選定
承認ゲートゼロ(完全自律)1段だけ人間の承認を残す

私なら承認ゲートを1段だけ残します。

Claude Portfolioが完全自律でやっているのは「実験」だから。

業務でやるなら、責任所在を考えて半委任にしておく方が現実的です。

料金とアクセス(参考)

Claude本体を業務判断フレームに使う場合、必要なプランの目安です。

プラン月額用途
Claude Pro$20(年払い$17)個人の意思決定補助、十分
Claude Max(5倍)$100毎日大量にエージェント並走させたい層
Claude Max(20倍)$200業務システムに組み込む段階

私の判断では、個人で確率加重分析の足場として使うならProで足ります。

Maxは「30エージェント並列」を真似したくなったら検討する段階です。

FAQ

Q. Claude Portfolioに個人の資金を預けられますか?

預けられません。

これは運営者が自社資金$50,000を運用している実験プロジェクトで、第三者向けの預け先ではない。

Autopilotプラットフォーム(marketplace.joinautopilot.com)では別の運用商品があるが、Claude Portfolio自体は観察対象として公開されている形です。

Q. AnthropicがClaude Portfolioを運営していますか?

運営していません。

Anthropicは無関係(非公認・非関与)。

運営はAutopilot Advisers, LLC(フロリダ大学ファイナンス助教授の監督下)です。

Q. 確率加重分析を業務でやるにはClaudeじゃないとダメですか?

計算式自体(E(X) = Σ アウトカム値 × 確率)は数学なので、ChatGPTでもGeminiでも実行できる。

Claudeが選ばれているのはマルチエージェント並列とニュース解釈の精度が現状高いから、という外部評価が中心です。

フレーム自体はモデル依存ではない。

Q. パフォーマンス数字(+1.60%)は信用していいですか?

2026年4月7日時点のスナップショット。

運用開始から約1週間で、統計的な再現性の根拠にはならないので、判断材料として使うのは早計です。

「本当のテストは下落局面に来る」と外部解説でも書かれている通り、数字を追うより設計を見るのが正しい読み方。

Q. AI判断に法的責任の問題はありませんか?

あります。

自律AIに判断を委ねた場合の責任所在は既存の規制フレームでは未整備。

業務に持ち込む時は「最終承認は人間」を1段必ず残す設計が現実解です。

完全自律はリスクが大きすぎる。

このページに出てきた言葉

確率加重分析
起こりうる結果ごとに「金額×発生確率」を出して全部足す計算。期待値の式そのもの
エージェント
AIに役割を与えて自動で動かす単位。賛成派・反対派などに分けて並列で走らせる
ブル・ベース・ベア
投資シナリオの3区分。ブル=楽観、ベース=標準、ベア=悲観
SEC登録の投資顧問
アメリカの証券取引委員会に登録された投資アドバイザー
Russell 1000
アメリカの時価総額上位約1,000銘柄を集めた株価指数
FDA
アメリカ食品医薬品局。新薬や医療機器の承認を出す政府機関
承認ゲート
人間が「これでGO」と判断して通すチェックポイント
フォワードPER
来期予想の利益で計算した株価収益率。低いほど割安と読まれる
ハルシネーション
AIが事実でない内容をもっともらしく出力する現象
ペーパートレード
実資金を入れずに口座シミュレーションで売買を再現する練習形式
ドローダウン
ピークから底までの最大下落幅

関連リンク(一次ソース)

※この記事の内容は執筆時点のものです。AIは進化が速い分野のため、最新の仕様は公式サイトでご確認ください。

-AI活用全般
-,

← 戻る