2025年6月、SalesforceがリリースしたAgentforce 3.0は、AIエージェントの運用に本気で取り組む企業にとって“転換点”とも言えるアップデートです。これまでAgentforceは、カスタマーサービスや営業支援領域での対話AIとして導入が進んできましたが、「成果が見えにくい」「品質が担保できない」「スケールさせづらい」といった課題も浮き彫りになっていました。Agentforce 3.0はこれらの制約を根本的に解決し、企業全体でAIエージェントを統制しながら本格展開できる状態へと進化させました。本記事では、Agentforce 3.0で追加された以下の機能を中心に、従来との違い、具体的な設定やユースケース、設計上の注意点までを深堀りして解説します。
- 1. 1. Agentforce 3.0の全体像とリリース背景
- 2. 2. Salesforceが目指す「デジタル労働力」の中核へ
- 3. 3. Command Center ― エージェント統制の司令塔
- 4. 4. Testing Center ― 品質を担保する自動テスト基盤
- 5. 5. MCP正式対応 ― Agentforceの外部連携が“コーディング不要”に
- 6. 6. OpenTelemetry対応 ― 観測性を「AIにも」拡張する
- 7. 7. LLM選択性とセキュリティ設計 ― Claudeの“組織内ホスティング”の強み
- 8. 8. 実務ユースケース集 ― AIエージェントの働き方
- 9. 9. 管理者と開発者、それぞれのメリット
- 10. 10. まとめ
- 11. 11. お問い合わせ
1. Agentforce 3.0の全体像とリリース背景
自律型AIエージェントの急拡大
Agentforceは、「人とAIがチームとして業務を遂行する」ことを目的に設計されたSalesforce標準のAIエージェント基盤です。初期バージョンでは、SlackやService Cloudで動作するチャットエージェントの実装が注目を集め、2024年末の2.0リリースではMuleSoft統合やアクションテンプレート拡充などが進みました。
そして今回の3.0では、利用企業数が全世界8,000社超、直近6か月間のセッション利用数が+233%と急増する中で、以下の課題に対応する設計思想が強く打ち出されました。
課題 | 従来の状況 | Agentforce 3.0での解決策 |
---|---|---|
効果が見えない | エージェントの成果がブラックボックス化 | Command Centerで健全性・貢献度を可視化 |
品質検証が困難 | 本番運用までテスト手段が限定的 | Testing Centerで事前評価+自動テスト |
他システム連携の工数 | API開発が必要、属人的対応 | MCPで外部サービスを即時連携可能に |
トレーシング不可 | モニタリングできずトラブル原因不明 | OpenTelemetry準拠でDatadog/Splunkと統合 |
LLM不透明性 | 応答モデルの選択肢が乏しい | Claude/GPT/Geminiから選択可能に(地域対応) |
2. Salesforceが目指す「デジタル労働力」の中核へ
SalesforceはAgentforceを単なるAIチャットボットとは定義していません。むしろ「AIによる自律的な業務実行エージェント(デジタル労働力)」として、以下のような役割を期待しています。
- 自社の業務知識やプロセスを学習し、継続的に改善・最適化
- 人間の判断を補完するためのリアルタイムな対話と提案
- 異常時は人間にエスカレーションし、協調動作
Agentforce 3.0の構成は、これらの思想を「可視化・検証・統合・制御」のレイヤーで実装するものです。つまり、企業でAIエージェントを“組織資産”として安全に運用できる状態が整備されたといえるでしょう。
3. Command Center ― エージェント統制の司令塔
ブラックボックスからの脱却
Agentforce 3.0の目玉機能とも言える「Command Center」は、組織内のすべてのAIエージェントを可視化・監視・統制するリアルタイムダッシュボードです。これにより、管理者やプロダクトオーナーはエージェントの活動状況を定量的に把握でき、「AIが何をしているのか」「どれほど成果を出しているのか」「どこにリスクがあるのか」を即座に確認可能です。
かつてAIエージェントの「挙動が不透明」「失敗原因が見えない」「成果が説明できない」という問題は多くの企業を導入停滞に追い込みました。Command Centerはこの問題を根本的に解決します。
主な監視カテゴリと機能
指標カテゴリ | 内容 |
---|---|
健全性スコア | レスポンス時間、セッションエラー率、分類精度、空応答率など |
利用状況 | 日時別の利用回数、ユーザー部門別のアクセス状況、ピックアップトピック |
成果貢献度(ROI) | 初回解決率、CSATスコア、エージェント経由処理数など |
エスカレーション率 | 人間への引き継ぎ件数、拒否応答数、失敗セッションの割合 |
トピック別統計 | トピック別成功率/滞留率/再発率(例:「パスワード再設定」など) |
機能的ハイライト
- 異常検知アラート
応答時間が指定しきい値を超えた場合、自動でSlackやEmailに通知。例えば「過去1時間で失敗率10%超」は即アラート。 - 組織別・ユーザー別分析
部署ごとに導入効果を可視化。A事業部では初回解決率90%、B事業部では70%…などROI評価が可能。 - Flowやケースデータとのクロス集計
Agentforceが起点となって起票されたSalesforceレコードと突合し、売上影響や営業成果への寄与度を測定。
実務活用のTips
コールセンターでの活用では、「ピーク時間帯の負荷可視化」が業務シフト設計に直結。IT部門では、各AIトピックの「問い合わせ再発率」を監視し、ナレッジベースの更新や自動化プロセスの改善に繋げる。
4. Testing Center ― 品質を担保する自動テスト基盤
本番展開前に品質を“見える化”
AIエージェントの会話品質は、思い込みや手動テストだけでは不十分です。Agentforce 3.0の「Testing Center」では、対話型エージェントを本番投入前に自動検証/数値評価/改善ポイント抽出できます。
「対話AIはリリースしてみないと分からない」はもはや過去の話。Testing Centerでは、期待される質問(インテント)ごとに分類精度や応答品質をテストし、モデル精度を客観的に評価可能です。
主な機能
機能カテゴリ | 説明 |
---|---|
自動テスト生成 | 入力サンプルから大量の類似質問を自動生成(自然言語のパラフレーズ) |
意図分類の精度測定 | トピックごとのRecall/Precisionを測定、NG例を提示 |
応答評価 | 応答内の指示漏れ・誤った引用・禁則語などを指摘(LLMによる評価) |
回答品質のスナップショット | バージョンA/B比較、改善前後での精度推移をグラフ化 |
評価結果の見方と改善サイクル
意図誤分類率が高いトピックには「分類ガイドの明示化」や「FAQ分岐構造の強化」が推奨されます。応答の「語調・表現の不自然さ」にはトーン調整プロンプトを適用することで対処可能です。精度評価→改善→再テストのループ型開発(AI DevOps)が可能になります。
こんな場面に有効
- 初回リリース時の「お披露目前テスト」
- 定期的なモデル更新時の「性能劣化チェック」
- 導入部門ごとに異なるFAQを扱う「個別最適化テスト」
5. MCP正式対応 ― Agentforceの外部連携が“コーディング不要”に
AIエージェント連携の「USB-C」標準
MCP(Model Context Protocol)は、Salesforceが提唱するAIエージェント専用の通信プロトコルで、Agentforce 3.0で正式サポートされました。最大の特徴は、従来のようにAPI連携のためにApexコードや中間サーバーを構築する必要がなくなり、“プラグアンドプレイ”で外部サービスとAIエージェントを接続できる点です。
これにより、たとえば「Notionのデータを検索して要約」「Stripeで契約者情報を取得」「Boxから契約書を読み出しSlackで共有」などの動作を、コードなし・ノーコードで実現できます。
MCP連携構成図
┌────────────┐
│ Agentforce │
└────┬───────┘
│ [リクエスト]
▼
┌────────────┐
│ MCP Client │(標準搭載)
└────┬───────┘
│ [JSON RPC over HTTPS]
▼
┌────────────────┐
│ MCP Server(外部システム)│
├────────────────┤
│ PayPal / Slack / Notion │
│ Custom App / Heroku etc. │
└────────────────┘
実装パターン3選
- AppExchangeで配布されているMCP Serverを使う
例:PayPal連携テンプレートをインストール → MCP Serverをエージェントに紐付け → 数分で連携完了 - MuleSoft経由で既存APIをMCP対応させる
既存のREST APIがあれば、MuleSoftのMCPラッパーを使って再利用可能 - HerokuやNode.jsで独自MCP Serverを構築
サーバー側でMCPプロトコル(JSON RPC)に準拠したレスポンスを返すだけ
MCP連携でできること(ユースケース例)
- Slack統合
指定チャンネルに自動要約投稿 → リアクションでタスク起票 - PayPal請求
顧客の契約状況を照会し、未払いなら請求アクションをエージェントが代行 - Box契約書処理
最新契約書を取得 → Claudeで要約 → Slackで共有(リーガルボット)
6. OpenTelemetry対応 ― 観測性を「AIにも」拡張する
AIセッションをDatadog/Splunkに可視化
従来、AIエージェントが何をしているのかを監視・追跡することは困難でした。Agentforce 3.0はOpenTelemetry(OTel)準拠でトレースデータを出力可能になり、Datadog・Splunk・NewRelicなどのSIEM/監視ツールと直接統合できます。
つまり、従来のアプリケーション監視と同様に「AIの会話も可観測(observability)なリソース」として扱えるようになったのです。
出力されるトレースデータ例
項目 | 内容例 |
---|---|
traceId | abc-123-xyz (セッション識別子) |
timestamp | 2025-06-28T10:42:00Z |
トピック | 支払い遅延への対応 |
アクション実行 | MCP: PayPalSendInvoice |
LLMモデル | Claude-v3-Hosted |
レスポンス時間 | 1.3s |
フィードバック | エスカレーション(Yes) |
活用の代表例
- セキュリティ監査
AIがアクセスした情報・呼び出した外部サービスの追跡 - パフォーマンス最適化
応答遅延が発生したモデル・トピックを特定 - 障害予兆検知
1時間内の異常トピック急増 → アラートルール発動
運用Tips
- Splunk内でトピック別セッショングラフを作成
- トレースログにCommand CenterのKPIと紐付け → ダッシュボード統合
- トピック「注文確認」が30秒遅延したらSlack通知+自動デグレード対応など、監視×自律動作の自動化も可能
7. LLM選択性とセキュリティ設計 ― Claudeの“組織内ホスティング”の強み
AIモデルを「選び」「守る」構成へ
Agentforce 3.0では、AIモデル(LLM)の柔軟な選択と制御が可能になりました。SalesforceはClaude 3(Anthropic)を自社インフラ内でホストしており、データが社外クラウドに出ていかない構成を実現。さらに、年内にはGoogle Geminiにも正式対応予定です。
企業は自社ポリシーや業務内容に応じて、応答精度・処理時間・セキュリティ要件に最適なモデルを選択し、バックアップモデル(フェイルオーバー)も設定可能になりました。
Claudeホスト構成の特徴
項目 | 内容 |
---|---|
インフラ | SalesforceのHyperforce(多国籍対応) |
モデル | Claude 3 Opus / Sonnet(用途別に最適化) |
通信経路 | Salesforce → 社内モデル(SSL/TLS) |
ログ管理 | Salesforce Trust Layer経由(Einstein Trust対応) |
フェイルオーバー | Claude障害時はGPTへ自動切替(継続応答) |
Claude・GPT・Geminiの比較
モデル | 特徴 | おすすめ用途 |
---|---|---|
Claude 3 | 高い言語理解力、社内ホスティング、信頼性重視 | 法務、医療、顧客対応 |
GPT-4 | 柔軟な応答生成、対応API豊富 | 開発者支援、自由対話 |
Gemini(予定) | データ分析、コード推論、Google Workspace統合 | BI、統合アナリティクス |
応用構成例
- 法務ナレッジBot
Claudeで社内ドキュメント要約、Box/Slackと連携 - 問い合わせトリアージBot
Claudeで分類 → GPTで返信文生成 → Salesforceに記録 - Claude使用時に出典自動挿入(文中にKnowledge記事リンク)も可能で、説明責任が明確に
8. 実務ユースケース集 ― AIエージェントの働き方
Agentforce 3.0の真価は、「どこで・どう使うか」によって発揮されます。ここではSalesforce活用シーン別のユースケースを紹介します。
- カスタマーサポート部門:エスカレーションの自動判断とトリアージ
- 使う機能:Command Center、Testing Center、Claude、Slack通知
- 課題:FAQ回答精度が低く、一次対応に人手が必要だった
- Agentforce活用:分類・回答精度をTesting Centerで事前チューニング → ユーザー満足度80%以上のFAQのみエージェント対応 → Command CenterでCSAT・エスカレーション率を監視
- 結果:初回解決率+25%、平均対応時間−15%、エスカレーション比率−30%
- 法務部門:契約書要約と自動通知フロー
- 使う機能:MCP(Box連携)、Claude、Slack、Flow
- 処理フロー例:MCP経由でBoxからNDAファイルを取得
- Claudeで重要条項を要約(契約期間、支払条件)
- 要約+元ファイルPDFをSlackで法務チャンネルに自動投稿
- チャンネル内「👍」リアクションでFlowをトリガー → 電子承認フローに進む
- 結果:レビュー速度2倍、確認漏れ0、Slack承認ワークフローとの完全統合
- 営業部門:提案書作成支援
- 使う機能:AgentExchangeのテンプレートアクション、Claude、Gemini(予定)
- 特徴:製品・競合・過去受注データを組み合わせて提案書のベースを自動生成
- 成果例:A社では、RFP応答時間が従来2日→6時間に短縮
9. 管理者と開発者、それぞれのメリット
役割 | メリット |
---|---|
管理者(Admin) | ノーコードでAI運用開始可能、Command Centerで統制、設定ミスも見える化 |
開発者(Dev) | MCP・Apex・Flowとの統合開発が可能、CI/CDも視野に入れた本格開発ができる |
セキュリティ担当者 | OpenTelemetryでのログ分析、Trust Layerでのログ管理、Claudeの信頼設計 |
データガバナンス担当 | 出典付き回答、Slackログ/レポート監査、各種フィードバックをData Cloudと連携して分析可 |
10. まとめ
Agentforce 3.0は、もはや“チャットボット”の域を超えた、企業の業務そのものを担う自律型AIエージェント基盤です。Salesforceが本格的に「組織でAIを統制・活用する時代」へと踏み出した象徴的プロダクトと言えるでしょう。
Command Centerでエージェントの健全性を可視化し、
Testing Centerで会話品質を事前に検証し、
MCPで外部サービスと自在に連携し、
Telemetryで全セッションをトレース可能にし、
ClaudeやGeminiといった強力なLLMで、現場で本当に“動く”AIを実現する。
さらに、セキュリティと拡張性の設計思想により、金融・医療・公共などの厳格な業界要件にも対応可能です。
今、あなたの組織に必要なのは、完璧なAIではなく、「信頼して任せられるチームメイトとしてのAI」です。
Agentforceは、その第一歩を支える心強いパートナーになるはずです。
11. お問い合わせ
現在Salesforceを効果的に活用できていない企業様や、これからSalesforceの導入を検討している企業様で、設定や運用、保守に関するサポートが必要な場合は、ぜひお気軽にご相談くださいませ!