技術 約7分で読めます

SlackがMCP Server提供開始、GeminiにはAI音楽生成が追加——プラットフォーム各社のAI統合が加速

SlackとGoogle、それぞれ自社プラットフォームにAI機能を深く統合する動きを見せた。どちらも「AIを別のツールとして使う」のではなく「既存の環境にAIを溶け込ませる」アプローチを取っている。

Slack: MCP ServerとリアルタイムサーチAPI

Slackが2月17日、生成AIがSlackを統合的に操作できる2つの新機能を発表した。2025年10月のベータ開始から約4ヶ月でのGA(一般提供)となる。

MCP Server

Slack MCP Serverのエンドポイントは https://mcp.slack.com/mcp(JSON-RPC 2.0)。AIエージェントは以下の4カテゴリの操作が可能になる。

検索・探索

  • メッセージ・ファイル検索(日付・ユーザー・コンテンツタイプでフィルタリング)
  • ユーザー検索(名前の部分一致、メール、ユーザーID)
  • チャネル検索(パブリック・プライベート両対応)

メッセージング

  • あらゆる会話タイプへのメッセージ送信
  • チャネルのメッセージ履歴・スレッド会話のフル取得

Canvas管理

  • リッチなフォーマットドキュメントの作成・更新
  • CanvasのMarkdown形式エクスポート

ユーザー情報

  • 完全なユーザープロフィール取得(カスタムフィールド・ステータス含む)

MCP(Model Context Protocol)はAnthropicが提唱した、AIモデルが外部ツールにアクセスするための標準プロトコルだ。Slackのような主要ビジネスツールが公式にMCPサーバーを提供することで、AIエージェントの実用性が一段階上がった。MCPを使った事例としては、以前Blender MCPGoogle Developer Knowledge APIAndroid MCPサーバーについても書いている。

対応クライアントと認証

接続が確認されているMCPクライアントは以下の通り。

  • Claude.ai(web)/ Claude Desktop / Claude Code
  • Cursor
  • Perplexity

認証はOAuth 2.0(コンフィデンシャルフロー)を使用する。Slack APIの登録済みアプリが必要で、機能ごとに細かくスコープが分かれている。たとえばパブリックチャネル検索は search:read.public、プライベートチャネル検索は search:read.private、DM検索は search:read.im、メッセージ送信は chat:write といった具合だ。プライベートチャネルやDMへのアクセスにはユーザートークン(xoxp-)が必須で、ボットトークンではパブリックチャネルにしかアクセスできない。

なお、現時点ではSSEベースの接続とDynamic Client Registrationには非対応。PKCEサポートは「近日対応予定」とされている。

リアルタイムサーチAPI

外部アプリケーションがSlack内のリアルタイムデータに検索ベースで直接アクセスできるAPIも同時に発表された。これまでWebhookやEvents APIを組み合わせる必要があったデータ取得が、検索APIひとつで完結する。

APIメソッドは2つ。assistant.search.context がメッセージの全文検索、assistant.search.info がワークスペースの検索能力情報を返す。クエリではOR演算子による代替語検索、コンテンツタイプやチャネルタイプのフィルタリング、前後のコンテキストメッセージの取得などが可能。1ページあたり最大20件、レート制限はユーザーレベルで10リクエスト/分。

注意点として、セマンティック検索はSlack AI Search機能を持つワークスペースでのみ利用可能だ。これは通常、有料プランの上位ティアに含まれる機能になる。また、取得データの外部保存・コピーは禁止、AIモデルのトレーニングへの使用も禁止されている。

採用状況

ベータ期間中に50以上のパートナーがエージェントを構築し、RTSクエリとMCPツール呼び出しは25倍に増加したとSlackは発表している。パートナーにはGuru(ナレッジ管理)、Manus(タスク完了)、Perplexity(文書分析)、Moveworks(ITチケット自動解決)、ThoughtSpot(データ可視化)のほか、OpenAIのChatGPTやGoogle Agentspaceも名を連ねている。

OSSの代替実装との違い

GitHubにはコミュニティ製のSlack MCPサーバー実装も存在する。公式版との主な違いは、OSSではブラウザトークンを使った「ステルスモード」接続やユーザーグループ管理、SSEトランスポートに対応している点だ。一方で公式版はCanvas操作に対応し、エンタープライズレベルの監査ログやアクセス制御が備わっている。業務利用なら公式版一択だが、個人的な用途やMarketplace公開要件を回避したい場合はOSS版という選択肢もある。

Google Gemini: Lyria 3ベースの音楽生成

GoogleがGeminiアプリにDeepMindの音楽生成モデル「Lyria 3」を統合した。2月18日にWebブラウザ版で提供開始、モバイルアプリは数日以内に展開予定。

技術的な特徴

Lyria 3は言語エンコーダ(LLM型)と拡散ベースのオーディオデコーダを組み合わせたアーキテクチャで、48kHzステレオ出力に対応する。従来のAI音楽ツールが24kHz前後だったことを考えると、音質面で大きな改善だ。生成されるトラックはイントロ・バース・コーラス・トランジション・アウトロといった音楽的な構造を持つ。

前世代のLyria 2(2024年5月デビュー)からの主な進化は3点。

  1. テキストだけでなく画像・動画もプロンプトとして入力可能になった
  2. 歌詞の自動生成に対応(Lyria 2は手動入力が必要だった)
  3. Vertex AI経由で開発者向けAPIアクセスが追加された

チャットの画面から離れることなく、テキスト・画像・動画をもとに30秒の楽曲を生成できる。スタイル、ボーカル、テンポなどの音楽的要素を自然言語で指定でき、R&Bなど様々なジャンルに対応している。歌詞とカバーアート(「Nano Banana」AIが生成)も自動で付く。旅行の動画をアップロードしてBGMをつけるといった使い方が想定されている。

SynthIDによる電子透かし

生成された楽曲にはすべてSynthIDの電子透かしが埋め込まれる。仕組みとしては、音声の波形をスペクトログラム(周波数と時間の2次元表現)に変換し、人間の聴覚特性を利用して不可聴な透かしを埋め込む。MP3圧縮、再生速度変更、マイクを通じた再録音といった一般的な改変を経ても検出可能。GeminiアプリやSynthID Detectorポータルに音声ファイルをアップロードすれば、Google AIで生成されたかどうかを確認できる。

利用条件と制限

18歳以上のGeminiユーザーが対象で、無料プランでも利用可能(生成回数に制限あり)。対応言語は英語、ドイツ語、スペイン語、フランス語、ヒンディー語、日本語、韓国語、ポルトガル語の8言語。現時点ではベータ版で、30秒のトラック生成に限定されている。

YouTubeクリエイター向けには「Dream Track」機能として展開される。以前のDream Trackは参加アーティストの声のAIクローンに限定されていたが、Lyria 3ではオリジナルのボーカル・楽器生成にシフトし、全世界のクリエイターに向けて拡大する。

競合との比較

項目Lyria 3SunoUdio
トラック長30秒最大2分フル楽曲
入力テキスト・画像・動画テキストテキスト
音質48kHz高品質高品質
コストGeminiサブスクに含まれるフリーミアム + 有料プランフリーミアム + 有料プラン

テキストから音楽を生成するサービスはSunoやUdioなど先行プレイヤーがいるが、フル楽曲が必要ならSuno/Udioが依然として優位。Lyria 3の強みは「Gemini/YouTubeから離れずに生成できる」利便性と、既存のGeminiサブスクに含まれるコスト構造にある。

著作権周りの課題

GoogleはLyria 3の学習データについて「パートナー契約・利用規約・適用法に基づき、GoogleおよびYouTubeが使用権を持つ楽曲」で学習したと説明している。ただし2024年のBillboard報道では、DeepMindが著作権保護されたメジャーレーベルの録音を含むデータセットで学習させた後にアプローチしたという経緯が指摘されており、権利処理の透明性には疑問が残る。Universal Music GroupとYouTubeは2024年10月にAI周りのガードレールを含むライセンス契約を締結済みだが、生成コンテンツと既存楽曲の類似に対する保証は提供されていない。

参照