msgvault - Gmailをローカルにバックアップして高速検索できるツール
msgvaultとは
msgvaultは、Gmailのメールをローカルにバックアップし、高速検索できるツール。pandas(Pythonのデータ分析ライブラリ)の作者であるWes McKinneyが開発した。
公式の説明は「a local-first storage and retrieval engine for slicing, dicing, and querying a lifetime of email and messaging data in milliseconds」。要するに「人生分のメールをミリ秒で検索できるローカルファーストなエンジン」ということ。
なぜこれが必要か
Gmailを使い始めてかれこれ20年近くになる。過去のメールなんてほとんど見返さないんだけど、手紙と違ってデジタル資産は消えたら戻せない。
Googleに依存し続けることへの不安はある。
- 容量制限でメールが受信できなくなる
- サービス終了やポリシー変更で突然消される
- アカウント凍結で全データにアクセス不能
実際、GeminiでNanabananaを使っていたら、こちらが画像生成を頼んでないのに勝手に画像を出力して、それがポリシー違反で凍結されるという話もある。Googleのサービスに人生のデータを預けっぱなしにするリスクは無視できない。
技術スタック
- Go製の単一バイナリ
- SQLiteをメインDB
- DuckDB + Parquetで高速な分析クエリ
- FTS5による全文検索
- Gmail APIでOAuth認証
pandasの作者らしく、データ処理基盤にDuckDB + Parquetを採用しているのが特徴的。
主な機能
バックアップ
msgvault init-db
msgvault add-account you@gmail.com # ブラウザでOAuth認証
msgvault sync-full you@gmail.com # 全件同期
msgvault sync you@gmail.com # 増分同期
初回の全件同期はGmail APIのレート制限で時間がかかるが、以降の増分同期は数秒で終わる。
検索
msgvault search "検索ワード"
msgvault search "from:example@gmail.com has:attachment"
msgvault search "\"完全一致フレーズ\""
Gmailと同様の検索構文(from:, to:, has:attachment, before:, after:など)が使える。
Gmailの検索は最近なんか微妙で、指定した文字列だけ検索したいのに勝手に分割されたり類似語を拾ったりする。msgvaultはSQLite FTS5ベースなので、ダブルクォートで囲めば厳密なフレーズマッチができる。
TUI(ターミナルUI)
msgvault tui
インタラクティブにメールを閲覧・検索できるターミナルUIが付属。
MCPサーバー
msgvault mcp
Claude DesktopなどのMCP対応AIエージェントから、自分のメールアーカイブを検索・分析できる。「去年の○○からのメール探して」みたいな自然言語での操作が可能になる。
Google Workspaceでも使える?
明示的なドキュメントはないが、Gmail API + OAuthを使っているだけなので、おそらく問題ない。ただしWorkspace管理者がAPI利用を制限している場合は別。
バックアップのバックアップ
msgvaultはローカルファーストなので、ローカルのデータが消えたら終わり。皮肉な話だが「Gmailのバックアップ」のバックアップが必要になる。
現実的な選択肢:
- Gmailを消さない - msgvaultの「Staged deletion」機能を使わなければ、Gmail自体がバックアップになる
- rclone + クラウドストレージ -
~/.msgvault/をS3やBackblaze B2に定期同期 - NAS / 別ディスク - rsyncで3-2-1ルール
Gmailから完全削除しない限りは実質三重バックアップになるので、そこまで神経質にならなくていいかもしれない。
現状の注意点
- Pre-alphaソフトウェア(APIや保存形式が変わる可能性あり)
- 現時点ではGmailのみ対応(WhatsApp、iMessageは今後予定)
- 自分でOAuthクレデンシャルを作成する必要がある
所感
「自分のデータは自分で管理したい」という思想に共感する人には良いツール。Gmailの検索に不満がある人、将来的にGmailから脱却したい人は試してみる価値がある。
ただ、Pre-alphaなのでメインのバックアップとして信頼するには時期尚早かもしれない。しばらくは「Gmailを消さずに併用」が無難だろう。