技術 約2分で読めます

OpenRouterの無料モデルとFreeルーターを調べた

OpenRouterの無料モデルがどんな感じか気になって調べた。結論から言うと、試用・学習用途ならありだけど、本番利用は厳しい。

OpenRouterとは

複数のLLMプロバイダー(OpenAI、Anthropic、Google、Meta等)のモデルを統一APIで呼び出せるサービス。料金は各プロバイダーの価格そのままで、マークアップなし。クレジット購入時に手数料がかかる仕組み。

無料モデルの種類

特定モデルを直接指定

モデルIDに:freeサフィックスが付いたものを指定する。

  • meta-llama/llama-4-maverick:free — 400B MoE(17Bアクティブ)、マルチモーダル
  • google/gemini-2.0-flash-exp:free — 100万トークンコンテキスト
  • meta-llama/llama-3.3-70b-instruct:free — GPT-4級の性能
  • qwen/qwen3-coder-480b-a35b-instruct:free — エージェント向けコーディング

他にも多数ある。無料モデル一覧で確認できる。

Freeルーター(openrouter/free

リクエストを投げると、利用可能な無料モデルからランダムに1つが選ばれて推論を行う。画像理解やツール呼び出しなど必要な機能に基づいて自動フィルタリングされる。

  • コンテキスト長: 200,000トークン
  • 入力: テキスト + 画像
  • 出力: テキストのみ
  • 料金: 完全無料

問題点: どのモデルが使われるか分からないので、出力の品質・スタイルがバラバラになる。デバッグも困難。セッション中に同じモデルを使い続ける機能もない。

レート制限

条件制限
クレジット未購入(または$10未満)50リクエスト/日
$10以上のクレジット購入済み1,000リクエスト/日
全ユーザー共通20リクエスト/分

1日50回はかなり少ない。ちょっと試すだけならいいけど、継続的に使うなら$10入れて1,000回/日にするのが現実的。

エージェント利用時の注意

一部の無料モデルはツール呼び出し(function calling)に対応している。

  • qwen/qwen3-coder-480b-a35b-instruct:free
  • openai/gpt-oss-20b:free
  • arcee-ai/trinity-mini:free

ただし、:freeサフィックス付きモデルでツール呼び出しすると「No endpoints found that support tool use」エラーが出る既知のバグがある。無料版だとツール機能が制限されている可能性がある。

無料枠でまともにエージェント運用するのは厳しい。

プライバシーの注意

無料モデルではプロンプトと出力がプロバイダーにログされる。個人情報や機密情報は送らないこと。あくまで試用目的と割り切る必要がある。

参考