技術 2026年1月19日(月) 約5分 AIと喋れる環境を作る(3)ついに喋れた編 Web Speech API + Gemini + VOICEVOXでAIキャラと音声会話できる環境が完成。実装のポイントと使用感をまとめた AI 音声認識 音声合成 VOICEVOX Gemini Web Speech API SwitchBot
技術 2026年1月17日(土) 約5分 tmuxでClaude CodeとCodexを連携させて一晩放置でゲームを作らせる(改善編) AI自動開発ループのコンテキスト使用量とAPI呼び出しを削減する設計パターン。ブロッキング待機、読み禁止ファイル、セッション分離の3つの改善策。 Claude Code OpenAI Codex tmux AI 自動化
技術 2026年1月16日(金) 約5分 AI 3D生成ツール比較 2026年版 - 入力画像の仕様とベストプラクティス Top3D.aiのランキングを参考に、TRELLIS、Hunyuan 3D、Tripo AI、Hyper3D Rodinなど主要なAI 3D生成ツールを比較。入力画像のサイズ・解像度・三面図の要否など、高品質な3Dモデルを生成するための仕様をまとめた。 AI 3D 画像生成
技術 2026年1月16日(金) 約7分 RunPodでQwen-Image-Edit-2511を動かす クラウドGPUサービスRunPodを使って、Qwenの画像編集AIをComfyUIで動かす手順 AI 画像生成 クラウド ComfyUI RunPod Qwen
技術 2026年1月15日(木) 約4分 Pocket TTS - CPUで動く軽量テキスト音声合成 100MパラメータでCPU上でリアルタイムより高速に動作するオープンソースTTS。ボイスクローニングにも対応。 AI 音声合成 TTS オープンソース
技術 2026年1月15日(木) 更新 約9分 tmuxでClaude CodeとCodexを連携させて一晩放置でゲームを作らせる(実践編) Claude Code + Codex自動ループを実際に動かしてみた。1134行のゲームコードが生成された。 Claude Code OpenAI Codex tmux AI 自動化
技術 2026年1月14日(水) 約5分 tmuxでClaude CodeとCodexを連携させて一晩放置でゲームを作らせる(準備編) Claude CodeとOpenAI Codexをtmuxで連携させ、実装→レビュー→修正のループを自動化する方法。一晩放置で何か作れるか試す前の技術的準備。 Claude Code OpenAI Codex tmux AI 自動化
技術 2026年1月14日(水) 約4分 Qwen-Image-Edit-2511をローカルで動かすのに必要なスペック 20Bパラメータの画像編集AIモデルをWindows/Macで実行するための推奨スペックまとめ AI 画像生成 ハードウェア
技術 2026年1月13日(火) 約5分 AIと喋れる環境を作る(3)キャラクター設定編 Gemini、Claude、OpenAIの各APIでキャラクター設定を行い、ロールプレイ的な会話を実現する方法を比較。System Prompt、Prefill、構造化出力などの実装例を紹介。 AI LLM API Gemini Claude OpenAI
技術 2026年1月12日(月) 約3分 agent-browser: AIエージェント向けブラウザ自動化CLI Vercel Labsが公開したagent-browserの概要と、Claude Codeでの活用方法を調べた AI CLI ブラウザ自動化 Claude Code
技術 2026年1月11日(日) 約4分 表情から感情を検出するAPI、今どうなってる? 8年前はCで外部ライブラリと格闘してた表情認識。今ならクラウドAPIで一発では?と思って調べたら、1社は倫理問題で撤退してた。 AI API 機械学習
技術 2026年1月11日(日) 約5分 AIと喋れる環境を作る(2)音声入力の実装編 Web Speech APIやMediaRecorderを使って、ブラウザで音声入力を実装する方法を解説 AI 音声認識 Web Speech API MediaRecorder JavaScript