技術 2026年1月19日(月) 約5分 AIと喋れる環境を作る(3)ついに喋れた編 Web Speech API + Gemini + VOICEVOXでAIキャラと音声会話できる環境が完成。実装のポイントと使用感をまとめた AI 音声認識 音声合成 VOICEVOX Gemini Web Speech API SwitchBot
技術 2026年1月13日(火) 約5分 AIと喋れる環境を作る(3)キャラクター設定編 Gemini、Claude、OpenAIの各APIでキャラクター設定を行い、ロールプレイ的な会話を実現する方法を比較。System Prompt、Prefill、構造化出力などの実装例を紹介。 AI LLM API Gemini Claude OpenAI
技術 2026年1月10日(土) 約5分 AIと喋れる環境を作る(1)音声API調査編 キャラ付けAI+アバター+音声会話を目指して、まずは音声APIを比較調査してみた AI 音声合成 音声認識 TTS STT Gemini OpenAI ChatGPT VOICEVOX Google Cloud
技術 2026年1月8日(木) 約3分 Xでカメラアングルの話が出てたので出してみた AI画像生成で使えるカメラアングル・ショットサイズ・カメラエフェクトの対応表。プロンプトと出力結果を並べて確認できる。 AI 画像生成 構図 Nano Banana Pro Gemini
技術 2025年12月30日(火) 約4分 AIと会話を試みる(音声で) voice-chatプロジェクトをベースに、Gemini 2.0 FlashとVOICEVOXで日本語音声チャットを実現する計画を立てる AI Gemini VOICEVOX 音声認識 音声合成
技術 2025年12月28日(日) 約6分 Gemに食わせるための素体画像をFlowで作成する Gemini GemやFlowで体型が安定しない問題を解決するため、体型情報を含んだ素体参照画像を作成する AI Gemini 画像生成 Gem Flow オリジナルキャラクター
技術 2025年12月24日(水) 更新 約8分 Google Flow で画像生成を試してみた - Gemとの比較とプロンプトのコツ Google AI Proで使えるようになったFlowの画像生成機能を検証。He/She問題の発見、自然な英文プロンプトの有効性、Gemとの使い分けなど実践的な知見をまとめた。 AI 画像生成 Google Gemini Gem Flow Imagen Veo
技術 2025年12月23日(火) 約5分 Gemini Gemsの画像参照が突然壊れたので別のAIに祈って直した 昨日まで完璧に動いていたGemini Gemのキャラクター生成が突然崩壊。プロンプト改訂で復活させるまでの記録。 Gemini Claude 生成AI プロンプト トラブルシューティング
技術 2025年12月21日(日) 更新 約11分 AntigravityでNano Banana Proがついに使えるようになった 以前は使えなかったAntigravityのNano Banana Pro(キャラクター一貫性を保った画像生成)が、ついにロールアウトされた AI Gemini 画像生成 Antigravity Nano Banana Pro
技術 2025年12月20日(土) 約13分 Geminiはマジでサイドポニーテールが下手だったので克服した Geminiの画像生成でサイドポニーテールを正しく描かせるためのプロンプト設計と、一周分の参照画像を使ったGem作成の記録 AI Gemini 画像生成 プロンプト Gem オリジナルキャラクター