技術 2026年2月14日(土) 約6分 MimikaStudio - 複数TTSエンジンをGUIで束ねるローカルTTSアプリ Qwen3-TTS、Chatterbox、Kokoro、IndexTTS-2を一つのGUIに統合したローカルファーストのボイスクローン&TTS&オーディオブック作成アプリ。FastAPIバックエンド+Flutter UI+MCPサーバーの構成。 AI TTS 音声合成 ボイスクローン Flutter
技術 2026年2月12日(木) 約7分 MioTTS - コーデックから自作した軽量LLMベースTTS Aratakoが公開したMioTTS。独自コーデックMioCodecからフルスクラッチ開発された0.1B〜2.6Bの日英対応TTSモデル群。llama.cppやOllamaでそのまま動く設計が特徴的。 AI TTS 音声合成 オープンソース LLM
技術 2026年2月7日(土) 約6分 Qwen3-TTS - pip一発で使えるオープンソース音声合成 Alibaba Qwenチームが公開したQwen3-TTSの技術解説。pip install一発でセットアップ完了、3秒のボイスクローン、自然言語での声デザイン、日本語含む10言語対応。Apache 2.0ライセンス。 AI TTS 音声合成 オープンソース LLM
技術 2026年2月3日(火) 約3分 KugelAudio - 7BパラメータのオープンソースTTS(ComfyUI対応) ヨーロッパ24言語対応、ボイスクローン機能付きのText-to-Speech。ElevenLabsを上回るベンチマーク結果を出したオープンソースモデル。 ComfyUI TTS 音声合成 AI
技術 2026年1月15日(木) 約4分 Pocket TTS - CPUで動く軽量テキスト音声合成 100MパラメータでCPU上でリアルタイムより高速に動作するオープンソースTTS。ボイスクローニングにも対応。 AI 音声合成 TTS オープンソース
技術 2026年1月10日(土) 約5分 AIと喋れる環境を作る(1)音声API調査編 キャラ付けAI+アバター+音声会話を目指して、まずは音声APIを比較調査してみた AI 音声合成 音声認識 TTS STT Gemini OpenAI ChatGPT VOICEVOX Google Cloud