技術 2026年5月13日(水) 約9分 VoxCPM2含めOSS TTSが7方向に割れてきた VoxCPM2のtokenizer-free方式を起点に、F5-TTSやCosyVoice2など7モデルの方向の違い、Irodori-TTSやStyle-Bert-VITS2など日本語特化TTSの位置づけ、台本+OpenJTalkで音素を作る学習データの仕組み、ボイスクローン悪用リスクまでを整理した。 AI TTS 音声合成 ボイスクローン ローカルAI オープンソース ファインチューニング
技術 2026年4月28日(火) 約6分 Sarashina2.2-TTSは日本語寄りのゼロショット音声合成モデル SB Intuitionsが公開したsarashina2.2-ttsを調べた。日本語中心のLLMベースTTSで、短い参照音声から話者・話し方を再現し、日英生成やコードスイッチにも対応する。 AI TTS 音声合成 LLM ボイスクローン
技術 2026年3月17日(火) 約4分 LuxTTS - 1GB VRAMで動くZipVoiceベースの軽量ボイスクローニング ZipVoiceアーキテクチャを4ステップに蒸留し、1GB VRAM・150倍リアルタイムの速度でボイスクローンを実現するオープンソースTTS。過去に取り上げたTTSモデルとの比較も含めて整理した。 AI TTS 音声合成 OSS ボイスクローン
技術 2026年2月14日(土) 約6分 MimikaStudio - 複数TTSエンジンをGUIで束ねるローカルTTSアプリ Qwen3-TTS、Chatterbox、Kokoro、IndexTTS-2を一つのGUIに統合したローカルファーストのボイスクローン&TTS&オーディオブック作成アプリ。FastAPIバックエンド+Flutter UI+MCPサーバーの構成。 AI TTS 音声合成 ボイスクローン Flutter