技術2026年5月13日(水)約9分VoxCPM2含めOSS TTSが7方向に割れてきたVoxCPM2のtokenizer-free方式を起点に、F5-TTSやCosyVoice2など7モデルの方向の違い、Irodori-TTSやStyle-Bert-VITS2など日本語特化TTSの位置づけ、台本+OpenJTalkで音素を作る学習データの仕組み、ボイスクローン悪用リスクまでを整理した。AITTS音声合成ボイスクローンローカルAIオープンソースファインチューニング
技術2026年4月28日(火)約6分Sarashina2.2-TTSは日本語寄りのゼロショット音声合成モデルSB Intuitionsが公開したsarashina2.2-ttsを調べた。日本語中心のLLMベースTTSで、短い参照音声から話者・話し方を再現し、日英生成やコードスイッチにも対応する。AITTS音声合成LLMボイスクローン
技術2026年3月17日(火)約4分LuxTTS - 1GB VRAMで動くZipVoiceベースの軽量ボイスクローニングZipVoiceアーキテクチャを4ステップに蒸留し、1GB VRAM・150倍リアルタイムの速度でボイスクローンを実現するオープンソースTTS。過去に取り上げたTTSモデルとの比較も含めて整理した。AITTS音声合成OSSボイスクローン
技術2026年2月14日(土)約6分MimikaStudio - 複数TTSエンジンをGUIで束ねるローカルTTSアプリQwen3-TTS、Chatterbox、Kokoro、IndexTTS-2を一つのGUIに統合したローカルファーストのボイスクローン&TTS&オーディオブック作成アプリ。FastAPIバックエンド+Flutter UI+MCPサーバーの構成。AITTS音声合成ボイスクローンFlutter