#ボイスクローン

4 件の記事

技術2026年5月13日(水)約9分

VoxCPM2含めOSS TTSが7方向に割れてきた

VoxCPM2のtokenizer-free方式を起点に、F5-TTSやCosyVoice2など7モデルの方向の違い、Irodori-TTSやStyle-Bert-VITS2など日本語特化TTSの位置づけ、台本+OpenJTalkで音素を作る学習データの仕組み、ボイスクローン悪用リスクまでを整理した。

AI TTS 音声合成ボイスクローンローカルAI オープンソースファインチューニング

技術2026年4月28日(火)約6分

Sarashina2.2-TTSは日本語寄りのゼロショット音声合成モデル

SB Intuitionsが公開したsarashina2.2-ttsを調べた。日本語中心のLLMベースTTSで、短い参照音声から話者・話し方を再現し、日英生成やコードスイッチにも対応する。

AI TTS 音声合成 LLM ボイスクローン

技術2026年3月17日(火)約4分

LuxTTS - 1GB VRAMで動くZipVoiceベースの軽量ボイスクローニング

ZipVoiceアーキテクチャを4ステップに蒸留し、1GB VRAM・150倍リアルタイムの速度でボイスクローンを実現するオープンソースTTS。過去に取り上げたTTSモデルとの比較も含めて整理した。

AI TTS 音声合成 OSS ボイスクローン

技術2026年2月14日(土)約6分

MimikaStudio - 複数TTSエンジンをGUIで束ねるローカルTTSアプリ

Qwen3-TTS、Chatterbox、Kokoro、IndexTTS-2を一つのGUIに統合したローカルファーストのボイスクローン＆TTS＆オーディオブック作成アプリ。FastAPIバックエンド＋Flutter UI＋MCPサーバーの構成。

AI TTS 音声合成ボイスクローン Flutter