#TTS

6 件の記事

技術 2026年2月14日(土) 約6分

MimikaStudio - 複数TTSエンジンをGUIで束ねるローカルTTSアプリ

Qwen3-TTS、Chatterbox、Kokoro、IndexTTS-2を一つのGUIに統合したローカルファーストのボイスクローン＆TTS＆オーディオブック作成アプリ。FastAPIバックエンド＋Flutter UI＋MCPサーバーの構成。

AI TTS 音声合成ボイスクローン Flutter

技術 2026年2月12日(木) 約7分

MioTTS - コーデックから自作した軽量LLMベースTTS

Aratakoが公開したMioTTS。独自コーデックMioCodecからフルスクラッチ開発された0.1B〜2.6Bの日英対応TTSモデル群。llama.cppやOllamaでそのまま動く設計が特徴的。

AI TTS 音声合成オープンソース LLM

技術 2026年2月7日(土) 約6分

Qwen3-TTS - pip一発で使えるオープンソース音声合成

Alibaba Qwenチームが公開したQwen3-TTSの技術解説。pip install一発でセットアップ完了、3秒のボイスクローン、自然言語での声デザイン、日本語含む10言語対応。Apache 2.0ライセンス。

AI TTS 音声合成オープンソース LLM

技術 2026年2月3日(火) 約3分

KugelAudio - 7BパラメータのオープンソースTTS（ComfyUI対応）

ヨーロッパ24言語対応、ボイスクローン機能付きのText-to-Speech。ElevenLabsを上回るベンチマーク結果を出したオープンソースモデル。

ComfyUI TTS 音声合成 AI

技術 2026年1月15日(木) 約4分

Pocket TTS - CPUで動く軽量テキスト音声合成

100MパラメータでCPU上でリアルタイムより高速に動作するオープンソースTTS。ボイスクローニングにも対応。

AI 音声合成 TTS オープンソース

技術 2026年1月10日(土) 約5分

AIと喋れる環境を作る（1）音声API調査編

キャラ付けAI+アバター+音声会話を目指して、まずは音声APIを比較調査してみた

AI 音声合成音声認識 TTS STT Gemini OpenAI ChatGPT VOICEVOX Google Cloud