技術 2026年5月13日(水) 約9分 VoxCPM2含めOSS TTSが7方向に割れてきた VoxCPM2のtokenizer-free方式を起点に、F5-TTSやCosyVoice2など7モデルの方向の違い、Irodori-TTSやStyle-Bert-VITS2など日本語特化TTSの位置づけ、台本+OpenJTalkで音素を作る学習データの仕組み、ボイスクローン悪用リスクまでを整理した。 AI TTS 音声合成 ボイスクローン ローカルAI オープンソース ファインチューニング
技術 2026年5月4日(月) 約12分 ファインチューニングでLLMの著作物丸暗記が再発火するというarXiv論文 GPT-4o、Gemini 2.5 Pro、DeepSeek-V3.1を対象に、要約から全文展開するファインチューニングで著作権書籍の逐語再現が増えると報告したarXiv論文を読んだ。 AI LLM 著作権 OpenAI Gemini DeepSeek ファインチューニング 論文
技術 2026年1月31日(土) 約3分 Gradience: LoRAアダプタのランクが本当に必要か、スペクトル監査で測定するツール LoRAのrank設定が過剰かどうかを特異値分解で定量化するツールGradienceの紹介。Mistral-7Bでの実験ではrank半減で精度が向上した。 LoRA 機械学習 LLM ファインチューニング