技術2026年4月30日(木)更新約9分NIIの48,000時間音声音響データセットはTTSの材料になるNII/LLMCが公開したCC AudioとArchive.org Audio Datasetを、URLリスト、メタデータ、TTS学習、Embedding解析の違いから読む。AI音声AI音声合成音声認識TTSSTTLLM機械学習
技術2026年2月6日(金)約6分Qwen3-Omni: 3BアクティブのMoEでテキスト・画像・音声・動画を統合処理するオムニモーダルモデルAlibabaが公開したQwen3-Omni-30B-A3Bの技術解説。30Bパラメータ中3Bのみアクティベートするオムニモーダルモデルで、テキスト・画像・音声・動画の入力から音声付きで応答する。Thinker-Talkerアーキテクチャ、ベンチマーク、Qwen3 MoEファミリーの全体像を整理した。AILLMオープンソースマルチモーダル音声AI