#AI

274 件の記事

技術2026年7月6日(月)約6分

Geminiに「Do NOT issue search queries to the google search tool」が出て検索しなくなる原因と対処

Geminiが検索を拒否したり応答が止まったりする原因とされる指示文の正体を、リーク済みシステムプロンプトと突き合わせて確認。テキスト注入とツール未提供の2ケースの見分け方と対処も

Gemini AI LLM トラブルシューティング

技術2026年7月6日(月)約4分

VRAM 4GBのRTX 3050 Ti LaptopでIrodori-TTSの日本語ボイスクローンを試した

Flow MatchingベースのローカルTTS「Irodori-TTS」をWindows + RTX 3050 Ti Laptop（VRAM 4GB）で実行。通常のTTS生成とボイスクローンの音声サンプル、所要時間、MP3のお手本でFFmpegのDLLエラーが出る問題の回避策をまとめた。

AI TTS 音声合成ボイスクローンローカルAI 実験

技術2026年7月5日(日)更新約11分

Claude Codeの会話履歴とWordPress日記からAI文体検出器の学習データを集める

ブログの文体チェックが取りこぼすAI文体を小型エンコーダに学習させる前段。Claude Codeの会話履歴からEditツールの修正前後1,560ペア、WordPress時代の日記600文、公開済み記事622本の一括スキャンで学習データを集めた記録。

AI LLM BERT Claude Code 実験

技術2026年7月2日(木)約11分

AnimaのプロンプトをQwen Max・Claude・Codexに書かせて60枚比較、Qwen同士の相性仮説は外れた

3キャラ合体LoRA(trio_v2)で、同じ日本語指示10シーンを3つのLLMに英語プロンプト化させ、同一シード60枚をM1 MaxのローカルComfyUIで生成して照合した。Qwen-DiT系だから変換もQwenが有利という仮説の検証と、人数ロック付きブリーフで直る崩れ・どう書いても直らない崩れの切り分け。

Qwen Anima Claude Codex LLM AI 画像生成 ComfyUI 実験マルチキャラ

技術2026年7月1日(水)約8分

学習なしでQwenと蔵本モデルで画像生成器を作る、写実は出ないが構図と色はプロンプトで変わった

Un-0に触発された学習なしのtoy generator。QwenにプロンプトをJSON化させ、M1 MaxのNumPyだけで2D蔵本モデルを時間発展させて抽象画像を出す。写実は無理でも構図・色・動きはプロンプトで実際に変わった。実装と出力例、詰まった所まで。

AI 画像生成実験 Qwen Python

技術2026年6月30日(火)更新約7分

重み付き加算の代わりに蔵本モデルの同期で画像を生成するUn-0、ImageNet-64でFID 6.74

Unconventional AI（Naveen Rao）が2026年6月に公開したUn-0は、ニューラルネットの重み付き加算ではなく結合振動子（蔵本モデル）の物理で画像を生成する。仕組みとFID 6.74の実力、GPU比1000倍の省電力がまだ未実証な点を、動かせる同期デモ付きで整理する。

AI 画像生成拡散モデル機械学習ハードウェア

技術2026年6月29日(月)約6分

富士通PHOTONの「最大475倍」は単発高速化ではなくKVキャッシュ削減のマルチクエリー性能

富士通PHOTONの「最大475倍」をarXiv論文のTPMと1.2B評価条件から読む。単発が速いのではなく、品質を少し落としてGPUメモリあたりの生成量を増やし、9クエリー統合でTransformer水準に戻すマルチクエリー前提の数字だった。

AI LLM 推論 Japanese AI

技術2026年6月27日(土)更新約21分

Animaの3キャラ合体LoRAをRTX 5090(Blackwell)で学習、ControlNetなしで密着3人を描き分け

けい・かな・こはるの3キャラを1本のAnima(Qwen-DiT) LoRA(rank256・294枚)に合体し、学習を初めてBlackwell(RTX 5090, sm_120)で走らせた実機ログ。4090から差し替える環境スタック(cu128/torch2.8/SDPA)、最弱キャラがキャプション非対称で他キャラに吸収される原因と直し方、ControlNetなしでトリガーのみ＋ep143で密着3人を描き分けるまで。AnimaやQwen-DiTでマルチキャラLoRAを学習する人向け。

LoRA AI 画像生成 Anima Anima-Base RunPod Qwen ComfyUI 実験マルチキャラ Blackwell

技術2026年6月26日(金)約12分

Radeon 8060S（EVO-X2 / ROCm）でFastWanとWan 14Bを実走 ZLUDAは諦めてTheRockのgfx1151ホイールで動かした

AMD Radeon 8060S（EVO-X2 / Strix Halo / 48GB UMA）でローカルWan動画生成を実走。ZLUDAは公式PyTorchと非互換で全滅し、AMD TheRockのgfx1151ホイールでネイティブROCmが動いた。FastWan 1.3Bは4分、Wan 14B I2Vは13.6分、ボトルネックはVAEデコードと16GB RAMのSegfault。

AI 動画生成 Wan ROCm AMD PyTorch 実験

技術2026年6月25日(木)約8分

ノートPCのRTX 4060 8GBでローカル動画生成はやれるのか FramePack F1実走でVRAMでなくRAMの壁に当たった

RTX 4060 Laptop 8GBでFramePack F1を実走。VRAMは5.75GBしか使わないのに、26GBのモデルが32GB RAMに収まらずページファイルへ溢れ、5秒の生成に56分かかった。ノートPCでローカル動画生成をやるときの本当のボトルネックはVRAMでなくRAM、という実機検証。

AI 動画生成 Wan CUDA 実験

技術2026年6月25日(木)約11分

Krea 2をM1 MaxのComfyUIで試す Turboは3分強で回り、Rawは47分かけて黒画像

2026年6月公開のKrea 2 Raw/TurboをM1 Max 64GBのComfyUIで実機検証。12B DiTはbf16なら載りTurboは約3分半/枚で回るが、fp8拡散はMPSで弾かれ、Raw（52step+CFG3.5）は47分かけてNaNで黒画像になった。速度・メモリ・写実/アニメ/文字の品質、NSFWの通り具合とアンフィルターノードの実際、ライセンスまで。

AI 画像生成 ComfyUI Apple Silicon MPS 実験

技術2026年6月22日(月)約12分

PLaMo・LLM-jp・Sakana Fuguで国産LLMの作り方が三つに割れた

PLaMo 3.0 Prime・Sakana Fugu・LLM-jpの3つの作り方を比較。重みをゼロから作る/全部公開する/作らず司令塔で外部モデルを束ねる違いを、Fuguの仕組みとOpenRouterとの差まで技術的に整理した。

AI LLM Japanese AI