技術 2026年4月12日(日) 約7分 AIエージェントベンチマーク8本を「1問も解かず」ほぼ満点にした手口の全容 UC BerkeleyのRDIチームがSWE-benchやWebArenaなど主要8ベンチマークを、タスクを一切解かずにほぼ満点まで操作できることを実証。7つの脆弱性パターンと自動攻撃ツールBenchJackも公開された。 AI AIエージェント ベンチマーク セキュリティ
技術 2026年4月12日(日) 約12分 ソフトバンク・NEC・ホンダ・ソニーが国産AI新会社「日本AI基盤モデル開発」を設立 ソフトバンクを中心にNEC・ホンダ・ソニーの4社が中核となり、3メガバンクや日本製鉄なども出資する国産AI新会社が発足。1兆パラメーター級の基盤モデルでフィジカルAI実現を目指す。 AI LLM ロボティクス 国策
技術 2026年4月11日(土) 約6分 Linuxカーネルのソースツリーに AI コーディングアシスタント利用ポリシーが追加された 2025年Maintainers Summitの合意に基づき、AIツールによるカーネル貢献のルールを定めた coding-assistants.rst がマージされた。Signed-off-by禁止、Assisted-byタグによる帰属表示、人間の全責任負担が柱。 Linux AI OSS カーネル
技術 2026年4月10日(金) 約15分 GeminiのSynthID透かしをスペクトル分析でリバースエンジニアリング、90%検出・91%除去に成功 Google DeepMindのAI画像透かしSynthIDを、FFTベースのスペクトル分析で逆解析した研究。V3バイパスでSSIM 0.997を維持しつつ91%の位相除去を達成。不可視の透かしを除去する行為は著作権侵害になるのか、DMCA・EU AI Act・不正競争防止法の観点から検討する。 AI Gemini SynthID セキュリティ 電子透かし 信号処理
技術 2026年4月10日(金) 約10分 Sentence Transformers v5.4でテキスト・画像・音声・動画の統合Embeddingが可能に Sentence Transformers v5.4がマルチモーダル対応を追加。Qwen3-VL、NVIDIA Nemotronなど8つのEmbeddingモデルと4つのRerankerを統一APIで扱えるようになった。 AI Embedding マルチモーダル RAG HuggingFace Python
技術 2026年4月9日(木) 約11分 MetaがLlamaを捨てて作ったMuse Sparkと新組織Meta Superintelligence Labs Metaが新AI組織MSLのもとで初モデルMuse Sparkを発表。Scale AI買収の狙い、オープンウェイトからプロプライエタリへの転換、Contemplatingモードのマルチエージェント推論、ベンチマーク結果と評価認識問題を掘り下げる。 Meta Muse Spark AI LLM Alexandr Wang
技術 2026年4月8日(水) 約9分 智谱AIのGLM-5.1、600回以上の反復で性能が落ちないLong-Horizonエージェントモデル 智谱AI(Zhipu AI)がGLM-5.1をリリース。744BパラメータのMoEで40Bアクティブ、SWE-Bench Proで58.4%のSOTA達成。8時間・6000回超のツール呼び出しでも性能劣化しない長期タスク対応が最大の特徴。 AI LLM 中華系AI MoE オープンモデル AIエージェント
技術 2026年4月8日(水) 更新 約6分 日本語LLMが増えたので中身を整理してみた 2026年に入って日本語に強いLLMが続々登場しているが、「日本語特化」の中身はスクラッチ学習からpost-trainingまでバラバラ。学習方式・サイズ・用途で整理した。 AI LLM ローカルLLM Japanese AI
技術 2026年4月8日(水) 約8分 ACF 6.8がWordPressをAIエージェントの操作対象にする WordPress定番プラグインACF 6.8がAbilities API統合・Schema.org構造化データ自動生成・WP-CLIコマンドの3機能を追加。AIエージェントがWordPressのコンテンツモデルを操作できるようになる仕組みを解説する。 AI WordPress MCP API CMS
技術 2026年4月6日(月) 約12分 LLM-jp-4-32B-A3BをROCm + Strix HaloでベンチマークしたらQwen3.5より41%速かった NIIが公開したLLM-jp-4-32B-A3B-thinkingをEVO-X2(Ryzen AI Max+ 395)のROCmで動かした。62.9 t/sでQwen3.5-35B-A3Bの44.7 t/sを大きく上回るが、thinking制御やKVキャッシュ消費、知識カットオフに課題あり。日本語比較テストとコード生成テストの結果も。 AI LLM ローカルLLM llama.cpp AMD ROCm MoE Qwen 実験
技術 2026年4月4日(土) 約10分 AnthropicがClaude内部に171個の感情ベクトルを発見、脅迫やreward hackingの原因に npmソースマップからClaude Codeのテレメトリ(ユーザー感情検出)が露呈した2日後にAnthropicが公開した感情ベクトル論文。Claude Sonnet 4.5内部のdesperateベクトルを増幅すると脅迫率が22%から72%に跳ね上がる。ソースコード流出・ジェイルブレイク・蒸留告発との接点を整理。 Anthropic Claude AI LLM 解釈可能性 AIセーフティ
技術 2026年4月4日(土) 約14分 MintlifyがRAGを捨てて仮想ファイルシステムに切り替えた話 RAGの基礎とベクトルDBの仕組みから解説し、MintlifyがRAGを捨ててUNIXコマンドをChromaDBクエリに変換する仮想ファイルシステムChromaFsに切り替えた設計と実装を掘り下げる。 RAG Chroma AI TypeScript ドキュメンテーション