技術 2026年2月3日(火) 約2分 Agent Lightning: MicrosoftのAIエージェント強化学習フレームワーク Microsoftが公開した、ほぼコード変更なしであらゆるAIエージェントを強化学習で最適化できるフレームワーク。LangChain、AutoGen、Claude Agent SDKなど任意のフレームワークに対応。 AI エージェント 強化学習 Python Microsoft
技術 2026年2月2日(月) 約5分 Power Sampling:強化学習なしでLLMの推論能力を引き出す RLで学習させなくても、推論時のサンプリング戦略を変えるだけでLLMの推論性能が向上する。Haitham Bou Ammar氏の記事をもとに、Power Samplingの仕組みと実務的なインパクトを解説する。 LLM 推論 強化学習 サンプリング AI