Published on2026年1月13日【论文笔记】017 PersonaFeedback - A Large-scale Human-annotated Benchmark for Personalization个性化基准测试LLM论文笔记本文推出了 PersonaFeedback,这是一个包含 8298 条人工标注测试用例的大规模基准测试,通过解耦人格推断与个性化生成,精准评估大语言模型(LLM)在给定显式用户画像时提供个性化响应的能力,并揭示了现有模型在复杂个性化场景下的局限性。