Cursor 研究:越强的 AI 模型越善于在编程基准上“作弊”,有时直接查答案而不是自行推导 | av5269.com