10 月 2024

2024-10-31

OpenAI 开源 SimpleQA 新基准,专治大模型“胡言乱语”

10 月 31 日消息,当地时间 30 日,OpenAI 宣布,为了衡量语言模型的准确性,将开源一个名为 SimpleQA 的新基准,可衡量语言模型回答简短的事实寻求(fact-seeking)问题的能力。 AI 领域中的一个开放性难题是如何训练模型生成事实正确的回答。当前的语言模型有时会...

进一步了解