Anthropic重金投入，下一代AI基准测试更关注安全和社会影响

AI 评估体系迎来革新,Anthropic 引领未来方向
近期,知名 AI 公司 Anthropic 宣布斥资推动 AI 评估体系的革新。该公司计划资助开发新的基准测试,用于更全面地评估 AI 模型（包括其自研的生成式模型 Claude）的性能和影响。
Anthropic 指出,现有的 AI 基准测试存在着明显的局限性。首先,它们难以准确反映真实用户的使用情况,导致评估结果与实际应用脱节。其次,部分测试的评估指标已经落后于 AI 技术的快速发展,尤其是在生成式 AI 时代,传统的评估方法难以有效衡量模型的真实能力。
聚焦安全和社会影响,构建更全面、更可靠的 AI 评估体系
Anthropic 计划构建的 AI 评估体系将更加注重模型的安全性和社会影响。该公司呼吁开发新的测试方法,用于评估 AI 模型在以下方面的能力和潜在风险：

发动网络攻击的风险
被滥用于增强大规模杀伤性武器（如核武器）的风险
操纵或欺骗人类（如深度伪造和虚假信息传播）的风险

此外,Anthropic 还希望新的基准测试能够评估 AI 模型在科学研究、多语言对话、减少偏见和自我审查有害内容等方面的潜力。
打破传统,构建开放平台,推动 AI 评估走向标准化
为实现这一目标,Anthropic 计划创建一个开放平台,让不同领域的专家都能参与 AI 评估体系的开发和完善。该公司承诺将为该计划提供充足的资金和人力支持,并可能收购或扩展具有潜力的项目。
Anthropic 希望通过自身的努力,推动建立行业标准,使全面、安全、可靠的 AI 评估体系成为现实,从而引导 AI 技术朝着更安全、更有益的方向发展。
Anthropic 的努力值得肯定,但其商业动机也引发关注
Anthropic 斥巨资构建新一代 AI 基准测试的努力值得肯定,但其背后潜在的商业动机也引发了一些关注。该公司明确表示,希望新的评估体系能够与其自身制定的 AI 安全分类标准保持一致。这种做法是否会限制其他研究者的参与,是否会导致 AI 安全定义的单一化,这些问题值得深思。
此外,Anthropic 对“灾难性”和“欺骗性” AI 风险的强调也引发了一些争议。许多专家认为,目前没有证据表明 AI 会在短期内发展出超越人类的智能,并对人类构成生存威胁。他们担心,过分渲染 AI 威胁论会分散人们对现实 AI 问题的关注,例如 AI 模型的幻觉问题。
总而言之,Anthropic 为解决 AI 评估问题做出了积极贡献,但其背后的商业动机和对 AI 风险的看法也需要我们保持警惕。相信随着更多研究者和机构的参与,AI 评估体系将不断完善,为 AI 技术的健康发展保驾护航。

Author: hory-ai horysk

Link: https://www.hory-ai.com/2024/12/20/31/2024-12-20/Anthropic重金投入，下一代AI基准测试更关注安全和社会影响/