CohereForAI重磅发布Aya23多语言模型,80亿和350亿参数模型权重全面开放!
Cohere For AI 持续发力,推动多语言 AI 研究进入新阶段
近日,知名 AI 公司 Cohere For AI 宣布推出 Aya 23 多语言模型系列,这是一系列全新的、多语言的、生成式大型语言研究模型 (LLM),涵盖 23 种不同的语言。为了推动多语言 AI 研究,Cohere For AI 将以开放权重的形式发布 80 亿和 350 亿参数的 Aya 23 模型,彰显其致力于让 AI 技术普惠全球的决心。
Aya 23:更深度、更高效的多语言模型
Aya 23 模型系列建立在 Aya 项目的坚实基础之上。Aya 项目是一项开放科学运动,汇集了来自世界各地的 3000 多名合作者,共同构建了迄今为止最大的多语言指令微调数据集和最先进的大规模多语言模型。
之前的 Aya 101 模型涵盖 101 种语言,专注于语言的“广度”。此次发布的 Aya 23 则更侧重于“深度”,通过将高性能的预训练模型与最新发布的 Aya 数据集集合相结合,为 23 种语言提供服务,将最先进的语言建模能力扩展到近一半的世界人口。
打破语言壁垒,让更多人受益于 AI 技术
Aya 23 以及更广泛的 Aya 模型和数据集系列,推动了机器学习社区处理多语言人工智能研究方式的革新。众所周知,大多数高性能语言模型只服务于少数几种语言,世界上许多社区的语言需求仍然无法得到满足。
Aya 23 的发布充分表明了 Cohere For AI 的承诺,即致力于证明更多语言可以被视为一等公民,并发布支持更多研究人员的模型,致力于让全球更多人受益于 AI 技术。
Aya 23 性能优异,资源占用更小
基准测试结果显示,350 亿参数的 Aya 23 在涵盖所有语言的所有基准测试中均取得了最高分,而 80 亿参数的 Aya 23 则展示了同类最佳的多语言性能。
更难能可贵的是,80 亿参数版本的 Aya 23 模型的规模较小,降低了计算资源的需求,更加易于访问,这将有助于全球人工智能研究人员缩小差距,实现尖端技术的民主化。
立即体验 Aya 23,探索多语言 AI 的无限魅力
Aya 23 现已开放,可用于基础研究和安全审计的实验、探索和构建。访问 https://huggingface.co/spaces/CohereForAI/aya-23 即可体验。
访问 https://cohere.com/research/aya 了解更多关于 Aya 23 模型和更广泛的 Aya 计划的信息。