Reka Core:我们的前沿级多模态语言模型

2024-04-16 79 0

我们很高兴推出迄今为止最大、功能最强大的模型 Reka Core。

它是与当今业界领先模型相媲美的前沿级多模态语言模型。在几个月的时间里,Core 在数千个 GPU 上从头开始进行了有效的训练。

性能亮点

Core 在业界公认的关键评估指标上与 OpenAI、Anthropic 和 Google 的模型具有竞争力。考虑到其占地面积和性能,在总拥有成本的基础上,Core 提供了巨大的价值。 Core 的功能及其部署灵活性的结合释放了大量的新用例。

Core 在 MMMU 上与 GPT-4V 相当,在由独立第三方进行的多模态人类评估中优于 Claude-3 Opus,并在视频任务上超越 Gemini Ultra。在语言任务上,Core 在完善的基准上与其他前沿模型具有竞争力。

下表总结了 Core 与当今市场领先型号的比较。

资料来源:瑞卡内部信息、公司网站、公开披露信息、技术报告。 “-”表示由于模型能力而未披露或不相关/适用的数据。

能力

1. 多模态(图像和视频)理解。 Core不仅仅是一个前沿的大语言模型。它对图像、视频和音频具有强大的情境理解能力,是仅有的两种商用综合多模式解决方案之一。
2. 128K 上下文窗口。核心能够摄取并准确地回忆更多的信息。
3. 推理。 Core具有超强的推理能力(包括语言和数学),使其适合需要复杂分析的复杂任务。
4. 编码和代理工作流程。 Core 是顶级代码生成器。其编码能力与其他功能相结合,可以增强代理工作流程。
5. 多语言。 Core 使用 32 种语言的文本数据进行了预训练。它能说流利的英语以及几种亚洲和欧洲语言。
6. 部署灵活性。与我们的其他模型一样,Core 可通过 API、本地或设备上提供,以满足我们的客户和合作伙伴的部署限制。

虽然我们今天发布了第一个版本,但我们预计 Core 以及我们的其他模型在接受进一步训练时能够继续突破性能障碍。请在此处查看我们的技术报告并在此处查看示例输出以获取更多信息。

我们的伙伴

在不到一年的时间里,Reka 成为仅有的两家提供支持全面多模式输入模型的开发商之一。它的三种模型除了文本之外还允许图像、视频和音频输入。这为电子商务、社交媒体、数字内容和视频游戏、医疗保健和机器人等行业提供了更广泛和差异化的客户用例。

我们的各个合作伙伴是履行我们打造造福人类的前沿多式联运模式这一使命的关键部分。我们很自豪能够与Snowflake、Oracle和AI Singapore等领先的全球技术平台和政府组织合作。通过实现多式联运技术的民主化,它们使我们世界各地的客户、组织和个人能够从 Reka 模型中受益并利用 Reka 模型进行构建。

Snowflake 人工智能主管 Baris Gultekin 表示:“我们很高兴与 Reka 合作,通过 Snowflake Cortex 为客户带来 Reka Core 令人印象深刻的行业领先性能。” “Snowflake 和 Reka 处于人工智能创新的前沿,我们很高兴能够提供最先进的人工智能功能,所有这些功能都来自 Snowflake 的内置安全和治理。”

Oracle 云基础设施人工智能和数据管理服务高级副总裁 Greg Pavlik 表示:“Reka 的动态多模式和多语言模型使企业能够从数据中释放更多价值,简化复杂的任务并实现成本效益。”与 Reka 合作,为全球组织带来视频、音频和图像功能。”

“AI Singapore 的目标之一是为东南亚开发高性能的开源模型。我们对 Reka 的新模型感到兴奋,并期待与他们的一系列高性能通用模型密切合作,打造下一代新加坡人工智能产品高级总监 Leslie Teo 表示:“新加坡人工智能产品是新加坡国家研究基金会发起的一项国家计划,旨在巩固国家在人工智能方面的深厚能力。

相关文章

奥运会组织者宣布人工智能在体育领域的计划
Meta将其人工智能聊天机器人塞进Instagram DM
大型科技公司正在掀起一场人工智能招聘热潮
苹果专注于设备人工智能
Web浏览器及其他领域的人工智能创新
马斯克预估人工智能有10%-20%的机会终结人类

发布评论