AI 正在重塑各行各业,重新定义客户体验,并改变企业创新、运营和竞争的方式。尽管大部分关注点在前沿模型上,但一项根本的挑战在于数据 — 如何存储和检索数据并让数据为 AI 应用所用。AI 驱动软件的民主化依赖于在正确的抽象层上进行开发,但目前,对于大多数组织来说,大规模创建有用的实时 AI 应用仍然不可行。
挑战不仅在于复杂性,还在于信任。AI 模型是概率性的,这意味着其输出不具有确定性和可预测性。这在当今聊天机器人的幻觉问题中显而易见,并且随着 AI 智能载体的兴起,AI 系统可以自主做出决策,这一点变得更加重要。开发团队需要能够控制、塑造和调整生成的输出,以符合其目标并确保准确性。
AI 驱动的搜索和检索是一项强大的工具,可以从特定来源提取相关的上下文数据,增强 AI 模型,以生成可靠和准确的响应或采取负责任和安全的行动,这在著名的检索增强生成(RAG)方法中得到了体现。在 AI 驱动的检索中,核心是嵌入生成和重新排序 — 这两个关键的 AI 组件能够捕捉数据的语义含义,并评估问询和结果的相关性。我们认为将生成、重新排序以及 AI 驱动的搜索嵌入数据库层可简化堆栈,从而为 AI 应用奠定更可靠的基础。通过将更多智能引入数据库,我们帮助企业减少幻觉,提高可信度,并在 AI 扩展上释放 AI 的全部潜力。
最具影响力的应用需要一个灵活、智能且可扩展的数据基础。因此,我们很高兴地宣布收购了 Voyage AI,这是一家在嵌入和重新排序模型领域的领导者,通过 AI 驱动的搜索和检索显著提高了准确性。此举不仅旨在增加 AI 功能,更是关乎为 AI 时代重新定义数据库。
为什么这很重要:AI 的未来构建在数据更高的相关性和准确性之上
AI 是概率性的 — 这不像传统软件那样具有预定义的规则和逻辑。相反,它会根据 AI 模型的训练方式和检索到的数据生成响应或采取行动。然而,由于该技术的概率性,AI 可能会出现幻觉。幻觉是检索不佳或不精确的直接后果 — 当 AI 无法访问正确的数据时,它会生成看似合理但不正确的信息。这是 AI 采用的一项关键障碍,尤其是在企业中以及在准确性不可妥协的关键任务用例中。
这使得检索最相关的数据对于 AI 应用程序提供高质量、上下文准确的结果至关重要。如今,开发者依赖于拼凑而成的独立组件来构建 AI 驱动的应用程序。这些组件的次优选择,例如嵌入模型,可能会导致低相关性的数据检索和低质量的生成输出。这种分散的方法对开发者来说既复杂、昂贵、效率低下,又繁琐。
借助 Voyage AI,MongoDB 通过使 AI 驱动的搜索和检索成为数据库的原生功能,解决了这一挑战。开发者无需实施变通方法或管理单独的系统,而是可以从实时操作数据中生成高质量的嵌入,存储向量,执行语义搜索,并优化结果——所有这些都在 MongoDB 中完成。这消除了复杂性,并提供了更高的准确性、更低的延迟和简化的开发者体验。

Voyage AI 为 MongoDB 带来的优势
Voyage AI 已组建了一支以斯坦福大学、麻省理工学院、加州大学伯克利分校和普林斯顿大学为基础的世界级 AI 研究团队,并迅速成为高精度 AI 检索领域的领导者。他们的技术已经被一些最先进的 AI 初创企业所信任,包括 Anthropic、LangChain、Harvey 和 Replit。
值得注意的是,Voyage AI 的嵌入模型是 Hugging Face 社区中评分最高的零样本模型。Voyage AI 的模型旨在通过以下方式提高生成输出的质量:
-
通过创建更好地捕捉文本、图像、PDF 和结构化数据含义的嵌入来增强向量搜索。
-
通过先进的重新排序模型提高检索准确性,以优化 AI 驱动式应用的搜索结果。
-
通过使用针对金融服务、医疗保健、法律等不同行业以及代码生成等使用案例进行优化的微调模型,启用特定领域的 AI。
通过将 Voyage AI 的检索功能集成到 MongoDB 中,我们正在帮助组织更轻松地构建更准确、更可靠的 AI 应用,而不会增加不必要的复杂性。
如何将 Voyage AI 集成到 MongoDB 中
我们将 Voyage AI 与 MongoDB 的集成分为三个阶段。在第一阶段,Voyage AI 的文本嵌入、多模态嵌入和重排序模型将继续通过 Voyage AI 的现有 API 以及 AWS 和 Azure 云市场广泛提供,确保开发者可以继续使用其先进的嵌入和重新排序功能。我们还将投资于平台的可扩展性和企业级就绪能力,以支持 Voyage AI 模型的更广泛采用。
接下来,我们会将 Voyage AI 的功能无缝嵌入到 MongoDB Atlas 中,首先推出用于 Vector Search 的自动嵌入服务,该服务将自动处理嵌入生成。然后将进行原生重新排序,使开发人员能够立即提高检索准确性。我们还计划扩展特定领域的 AI 功能,以更好地支持不同行业(例如,金融服务、法律等)或用例(例如,代码生成)。
最后,我们将通过增强的多模态功能推进 AI 驱动的检索,实现文本、图像和视频的无缝检索和排序。我们还计划引入指令调整模型,允许开发者使用简单的提示而不是复杂的微调来优化搜索行为。这将通过在 MongoDB Atlas 中嵌入生命周期管理来实现补充,确保 AI 应用的持续更新和实时优化。
这对开发者和企业意味着什么?
AI 驱动的应用需要的不仅仅是一个存储、处理和持久化数据的数据库,而是还需要一个能够主动提高检索准确性、无缝扩展并消除操作摩擦的数据库。借助 Voyage AI,MongoDB 重新定义了支撑任务关键型 AI 驱动的应用的数据库要求。
开发者将不再需要管理外部嵌入 API、独立运行的实例向量存储或复杂的搜索管道。AI 检索将内建到数据库中,实现与传统查询一样的无缝语义搜索、向量检索和排序。
对于企业来说,这意味着能够更加信心十足地扩展 AI 应用,并加快价值实现速度。通过在大规模扩展交付高质量的结果,企业可以将 AI 无缝集成到其最关键的用例中,确保可靠性、性能和实际影响。
展望未来:接下来会发生什么
这仅仅是个开始。我们的愿景是将 MongoDB 打造成最强大且直观的数据库,适用于现代 AI 驱动的应用程序。
-
Voyage AI 的模型将很快在 MongoDB Atlas 中原生可用。
-
我们将继续提升 MongoDB 的 AI 检索能力,使其更智能、更具适应性,并能够处理更广泛的数据类型和应用场景。
请继续关注最新动态,详细了解如何在 MongoDB 中开始使用 Voyage AI 功能。
要了解更多关于 MongoDB 和 Voyage AI 如何为构建、扩展和部署智能应用提供最先进的 AI 搜索和检索功能的信息,请访问我们的产品页面。
Source: Read More