Close Menu
    DevStackTipsDevStackTips
    • Home
    • News & Updates
      1. Tech & Work
      2. View All

      Sunshine And March Vibes (2025 Wallpapers Edition)

      May 22, 2025

      The Case For Minimal WordPress Setups: A Contrarian View On Theme Frameworks

      May 22, 2025

      How To Fix Largest Contentful Paint Issues With Subpart Analysis

      May 22, 2025

      How To Prevent WordPress SQL Injection Attacks

      May 22, 2025

      How to open Control Center on your iPhone without swiping from top: 4 easier ways

      May 22, 2025

      How to try Veo 3, Google’s AI video generator that’s going viral on the internet

      May 22, 2025

      I just tested a smart cooler and can never go back to toting ice (and it’s $100 off)

      May 22, 2025

      This top-rated Dyson hair dryer is on sale for the lowest price yet on Amazon

      May 22, 2025
    • Development
      1. Algorithms & Data Structures
      2. Artificial Intelligence
      3. Back-End Development
      4. Databases
      5. Front-End Development
      6. Libraries & Frameworks
      7. Machine Learning
      8. Security
      9. Software Engineering
      10. Tools & IDEs
      11. Web Design
      12. Web Development
      13. Web Security
      14. Programming Languages
        • PHP
        • JavaScript
      Featured

      Perficient is Shaping the Future of Salesforce Innovation

      May 22, 2025
      Recent

      Perficient is Shaping the Future of Salesforce Innovation

      May 22, 2025

      Opal – Optimizely’s AI-Powered Marketing Assistant

      May 22, 2025

      Content Compliance Without the Chaos: How Optimizely CMP Empowers Financial Services Marketers

      May 22, 2025
    • Operating Systems
      1. Windows
      2. Linux
      3. macOS
      Featured

      Windows 11 24H2’s “no reboot” updates feature finally kicks off with KB5058497

      May 22, 2025
      Recent

      Windows 11 24H2’s “no reboot” updates feature finally kicks off with KB5058497

      May 22, 2025

      Windows 11 Notepad is turning into a full-fledged “AI writer” with Write feature

      May 22, 2025

      Microsoft Sora AI Bing Video Creator takes on Veo. It’s free on web, Android, iOS

      May 22, 2025
    • Learning Resources
      • Books
      • Cheatsheets
      • Tutorials & Guides
    Home»Development»Databases»Fireworks AI å’Œ MongoDB:依托您的数据,借助优质模型,助力您开发高速 AI 应用

    Fireworks AI 和 MongoDB:依托您的数据,借助优质模型,助力您开发高速 AI 应用

    April 11, 2024

    我们欣然宣布,MongoDB 与 Fireworks AI 正携手合作,让客户能够利用生成式人工智能 (AI),更快速、更高效、更安全地开展创新活动。Fireworks AI 由 Meta 旗下 PyTorch 团队的行业资深人士于 2022 年底创立,他们在团队中主要负责优化性能、提升开发者体验以及大规模运行 AI 应用。

    Fireworks AI 将这些专业知识运用于自己的生产 AI 平台,从而整理并优化了业界优质的开放模型。该公司进行了基准测试,结果表明,在 Fireworks AI 上运行的生成式 AI 模型的推断速度比其他同类平台快 4 倍,吞吐量和规模高出多达 8 倍。

    模型属于应用程序堆栈的一部分。然而,开发者要想发挥生成式人工智能的力量,还需要将企业数据引入这些模型中。这正是企业采用 AI 时所面临的一大棘手问题,也是 Fireworks AI 与 MongoDB 开展合作的原因。借助 MongoDB Atlas,开发者可以安全地将运营数据、非结构化数据和向量嵌入进行统一,从而安全打造一致、正确和差异化的 AI 应用程序和体验。

    Fireworks AI 和 MongoDB 强强联手,精心整理并优化了各种开源模型,为想要结合企业自身专有数据使用这些模型的开发者提供了解决方案,并且能够快速安全地实现这一切。

    Fireworks AI 提供快如闪电的模型:将速度、效率和价值“一网打尽”

    Fireworks AI 凭借快如闪电的推断平台,整理、优化并部署了 40 多种不同的 AI 模型。这些优化措施可以同时节省大量成本、减少延迟、提高吞吐量。他们的平台通过以下方式实现这些效果:

    现成模型、优化模型和插件:Fireworks AI 提供一系列高质量的文本、嵌入和图像基础模型。开发者可以利用这些模型或者对其进行微调,然后部署自己的模型,再借助 MongoDB Atlas 将自己的专有数据引入模型。

    微调功能:为了进一步提高模型的准确性和速度,Fireworks AI 还提供了微调服务,该服务可利用命令行界面 (CLI) 从 MongoDB Atlas 等数据库中摄取采用 JSON 格式的对象。

    用于开发和生产的各种简易界面和 API:Fireworks AI Playground 可让开发者直接在浏览器中与模型进行交互,而且支持通过方便的 REST API 以编程方式进行访问。Fireworks AI Playground 与 OpenAI API 兼容,因此可以与更广泛的大型语言模型 (LLM) 生态系统进行互操作。

    使用指南:这份指南简单易用,提供了一套全面的即用型解决方案,可以满足包括微调、生成和评估在内的各种应用场景。

    Fireworks AI 和 MongoDB:通过整理和优化快速的模型为 AI 设定标准

    借助 Fireworks AI 和 MongoDB Atlas,应用可在隔离的环境中运行,在符合最严格监管标准的复杂安全控制措施保护下,确保正常运行时间和数据的私密性:

    作为优秀的开源模型 API 提供商,Fireworks AI 每天提供 660 亿个词元(并且数量还在不断增长)。

    您可以在久经考验的 Atlas 平台上运行 App,该平台为数以万计的客户提供服务,其中不乏高增长的初创公司和规模庞大的企业和政府。

    Fireworks AI 和 MongoDB 联合解决方案可以实现以下功能:

    Hostinger

    基于大量文档进行检索增强生成 (RAG) 或问答 (Q&A):摄入大量文档,生成摘要和结构化数据,从而为对话式 AI 提供支持。

    通过语义/相似性搜索进行分类:对来自销售电话、视频会议等事件中的概念和情绪进行分类和分析,以提供更好的情报和策略。或者,使用产品图片和文字对产品目录进行整理和分类。

    从图像中提取结构化数据:从图像中提取有意义的内容,生成可在库存照片、时尚、物体检测、医疗诊断应用等一系列视觉应用中处理和搜索的结构化数据。

    智能警报:实时处理大量数据,自动检测欺诈、网络安全威胁等活动并发出警报。

    图 1:Fireworks 教程展示了如何使用 RAG 和 MongoDB Atlas 将自己的数据引入 LLM

    上手使用 Fireworks AI 和 MongoDB Atlas

    为了帮助您上手使用 Fireworks AI 和 MongoDB Atlas,请查看《使用 MongoDB Atlas 和 Fireworks AI 优化 RAG》的教程,该教程向您展示了如何构建电影推荐应用,其中涉及

    使用嵌入对电影进行索引的 MongoDB Atlas 数据库。(向量存储)

    文档嵌入生成系统。我们将使用 Fireworks 嵌入 API 从文本数据中创建嵌入。(向量化)

    MongoDB Atlas Vector Search 通过将查询转换为嵌入来获取对应的电影,进而响应用户查询。(检索引擎)

    Mixtral 模型使用 Fireworks 推断 API 来生成推荐建议。如果您愿意,您还可以使用 Llama、Gemma 和其他出色的开源软件 (OSS) 模型。(LLM)

    加载 MongoDB Atlas 示例 Mflix 数据集以生成嵌入(数据集)

    我们还可以帮助您设计最符合贵组织需求的架构。请随时与您的客户团队联系,或在此联系我们为您安排一次协作会议,共同探讨 Fireworks AI 和 MongoDB 如何能够优化您的 AI 开发流程。

    Source: Read More

    Facebook Twitter Reddit Email Copy Link
    Previous ArticleFireworks AI 및 MongoDB: 데이터를 기반으로 하는 최고의 모델을 갖춘 가장 빠른 AI 앱
    Next Article A crossroads for computing at MIT

    Related Posts

    Development

    The Ampere Porting Advisor Tutorial

    May 22, 2025
    Development

    How to Build Scalable Web Apps with React JS

    May 22, 2025
    Leave A Reply Cancel Reply

    Continue Reading

    Top-Rated Chinese AI App DeepSeek Limits Registrations Amid Cyberattacks

    Development

    Disponibile CachyOS Kernel Builder: Un Nuovo Strumento per Compilare il Kernel Linux

    Linux

    5 AI features on the Samsung Galaxy S25 that make me forgive the minor hardware changes

    News & Updates

    CVE-2025-4022 – Web-Arena-X Web Content Injection Vulnerability

    Common Vulnerabilities and Exposures (CVEs)

    Highlights

    This gadget can help you drive safer and save money

    July 27, 2024

    Maintaining the correct tire pressure on your vehicle not only helps you save on gas,…

    React Native 0.75 – Support for Percentage Values in Layout, New Architecture Stabilization, Template & init Updates, and more

    August 13, 2024

    EXAONE 3.0 Released: A 7.8B Open-Sourced State of the Art Language Model from LG AI Research

    August 9, 2024

    Autoscaler

    December 28, 2024
    © DevStackTips 2025. All rights reserved.
    • Contact
    • Privacy Policy

    Type above and press Enter to search. Press Esc to cancel.