Close Menu
    DevStackTipsDevStackTips
    • Home
    • News & Updates
      1. Tech & Work
      2. View All

      Sunshine And March Vibes (2025 Wallpapers Edition)

      May 21, 2025

      The Case For Minimal WordPress Setups: A Contrarian View On Theme Frameworks

      May 21, 2025

      How To Fix Largest Contentful Paint Issues With Subpart Analysis

      May 21, 2025

      How To Prevent WordPress SQL Injection Attacks

      May 21, 2025

      The best smart glasses unveiled at I/O 2025 weren’t made by Google

      May 21, 2025

      Google’s upcoming AI smart glasses may finally convince me to switch to a pair full-time

      May 21, 2025

      I tried Samsung’s Project Moohan XR headset at I/O 2025 – and couldn’t help but smile

      May 21, 2025

      Is Google’s $250-per-month AI subscription plan worth it? Here’s what’s included

      May 21, 2025
    • Development
      1. Algorithms & Data Structures
      2. Artificial Intelligence
      3. Back-End Development
      4. Databases
      5. Front-End Development
      6. Libraries & Frameworks
      7. Machine Learning
      8. Security
      9. Software Engineering
      10. Tools & IDEs
      11. Web Design
      12. Web Development
      13. Web Security
      14. Programming Languages
        • PHP
        • JavaScript
      Featured

      IOT and API Integration With MuleSoft: The Road to Seamless Connectivity

      May 21, 2025
      Recent

      IOT and API Integration With MuleSoft: The Road to Seamless Connectivity

      May 21, 2025

      Celebrating GAAD by Committing to Universal Design: Low Physical Effort

      May 21, 2025

      Celebrating GAAD by Committing to Universal Design: Flexibility in Use

      May 21, 2025
    • Operating Systems
      1. Windows
      2. Linux
      3. macOS
      Featured

      Microsoft open-sources Windows Subsystem for Linux at Build 2025

      May 21, 2025
      Recent

      Microsoft open-sources Windows Subsystem for Linux at Build 2025

      May 21, 2025

      Microsoft Brings Grok 3 AI to Azure with Guardrails and Enterprise Controls

      May 21, 2025

      You won’t have to pay a fee to publish apps to Microsoft Store

      May 21, 2025
    • Learning Resources
      • Books
      • Cheatsheets
      • Tutorials & Guides
    Home»Development»Databases»Fireworks AI å’Œ MongoDB:依托您的数据,借助优质模型,助力您开发高速 AI 应用

    Fireworks AI 和 MongoDB:依托您的数据,借助优质模型,助力您开发高速 AI 应用

    April 11, 2024

    我们欣然宣布,MongoDB 与 Fireworks AI 正携手合作,让客户能够利用生成式人工智能 (AI),更快速、更高效、更安全地开展创新活动。Fireworks AI 由 Meta 旗下 PyTorch 团队的行业资深人士于 2022 年底创立,他们在团队中主要负责优化性能、提升开发者体验以及大规模运行 AI 应用。

    Fireworks AI 将这些专业知识运用于自己的生产 AI 平台,从而整理并优化了业界优质的开放模型。该公司进行了基准测试,结果表明,在 Fireworks AI 上运行的生成式 AI 模型的推断速度比其他同类平台快 4 倍,吞吐量和规模高出多达 8 倍。

    模型属于应用程序堆栈的一部分。然而,开发者要想发挥生成式人工智能的力量,还需要将企业数据引入这些模型中。这正是企业采用 AI 时所面临的一大棘手问题,也是 Fireworks AI 与 MongoDB 开展合作的原因。借助 MongoDB Atlas,开发者可以安全地将运营数据、非结构化数据和向量嵌入进行统一,从而安全打造一致、正确和差异化的 AI 应用程序和体验。

    Fireworks AI 和 MongoDB 强强联手,精心整理并优化了各种开源模型,为想要结合企业自身专有数据使用这些模型的开发者提供了解决方案,并且能够快速安全地实现这一切。

    Fireworks AI 提供快如闪电的模型:将速度、效率和价值“一网打尽”

    Fireworks AI 凭借快如闪电的推断平台,整理、优化并部署了 40 多种不同的 AI 模型。这些优化措施可以同时节省大量成本、减少延迟、提高吞吐量。他们的平台通过以下方式实现这些效果:

    现成模型、优化模型和插件:Fireworks AI 提供一系列高质量的文本、嵌入和图像基础模型。开发者可以利用这些模型或者对其进行微调,然后部署自己的模型,再借助 MongoDB Atlas 将自己的专有数据引入模型。

    微调功能:为了进一步提高模型的准确性和速度,Fireworks AI 还提供了微调服务,该服务可利用命令行界面 (CLI) 从 MongoDB Atlas 等数据库中摄取采用 JSON 格式的对象。

    用于开发和生产的各种简易界面和 API:Fireworks AI Playground 可让开发者直接在浏览器中与模型进行交互,而且支持通过方便的 REST API 以编程方式进行访问。Fireworks AI Playground 与 OpenAI API 兼容,因此可以与更广泛的大型语言模型 (LLM) 生态系统进行互操作。

    使用指南:这份指南简单易用,提供了一套全面的即用型解决方案,可以满足包括微调、生成和评估在内的各种应用场景。

    Fireworks AI 和 MongoDB:通过整理和优化快速的模型为 AI 设定标准

    借助 Fireworks AI 和 MongoDB Atlas,应用可在隔离的环境中运行,在符合最严格监管标准的复杂安全控制措施保护下,确保正常运行时间和数据的私密性:

    作为优秀的开源模型 API 提供商,Fireworks AI 每天提供 660 亿个词元(并且数量还在不断增长)。

    您可以在久经考验的 Atlas 平台上运行 App,该平台为数以万计的客户提供服务,其中不乏高增长的初创公司和规模庞大的企业和政府。

    Fireworks AI 和 MongoDB 联合解决方案可以实现以下功能:

    基于大量文档进行检索增强生成 (RAG) 或问答 (Q&A):摄入大量文档,生成摘要和结构化数据,从而为对话式 AI 提供支持。

    通过语义/相似性搜索进行分类:对来自销售电话、视频会议等事件中的概念和情绪进行分类和分析,以提供更好的情报和策略。或者,使用产品图片和文字对产品目录进行整理和分类。

    从图像中提取结构化数据:从图像中提取有意义的内容,生成可在库存照片、时尚、物体检测、医疗诊断应用等一系列视觉应用中处理和搜索的结构化数据。

    智能警报:实时处理大量数据,自动检测欺诈、网络安全威胁等活动并发出警报。

    图 1:Fireworks 教程展示了如何使用 RAG 和 MongoDB Atlas 将自己的数据引入 LLM

    上手使用 Fireworks AI 和 MongoDB Atlas

    为了帮助您上手使用 Fireworks AI 和 MongoDB Atlas,请查看《使用 MongoDB Atlas 和 Fireworks AI 优化 RAG》的教程,该教程向您展示了如何构建电影推荐应用,其中涉及

    使用嵌入对电影进行索引的 MongoDB Atlas 数据库。(向量存储)

    文档嵌入生成系统。我们将使用 Fireworks 嵌入 API 从文本数据中创建嵌入。(向量化)

    MongoDB Atlas Vector Search 通过将查询转换为嵌入来获取对应的电影,进而响应用户查询。(检索引擎)

    Mixtral 模型使用 Fireworks 推断 API 来生成推荐建议。如果您愿意,您还可以使用 Llama、Gemma 和其他出色的开源软件 (OSS) 模型。(LLM)

    加载 MongoDB Atlas 示例 Mflix 数据集以生成嵌入(数据集)

    我们还可以帮助您设计最符合贵组织需求的架构。请随时与您的客户团队联系,或在此联系我们为您安排一次协作会议,共同探讨 Fireworks AI 和 MongoDB 如何能够优化您的 AI 开发流程。

    Source: Read More

    Facebook Twitter Reddit Email Copy Link
    Previous ArticleFireworks AI 및 MongoDB: 데이터를 기반으로 하는 최고의 모델을 갖춘 가장 빠른 AI 앱
    Next Article A crossroads for computing at MIT

    Related Posts

    Security

    Nmap 7.96 Launches with Lightning-Fast DNS and 612 Scripts

    May 21, 2025
    Common Vulnerabilities and Exposures (CVEs)

    CVE-2025-48205 – TYPO3 sr_feuser_register Insecure Direct Object Reference

    May 21, 2025
    Leave A Reply Cancel Reply

    Continue Reading

    Scalable Reinforcement Learning with Verifiable Rewards: Generative Reward Modeling for Unstructured, Multi-Domain Tasks

    Machine Learning

    DistroWatch Weekly, Issue 1099

    Development

    CVE-2025-3801 – Songquanpeng One-Api Cross Site Scripting Vulnerability

    Common Vulnerabilities and Exposures (CVEs)

    I flight-tested the best carry-on tech bag with all of my essential devices, and it won a perfect score with ease

    News & Updates

    Highlights

    Development

    Key ISO 20022 Compliance & Security Insights for Banking Sector 

    November 21, 2024

    This blog discusses how ISO 20022 can transform global banking, offering enriched data and streamlined payments. It also highlights key compliance and security challenges, including data integrity, system upgrades, and regulatory requirements. Learn best practices for testing, automation, and enhancing payment systems to ensure smooth adoption. Explore strategies to safeguard financial data and meet global standards while embracing the future of banking with ISO 20022.
    The post Key ISO 20022 Compliance & Security Insights for Banking Sector  first appeared on TestingXperts.

    GhostSec Announces Shift in Operations from Ransomware to Hacktivism

    May 16, 2024

    CVE-2025-46610 – Artec EMA Mail CSRF Vulnerability

    May 12, 2025

    overtrue/laravel-filesystem-cos

    January 12, 2025
    © DevStackTips 2025. All rights reserved.
    • Contact
    • Privacy Policy

    Type above and press Enter to search. Press Esc to cancel.