英伟达发布新的AI Foundry服务，或掀起企业定制模型潮流

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年7月25号 13:54

137

近日，英伟达（Nvidia）悄然推出了其全新AI服务——AI Foundry，这一举措可能会引发企业定制AI模型的热潮。此服务旨在帮助企业开发和部署符合自身需求的定制大语言模型，以更高的准确度和控制力来应对市场的快速变化。

AI Foundry结合了英伟达的硬件、软件工具和专业知识，帮助公司开发出针对具体业务需求的定制化开源模型，例如Meta刚刚发布的Llama3.1。随着企业越来越希望利用生成式AI技术，同时又希望掌控自己的数据和应用，AI Foundry的推出正逢其时。

英伟达表示，通过对这些开源模型的定制，能够显著提高模型的表现。例如，定制后的模型准确度能提高近10个百分点。AI Foundry不仅提供了大量预训练模型，还通过英伟达的DGX Cloud和NeMo工具包提供高性能计算资源和模型定制评估。此外，英伟达的AI专家团队还将提供专业指导。

除了AI Foundry，英伟达还推出了NIM（Nvidia Inference Microservices），这是一种将定制模型打包成容器化、API可访问格式的服务，简化了模型的部署过程。NIM标志着英伟达在AI模型部署方面的一项重大突破，展示了公司在多年研究和开发上的积累。

此次发布的时机也很微妙，正值Meta发布Llama3.1之际，同时也在AI安全性和治理问题日益引发关注的背景下。通过提供一个让企业能够创建和控制自己AI模型的服务，英伟达可能在满足企业对高级AI需求的同时，规避了使用公共通用模型的风险。

然而，定制AI模型的广泛部署也可能带来一些挑战，如AI能力在各行业间的碎片化以及保持一致的AI安全和伦理标准的困难。随着AI行业竞争的加剧，英伟达的AI Foundry将成为其在企业AI市场未来布局的重要一步。

官方博客：https://blogs.nvidia.com/blog/ai-foundry-enterprise-generative-ai/

### 划重点:
📊 **定制化提升准确度**:英伟达AI Foundry能显著提高AI模型的准确度，定制后准确度提升近10%。
🛠️ **全新部署方式**:NIM服务将定制模型打包成API可访问的容器化格式，简化部署过程。
📅 **发布时机特殊**:此次发布正值Meta Llama3.1发布之际，旨在满足企业对高级AI模型的定制需求。

亚马逊云科技率先推出完全托管DeepSeek-R1，企业AI部署再添利器

亚马逊云科技近日宣布，DeepSeek-R1大语言模型现已作为完全托管的无服务器服务在Amazon Bedrock上正式可用。作为首个将该模型作为完全托管服务推出的云服务提供商，亚马逊云科技进一步扩展了客户使用DeepSeek-R1及其蒸馏版本的方式。通过完全托管的服务方式，客户无需处理复杂的技术设置或运维，即可轻松将DeepSeek-R1应用于企业级部署。客户可利用该模型解决复杂问题、编写代码、处理和分析数据等。同时，客户还能享受亚马逊云科技企业级安全保障，包括数据加密、严格的访问控制以及

仅用四周时间！富士康推出中文大语言模型FoxBrain

富士康旗下的鸿海研究院近日发布了一款全新的传统中文大型语言模型（LLM）——FoxBrain。这一模型的推出引起了业界的广泛关注，标志着在中文人工智能领域的一次重要进展。FoxBrain 的训练过程在短短四周内完成，展示了强大的技术能力和高效的研发速度。图源备注：图片由AI生成，图片授权服务商MidjourneyFoxBrain 的研发旨在提升传统中文的处理能力，满足日益增长的市场需求。在互联网及社交媒体的推动下，中文内容的生成和处理对技术的要求越来越高，FoxBrain 的推出正是为了应对这种

Firecrawl推出LLM.txt API：提供网址即可生成任意网站的LLM.txt

近日，Firecrawl 推出了一项全新的功能 ——LLMs.txt 生成器接口（Alpha 版），旨在帮助用户将任何网站的内容转化为清晰、适用于大语言模型(LLM)训练的文本文件。用户只需提供一个网站的 URL，Firecrawl 便会对该网站及其链接页面进行抓取，生成两种格式的文本文件:llms.txt 和 llms-full.txt，便于后续的分析和训练。该生成器的工作流程相对简单。用户只需提供一个网址，系统便会自动爬取该网站的内容，提取出干净且有意义的文本信息。生成的文件分为两种类型:llms.txt 是对网站内容的简明总结，

阿里的AI视频模型通义万相Wan推出独立网站

阿里巴巴旗下“通义”品牌宣布，其AI视频生成模型“通义万相Wan”正式推出独立网站，标志着其生成式AI技术的重大进展。新网站现已开放，用户可直接登录体验“文本生成视频”和“图像生成视频”功能，无需本地部署，极大降低了使用门槛。此外，每天登录网站还可获赠积分，激励用户持续探索。“通义万象Wan”自2023年7月亮相以来不断优化，其最新版本Wan2.1在VBench排行榜上以84.7%的得分位居首位，擅长动态场景和多对象交互。依托阿里云自研的扩散变换器（DiT）架构，该模型支持中