Simplismart 推出个性化 AI 推理引擎，提升企业 AI 性能

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年10月18号 16:24

210

在如今这个人工智能（AI）飞发展的时代，各大企业都在全力以赴地想要将 AI 技术应用到生产环境中，以期获得更高的投资回报率。然而，即便市场上有各种先进的 AI 模型，团队们在部署时依然面临不少挑战。

根据 Everest Group 的首席执行官彼得・本多尔 - 塞缪尔的估计，90% 的生成式 AI 试点项目将难以进入生产阶段。此外，Gartner 预测到2025年底，许多生成式 AI 项目可能会在概念验证后被遗弃。

在这些挑战中，最大的障碍就是协调问题。团队往往缺乏足够的资源来完成所有工作，这使他们不得不依赖那些僵化且昂贵的第三方 API。为了填补这一空白，Simplismart AI 最近获得700万美元的融资，推出了一个端到端的机器学习运营平台，旨在加速整个协调过程，从模型微调到部署和监控一应俱全。

与市场上其他机器学习运营解决方案相比，Simplismart 的亮点在于其个性化的软件优化推理引擎。该引擎可以以极快的速度部署模型，大幅提升性能并降低相关成本。Simplismart 的联合创始人阿米特兰舒・贾因表示，在没有任何硬件优化的情况下，Llama3.18B 模型的吞吐量达到了每秒501个 token，远超其他推理引擎。

在内部部署 AI 时，团队需要面对多个瓶颈，包括获取计算能力、优化模型性能、扩展基础设施和成本效率等。Simplismart 的平台标准化了整个工作流程，用户可以根据需要微调、部署和观察高度优化的开源模型。

用户可以选择使用 Simplismart 的共享基础设施或自带计算资源，方便地配置自己的基础设施和部署。此外，平台的直观仪表板使用户能够设置 GPU、机器类型和扩展范围等参数。平台还提供了监控功能，让用户可以追踪服务水平协议（SLA），监测模型的实际性能。

目前，Simplismart 已与30家企业客户建立了合作关系，并计划进一步提升其机器学习运营平台的性能。公司希望借助新一轮融资推动研发，提升 AI 推理速度，并力争在未来15个月内将年化收入从约100万美元增长到1000万美元。

划重点:
💡90% 的生成式 AI 试点项目将难以进入生产阶段，协调问题是最大障碍。
🚀 Simplismart 的个性化推理引擎在无硬件优化的情况下实现了每秒501个 token 的吞吐量。
📈 公司已与30家企业客户建立合作，目标在15个月内将年化收入提升到1000万美元。

小红书将接入DeepSeek，AI 搜索产品“点点” 内测深度思考功能

据钛媒体报道，小红书即将接入 DeepSeek-R1开源模型，其AI搜索产品“点点”App将推出”深度思考“功能。据悉，这一新功能目前正处于内测阶段。随着 ChatGPT 的流行，小红书开始深入参与生成式 AI 的发展，推出了独立的 AI 搜索应用 “点点”。“点点” 定位为生活搜索助手，覆盖了交通、美食、旅游等多个场景，旨在为用户提供及时的信息和真实的反馈，帮助他们解决日常问题。除了 “点点”，小红书还在内测其他搜索功能，如搜索智能助手“搜搜薯” 和 AI 搜索对话助手 “达芬奇” 等

微软Azure全力支撑OpenAI新模型 GPT-5或于5月下旬震撼登场

据国外媒体报道，知情人士透露微软工程师团队正加速部署服务器资源，为OpenAI即将推出的GPT-4.5和GPT-5模型做技术储备。尽管OpenAI CEO山姆·阿尔特曼（Sam Altman）近期确认GPT-4.5将在几周内亮相，但微软内部预计最快下周即可完成新模型的托管部署，这一动作暗示着生成式AI领域的技术竞赛已进入冲刺阶段。代号为Orion的GPT-4.5被视作当前技术路线的“收官之作”。虽然OpenAI未公开其具体性能参数，但内部测试显示，该模型在多模态任务处理和上下文连贯性上较前代有显著提升。值得注意的是，

Meta 宣布举办首届生成式 AI 开发者大会 LlamaCon，聚焦 Llama 系列模型

Meta 公司近日宣布，将于4月29日举行首届 LlamaCon 开发者大会，专注于其 Llama 系列生成式 AI 模型的最新进展。这一大会旨在为开发者提供一个平台，分享开源 AI 的最新成果，帮助他们更好地构建应用和产品。随着生成式 AI 技术的迅猛发展，Meta 希望通过此次大会进一步推动其生态系统的建设。在这场即将到来的大会上，Meta 计划展示多项与 Llama 模型相关的新功能和技术进展。Llama 模型自推出以来下载量已达数亿次，已经吸引了至少25个合作伙伴进行托管，显示出其在行业中的广泛应用。Met

微软研究揭示：过度使用AI可能削弱人类的批判性思维能力

一项来自微软与卡内基梅隆大学的最新研究表明，过度依赖人工智能（AI）工具可能正在侵蚀人们的批判性思维能力。研究团队对319名知识工作者进行了调查，收集了936个在 IT、设计、行政和金融等多个行业使用生成式 AI 的真实案例。研究分析了六个批判性思维的维度:知识、理解、应用、分析、综合和评估。研究发现，使用 AI 工具后，人们在解决问题时的思维方式发生了三大变化。首先，知识工作者不再独立搜集信息，而是主要集中于验证 AI 生成的结果;其次，他们更倾向于整合 AI 提供

AI新闻资讯

Simplismart 推出个性化 AI 推理引擎，提升企业 AI 性能

AIbase基地

相关AI新闻推荐

​小红书将接入DeepSeek，AI 搜索产品“点点” 内测深度思考功能

微软Azure全力支撑OpenAI新模型 GPT-5或于5月下旬震撼登场

Meta 宣布举办首届生成式 AI 开发者大会 LlamaCon，聚焦 Llama 系列模型

​微软研究揭示：过度使用AI可能削弱人类的批判性思维能力

小红书将接入DeepSeek，AI 搜索产品“点点” 内测深度思考功能

微软研究揭示：过度使用AI可能削弱人类的批判性思维能力