Nexa AI近日推出了其全新的OmniAudio-2.6B音频语言模型,旨在满足边缘设备的高效部署需求。与传统的将自动语音识别(ASR)和语言模型分开的架构不同,OmniAudio-2.6B将Gemma-2-2b、Whisper Turbo以及定制的投影仪集成到一个统一框架中,这一设计消除了传统系统中各个组件链接所带来的低效率和延迟,特别适用于计算资源有限的设备。主要亮点:处理速度: OmniAudio-2.6B在性能上表现出色。在2024Mac Mini M4Pro上,使用Nexa SDK并采用FP16GGUF格式时,模型可实现每秒35.23个令牌的处理速度,而在Q4_K_M GGUF格式下,
11月25日消息,人工智能公司Anthropic宣布推出一项新的开源标准——模型上下文协议(MCP),旨在通过将AI助手与业务工具和软件等数据源连接,提升模型对查询的响应质量和相关性。MCP的发布意味着AI助手在处理任务时,能够直接从不同的数据源中提取信息,避免了“信息孤岛”的问题。在一篇博客文章中,Anthropic表示,尽管AI助手在推理和质量方面已取得快速进展,但目前大多数模型仍受限于与数据的隔离,无法直接访问存储的数据。这使得每个数据源都需要单独的定制实现,从而导致互
英伟达公司在人工智能领域的领导地位毋庸置疑,近期,该公司发布的季度财报显示,英伟达在上一季度售出了价值310亿美元的 AI 系统。作为公司的联合创始人及首席执行官黄仁勋最近在一次与华尔街分析师的交流中,强调了人工智能在各行各业的重要应用。在这次交流中,黄仁勋提到了谷歌的 Notebook LM 工具,他表示自己 “非常频繁地使用” 这个 AI 工具。Notebook LM 是一款用户可以上传文档的 AI 工具,能够生成文档内容的摘要,建议用户提出问题,与用户进行关于文档的对话,并能将内
一家令人瞩目的创业公司正在开发一项突破性的AI系统,承诺将为创作者带来前所未有的电影级世界生成能力。这家名为Odyssey的公司采用了一种独特的方式:让工作人员背着特制相机系统,实地采集全球各地的场景数据。由自动驾驶领域的资深专家Oliver Cameron和Jeff Hawke创立的Odyssey最近完成了1800万美元A轮融资,由EQT Ventures领投,GV和Air Street Capital参投。至此,公司总融资额达到2700万美元。这笔资金将主要用于扩大其在加利福尼亚州的数据采集业务。Odyssey开发的先进摄影系统重约25磅,配备了