NVIDIA推出Tied-Lora技术:提升LoRA方法参数效率

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
2025年4月9日,在Google Cloud Next2025大会上,Google Cloud宣布了一项重大合作计划,将其分布式云服务Google Distributed Cloud(GDC)与Gemini人工智能模型和NVIDIA的Blackwell架构相结合,为企业提供强大的本地化AI解决方案。这一合作旨在满足对数据主权和安全性有严格需求的行业,推动“代理AI”(Agentic AI)技术在本地环境中的应用。据最新消息,Google Distributed Cloud将支持Gemini模型在企业自有数据中心运行。这一举措通过与NVIDIA的合作得以实现,具体利用NVIDIA最新推出的Blackwell GPU系统,提供高性能计算能
2025年4月8日,英伟达(NVIDIA)宣布推出其最新大型语言模型(LLM)——Llama3.1Nemotron Ultra253B。这一模型基于Meta的Llama-3.1-405B-Instruct开发,通过创新的神经架构搜索(NAS)技术进行了深度优化,不仅在性能上超过了近期发布的Llama4系列中的Behemoth和Maverick,还以开源形式在Hugging Face平台上发布,引发了AI社区的广泛关注。性能突破:碾压Llama4Behemoth和Maverick根据英伟达官方披露的信息以及社交媒体上的最新讨论,Llama3.1Nemotron Ultra253B在多个关键基准测试中表现出色。这一模型拥有2530亿个参数,相较于Lla
Nvidia 最近发布了其实验性 AI 助手 Project G-Assist,该工具可以在 GeForce RTX 卡上本地运行。这一发布是在2024年 Computex 展会上的首次预览后进行的标志着科技公司在为玩家开发专用 AI 助手方面迈出了重要一步。例如微软也在开发一款名为 “Gaming C o p i l o t” 的助手,最初将提供游戏技巧的聊天支持,并计划在后续更新中实时分析游戏场景。G-Assist 与许多需要互联网连接和订阅服务的云端 AI 助手不同,它完全依赖于用户的 GeForce RTX GPU 来运行。该助手使用了基于 Llama 的8亿参数模型,通过按下
苹果公司近期在人工智能领域的投资动作引起了广泛关注。根据 Loop Capital 分析师 Ananda Baruah 的报告,苹果公司正在斥资10亿美元购买 NVIDIA 的 AI 系统,以支持其 Apple Intelligence 的运行。虽然苹果之前曾表示依靠自家的 Apple Silicon 服务器来处理相关任务,但如今的投资显示出其在技术领域的进一步布局。图源备注:图片由AI生成,图片授权服务商MidjourneyBaruah 在报告中指出,苹果正式加入了大型服务器集群的人工智能竞争中,与超微(Super Micro Computer)和戴尔等公司成为重要的服务器合作伙伴
近日,AI 驱动的服务机器人制造商 Richtech Robotics 在乔治亚州皮奇特市的一家沃尔玛超市内开设了新餐厅 “One Kitchen”,并推出了由 Nvidia AI 技术驱动的机器人服务咖啡、奶茶和水果茶等饮品。该餐厅与 Ghost Kitchens America 合作运营,机器人 Scorpion 负责与顾客互动、监控环境并制作饮品。与此同时,Richtech 的另一款人形机器人 Adam 正在拉斯维加斯的一家餐厅为顾客提供咖啡和甜点。Adam 在 “Clouffee and Tea” 餐厅内工作,与店员配合,后者负责售卖 Adam 无法制作的零食或瓶装饮料。顾客在与 Adam
近日,HPC-AI Tech 宣布推出 Open-Sora2.0,这是一款突破性的视频 AI 系统,仅需约十分之一的典型训练成本即可实现商业级质量。这一进展标志着在资源密集型的视频 AI 领域可能出现范式转变,堪比语言模型中出现的效率提升。虽然像 Movie Gen 和 Step-Video-T2V 这样现有的高质量视频生成系统可能需要数百万美元的训练费用,但 Open-Sora2.0的训练支出仅约为20万美元。尽管成本大幅降低,但测试表明,其输出质量可与 Runway Gen-3Alpha 和 HunyuanVideo 等已建立的商业系统相媲美。该系统使用了224个 Nvidia H20
据彭博社报道,OpenAI 正在大规模投资建立其首个名为 “星际之门”(Stargate)的基础设施项目,预计耗资达1,000亿美元。该项目的首个数据中心综合体位于德克萨斯州的小城阿比林,计划能够容纳多达40万片 Nvidia 生产的强大 AI 晶片,一旦完全投入使用,将成为全球最大的人工智能算力中心之一。图源备注:图片由AI生成,图片授权服务商Midjourney根据开发商 Crusoe 的说法,这个庞大的数据中心预计将在2026年中期完工,具备1.2吉瓦的发电容量。虽然该设施能够支持大量的先进 AI 晶片,但具
在3月18日的 GTC 大会上,Nvidia 首席执行官黄仁勋宣布了一项令人奋的计划,旨在通过新推出的软件 Dynamo,将 DeepSeek 的人工智能处理速度提高30倍。此举是 Nvidia 对 DeepSeek 公司 R1人工智能程序引发的市场动荡的回应。DeepSeek 的技术能够显著降低每个查询所需的计算量,导致投资者对 Nvidia 的未来前景表示担忧。Nvidia 的 Dynamo 软件能够将 AI 推理任务分配到多达1000个 GPU 上并行处理,极大地提升了查询吞吐量。黄仁勋表示,使用新的 Blackwell 芯片,Dynamo 能够在相同的架构下提供30倍的处理能力。
在2025年全球技术大会(GTC)上,Nvidia 的创始人兼 CEO 黄仁勋如同科幻电影中的高科技天才,隆重推出了两款颠覆传统的 “个人 AI 超级计算机”:DGX Spark 与 DGX Station。这两款设备不仅拥有强大的计算能力,还为用户在边缘计算领域的创新提供了全新的可能性。 超乎想象的计算能力首先,DGX Spark 让我们感受到了一种 “未来已来” 的震撼。Nvidia 宣称,这款设备能够实现每秒高达1000万亿次的 AI 计算,仿佛把整个互联网的计算力浓缩到了你的桌面上!其核心采用了 GB10Grace Blackwell 超级芯片,专为
在2025年 GTC 大会上,英伟达首席执行官黄仁勋宣布,英伟达正在与迪士尼研究部门及谷歌DeepMind 合作,开发名为 “Newton” 的物理引擎。这款引擎旨在模拟机器人在现实环境中的运动,为未来的娱乐机器人提供技术支持。图源备注:图片由AI生成,图片授权服务商Midjourney迪士尼将是首批使用 Newton 技术的公司之一,预计这项技术将应用于其下一代娱乐机器人,例如受《星球大战》启发的 BDX 机器人。在黄仁勋的主题演讲中,一款 BDX 机器人更是现场登台,生动展示了其运动能力。英伟达计划