恒生电子发布金融大模型产品 LightGPT 内测

站长之家

发布于AI新闻资讯 · 1 分钟阅读 · 2023年9月25号 14:01

恒生电子宣布，恒生大模型产品 LightGPT 已面向 20 家金融机构开启内测。LightGPT 是专为金融领域打造的大语言模型，具有更专业、更合规和更轻量的特点。光子是基于 LightGPT 的智能助手，可以为金融机构的各个业务系统注入 AI 能力，成为金融从业人员的智能助手。LightGPT 支持私有化 / 云部署，可以通过 API 调用，推理端只需一机两卡部署。

斯坦福新AI框架 OctoTools：无需训练，让AI实现高效复杂推理！

在人工智能（AI）领域，尽管大型语言模型(LLMs)在处理自然语言方面表现出色，但它们在面对复杂推理任务时常常显得力不从心。这些任务通常需要多步骤的推理、领域特定的知识，或者外部工具的有效集成。为了克服这些限制，研究人员们一直在探索如何通过外部工具的使用来提升 LLM 的能力。传统的增强方法往往需要对模型进行微调或额外训练，导致其在任务适应性和灵活性上受到限制。现有的框架通常依赖于静态的、预定义的工具集，缺乏高效的工具选择和规划机制，从而在执行任务

月之暗面联手UCLA推新模型Mixture-of-Expert，提升语言模型训练效率

在人工智能领域，训练大型语言模型（LLMs）已成为推动技术进步的重要方向。然而，随着模型规模和数据集的不断扩大，传统的优化方法 —— 特别是 AdamW—— 逐渐显露出其局限性。研究人员面临着计算成本高、训练不稳定等一系列挑战，包括梯度消失或爆炸、参数矩阵更新不一致及分布式环境下的资源需求高等问题。因此，迫切需要更高效、更稳定的优化技术来应对这些复杂性。为了解决这些挑战，Moonshot AI （月之暗面）与加州大学洛杉矶分校(UCLA)联合开发了 Moonlight，一个使用 Muon 优

阿里国际开源Ovis2系列多模态大语言模型共有六个版本

Ovis2 是阿里巴巴国际化团队提出的Ovis系列模型的最新版本。与前序1. 6 版本相比，Ovis2 在数据构造和训练方法上都有显著改进。它不仅强化了小规模模型的能力密度，还通过指令微调和偏好学习大幅提升了思维链（CoT）推理能力。此外，Ovis2 引入了视频和多图像处理能力，并增强了多语言能力和复杂场景下的OCR能力，显著提升了模型的实用性。

深推理模型崛起！Together AI融资3.05亿美元助推GPU需求

在 AI 行业，Together AI 最近宣布完成了一轮3.05亿美元的 B 轮融资，这一消息引起了广泛关注。该公司的崛起与其新推出的深度理模型 DeepSeek-R1密切相关。与最初的担忧相反，许行业专家认为，深度推理的进步并没有降低对基础设施的需求，反而在不断提升这一需求。图源备注：图片由AI生成，图片授权服务商Midjourney自2023年成立以来，Together AI 旨在简化企业对开源大型语言模型（LLM）的使用。随着时间的推移，该公司逐步扩展其平台，提供了一个名为 “Together 平台” 的解决方案，支持在虚

AI新闻资讯