日本政府与科技巨头联手投资数亿美元开发日语语言模型

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
谷歌近期推出了 Gemma3系列的全新版本,这一消息让众多 AI 爱好者为之振奋。仅在上线一个月后,谷歌便发布了经过量化感知训练(QAT)优化的 Gemma3,旨在显著降低内存需求的同时,保持模型的高质量。具体来说,经过 QAT 优化的 Gemma327B 模型,其显存需求从54GB 大幅降低到14.1GB,意味着用户现在可以在 NVIDIA RTX3090等消费级 GPU 上本地运行这一大型模型。通过简单的测试,配备 RTX3070的机器也能运行 Gemma3的12B 版本,尽管其 token 输出速度稍显不足,但整体性能仍在可接受范围之内。QAT 的神奇
在人工智能的不断发展中,扩散模型在推理能力上逐渐崭露头角,现如今,它们不再是自回归模型的 “跟随者”。近日,来自加州大学洛杉矶分校(UCLA)和 Meta 的研究者们联合推出了一种名为 d1的新框架,该框架结合了监督微调(SFT)和强化学习(RL),使扩散模型具备更强的推理能力,包括数学理解、逻辑推理等。这一创新的 d1框架通过两阶段的后训练策略来提升掩码大语言模型(dLLM)的性能。在第一阶段,模型通过高质量的推理轨迹进行监督微调,从而掌握基础知识和逻辑推理能力。接着
xAI近日推出了其全新的语言模型——Grok3Mini,进一步推动了高效AI技术的发展。Grok3Mini专为速度和经济性设计,尽管体积较小,但在多个领域的表现优于许多更昂贵的AI模型,尤其在数学、编程和科学基准测试中表现突出。Grok3Mini:高性能与低成本的完美平衡Grok3Mini是Grok3系列的一部分,该系列包含六种变体,其中包括标准的Grok3、Grok3Fast,以及四种版本的Grok3Mini,提供慢速和快速两个版本,每种版本又具备低推理能力或高推理能力的选项。xAI表示,Grok3Mini与大型的Grok3有所不同,虽然两者都
昆仑万维 SkyReels 团队正式发布并开源了 SkyReels-V2,这是全球首个使用扩散强迫(Diffusion-forcing)框架的无限时长电影生成模型。该模型通过结合多模态大语言模型(MLLM)、多阶段预训练、强化学习和扩散强迫框架来实现协同优化,标志着视频生成技术迈入了一个新的阶段。
Intel近日宣布,其专为本地生成式AI设计的AI Playground软件正式开源,为Intel Arc GPU用户提供了一个强大的AI模型运行平台。据AIbase了解,AI Playground支持多种图像、视频生成模型以及大型语言模型(LLMs),通过优化本地计算资源,显著降低了AI应用的硬件门槛。项目已在GitHub发布,吸引了全球开发者与AI爱好者的广泛关注,标志着Intel在开源AI生态中的重要布局。核心功能:多模态AI模型一站式支持AI Playground作为一款用户友好的“AI中心”,集成了丰富的生成式AI功能,涵盖图像生成、图像风格化
近日,Persona Engine(人格引擎)项目正式开源,凭借其融合大语言模型(LLM)、Live2D、自动语音识别(ASR)、文本转语音(TTS)以及实时语音克隆(RVC)等前沿技术的强大功能,引发了AI与虚拟内容创作领域的广泛关注。据AIbase了解,该项目通过赋予虚拟角色自然对话与动态表情能力,实现了与虚拟人物的实时交互,特别适用于VTubing、直播和虚拟助手场景。项目已在GitHub上线,标志着AI驱动虚拟交互技术的又一里程碑。图源备注:图片由AI生成,图片授权服务商Midjourney核心功能:多技术融合实现沉浸式交
在数字化时代,如何有效地处理文档信息已经成为了许多行业中的一个热门话题。而今,微软推出的 MarkItDown MCP(Model Context Protocol)将文档处理提升到了一个新的高度!想象一下,您只需简单几步,就能将各种格式的文件(如 PDF、Word、PowerPoint 等)轻松转换为 Markdown 格式,为您的文本分析和大型语言模型(LLM)应用提供无缝支持。更为惊艳的是,MarkItDown 不仅保持了文档的结构与内容,更能实现信息的高效传递。MarkItDown MCP 的问世,是对传统文档处理方式的一次颠覆。以其灵活的插件支持和丰富
在快速发展的数字时代,虚拟角色与互动体验的融合正逐渐成为趋势。Persona Engine 应运而生,作为一款集成了 Live2D、** 大型语言模型(LLM)、 自动语音识别(ASR)、 文本转语音(TTS)** 和 ** 实时语音克隆(RVC)** 的全能工具包,为用户提供了创建生动、互动性强的数字角色的完美解决方案。这款引擎特别适合用于 VTubing、直播以及虚拟助手等应用,帮助用户在互动体验上突破传统界限。Persona Engine 使用户能够轻松实现富有表现力的实时动画,通过 Live2D 技术,虚拟角色可以以流畅的方式与观
字节跳动研究团队宣布开源 ChatTS-14B,这是一款专为时间序列数据理解和推理设计的140亿参数大型语言模型(LLM)。以 Apache2.0许可协议发布,ChatTS-14B 的开源引发了 AI 社区的广泛关注,被认为是时间序列分析与生成式 AI 结合的重大进展。ChatTS-14B:时间序列的智能对话引擎ChatTS-14B 基于 Qwen2.5-14B-Instruct 模型进行微调,专为处理时间序列数据而设计,能够理解和推理复杂的时序数据模式。不同于传统时间序列分析工具,ChatTS-14B 支持用户通过自然语言与时间序列数据交互,例如分析金融市场趋
Intel 宣布将其生成式 AI 软件 AI Playground 正式开源,这一举措引发了 AI 社区的广泛关注。作为一款专为 Intel Arc GPU 和集成显卡优化的 AI 工具,AI Playground 被描述为一个“AI 中心”,支持本地运行聊天式大语言模型(LLM)以及图像和视频生成功能。此次开源标志着 Intel 在推动生成式 AI 技术普及和社区协作方面迈出了重要一步。开源 AI Playground:功能与潜力AI Playground 是一款功能强大的 AI PC Hannah’s Way 软件,支持多种生成式 AI 模型,包括图像扩散模型(如 Stable Diffusion 1.5、SDXL、Flux.1-Schnell 和