近日,随着字节跳动旗下豆包大模型的商业化进程加速,以及其在全球 AI 领域的亮眼表现,“
”概念股成为资本市场的新宠,引发 AI 赛道新一轮的上涨行情。
近日,随着字节跳动旗下豆包大模型的商业化进程加速,以及其在全球 AI 领域的亮眼表现,“
”概念股成为资本市场的新宠,引发 AI 赛道新一轮的上涨行情。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
字节跳动宣布推出全新多模态模型Vidi,专注于视频理解与编辑,首版核心能力为精准的时间检索功能。据AIbase了解,Vidi能够处理视觉、音频和文本输入,支持长达一小时的超长视频分析,在时间检索任务上性能超越GPT-4o与Gemini等主流模型。这一突破性技术已在AI社区引发热烈讨论,相关细节通过字节跳动官方渠道与GitHub公开。核心功能:精准时间检索与多模态协同Vidi以其强大的时间检索与多模态处理能力,为视频理解与编辑提供了全新解决方案。AIbase梳理了其主要功能: 时间检索精准定位
字节跳动宣布推出高效预训练长度缩放技术(Efficient Pretraining Length Scaling),通过创新的Parallel Hidden Decoding Transformer(PHD-Transformer)框架,显著提升大语言模型(LLM)在长序列预训练中的效率与性能。据AIbase了解,该技术在保持推理效率的同时,支持高达2048K(2M)的上下文长度训练,解决了传统框架在数据异构性与计算平衡上的瓶颈。相关研究已在arXiv公开,引发了AI研究社区的广泛关注。核心创新:PHD-Transformer优化长序列训练字节跳动的PHD-Transformer通过独特的键值缓存(KV Cache)管理策略与架构优
据:晚点LatePost消息,字节跳动近期对其 AI 产品部门 Flow 进行了重要调整,社交陪伴类 AI 产品猫箱更换负责人,原负责人梁琛奇离职,由原星绘产品负责人西原(花名)接任。与此同时,AI 相机和图片生成应用星绘团队计划并入豆包 App,由豆包 App 端负责人陆游(花名)统一管理。Flow 部门由朱骏负责,旗下拥有豆包、猫箱、星绘以及豆包爱学、Gauthmath 等多款产品。此次调整的核心在于对表现相对平平的猫箱和星绘进行整合,将资源集中到核心产品豆包上,以期实现更快速的增长。据悉,猫箱
字节跳动研究团队宣布开源 ChatTS-14B,这是一款专为时间序列数据理解和推理设计的140亿参数大型语言模型(LLM)。以 Apache2.0许可协议发布,ChatTS-14B 的开源引发了 AI 社区的广泛关注,被认为是时间序列分析与生成式 AI 结合的重大进展。ChatTS-14B:时间序列的智能对话引擎ChatTS-14B 基于 Qwen2.5-14B-Instruct 模型进行微调,专为处理时间序列数据而设计,能够理解和推理复杂的时序数据模式。不同于传统时间序列分析工具,ChatTS-14B 支持用户通过自然语言与时间序列数据交互,例如分析金融市场趋
字节跳动技术团队宣布,其全新 AI 协同办公平台“扣子空间”(Coze Space)正式开启内测。“扣子空间”旨在成为用户与 AI Agent 协同办公的最佳场所,提供从回答问题到解决问题的全方位服务,帮助用户更高效地完成工作。
近日,华晨宝马领悦数字信息技术有限公司(“领悦”)与字节跳动旗下火山引擎达成合作,双方将在人工智能(AI)技术的帮助下创新汽车营销服务。此次合作通过AI技术实现精准的产品匹配与购车建议,优化内容引导,提升用户购车体验及经销商运营效率。宝马集团大中华区总裁高翔表示,AI是宝马打造更智能、贴心出行解决方案的关键,正在加速融入研发、生产、供应链、产品、服务及运营各个环节。“此次合作将推动营销模式的创新,提升数字化客户旅程,并助力经销商提高运营效率
字节跳动在Hugging Face平台正式发布了UI-TARS-1.5,一款基于强大视觉语言模型构建的开源多模态代理。这一发布标志着字节跳动在AI自动化交互领域的又一重大突破,为开发者与用户提供了一个高效、智能的跨平台GUI(图形用户界面)自动化解决方案。UI-TARS-1.5:多模态代理的创新标杆UI-TARS-1.5是字节跳动继UI-TARS系列后的全新迭代,专为自动化图形界面交互设计,具备卓越的感知、推理、行动和记忆能力。该模型采用端到端架构,依托纯视觉输入,能够实时理解动态界面,并通过自然语言指令完
字节跳动豆包大模型团队宣布开源 UI-TARS-1.5,这是一款基于视觉 - 语言模型构建的开源多模态智能体,能够在虚拟世界中高效执行各类任务。该模型在7个典型的 GUI 图形用户界面评测基准中取得了 SOTA(State-of-the-Art)表现,并首次展现了其在游戏中的长时推理能力和在开放空间中的交互能力。这一开源项目标志着多模态智能体技术在 GUI 操作和游戏推理领域取得了重要进展。
豆包大模型近日发布了系列更新,其中豆包1.5·深度思考模型和豆包文生图模型3.0正式通过火山引擎开放 API,供开发者和企业客户使用。这两款模型在推理任务和通用任务的综合表现达到了业界前沿水平,并在视觉推理和图像生成方面取得了显著进展。
火山引擎今日发布活动预热,正式宣布其新款豆包大模型将于明日(4月17日)在FORCE LINK AI创新巡展杭州站上隆重发布。官方信息显示,此次发布会将带来豆包大模型家族的全新升级,并特别推出备受瞩目的豆包1.5深度思考模型。此前已有消息透露,豆包APP和桌面端已针对“深度思考模式”进行了多轮实验性测试。此次发布后,该模型将正式面向企业客户提供服务。据悉,豆包公众号此前已公开宣布测试新版深度思考功能,该功能创新性地将推理过程中的思维链与搜索能力相结合,实现了“