近日,随着字节跳动旗下豆包大模型的商业化进程加速,以及其在全球 AI 领域的亮眼表现,“
”概念股成为资本市场的新宠,引发 AI 赛道新一轮的上涨行情。
近日,随着字节跳动旗下豆包大模型的商业化进程加速,以及其在全球 AI 领域的亮眼表现,“
”概念股成为资本市场的新宠,引发 AI 赛道新一轮的上涨行情。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
近日,字节跳动(ByteDance)正式公布了其最新AI项目“DreamActor-M1”,一项旨在革新视频生成技术的前沿成果。这款模型通过结合一张静态照片和一段参考动作视频,能够将照片中的人物无缝替换到视频场景中,生成表情细腻、动作自然且画质高清的动态影像。这一技术的亮相,不仅标志着字节跳动在生成式AI领域的又一次突破,也被视为对现有动画生成工具(如Runway的Act-One)的有力挑战。DreamActor-M1的核心创新在于其对细节的精准把控和一致性表现。传统图像到视频的生成方法往往面临诸多难
字节跳动近日推出其全新AI项目DreamActor-M1,该项目旨在实现类似Runway Act-One的功能,通过先进的生成式AI技术,将视频中的角色表演转化为虚拟动画,展现出更高的精确度和表现力。这一消息迅速引发了业界和网友的广泛关注,被视为字节跳动在AI视频生成领域迈出的又一大步。技术突破:超越Runway Act-One的野心据公开信息显示,DreamActor-M1的核心目标是捕捉演员的面部表情、动作节奏以及情感细节,并将其无缝转移到任意虚拟角色上。与Runway的Act-One类似,该技术允许用户仅通过上传一段表演
北京——字节跳动(ByteDance)近日在人工智能开源社区Hugging Face上正式发布了其最新的文本转语音(TTS)模型MegaTTS3。这一发布迅速引起了全球AI研究者和开发者的关注,因其在轻量化设计和多语言支持方面的突破性表现。根据技术社区反馈和官方信息,MegaTTS3 被誉为语音合成领域的一次重要进步。MegaTTS3 的核心亮点MegaTTS3 是一款由字节跳动与浙江大学合作开发的开源语音合成工具,其主干模型仅包含0. 45 亿个参数,相较于传统大型TTS模型显得异常轻量。这一设计不仅降低了计算资源需求,
在AI领域引发广泛关注的消息传来,前字节跳动的 AI 技术专家解浚源已正式加入具身智能创业公司千寻智能,担任具身智能部负责人。这一变化不仅为千寻智能的技术团队注入了强大的动力,也为具身智能的未来发展铺平了道路。解浚源是一位在人工智能领域颇具声望的人物。他本科毕业于中国科学技术大学,并在美国华盛顿大学获得博士学位。他在多个顶级学术会议上发表过论文,且这些论文的引用次数超过了一万次,显示出他在该领域的深厚影响力。此外,解浚源还曾是知名开源项目
在人工智能行业的快速发展中,国内市场的格局正在发生剧烈变化。零一万物的创始人兼首席执行官李开复在一档对话节目中发表了他的看法,指出随着 DeepSeek 的崛起,中国市场未来可能只会留下三家主要的 AI 模型公司:DeepSeek(深度求索)、阿里巴巴和字节跳动。李开复强调,DeepSeek 的影响力正在重塑整个行业的发展模式,甚至可能让 OpenAI 的创始人感到不安。他认为,DeepSeek 的创新和技术进步让其在市场竞争中占据了领先地位,不仅推动了 AI 技术的应用,也使得传统竞争对手感受到前
在人工智能领域蓬勃发展的背景下,字节跳动的豆包大模型团队(Seed)近日召开了一次全员会议,标志着该团队在未来发展方向上的重要决策。会议由朱文佳与新任 AI 基础研究负责人吴永辉共同主持,这也是两位领导首次同台出席,吸引了业内的广泛关注。会议上,朱文佳和吴永辉明确表示,Seed 团队的首要目标是 “探索智能上限”,这将成为团队未来工作的核心导向。他们指出,探索智能的边界是一个长期的任务,团队将围绕已发布的 AGI 研究计划 “Seed Edge” 进行深入研究。朱文佳提
还在为短视频配音效抓耳挠腮?还在苦苦寻找合适的BGM却总是差强人意?现在,字节跳动直接放出王炸级AI黑科技,一举打破视频创作的最后一道静音魔咒!他们最新推出的SeedFoley音效生成模型,如同为视频注入了声命之魂,只需轻轻一点,就能为你的视频智能匹配专业级音效,瞬间让你的作品从默片变身有声大片,效果堪称惊艳!更令人振奋的是,这项AI音效神技已火速上线字节跳动旗下视频创作平台即梦,人人都能秒速体验一键音效加持的神奇魔力!SeedFoley究竟是如何做到如此声入人心的?其核
今日,豆包大模型团队正式发布文生图技术报告,首次公开Seedream2.0图像生成模型的技术细节,涵盖数据构建、预训练框架、后训练RLHF全流程,在文生图领域投下一颗“重磅炸弹”。Seedream2.0自2024年12月初在豆包APP和即梦上线后,已服务上亿C端用户,深受专业设计师青睐。与Ideogram2.0、Midjourney V6.1等主流模型相比,它解决了文本渲染不佳、对中国文化理解不足等问题,在中英文双语理解、美感和指令遵循等方面实现全面提升。通过Bench-240评测基准测试,其英文提示词生成内容的结构合理性
据凤凰科技报道,骆怡航近日正式加入生数科技担任CEO,全面负责公司研发、产品、商业化及团队管理。作为清华大学自动化系博士,他在云计算及AI领域深耕十余年,拥有深厚的技术背景和商业化经验。在加入生数科技前,骆怡航担任字节跳动火山引擎AI应用产品线负责人,直接汇报火山引擎总裁。据透露,该产品线由他从零组建,覆盖多个AI相关产品,管理规模数百人。此前,他还参与了字节跳动早期的AI中台规划与建设。业内人士评价,骆怡航在AI技术规划、产品规划、商业拓展及团队
字节跳动旗下豆包大模型团队近日宣布,成功攻克混合专家模型(MoE)架构的关键瓶颈,并开源一项名为COMET的重大优化技术。该技术显著提升了大模型的训练效率,实现了高达1.7倍的效率提升,并有效降低了40%的训练成本。图源备注:图片由AI生成,图片授权服务商Midjourney据介绍,COMET技术已在字节跳动的万卡集群训练中得到实际应用,累计节省了数百万GPU小时的训练算力。与近期DeepSeek开源的DualPipe等MoE优化方案相比,COMET具有更强的兼容性和便捷性,能够像插件一样直接接入现有的MoE训