欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、IDC:到2028年中国人工智能投资将突破1000亿美元

根据国际数据公司(IDC)的预测,中国在人工智能领域的投资将显著增长,预计到2028年总投资将突破1000亿美元,年均复合增长率达到35.2%。与此同时,全球人工智能市场也在快速扩张,尤其是生成式AI领域,预计到2028年市场规模将达到2842亿美元,成为整体AI市场的重要组成部分。

image.png

【AiBase提要:】

💡 全球生成式 AI 市场预计到2028年将达2842亿美元,占整体 AI 市场的35%。

🚀 中国人工智能总投资预计到2028年将突破1000亿美元,年均复合增长率为35.2%。

🔧 软件和信息服务行业是人工智能投资最多的领域,预计到2028年占比将达到49.8%。

2、Midjourney V7正式发布:最美观、最连贯的模型

Midjourney V7的发布标志着AI图像生成技术的又一重要进步。作为最新的图像模型,V7在图像质量、连贯性和用户个性化体验上均有显著提升。新功能如草稿模式和默认个性化设置,使得用户在创作中更加高效和灵活。未来的更新计划也将进一步扩展V7的功能,推动AI与创意工作的深度融合。

【AiBase提要:】

🚀 V7推出草稿模式,渲染速度提升10倍,成本减半,适合快速原型设计。

🎨 新模型在细节处理上表现出色,特别是在复杂元素的连贯性和分辨率上有显著提升。

🔧 默认启用个性化功能,用户可通过评级图片来调整模型输出,增强独特体验。

3、Quasar Alpha神秘亮相:首款“隐秘”长上下文模型开启免费体验

Quasar Alpha是一款新推出的AI模型,以其超长的100万token上下文处理能力和优化的编码能力引起了广泛关注。该模型的设计兼顾专业性与通用性,适用于多种应用场景,尤其在编程领域表现出色。它的免费开放策略不仅降低了使用门槛,还为开发者提供了宝贵的试用机会。

image.png

【AiBase提要:】

🚀 Quasar Alpha具备100万token的超长上下文处理能力,适合复杂推理和深度理解任务。

💻 该模型优化了编码能力,能够高效生成高质量代码,并在多语言编码基准测试中表现优异。

🌐 目前已通过OpenRouter等平台免费开放,用户可轻松集成到开发环境中,体验其强大功能。

详情链接:https://openrouter.ai/chat

4、谷歌发布 Gemini2.5Pro API,比GPT-4o更便宜

谷歌最近推出了其最新的旗舰人工智能模型Gemini2.5Pro,声称这是有史以来最智能的模型。该模型通过Gemini API在Google AI Studio上进行公开预览,并将很快在Vertex AI上线。其极具竞争力的定价策略吸引了众多开发者的关注,Gemini2.5Pro的定价为每百万输入tokens仅1.24美元,远低于竞争对手的价格。

image.png

【AiBase提要:】

🚀 Gemini2.5Pro被誉为“有史以来最智能的模型”,在推理能力和逻辑推理方面表现卓越。

💰 该模型的定价为每百万输入tokens仅1.24美元,远低于竞争对手如OpenAI和Anthropic的定价。

📈 谷歌通过公开预览收集开发者反馈,推动AI技术的广泛应用,并引领行业降本增效的新潮流。

5、MagicColor:AI一键自动帮线稿上色 多角色图也能精确分区域上色

MagicColor是一款创新的AI工具,能够快速为线稿图像自动上色。用户只需上传黑白线稿和参考图像,系统便能在数秒内完成色彩填充。其强大的图像识别与生成算法确保了色彩的精准匹配,特别适合动漫设计师和插画师使用。该工具的灵活性和高效性为创作者节省了大量时间,推动了数字艺术的智能化发展。

image.png

【AiBase提要:】

🖌️ MagicColor通过一键式上色流程,用户只需上传线稿和参考图像,便可自动生成彩色图像。

🌈 该工具支持多种风格的参考图像,用户可自由探索不同画风与色调的结合,增强创作个性。

⏱️ MagicColor的快速生成能力让创作者节省时间,能够将更多精力投入到创意构思中。

详情链接:https://yinhan-zhang.github.io/color/

6、Luma推出Ray2相机运动概念功能:AI视频迈向电影级镜头控制新境界

Luma最近发布的Ray2模型更新引入了相机运动概念,提供了20多种专业级摄像机运动模式,显著提升了AI生成视频的艺术性与精确性。这一创新不仅为广告和影视预览等领域开辟了新可能性,也解决了AI视频生成中的镜头运动自然性与可控性问题。用户可以通过简单的文本指令自由组合镜头运动,创造出复杂的动态效果,极大地增强了视频创作的灵活性与效率。

【AiBase提要:】

📹 Ray2引入20多种摄像机运动模式,提升AI生成视频的专业水平。

🎬 用户可通过简单文本组合多种镜头运动,实现复杂效果。

💡 该功能解决了AI视频生成中的镜头运动自然性与可控性问题。

7、一周数据干翻七年苦练?微软模型WHAMM实时生成《雷神之锤II》可玩Demo

微软推出的WHAMM模型展示了生成式AI在游戏开发中的潜力,通过实时生成可玩的《雷神之锤II》演示,标志着AI技术的重大突破。尽管存在一些技术局限性,如环境生成的模糊和输入延迟,但WHAMM在数据学习和图像生成策略上的创新为未来的AI辅助游戏开发开辟了新方向,预示着游戏产业将迎来更多的自动化工具。

【AiBase提要:】

🕹️ WHAMM模型能够从零开始生成整个游戏环境,允许玩家实时互动。

⚡ 相比于前版本,WHAMM在性能上实现显著飞跃,生成速度超过每秒十帧。

🔍 尽管WHAMM展示了潜力,但仍存在技术局限,如敌方角色模糊和输入延迟问题。

8、腾讯ARC实验室出品!AnimeGamer打造无限动漫人生模拟器

腾讯ARC实验室与香港城市大学联合推出的AnimeGamer是一款创新的动漫人生模拟工具,能够实现无限的动漫角色互动和游戏状态预测。通过自然语言指令,用户可以沉浸在自己喜爱的动漫世界中,体验角色之间的梦幻联动。

image.png

【AiBase提要:】

🎬 AnimeGamer提供无限长度的动画视频,用户可以通过自然语言与角色互动。

🌟 角色跨作品联动成为可能,打破次元壁,创造独特场景。

🤖 采用多模态大语言模型,提升动画生成质量,展现强大的泛化能力。

详情链接:https://top.aibase.com/tool/animegamer

9、OpenAI 考虑收购 Jony Ive 设计的 AI 设备初创公司io Products

OpenAI正在考虑收购初创公司io Products,该公司由知名设计师Jony Ive与OpenAI首席执行官Sam Altman合作开发,专注于研发基于人工智能的个人设备。此举可能会改变用户与技术的互动方式,同时助力OpenAI在个人智能设备市场的扩展。

【AiBase提要:】

🌟 OpenAI正在讨论收购初创公司io Products,该公司由Jony Ive和Sam Altman合作开发AI设备。

🤖 io Products专注于研发基于人工智能的个人设备,可能会改变用户与技术的互动方式。

🚀 收购成功后,OpenAI将获得io Products团队及其正在研发的设备,助力公司在个人智能设备市场的扩展。

10、OpenAI 为 GPT-4o 图像生成添水印,Plus 会员享特权

OpenAI 正在为其 GPT-4o 图像生成模型添加水印,旨在规范用户使用和保护版权。此功能最初仅面向 ChatGPT Plus 用户,现已向所有用户开放。免费用户生成的图像将带有水印,而 Plus 会员则可以保存无水印版本。OpenAI 同时确认正在开发 ImageGen API,未来开发者将能利用该接口构建应用程序。

【AiBase提要:】

💧 OpenAI 正在为 GPT-4o 模型添加水印,以规范用户使用和保护版权。

🎨 生成的图像不仅具备美学效果,还能够模仿著名动画公司的艺术风格。

🔧 OpenAI 正在开发 ImageGen API,未来将为开发者提供更多应用可能性。

11、字节跳动登记即梦AI 作品著作权

近日,北京字跳网络技术有限公司在知识产权领域取得了显著进展,成功登记了“即梦 AI/Dreamina AI”的美术作品著作权。这一里程碑为公司的创意产业探索奠定了坚实的基础。即梦 AI 作为一款创新产品,旨在为创意爱好者提供多功能平台,支持AI图片创作和视频制作。

【AiBase提要:】

🎨 北京字跳网络技术有限公司成功登记了“即梦 AI/Dreamina AI”的美术作品著作权。

🚀 即梦 AI 是一款创新产品,旨在为创意爱好者提供多功能平台,支持AI图片创作和视频制作。

📈 公司的著作权登记不仅认可了其技术实力,也为未来发展奠定了基础。

12. Kimi开放平台宣布价格调整:模型推理服务与上下文缓存双双降价

Kimi开放平台正式发布公告,宣布基于Moonshot AI一年来的技术积累和性能优化,对平台提供的模型推理服务价格进行调整,同时大幅下调上下文缓存价格。

亮点提要:

🚀 Kimi 开放平台基于过去一年技术优化,全面下调模型推理服务价格,提高用户使用的性价比。

💡 上下文缓存价格大幅下调,使企业和开发者在处理长文本任务时能更经济高效。

📊 Kimi 平台以超长上下文处理能力为核心竞争力,广泛应用于多种文档分析和开发场景。