谷歌最近发布了开源大模型Gemma,在开源界引起轰动。然而,在国内开源大模型领域,InternLM2居于榜首,表现优异,完胜了Gemma和Llama。开源大模型领域的竞争日趋激烈,各大科技厂商纷纷推出自家产品,大模型战场变得愈发热闹。
全球知名创意资源平台Freepik宣布与科技巨头谷歌合作,率先在全球范围内推出最新一代AI视频模型——Veo 2。这一重磅消息迅速引发了广泛关注,不少用户纷纷表示,这可能是目前最先进的AI视频生成工具。据介绍,Veo2 由谷歌DeepMind团队研发,是其前代模型Veo的全面升级版。它不仅能生成高达4K分辨率的视频,还能实现长达数分钟的画面内容。更令人惊叹的是,Veo2 在真实感和动画流畅性上达到了新的高度。无论是模拟真实世界的物理效果,还是呈现细腻的人物动作和表情,这款工具都能做
在近期于班加罗尔举办的 “投资卡纳塔克2025” 会议上,众多科技行业的领导者聚集一堂,探讨人工智能在印度的变革潜力及其影响。谷歌DeepMind的高级董事马尼什・古普塔(Manish Gupta)在会上发表了重要讲话,强调在推动技术创新的同时,应建立相应的规章制度,以确保负责任的发展。图源备注:图片由AI生成,图片授权服务商Midjourney古普塔指出,随着印度在构建基础性人工智能模型方面取得显著进展,大家都在关注人工智能对就业市场的影响。他表示,科技行业的责任在于开发可以增
谷歌日前正式宣布推出基于Gemini2.0的AI科研助手系统——AI co-scientist,旨在为科学家提供虚拟协作,从而生成新颖的研究假设和建议。这套系统不仅具备常规的文献审查和总结功能,更突破性地加入了原创知识发掘能力。AI co-scientist能够模拟科学方法的推理过程,根据已有证据和具体研究目标,为科研人员提供新颖的研究假设和建议方案。在实际应用方面,AI共同科学家已在三个关键生物医学领域取得了显着的成果。首先,在急性髓系白血病的药物再利用研究中,AI系统提出了新型药物候选
近日,谷歌宣布推出一款全新的视觉 - 语言模型(Vision-Language Model, VLM),名为 PaliGemma2Mix。这款模型融合了图像处理与自然语言处理的能力,能够同时理解视觉信息和文本输入,并根据需求生成相应的输出,标志着人工智能技术在多任务处理方面的进一步突破。PaliGemma2Mix 的功能非常强大,它集成了图像描述、光学字符识别(OCR)、图像问答、目标检测和图像分割等多种视觉 - 语言任务,适用于多种应用场景。开发者可以通过预训练检查点(checkpoints)直接使用这款模型,或根据自己的需求