智谱清言浏览器插件近日宣布接入AutoGLM能力,标志着浏览器插件向智能Agent的进化。现在,通过AutoGLM的集成,清言插件能够根据用户的文字或语音指令,模拟人类操作自动完成网页任务,为用户提供“全自动”的上网新体验AutoGLM是智谱推出的一款大模型智能交互智能体(Agent),它能够理解用户意图并执行相应的操作。目前,这项能力已在百度搜索、微博、知乎、Github和Arxiv等数十个网站上实现,允许用户执行复杂的搜索和筛选任务,以及对多个链接内容进行总结。
智谱技术团队最近推出了一个基于GLM技术团队研究成果的新产品——AutoGLM,这是一个智能体(Agent),能够模拟人类操作手机,执行各种任务。AutoGLM的推出标志着人工智能在“Phone Use”领域的进步,使得AI的应用更加贴近人们的日常生活。
智谱AI宣布,其端到端情感语音技术已正式登陆智谱清言平台,并向所有用户开放。这项技术突破了传统文本转语音(TTS)技术的局限,能够深入理解上下文语境,并生成富有情感的自然对话。这标志着智谱AI的语音合成技术已经从简单的文字朗读进化到能够表达真实情感的人工智能。
智谱技术团队今日发布了一则振奋人心的消息,他们最新研发的文生图模型CogView3及其升级版CogView3-Plus-3B已正式开源,同时在"智谱清言"App中成功上线。这两款模型的问世,标志着AI辅助艺术创作迈入了一个新的阶段。CogView3作为一款基于级联扩散的文本转图像模型,其生成过程堪称精妙。模型首先生成一幅512x512像素的低分辨率图像,随后通过中继扩散过程将其提升至1024x1024,最终再次迭代,呈现出一幅2048x2048的高清大图。这种层层递进的生成方式,犹如数字画家在画布上逐步完善作品,为