AI图像编辑应用Photoroom以5亿美元估值成功融资4300万美元。该应用通过人工智能技术为用户提供照片编辑服务,吸引了大量商业和休闲用户。融资参与者包括多家知名投资公司,Photoroom的市场份额不断增长。
被誉为“人工智能教母”的斯坦福大学计算机科学家兼初创公司创始人李飞飞,在下周巴黎人工智能行动峰会前,提出了“未来人工智能政策制定的三大基本原则”。她强调,人工智能政策必须以“科学而非科幻小说”为基础。李飞飞认为,政策制定者应聚焦人工智能的现实,而非构建于乌托邦或世界末日设想的宏大未来场景。她特别指出,聊天机器人和副驾驶程序并非“具有意图、自由意志或意识的智能形式”,政策制定者应避免“牵强附会的情景”,专注于“重大挑战”。其次,她强
近日,百度智能云正式推出了四款全新应用 —— 客悦、曦灵、一见和甄知,这些应用已成功接入最新版本的 DeepSeek 模型。这一举措不仅为企业提供了更为丰富的人工智能解决方案,还旨在满足在智能外呼、数字人视频脚本生成、视觉智能分析及知识管理等高价值业务场景中的多样化需求。随着数字化转型的加速,百度智能云也在积极推进各行业的应用落地,包括金融、交通、政务、汽车、医疗及工业等领域。目前,该公司正在加速验证这些行业应用与 DeepSeek 模型的适配性,力求探索大模
随着人工智能技术的不断发展,视觉与文本数据的融合成为了一项复杂的挑战。传统的模型往往难以准确解析表格、图表、信息图和图示等结构化视觉文档,这一限制影响了自动内容提取和理解能力,进而影响了数据分析、信息检索和决策等应用。面对这一需求,IBM 近期发布了 Granite-Vision-3.1-2B,一款专为文档理解设计的小型视觉语言模型。Granite-Vision-3.1-2B 能够从各种视觉格式中提取内容,包括表格、图表和图示。该模型基于精心挑选的数据集进行训练,数据来源包括公共和合成源,能够
Meta 最近宣布与联合国教科文组织(UNESCO)合作推出一项新的语言技术伙伴计划,旨在收集多种语言的语音录音和文字记录,以推动未来开放可用的人工智能(AI)发展。这项计划特别关注那些在数字环境中被忽视的少数民族语言。根据 Meta 的介绍,该计划希望吸引合作伙伴,提供超过10小时的语音录音及其转录内容、丰富的书面文本,以及翻译句子的集合。Meta 希望通过与合作伙伴的共同努力,将这些语言整合到其 AI 语音识别和翻译模型中,最终形成的成果将以开源形式发布。图源备注:图