智谱 AI 发布中文 LLM 对齐评测基准 AlignBench

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
百度在2024世界大会上首次亮相其最新AI硬件产品——小度AI眼镜。这款被称为"全球首款搭载中文大模型的原生AI眼镜"的产品,展现了百度在可穿戴设备领域的创新实力。从硬件规格来看,小度AI眼镜在轻量化设计上取得突破,整机重量仅45克,确保佩戴舒适度。配备16MP超广角摄像头,集成AI防抖算法,可实现稳定的第一视角拍摄。在续航方面,官方数据显示待机时间可达56小时,支持超过5小时的持续聆听模式,同时具备30分钟快充能力。声学系统采用四麦克风阵列设计,配合开放式防漏音扬
北京智源人工智能研究院(BAAI)最近推出了全球首个中文大模型辩论平台FlagEval Debate。这一新平台旨在通过模型辩论这一竞争机制,为大语言模型的能力评估提供新的度量方式。它是智源模型对战评测服务FlagEval大模型角斗场的扩展,目标是甄别大语言模型之间的能力差异。
智谱 AI,大模型领域的独角兽企业,宣布完成数十亿元融资,用于支持技术创新与生态发展。此轮融资后,智谱估值达200亿元,领投方为中关村科学城公司,这是其2024年的第三笔融资。智谱的股东阵容包括中关村科学城、高瓴资本、启明创投、君联资本等知名投资机构,以及互联网巨头美团、阿里、腾讯和小米。
智谱 AI 旗下北京智谱华章科技有限公司近期注册资本由约2511.48万元增加至2790.54万元,彰显了公司的发展潜力。作为一家成立于2019年的科技公司,智谱华章专注于人工智能软件开发,特别是在理论和算法领域,持续推动行业创新。其股东阵容包括腾讯在内的多家知名企业,为公司提供了资金和资源支持。近期,智谱华章发布了多项国际领先的人工智能模型,包括语言、文生图、图像/视频理解和视频生成模型,展示了公司在人工智能领域的强大实力和创新能力。
智谱 AI 已发布其开源模型 GLM-4-9B 和 CodeGeeX4-ALL-9B 为 Ollama 支持。GLM-4-9B 属于多领域通用模型,表现出色并得到开放共享。基于上述模型的 CodeGeeX4-ALL-9B 则专注于多语言代码生成,显著提升生成能力。Ollama 是一款方便在本地环境部署大型语言模型的工具,支持 Windows、macOS、Linux 和 Docker,用户可快速运行所选模型,界面友好。时下版本的 Ollama 已支持对语言模型进行部署,但仍不支持多模态模型。用户可以通过以下链接访问模型:GLM-4-9B - <https://ollama.com/library/glm4>;CodeGeeX4-ALL-9B - <https://ollama.com/library/codegeex4>。
["智谱 AI 发布新一代大模型 GLM-4,逼近 GPT-4","GLM-4 支持更长的上下文和更强的多模态能力","GLMs 模型应用商店将同期公布","智谱 AI 强调支持开源和开发者社区"]
["智谱 AI 开源了 CogAgent,它是一个视觉语言模型拥有 180 亿参数规模。","CogAgent 在 GUI 理解和导航方面表现出色,在多个基准测试上取得了 SOTA 的通用性能。","该模型支持高分辨率的视觉输入和对话问答,并且可以针对任意 GUI 截图进行问答。","CogAgent 还支持 OCR 相关任务,通过预训练和微调,其能力得到了显著提升。","模型可以通过上传截图来进行任务推理,并返回计划、下一个动作以及具体操作的坐标信息。"]
["智谱 AI 发布高质量、低成本的评分模型 CritiqueLLM","传统评价指标如 BLEU 和 ROUGE 缺乏对整体语义的把握","CritiqueLLM 提出可解释、可扩展的文本质量评价模型","在 8 类常见任务中,CritiqueLLM 优于其他模型","CritiqueLLM 通过用户询问增广、含参考文本评价数据收集、无参考文本评价数据改写和训练模型的方法生成评分"]
["无问芯穹智能科技有限公司股东新增百度、腾讯、智谱 AI 等公司","无问芯穹注册资本由 119 万人民币增至 152 万人民币","无问芯穹致力于大模型推理优化","新增股东将为无问芯穹带来更多资源与支持","无问芯穹是一家初创公司,成立于 2023 年,专注于人工智能领域"]
["智谱 AI 在 2023 中国计算机大会上发布第三代基座大模型 ChatGLM3","ChatGLM3 具备多模态理解能力、代码生成和执行、网络搜索增强等新功能","ChatGLM3 经过深度优化,在中英文公开数据集测试中表现优秀","智谱清言成为国内首个具备代码交互能力的大模型产品","智谱 AI 期待国产原生大模型与国产芯片在国际舞台上脱颖而出"]