站长之家(ChinaZ.com)6月12日 消息:苹果公司近日公布了其人工智能平台Apple Intelligence背后的核心技术——一个约30亿参数的设备端模型以及一个基于服务器的语言模型。在一系列评估中,Apple Intelligence的表现超越了包括Phi-3、Gemma、Mistral、DBRX在内的开源模型,以及GPT-3.5-Turbo、GPT-4-Turbo等商业模型,多数情况下被人类评估者优先选择。
Apple Intelligence的优化与应用
Apple Intelligence的基础模型专为文本写作与润色、通知的优先级排序与摘要、为与家人朋友的对话创建有趣的图像,以及简化应用内交互而优化。该模型使用开源AXLearn框架进行训练,结合数据并行、张量并行、序列并行和完全分片数据并行(FSDP)等先进技术,实现了高效且可扩展的训练过程。数据源包括经过授权的数据和苹果Bot爬取的公开数据,所有数据都经过严格过滤以保护用户隐私。
Apple Intelligence包含多个功能强大的生成模型,它们专为用户的日常任务设计,并能根据当前活动进行即时调整。基础模型经过微调,以提升用户体验,包括撰写和优化文本、优先处理和总结通知、为对话创造有趣的图片,以及简化跨应用的交互。
苹果公司还公布了一套负责任的AI原则,以指导开发AI工具及其基础模型。这些原则包括:
为用户提供智能工具:识别AI可以负责任使用的领域,创建满足特定用户需求的工具,并尊重用户使用这些工具的方式。
代表我们的用户:构建深具个性化的产品,真实代表全球用户,避免在AI工具和模型中延续刻板印象和系统性偏见。
谨慎设计:在设计、模型训练、功能开发和质量评估的每个阶段采取预防措施,避免AI工具被滥用或导致潜在伤害,并通过用户反馈不断改进。
保护隐私:通过强大的本地处理和私有云计算等基础设施保护用户隐私,在训练基础模型时不使用用户的私人数据或用户交互数据。
这些原则贯穿于Apple Intelligence的架构中,确保功能和工具与专用模型的连接,并为每个功能提供负责任运行所需的信息。