在人工智能技术飞速发展的当下,OpenAI 于2023年10月1日推出了其最新的实时 API,旨在为开发者提供构建智能语音应用的强大工具。此 API 的发布受到了广泛关注,尤其是在 OpenAI DevDay 新加坡站上,Daily.co 的工程师分享了他们在使用这一 API 过程中获得的经验和教训。该工程师们不仅借助实时 API 搭建产品,还积极参与了开源项目 Pipecat 的开发,旨在为更多开发者提供便利。实时 API 的核心功能是其出色的 “语音到语音” 处理能力,这使得开发者能够以极低的延迟实现语音交互。通过将语音输
微软近期在 Hugging Face 平台上发布了名为 Phi-4的小型语言模型,这款模型的参数量仅为140亿,但在多项性能测试中表现出色,超越了众多知名模型,包括 OpenAI 的 GPT-4o 及其他同类开源模型如 Qwen2.5和 Llama-3.1。在之前的在美国数学竞赛 AMC 的测试中,Phi-4获得了91.8分,显著优于 Gemini Pro1.5、Claude3.5Sonnet 等竞争对手。更令人惊讶的是,这款小参数模型在 MMLU 测试中取得了84.8的高分,充分展现了其强大的推理能力和数学处理能力。与许多依赖于有机数据源的模型不同,Phi-4采用了创新的方法来生
在2025年的 CES 展会上,闪极正式推出了其海外全新子品牌 loomos,并首发了一款名为 loomos AI 眼镜的新产品。这款眼镜在硬件配置和功能上,与国内版本的闪极 AI「拍拍镜」几乎一致,支持高达4K 的照片拍摄和1080P 的视频录制。不同之处在于,loomos AI 眼镜搭载了由 GPT-4o 驱动的语音助手,能为用户提供即时帮助,如文字翻译、物品识别、记忆车位以及信息检索等。loomos AI 眼镜预计将于1月21日左右在 Kickstarter 平台上开启众筹。官方同时宣布,将在北美和欧洲等地区设立分公司,致力于推动闪
在2025年 CES 消费电子展上,闪极宣布了其全新海外子品牌 loomos,并推出了最新的 loomos AI 眼镜。这款眼镜的硬件配置和特色功能基本与国内版本的闪极 AI “拍拍镜” 相同,支持拍摄4K 照片和1080P 视频,展现出强大的影像能力。与国内版本不同,loomos AI 眼镜搭载了由 GPT-4o 驱动的语音助手,可以为用户提供即时的帮助,例如文字翻译、物品识别、记忆停车位置和信息检索等实用功能。用户可以通过简单的语音指令,获得所需的信息或服务。据悉,loomos AI 眼镜将于1月21日在 Kickstarter 平台开启