一款创新的 AI 菜单可视化工具 PicMenu 近日问世,它能通过简单的拍照操作,将传统纸质菜单转化为生动直观的数字化展示。这款工具不仅能为每道菜自动生成高质量图片,还能提供丰富的菜品信息,为餐饮行业的数字化转型提供了全新解决方案。PicMenu 采用了多重 AI 技术栈来确保其强大的功能实现。该工具运用了 Together AI 的 Llama3.2Vision90B 模型进行菜单信息提取,配合 Llama3.18B 模型生成结构化数据,并通过 Flux Schnell 模型创建逼真的菜品图像。在技术架构上,PicMenu 选择了 Next.js 和 TypeScrip
随着渐冻症(ALS)等运动障碍患者日常沟通的困难,传统的辅助性沟通工具往往无法高效解决眼动打字过程中按键操作频繁带来的眼疲劳和高时间成本。为了解决这一问题,谷歌研究团队开发了一款名为SpeakFaster的用户界面(UI),它利用大语言模型(LLM)和对话语境,帮助ALS患者显著提升沟通效率。SpeakFaster通过预测用户输入的首字母缩写,并根据对话上下文扩展为完整的短语,减少了眼动打字的按键次数高达57%,文本输入速度较传统方法提升了29%至60%。该系统经过微调的LLM结合了三个不同的输
在肯尼亚,越来越多的年轻人被人工智能这个新兴行业吸引,加入到数据标注的工作中。这项工作听起来很酷,但实际上却暗藏许多不为人知的辛酸。许多年轻人在这个行业里打拼,试通过劳动改变自己的命运,却发现自己置身于一个低工资、高压和心理困扰的环境中。图源备注:图片由AI生成,图片授权服务商Midjourney在内罗毕的一个办公空间里,娜夫塔利・万巴洛,一位数学专业的毕业生正忙于给数以千计的图片和视频标注标签。他的工作是教 AI 识别图像中的物体,比如告诉机器 “这是
OpenAI 正在考虑开发一款集成其对话机器人技术的全新网络浏览器。据科技媒体 The Information 报道,这家人工智能巨头已经开始与多家合作伙伴洽谈,计划整合旅游、餐饮、房地产和零售等领域的搜索功能。这一消息的可信度因一则重要人事任命得到进一步印证:Chrome 浏览器的联合开发者 Darin Fisher 已于去年11月加入 OpenAI。不过据知情人士透露,整个项目目前仍处于早期阶段,具体的发布时间表尚未确定。事实上,OpenAI 已经通过推出 ChatGPT 桌面应用和 ChatGPT 搜索功能,在与谷歌的竞争中迈出