作为OpenAI和Anthropic之外最受关注的AI初创公司之一,Cohere在 7 月份的估值已高达 55 亿美元。这家公司的联合创始人之一正是“Attention Is All You Need”论文的作者,这篇论文被认为是引发大型语言模型(LLM)革命的关键。
图源备注:图片由AI生成,图片授权服务商Midjourney
作为OpenAI和Anthropic之外最受关注的AI初创公司之一,Cohere在 7 月份的估值已高达 55 亿美元。这家公司的联合创始人之一正是“Attention Is All You Need”论文的作者,这篇论文被认为是引发大型语言模型(LLM)革命的关键。
图源备注:图片由AI生成,图片授权服务商Midjourney
在当今数字化的世界里,短文本的使用已成为在线交流的核心。然而,由于这些文本往往缺乏共同的词汇或背景,使得人工智能(AI)在分析时面临诸多挑战。对此,悉尼大学的一名英语文学研究生兼数据科学家贾斯汀・米勒(Justin Miller)提出了一种新方法,利用大型语言模型(LLMs)对短文本进行深入理解和分析。米勒的研究重点在于如何将大量短文本,如社交媒体个人资料、顾客反馈或与灾难事件相关的在线评论,进行有效的分类。他开发的 AI 工具可以将数以万计的 Twitter 用户个人简介聚类
DeepSeek近日正式发布并开源了其最新研发的大型语言模型R1,该模型在性能上表现出色,被认为可与OpenAI的o1正式版相媲美。这一举措不仅标志着国产AI技术的又一次重大突破,也为全球AI开发者带来了新的选择。DeepSeek R1在后训练阶段大规模应用了强化学习技术,即便是在极少标注数据的情况下,也显著提升了模型的推理能力。在数学、代码、自然语言推理等关键任务上,DeepSeek R1的性能均能与OpenAI o1正式版平分秋色,展示了其强大的实力。为了回馈开源社区,DeepSeek同时开源了DeepSeek-R1和De
近日,一项由奥地利复杂科学研究所(CSH)主导的研究显示,尽管大型语言模型(LLMs)在多项任务中表现优异,但在应对高级历史问题时却暴露了短板。研究团队针对三大顶尖模型进行测试,包括 OpenAI 的 GPT-4、Meta 的 Llama 和谷歌的 Gemini,结果让人失望。图源备注:图片由AI生成,图片授权服务商Midjourney为了评估这些模型在历史知识上的表现,研究者们开发了一个名为 “Hist-LLM” 的基准测试工具。该工具依据 Seshat 全球历史数据库,旨在验证 AI 回答历史问题的准确性。研究结果在知名人工智
最新研究显示,尽管人工智能在编程和内容创作等领域表现出色,但在处理复杂的历史问题时仍显不足。近期在NeurIPS会议上公布的一项研究表明,即使是最先进的大型语言模型(LLM)在历史知识测试中也难以取得令人满意的成绩。研究团队开发了名为Hist-LLM的测试基准,对OpenAI的GPT-4、Meta的Llama和谷歌的Gemini三款顶级语言模型进行评估。测试基于Seshat全球历史数据库进行,结果令人失望:表现最佳的GPT-4Turbo准确率仅为46%。图源备注:图片由AI生成,图片授权服务商Midjourney伦敦大学学院副教授