‍【AI 行业速看】

报道称 OpenAI、谷歌等 AI 模型遇瓶颈；
秘塔 AI 推出“知识库”功能；
阿里云开源 Qwen2.5-Coder 模型；
“AI 教母”李飞飞团队发布长时间视频理解新基准 HourVideo；
微软 Copilot 下月将添新选项，AI 聊天可选择关闭或启用网络搜索；
字节发布图像编辑模型 SeedEdit；
AI 重现披头士最后一首歌《Now and Then》，角逐格莱美；
李开复：现在卖大模型的方式行不通，需考虑技术和业务成本、要有客户买单；

报道称 OpenAI、谷歌等 AI 模型遇瓶颈

11 月 13 日，据彭博社报道，包括 OpenAI、谷歌和 Anthropic 在内的人工智能巨头公司在开发更先进的 AI 模型方面遇到了瓶颈，面临着“收益递减”的困境。

OpenAI 的最新模型 Orion 在处理编码任务方面表现不佳，与 GPT-4 相比，Orion 并没有显著的进步。谷歌即将推出的 Gemini 软件也面临类似的挑战，而 Anthropic 则推迟了其备受期待的 Claude 3.5 Opus 模型的推出。

据了解，这些挑战源于难以找到“新的、未开发的高质量人类生成训练数据”以及同时开发和运营新旧模型的巨大成本。（来源：彭博社）

秘塔 AI 推出“知识库”功能

秘塔 AI 近日推出了“知识库”功能，支持用户将 AI 搜索结果分类收藏至专题中，形成个人知识库。用户不仅可以收藏秘塔生成的回答，还能收藏搜索到的信息源并支持上传本地资料。

据悉，秘塔还开放了 API 接口，支持用户共享和共同编辑知识库，甚至可以创建前端页面应用。

秘塔 AI 搜索“知识库”功能目前仅支持 PC 端（https://metaso.cn/）使用。（来源：综合消息）

阿里云开源 Qwen2.5-Coder 模型

阿里云通义大模型团队于 11 月 12 日宣布开源其最新代码模型 Qwen2.5-Coder 系列。这一系列包括 0.5B、1.5B、3B、7B、14B 和 32B 共 6 种不同尺寸的模型，每个尺寸都提供了 Base 和 Instruct 两种模型，以适应不同的应用场景和需求。

其中，Qwen2.5-Coder-32B-Instruct 成为目前 SOTA 的开源代码模型，官方号称代码能力追平 GPT-4o。Qwen2.5-Coder 基于 Qwen2.5 基础大模型，通过大量数据训练，显著提升了 AI 编程的性能和效率，使得即使是编程初学者也能够轻松生成网站、数据图表、简历和游戏等复杂应用。

此外，通义官网即将上线代码模式，内测通道已开放申请，支持一句话生成网站、小游戏和数据图表等各类可视化应用。（来源：综合消息）

通义代码模式申请地址：

https://m.tongyi.aliyun.com/app/tongyi/tongyi-activity/subscribeCodeMode?pha=true&inFullScreen=1Github

项目地址：

https://github.com/QwenLM/Qwen2.5-Coder

“AI 教母”李飞飞团队发布长时间视频理解新基准 HourVideo

近日消息，斯坦福大学教授、被誉为“AI 教母”的李飞飞与吴佳俊团队联手推出一个用于一小时视频语言理解的基准数据集名为“HourVideo”。

据悉，HourVideo 包含了 500 段来自 Ego4D 数据集的手动筛选的第一视角视频，这些视频时长从 20 分钟到 120 分钟不等，覆盖了 77 种日常活动场景，如烹饪、修理、打扫卫生等。

并且，为了全面评估多模态模型对长时间视频的理解能力，研究团队设计了一套全新的任务集，涵盖了感知、理解和推理的多个层面，以最大程度地考察模型的长时间依赖和多模态综合能力，包括摘要生成、感知任务、视觉推理、导航任务等。

测试结果表明，即便是目前最先进的多模态模型，其表现也只是比随机猜测（20%）略好一点。在各类任务的表现上，GPT-4V 和 LLaVA-NeXT 的平均准确率分别为 25.7%和 22.3%，而 Gemini1.5 Pro 虽然在长时间视频理解方面表现稍好，但其准确率也只有 37.3%。相比之下，人类专家的平均准确率高达 85.0%，这说明当前的多模态模型在长时间视频理解方面与人类之间仍然存在巨大差距。（来源：综合消息）

论文地址：https://arxiv.org/abs/2411.04998

微软 Copilot 下月将添新选项，AI 聊天可选择关闭或启用网络搜索

11 月 12 日，根据 Microsoft 365 更新路线图，微软计划 12 月中旬为 Copilot 引入新控制选项，可以让用户控制是否将网络搜索查询发送到 Microsoft Bing。

用户可以通过新的控制选项禁用或启用网络搜索，如果用户禁用网络搜索，他们将被通知 Copilot 的回复将不包括来自网络的最新日期。如果管理员在 Microsoft 365 管理中心使用“可选连接体验”，或禁用了“在 Copilot 中允许网络搜索”，在此次更新后，网络搜索将保持禁用状态。（来源：综合消息）