🤖 AI Newsletter 日报

最近更新:2026年4月18日累计 29 篇
📅 2026年4月18日 · 10 篇(邮件 3 + 国际 3 + 国内 4)
🔥 重大发布/公告
Every · 🔥 重大发布
Opus 4.7 深度实测:更精确更字面化,但不再帮你"脑补"
五位测试者对 Anthropic 最新旗舰模型进行了覆盖编码、写作和 Agent 工作的全方位测评。
2026-04-17
Every 在 Anthropic 发布 Claude Opus 4.7 当天组织了五位测试者进行直播测评,超过 10000 人在线观看,Anthropic 研究员 Alex Albert 也加入了直播。经过两小时实测和团队讨论后的核心结论是:Opus 4.7 对写精确提示词的人是巨大升级,但对依赖模型"脑补"上下文的用户会感到沮丧。在编码方面,测试者 Kieran Klaassen 称这是他测试过的最强模型——第一个能完整构建含自定义产品设计器和可靠购物车的电商网站。Dan Shipper 看到它能写出"高级工程师级别"的代码诊断,但随后拒绝执行解决方案。写作方面,Mike Taylor 获得了比他自己写的还好的咨询文案和最佳幻灯片设计。但 Katie Parrott 在个人散文对比测试中选择了 4.6——4.7 的文稿"能力合格但节奏平淡"。Brandon Gell 让它做月度损益分析时发现,4.7 漏掉了一个 4.6 上月曾自动发现的数据错误。底层规律是:Anthropic 在版本间像调旋钮一样调节模型的"主动性",4.7 大幅回拨了 4.6 的"脑补填充"直觉,旧的 Opus 提示词需要重写才能在新版本上获得同样效果。
  • Kieran Klaassen:最强编码模型,首次完整构建复杂电商网站
  • 写作能力分化:商业文案出色,但个人散文节奏不如 4.6
  • 4.7 漏掉了 4.6 曾自动发现的数据错误——"主动性"被刻意降低
  • 核心建议:旧提示词需要重写,4.7 奖励精确规范的指令
  • Anthropic 在版本间调节模型"eagerness"旋钮,4.7 是一次大幅回调
📊
CNBC · 🔥 重大发布
Broadcom 与 Google、Anthropic 扩大芯片合作:3.5GW 算力协议
Anthropic 年化收入已超 300 亿美元,OpenAI 锁定 6GW AMD GPU,算力军备竞赛白热化。
2026-04-18
Broadcom 宣布与 Google 达成协议,将为其生产下一代 AI 芯片,并与 Anthropic 签署扩大合作协议——为 Anthropic 提供约 3.5 吉瓦的算力容量,基于 Google 自研的张量处理单元(TPU)。Anthropic 同时披露其年化收入已超过 300 亿美元,较去年底的约 90 亿美元大幅增长。Broadcom CEO Hock Tan 在此前财报电话会上表示,为 Anthropic 提供 1 吉瓦算力的计划在 2026 年初已取得良好进展。与此同时,OpenAI 也已承诺采用 6 吉瓦的 AMD GPU,首批 1 吉瓦预计在今年下半年上线。这一系列协议标志着 AI 行业的算力军备竞赛进入新阶段——头部 AI 公司正以前所未有的规模锁定芯片产能,算力需求以吉瓦为单位计量。
  • Broadcom 将为 Google 生产下一代 AI 芯片
  • Anthropic 获得 3.5GW 算力,年化收入飙升至 300 亿美元
  • OpenAI 锁定 6GW AMD GPU,首批今年下半年上线
  • 算力需求以吉瓦计量,AI 军备竞赛进入全新规模
💰 行业动态
🚀
TechCrunch · 💰 行业动态
OpenAI 收购个人财务 AI 创业公司 Hiro,加速 AI 生活场景渗透
OpenAI 持续通过收购拓展 AI 应用边界,Hiro 专注于用 AI 帮助普通人管理个人财务。
2026-04-13
据 TechCrunch 报道,OpenAI 已完成对 AI 个人财务创业公司 Hiro 的收购。Hiro 专注于利用 AI 帮助普通用户管理个人财务——包括预算规划、支出分析和财务目标跟踪。此次收购是 OpenAI 从通用 AI 平台向垂直生活场景渗透的最新举措,此前 OpenAI 已推出面向药物研发的 GPT-Rosalind。收购 Hiro 意味着 OpenAI 正在构建覆盖医疗、金融等高价值领域的 AI 应用矩阵。在更广泛的行业背景下,AI 创业公司的整合趋势正在加速——头部公司通过收购快速获取垂直领域的数据、人才和产品能力。OpenAI 的年化收入已超 250 亿美元,其激进的收购策略显示出从技术领先向生态领先转型的野心。
  • OpenAI 收购 AI 个人财务公司 Hiro,拓展生活场景应用
  • 继 GPT-Rosalind 后,OpenAI 持续布局垂直行业 AI
  • AI 创业公司整合加速,头部公司通过收购构建生态
🚀
TechCrunch · 💰 行业动态
Cognichip 融资 6000 万美元:用 AI 设计 AI 芯片
AI 芯片设计赛道升温,ChipAgents 和 Ricursive 已分别融资 7400 万和 3 亿美元。
2026-04-01
芯片设计 AI 创业公司 Cognichip 完成 6000 万美元融资,致力于构建深度学习模型辅助工程师设计新型计算芯片。Cognichip 的目标是与 Synopsys、Cadence 等 EDA 巨头竞争,用 AI 大幅缩短芯片设计周期并降低成本。这一赛道正在快速升温:ChipAgents 在 2 月完成了 7400 万美元 A 轮扩展融资,Ricursive Intelligence 在 1 月以 40 亿美元估值完成了 3.35 亿美元 A 轮融资。AI 芯片设计的核心逻辑是"用 AI 设计更好的 AI 芯片",形成正向循环:AI 需要更多更强的芯片,而 AI 本身可以加速芯片设计流程,从电路布局优化到功耗仿真全链条提效。这一趋势与 Broadcom、NVIDIA 等芯片巨头的 AI 战略形成互补——大公司做制造,AI 创业公司做设计智能化。
  • Cognichip 获 6000 万美元融资,用 AI 辅助芯片设计
  • 竞争对手 ChipAgents(7400 万)和 Ricursive(3.35 亿)已先行布局
  • "AI 设计 AI 芯片"形成正向循环,加速算力进化
  • 挑战 Synopsys、Cadence 等传统 EDA 巨头
🛠️ 工具应用
Every · 🛠️ 工具应用
"活的软件"vs"工具型软件":AI 时代的产品哲学
为什么 Figma 的频繁更新让人烦躁,但 AI Agent 的每日进化却令人期待?
2026-04-17
Every 高级编辑 Jack Cheng 提出了一个精辟的软件分类框架:"工具型软件"(Tool-like Software)和"活的软件"(Living Software)。工具型软件——如 Figma、Notion——用户期望它稳定一致,频繁添加半成品 AI 功能会让用户感到迷失。活的软件——如 AI Agent——用户理解它的能力在不断进化,愿意原谅它的失误。文章追溯了软件发展史:从 1980 年代软盘分发的 MS-DOS 到今天 AI 编码模型让单个开发者产出代码量暴增,更新节奏越来越快,但用户期望并未同步改变。对"工具型软件"构建者的建议:控制节奏,不要因为能快就快发;提前沟通变化;提供选退选项;把省下的开发时间用于性能优化。对"活的软件"构建者的建议:建立情感连接(如给 Agent 命名),利用"Beta 社区"效应增加用户容忍度。最坏的做法是"假装是工具,实际在变异"——让本应稳定的软件变成了"僵尸"。
  • 工具型软件应稳定一致,活的软件可以持续进化
  • AI 让软件更新速度暴增,但用户对"工具"的稳定性期望未变
  • 给 Agent 命名、建立情感连接能提高用户对变化的容忍度
  • 最差做法:让工具型软件"僵尸化"——假装稳定实际在变异
The AI Break · 🛠️ 工具应用
教程:用 ChatGPT 当品牌战略师,45 分钟搞定品牌全案
六步提示词链条:品牌审计→定位→痛点挖掘→信息架构→语调设计→品牌手册,替代 1.5 万美元的品牌代理。
2026-04-17
The AI Break 发布了一篇极为实用的教程:如何利用 ChatGPT 在 45 分钟内完成一套完整的品牌战略方案,替代原本需要 1.5 万美元和 6 周时间的品牌代理机构。教程采用六步提示词链条设计,每一步的输出自动成为下一步的输入。第一步"品牌审计师"——让 AI 像一个充满敌意的投资人一样审视你的现有品牌,检查 7 个维度的问题。第二步"定位专家"——基于 April Dunford 和 Al Ries 的定位理论,锁定品类、理想客户画像和"反客户"(主动拒绝服务的人群)。第三步"痛点挖掘"——基于 JTBD 框架,从功能性痛点、情感痛点到"身份焦虑"三层深挖。第四步"信息架构"——构建价值主张、信息支柱和 7 个风格各异的标语选项。第五步"语调设计"——制定品牌语音和语调规范。第六步——编译完整品牌手册并附带 90 天执行计划。
  • 六步提示词链条:审计→定位→痛点→信息→语调→手册
  • 每步输出喂入下一步,确保一致性和递进深度
  • 基于 April Dunford 定位理论和 JTBD 框架
  • 号称替代 1.5 万美元/6 周的品牌代理机构工作
🇨🇳 国内动态
🐧
腾讯新闻·麦可思研究 · 🇨🇳 国内动态
多所高校"人工智能"专业停招,热门专业遭遇就业现实检验
2024 届 AI 专业毕业生就业数据与预期存在偏差,部分高校开始收缩招生。
2026-04-17
尽管人工智能被贴上"高薪""紧缺""风口"等标签,但多所高校已开始停止"人工智能"本科专业的招生。据麦可思研究数据显示,2024 届人工智能专业本科毕业生的实际就业表现与公众想象存在明显偏差。这一现象背后有多重原因:一是 AI 行业对人才的需求偏向研究生及以上学历,本科层面的基础训练难以满足产业实际需要;二是专业设置扎堆导致供给过剩,不少高校在师资和实验条件不足的情况下仓促开设 AI 专业;三是行业发展速度远超课程体系更新速度,毕业生的知识结构可能已经过时。这与全球趋势形成有趣对比——美国科技公司正因 AI 自动化大量裁员,而中国则面临 AI 专业毕业生就业不达预期的困境,共同指向 AI 对劳动力市场的深层重构。
  • 多所高校停招"人工智能"本科专业
  • 2024 届 AI 专业就业数据与"高薪紧缺"预期存在偏差
  • 本科 AI 教育难以匹配产业对高层次人才的实际需求
🐧
腾讯新闻·微言教育 · 🇨🇳 国内动态
西安电子科技大学:人工智能赋能教育综合改革实践
《造物工程》课程重新定义 AI 时代的大学教学,从知识获取转向能力构建。
2026-04-17
作为教育强国建设三年行动计划的一部分,西安电子科技大学正在探索人工智能赋能教育综合改革的新路径。当 AI 让获取知识变得更加便捷时,大学课堂该怎么教?西电推出的《造物工程》课程是一个典型案例——不再以知识灌输为核心,而是培养学生利用 AI 工具解决实际工程问题的能力。这一改革方向回应了一个根本性问题:在 AI 时代,高等教育的价值不在于传授可被 AI 快速检索的事实性知识,而在于培养批判性思维、系统设计能力和人机协作素养。西电的实践被列入"强国看教育·走进改革攻坚一线"专栏,具有全国示范意义。
  • 《造物工程》课程:从知识灌输转向 AI 辅助工程实践
  • AI 时代高等教育价值重定义:批判思维 > 事实性知识
  • 列入"强国看教育"专栏,具有全国示范意义
🐧
腾讯新闻·中国新闻网 · 🇨🇳 国内动态
上海航天智能工厂:人工智能成火箭制造"新推进剂"
长征十二号等运载火箭制造已搭上智能化生产"高速列车",离散制造的 AI 化有独特挑战。
2026-04-16
中国航天科技集团八院上海航天设备制造总厂正在将人工智能深度融入运载火箭制造流程。长征十二号等运载火箭的生产已经实现智能化生产。与汽车等批量制造不同,航天产品属于"离散制造"——以单件小批量为主,这对 AI 的应用提出了独特挑战:无法简单套用大规模流水线的自动化方案,需要 AI 在灵活性和精确度之间找到平衡。智能工厂项目负责人介绍,AI 在航天制造中的应用涵盖生产流程优化、质量检测、供应链管理等多个环节。这一案例展示了中国在 AI+高端制造领域的前沿实践——将 AI 应用从互联网和消费场景延伸到国家战略级的航天工业。
  • 长征十二号火箭制造实现 AI 智能化生产
  • 航天离散制造对 AI 的独特挑战:单件小批量 vs 大规模流水线
  • AI 应用覆盖生产优化、质量检测、供应链管理
🐧
腾讯新闻·中国新闻网 · 🇨🇳 国内动态
宁台人工智能产业交流:两岸共话 AI 创新发展
全国首个线上线下融合的智能体集散中心"AI·模坊"亮相南京。
2026-04-17
作为"2026 江苏·南京台湾周"配套活动,宁台人工智能产业交流活动在南京举行。台湾工商建研会参访团走进中国(南京)软件谷,参观了南京"AI·模坊"智能体集散中心——这是全国首个线上线下融合的智能体集散中心,集展示、体验、开发功能于一体。活动通过实地参访和座谈交流,推动两岸 AI 产业合作。南京软件谷作为中国重要的软件产业基地,正在将 AI 智能体作为新的增长极。"AI·模坊"的概念值得关注:它试图为 AI 智能体创建一个类似"应用商店"的集散平台,让开发者能更便捷地展示和分发智能体产品。
  • "AI·模坊":全国首个线上线下融合的智能体集散中心
  • 两岸 AI 产业交流,推动合作创新
  • 南京软件谷将 AI 智能体作为新增长极
📅 2026年4月17日 · 10 篇(邮件 0 + 国际 6 + 国内 4)
🔥 重大发布/公告
📡
AINews / Anthropic · 🔥 重大发布
Anthropic 发布 Claude Opus 4.7——每个维度都比 4.6 更强
Anthropic 正式发布旗舰模型 Claude Opus 4.7,在复杂推理、长时间 Agent 工作流和代码生成方面全面超越前代。
2026-04-17
Anthropic 于 4 月 17 日正式发布了 Claude Opus 4.7,被描述为"在每个维度上都比 4.6 好一步"的模型。Opus 4.7 是 Anthropic 最新的旗舰模型,专注于复杂推理和长时间运行的 Agent 工作流。此次发布正值 AI 行业历史性的密集发布周——同一周内 GPT-6 和 Meta 的 LlamaCon 也接连亮相。Opus 4.7 延续了 Anthropic 在 Agent 领域的深入布局:此前的 Sonnet 4.6 和 Opus 4.6(2 月发布)已引入 100 万 token 上下文窗口和 Claude Memory 功能。新版本进一步强化了代码生成、安全研究和多轮对话的能力。在基准测试中,Claude 系列在 GDPval-AA Elo 排行榜上保持领先,Sonnet 4.6 此前以 1633 分位居榜首。行业分析指出,Opus 4.7 代表着 AI 从"回答问题的工具"向"自主完成复杂任务的 Agent"的持续演进。
  • Claude Opus 4.7 在推理、代码、Agent 工作流方面全面超越 4.6
  • 与 GPT-6、Meta LlamaCon 同周发布,AI 竞赛进入白热化
  • 延续 100 万 token 上下文、Memory 功能和 Managed Agents 生态
  • Claude 系列在 GDPval-AA Elo 排行榜保持领先地位
🚀
Ars Technica · 🔥 重大发布
Google 发布 Gemma 4 开源模型,正式切换至 Apache 2.0 许可证
四种规格覆盖从 H100 服务器到手机端,放弃限制性自定义许可证是最大亮点。
2026-04-17
Google 正式发布 Gemma 4 开源模型系列,包含四种规格:26B 混合专家模型(MoE,推理时仅激活 3.8B 参数)、31B 密集模型、以及面向移动设备的 E2B 和 E4B 轻量模型。最大变化是许可证从此前饱受争议的 Google 自定义许可证切换为 Apache 2.0——此前的 Gemma 3 许可证允许 Google 单方面修改条款,并要求开发者在所有衍生项目中执行 Google 的规则,甚至可能将许可扩展至 Gemma 合成数据生成的其他模型。Apache 2.0 没有这些限制。性能方面,31B Dense 模型在 Arena 开源排行榜位列第三(仅次于 GLM-5 和 Kimi 2.5),但体积远小于这些模型。基于 Gemini 3 技术,Gemma 4 支持原生函数调用、结构化 JSON 输出、Agent 工具集成和代码生成,上下文窗口最高 256K token。E2B 和 E4B 将成为下一代 Gemini Nano 4 手机端 AI 的基础,Google 与高通、联发科合作优化了在手机、树莓派和 Jetson Nano 上的运行体验。
  • 四种规格:26B MoE、31B Dense、E2B、E4B,覆盖云端到手机
  • 许可证从限制性自定义切换为 Apache 2.0,消除开发者顾虑
  • 31B 在 Arena 开源排行榜第三,26B MoE 推理仅激活 3.8B 参数,吞吐量极高
  • E2B/E4B 将成为 Gemini Nano 4 手机 AI 基础,支持语音识别
  • 支持原生函数调用、Agent 工具、代码生成,256K token 上下文
🏢
OpenAI / 界面新闻 · 🔥 重大发布
OpenAI 推出药物研发 AI 模型 GPT-Rosalind,加速新药发现
OpenAI 进军生物医药领域,GPT-Rosalind 旨在加速从靶点发现到临床试验的全流程。
2026-04-17
OpenAI 正在推出一款名为 GPT-Rosalind 的 AI 模型早期版本,专门面向药物研发领域。这是 OpenAI 首次推出垂直领域专用模型,标志着其从通用 AI 向行业深耕的战略转型。GPT-Rosalind 旨在加速从靶点发现、分子设计到临床试验数据分析的全流程。此举也与行业趋势一致:Novo Nordisk 已与 OpenAI 达成合作,计划在 2026 年底前全面部署 AI 到药物发现和全球运营中;Eli Lilly 此前也推出了制药业最强 AI 超算 LillyPod。AI 制药正在从实验阶段进入大规模临床应用阶段——AI 发现的候选药物已有多个进入中后期临床试验。OpenAI 年化收入已超 250 亿美元,此次进军医药显示了其将 AI 能力变现到高价值行业的野心。
  • GPT-Rosalind 是 OpenAI 首个垂直行业 AI 模型,聚焦药物研发
  • 覆盖靶点发现、分子设计到临床试验全流程
  • Novo Nordisk 已与 OpenAI 合作,计划 2026 年底全面部署
  • AI 制药从实验进入规模化临床阶段
🔬 研究突破
🌐
Stanford HAI / 参考消息 · 🔬 研究突破
斯坦福 2026 AI 指数报告:中美模型性能差距"基本消除"
编码基准从 60% 跃升至近 100%,AI 事故增至 362 起,能力加速但责任 AI 落后。
2026-04-17
斯坦福大学以人为本人工智能研究所(HAI)发布了 2026 年度 AI 指数报告,这是迄今最全面的 AI 行业数据分析。报告核心发现:中美 AI 模型性能差距已"基本消除"——中国的 GLM-5、Kimi 2.5 等模型在多项基准上与美国前沿模型不相上下。编码基准在一年内从 60% 跃升至接近 100%,代码生成已成为 AI 最成熟的能力之一。但报告同时指出,AI 事故数量上升至 362 起,负责任 AI 的发展严重滞后于能力进步。报告认为 AI 有望成为 21 世纪最具变革性的技术,但"除非我们审慎地引导其发展,否则其带来的福祉将无法实现普惠共享"。报告还揭示了 AI 产业的集中化趋势:OpenAI 和 Anthropic 的合计融资额占 Forbes AI 50 总融资的八成。
  • 中美 AI 差距基本消除,中国模型在多项基准上追平美国
  • 编码基准一年内从 60% 飙升至近 100%
  • AI 事故增至 362 起,责任 AI 发展严重滞后
  • AI 产业高度集中:OpenAI + Anthropic 融资占 AI 50 总额的 80%
🚀
NVIDIA · 🔬 研究突破
NVIDIA 发布 Ising:全球首个量子计算开源 AI 模型
量子纠错解码速度提升 2.5 倍、准确率提高 3 倍,哈佛和费米实验室已采用。
2026-04-14
NVIDIA 发布了名为 Ising 的全球首个面向量子计算的开源 AI 模型系列。Ising 模型专门用于量子计算中最关键的瓶颈之一——纠错解码。量子计算机中的量子比特(qubit)极易受噪声干扰产生错误,纠错解码是保证计算准确性的基础。Ising 模型实现了 2.5 倍的纠错速度提升和 3 倍的准确率改善。哈佛大学和费米国家加速器实验室已成为首批采用者。此举标志着 NVIDIA 正在将其 AI 优势延伸到量子计算领域,量子+AI 的融合可能开辟全新的计算范式。NVIDIA 在 GTC 2026 上已展示了企业级 Agent 部署框架 NeMoCLAW 和 OpenCLAW,此次量子 AI 模型进一步扩大了其 AI 生态版图。
  • 全球首个量子计算开源 AI 模型,聚焦量子纠错解码
  • 速度提升 2.5 倍,准确率提高 3 倍
  • 哈佛、费米实验室已采用
  • AI 与量子计算融合,开辟新计算范式
💰 行业动态
🐧
腾讯新闻·鞭牛士 · 💰 行业动态
福布斯发布第八届 AI 50 强榜单:OpenAI 与 Anthropic 融资占八成
两大巨头合计融资 2426 亿美元,年化收入分别超 250 亿和 190 亿美元,均在筹备 IPO。
2026-04-17
福布斯发布了第八年度 AI 50 榜单,评选全球最有前景的私营 AI 公司。OpenAI 和 Anthropic 继续占据前两名,两家合计融资额达 2426 亿美元,占本届 AI 50 总融资额 3056 亿美元的近八成。OpenAI 截至 2 月底的年化收入已超过 250 亿美元,Anthropic 接近 190 亿美元。两家巨头均在推进重磅 IPO。其他上榜公司中,xAI/SpaceX 以 1.75 万亿美元 IPO 目标备受关注;数据平台 Scale AI 以 54 亿美元年化收入和 2 万客户稳居前列;军工 AI 公司 Shield AI 完成 20 亿美元融资(15 亿股权 + 5 亿黑石优先股),估值达 127 亿美元,一年内增长 140%。榜单反映了 AI 产业的极度集中化趋势和头部公司的超速增长。
  • OpenAI + Anthropic 融资 2426 亿美元,占 AI 50 总额近八成
  • OpenAI 年化收入超 250 亿,Anthropic 接近 190 亿美元
  • xAI/SpaceX 筹备 1.75 万亿美元 IPO
  • Shield AI 估值一年增长 140% 至 127 亿美元
🚀
TechCrunch / Crescendo · 💰 行业动态
Snap 裁员 1000 人,CEO 直言 AI 驱动效率提升是核心原因
AI 已生成 Snap 超 65% 的新代码,预计年省 5 亿美元以上,股价反涨 11%。
2026-04-15
Snap 宣布裁员约 1000 人,占其全球员工总数的 16%。引人注目的是,CEO Evan Spiegel 公开将 AI 驱动的效率提升作为裁员的核心原因——这在大型科技公司中尚属罕见的直白表态。据报道,AI 已生成 Snap 超过 65% 的新代码,大幅降低了对传统工程人力的需求。此次重组预计将带来每年超过 5 亿美元的成本节省。市场对此反应积极,Snap 股价在消息公布后上涨 11%。这一事件与更广泛的行业趋势一致:Oracle 和 Block 宣布合计裁员 34000 人,Amazon 裁员 16000 人,Atlassian 裁员 1600 人,均将 AI 自动化作为重要原因。AI 对知识工作岗位的替代正从预测变为现实。
  • 裁员 1000 人(16%),CEO 罕见直言 AI 效率是核心原因
  • AI 已生成 Snap 超 65% 的新代码
  • 预计年省 5 亿美元以上,股价反涨 11%
  • Oracle、Amazon、Atlassian 等同期大规模 AI 驱动裁员
🌍 政策监管
📰
Reuters / Crescendo · 🌍 政策监管
美联邦法官裁定:AI 聊天记录不受律师-客户特权保护
Rakoff 法官认定用户与 Claude 之间不存在律师-客户关系,31 份 AI 生成文件须交出。
2026-04-15
美国联邦法官 Rakoff 做出了一项里程碑式裁决:AI 聊天机器人的对话不受律师-客户保密特权的保护。案件涉及一名当事人声称其与 Anthropic 的 Claude 模型的对话属于特权通信,不应被对方获取。Rakoff 法官明确裁定,用户与 AI 之间不存在律师-客户关系,因此 31 份 AI 生成的法律分析文件必须移交。此裁决对越来越多依赖 AI 进行法律研究和咨询的用户是一个重要警示。与此同时,内布拉斯加州最高法院因 AI"幻觉"问题暂停了一名律师的执照——其上诉简报中 63 条引用有 57 条存在缺陷,包含 20 条 AI 编造的虚假引用。2026 年第一季度,美国法院已对 AI 引用错误处以至少 14.5 万美元罚款。
  • 联邦法官裁定用户与 AI 之间不存在律师-客户关系
  • 31 份 AI 生成法律文件须移交,不受保密特权保护
  • 律师因 AI 幻觉引用被暂停执照,57/63 条引用有缺陷
  • Q1 2026 美国法院对 AI 引用错误处罚已超 14.5 万美元
🇨🇳 国内动态
🐧
腾讯新闻·九派新闻 · 🇨🇳 国内动态
湖北发布"人工智能+制造"路线图:2027 年推出百个高水平工业智能体
明确到 2027 年建成 100 个行业垂直大模型、100+ 高水平工业智能体。
2026-04-17
2026 湖北人工智能产业发展生态大会暨"AI+制造"政策宣贯活动于 4 月 16 日举办。湖北省经信厅现场发布并解读了《湖北省"人工智能+制造"专项行动实施方案》。路线图明确了两大核心目标:到 2027 年建成 100 个国内先进水平的行业垂直大模型,推出 100 个以上高水平工业智能体。方案涵盖智能制造的多个关键领域,旨在推动 AI 与传统制造业的深度融合。这是地方政府层面最具体的 AI+制造政策之一,反映了中国在 AI 应用落地上正从一线城市向内陆省份加速扩展。湖北作为制造业重镇,其 AI 战略对中部地区产业升级具有示范效应。
  • 2027 年目标:100 个行业垂直大模型 + 100+ 工业智能体
  • AI+制造深度融合,地方最具体的产业政策之一
  • 湖北作为制造业重镇的 AI 产业升级示范效应
🐧
腾讯新闻·每日经济新闻 · 🇨🇳 国内动态
高层表示今年重点在"人工智能+"基础设施领域扩大有效投资
政策层面明确将 AI 基础设施列为扩大投资的重点方向,利好算力和 AI 应用产业链。
2026-04-17
国家层面明确表示,2026 年将重点在"人工智能+"基础设施等领域开展一系列扩大有效投资行动。这一政策信号对 AI 产业链具有重要意义:算力基础设施、数据中心建设、AI 芯片和智能终端等领域将获得更多政策支持和资金投入。受此消息提振,A 股人工智能板块表现活跃,人工智能 ETF 华夏(515070)上涨 1.83%,新易盛领涨 8.36%,寒武纪上涨 2.60%。这与此前台积电因 AI 需求高增而加大资本支出的趋势一致。分析人士认为,政策端的明确信号叠加产业端 AI 需求的持续增长,将为中国 AI 基础设施建设带来新一轮投资周期。
  • 国家层面明确"人工智能+"基础设施为扩大投资重点方向
  • 利好算力基础设施、数据中心、AI 芯片产业链
  • 台积电同步加大资本支出,AI 需求持续高增
📅 2026年4月16日 · 4 篇
📡
AINews / Latent Space
安息吧 Pull Request(2005-2026)
代码审查死了,Pull Request 也要死了——当 AI Agent 成为代码的主要作者,Git 工作流还有存在的意义吗?
2026-04-16
本期 AINews 聚焦一个震动开发圈的话题:Pull Request 可能正在走向终结。PR 于 2005 年诞生,被 GitHub 发扬光大,但如今 GitHub 历史上第一次允许在开源仓库中禁用 PR。生成式 AI 的崛起早已预示了 PR 的消亡——知名开发者 Pete Steinberger 和 Theo 只接受"Prompt Request"而非 Pull Request,理由是:没有合并冲突、维护者更容易修改 prompt、且不容易夹带恶意代码。Mitchell Hashimoto 和 Amp Code 则创建了基于"信誉"的系统来处理不受信任的代码贡献。技术动态方面:OpenAI 将 Agents SDK 推向开源,支持持久化 Agent、文件/计算使用和记忆管理,Cloudflare、Modal、E2B、Vercel 等纷纷推出沙箱集成。Cloudflare 发布了 Project Think(持久执行 Agent SDK)、Agent Lee(控制面板内 Agent)和语音管道。Google 发布了 Mac 原生 Gemini 应用和 Gemini 3.1 Flash TTS。GPT-5.4 Pro 为厄多斯问题 #1196 提供了数学证明,被认为可能是首个被数学界广泛尊重的 AI 生成"优美证明"。NVIDIA 发布了 Nemotron 3 Super(120B 混合 Mamba-Attention MoE,12B 活跃参数,1M 上下文)。
  • GitHub 首次允许在开源仓库中禁用 Pull Request,"Prompt Request"模式兴起
  • OpenAI Agents SDK 开源化,Cloudflare/Modal/E2B/Vercel 推出沙箱集成生态
  • Cloudflare 密集发布:Project Think、Agent Lee、语音管道和浏览器自动化
  • GPT-5.4 Pro 为厄多斯问题 #1196 提供了令数学界瞩目的证明
  • NVIDIA Nemotron 3 Super:120B MoE 模型,12B 活跃参数,吞吐量最高达对标模型 7.5 倍
Every
你现在是经理了
开发者的角色正从写代码转向管理 Agent——Claude Code 新桌面端设计说明了一切。另外:小模型无法复制 Mythos 的能力。
2026-04-16
Every 本期的核心观点是:开发者的角色已经从"写代码"转变为"管理 Agent"。Anthropic 给 Claude Code 桌面端做了重新设计,加入了侧边栏管理多个会话、拖放面板、集成终端和文件编辑器,本质上是让开发者能并行监管多个 Agent 任务。这并非原创——Cora 的总经理 Kieran 指出这正是他已有的工作方式,Monologue 总经理 Naveen 则说 Cursor 早就有类似体验,"都是抄 Codex 的设计"。但它确认了编程未来的方向:监管 Agent,而非手写代码。CLI 吃掉 UI 的说法被否定了——Agent 做代码后,文本界面不再是好的主界面,未来的编程 UI 核心是管理并行工作和预览构建结果。另一个重要话题:有人声称小模型能找到和 Mythos 一样的安全漏洞,Every CEO Dan Shipper 反驳说这是框架问题——指着已知代码让小模型找 bug 和让 Mythos 自主在所有主流操作系统和浏览器中发现严重漏洞是完全不同的事。此外还介绍了 Claude Code 的"信心检查"工作流:完成任务后问它"1-100 你有多自信?"低于 90 分就打回重做,以及 Every 开发的 Tact 插件,教 AI Agent 读懂"社交氛围",不该说话时闭嘴。
  • Claude Code 桌面端重新设计,核心是并行管理多个 Agent 会话
  • 编程 UI 的未来:管理并行工作 + 实时预览,而非 CLI 日志和终端
  • Mythos 与小模型的能力差异是"框架层级"问题,不是简单的能力对比
  • "信心检查"工作流:让 Claude Code 自评 1-100 分,低于 90 分打回修改
  • Tact 插件:训练 Agent 识别 Slack 中该不该说话,编程"社交规范"
The AI Break
Claude Opus 4.7 可能本周发布——目前已知信息汇总
Anthropic 即将推出 Claude Opus 4.7 和 AI 设计工作室,Adobe 将 Firefly AI 接入 Claude,Google 推出免费 Mac Gemini 应用。
2026-04-16
The AI Break 本期速报围绕 Anthropic 的重磅动态:Claude Opus 4.7 即将发布,可能就在本周。与此同时,Anthropic 还在筹备一个 AI 设计工作室,其未公开的 Mythos 模型已成功完成了自主网络攻击模拟。行业动态方面:Adobe 推出 Firefly AI Assistant,能在整个 Creative Cloud 中协调多步创意工作流,即将推出与 Claude 的连接器。Google 发布了免费的 macOS 原生 Gemini 桌面应用,支持屏幕共享、键盘快捷键和内建图像生成。Snap 裁员约 1000 人,CEO Evan Spiegel 公开将 AI 作为裁员理由,预计年省 5 亿美元以上。Midjourney V8.1 默认输出原生 2K 高清图像,速度比 V8 快 3 倍、成本降低 3 倍,同时恢复了其标志性美学风格。投资方面:Artemis 融资 7000 万美元打造 AI 原生网络安全,Parasail 融资 3200 万美元构建 AI 超级云按 token 计费,Gizmo 融资 2200 万美元做 AI 自适应学习应用已有 1300 万用户。
  • Claude Opus 4.7 可能本周发布,Anthropic 同时筹备 AI 设计工作室
  • Adobe Firefly AI Assistant 上线,可在 Creative Cloud 中编排多步创意流程
  • Google 免费 Mac Gemini 应用:屏幕共享 + 键盘快捷键 + 图像生成
  • Midjourney V8.1:原生 2K 输出,3 倍速度提升,3 倍成本下降
  • Snap 裁员 1000 人,CEO 直言"AI 替代"为核心原因
🔳
Turing Post
如何大规模治理多 Agent 系统?
Galileo 和 CrewAI 联合举办线上研讨会,讲解如何在生产环境中安全、合规地管理多 Agent 系统。
2026-04-16
Turing Post 推荐了一场关于多 Agent 系统治理的线上研讨会(4 月 21 日),由 Galileo 联合创始人 Yash Sheth 和 CrewAI 创始人 Joao Moura 联合主讲。核心问题是:构建多 Agent 系统并不是最难的部分,大规模治理才是真正的挑战。研讨会将覆盖四个关键领域:如何在 Agent 中强制执行安全和安保策略;如何在运行时将 Agent 引导至最佳模型和后备工具以提高准确性并控制 token 成本;如何用一套集中化策略治理所有 Agent——无论是 CrewAI 构建的、内部开发的还是第三方的;以及如何让非技术利益相关者(如风控和合规团队)参与策略编写和维护,无需编码。这反映了 Agent 领域正从"能不能跑起来"进入"能不能安全合规地大规模运营"的成熟阶段。
  • 多 Agent 系统的核心难题不是构建,而是大规模治理——安全、成本、合规
  • 运行时模型调度:根据任务将 Agent 路由到最佳模型,失败时自动切换后备工具
  • 集中化治理:一套策略管所有 Agent(CrewAI、内部、第三方)
  • 非技术参与:让风控和合规团队直接编写治理策略,无需代码
📅 2026年4月15日 · 5 篇
📡
AINews / Latent Space
人类的最后挣扎
AI 让所有人更忙了——Agent 做了更多工作,但人类反而比以前更拼命。这是好事还是坏事?
2026-04-15
本期 AINews 探讨了一个令人困惑的悖论:AI Agent 在承担越来越多的工作,但所有人似乎比以前更忙了。Box CEO Aaron Levie 说"AI 并没有让任何人减少工作量";经济学家 Tyler Cowen 认为不管你认为 AI 会降低还是提升你的价值,你都应该现在拼命工作;Notion 的 Simon Last 因为 Agent 层的 token 焦虑重新回到了通宵工作状态。文章用"火鸡问题"做了一个深刻的类比:火鸡根据过往数据会认为人类永远会给它们喂食——直到感恩节来临。知识工作者会不会就是这样的火鸡?SWE-Bench 已经饱和,Claude Mythos 达到 78%,GPT 5.4 在 83% 的经济领域超过人类专家。技术新闻方面:Google Chrome 推出"Skills"功能,Tencent 的 HYWorld 2.0 将世界模型定位为可编辑 3D 场景生成器,Hermes Agent 被评为越来越成熟的本地 Agent 栈,Hugging Face 推出 Hub 上的 GPU Kernels 仓库。
  • AI 让所有人更忙:Agent 做更多事,人类也工作更努力,形成了反直觉的"双高"现象
  • "火鸡问题"类比:知识工作者可能在享受 AI 红利的最后时刻,不自知地走向被替代
  • SWE-Bench 已饱和,GPT 5.4 在 83% 的经济领域等于或超越人类专家
  • Hermes Agent 被 AINews 评为可靠性和记忆能力突出的本地 Agent 框架
  • Google Chrome Skills、HuggingFace Kernels、Gemini Robotics-ER 1.6 等多项技术发布
Every
迷你体验报告:Claude 托管 Agent 接管了基础设施工作
LLM 是不是终极 AI 形态?一位创始人提出了能量模型(EBM)作为替代方案。另外 Claude Managed Agents 让 Agent 基础设施开发者"虎躯一震"。
2026-04-15
本期包含两个重磅话题。第一是 Every 播客 "AI & I" 的新一期,Dan Shipper 对话 Logical Intelligence 创始人 Eve Bodnia,讨论了一个大多数 AI 圈人不敢问的问题:LLM 是不是 AI 最强大的形态?Bodnia 认为 LLM 在非语言任务(空间推理、逻辑验证、实时数据分析)上存在本质缺陷,她提出能量模型(EBM)作为替代——EBM 将所有可能结果映射到数学地形上,概率高的在"山谷",不像 LLM 逐 token 猜测,而是扫描全局找到最低点。她形容 LLM 像在旧金山没有地图开车,一旦走错就无法回头;EBM 则有鸟瞰视角。第二个话题是 Claude Managed Agents 让 Every 团队产生了"哦,糟糕"的感觉——他们花了数月建设的 Agent 基础设施,被 Anthropic 直接做成了产品。
  • LLM 替代论:能量模型(EBM)扫描全局概率地形找最优解,而非逐 token 猜测
  • EBM 三大优势:架构透明可解释、直接处理数字和空间数据、全局推理而非串行推理
  • Claude Managed Agents 对自建 Agent 基础设施的团队是一个"降维打击"时刻
  • Every 已经在用 Claude Managed Agents 构建产品
🔳
Turing Post
AI 101:什么是 Token(以及它为什么驱动 AI)
Token 是生成式 AI 的基本货币。一篇深入浅出的科普文章,从 BPE、WordPiece 到 SentencePiece 全面解析分词原理。
2026-04-15
Turing Post 推出了一篇 AI 101 基础科普:Token。Token 不等于单词——它可以是一个完整的单词、单词的一部分、标点符号或字符序列。模型不像人类一样"看到"文字和含义,它从 token 开始:文本被拆成小单元,转换为 ID,再转为向量,然后才开始处理。英语中的经验法则是 1 个 token 约等于 4 个字符或 3/4 个单词。但中文不一样:没有空格分隔,单个汉字往往就承载意义,所以分词更偏向字符级别,同一句话中文可能产生完全不同的 token 数。文章还介绍了三种主流分词方法:BPE(字节对编码)、WordPiece 和 SentencePiece,以及它们对模型效率、上下文窗口和跨语言性能的影响。Token 已成为 AI 的基本货币——它决定了模型能处理多少文本、响应速度、内存使用和运行成本。
  • Token ≠ 单词:可以是完整单词、子词片段、标点或字符序列
  • 英语约 1 token = 4 字符,中文因无空格分隔,分词更偏字符级别
  • 三大分词方法:BPE、WordPiece、SentencePiece 各有适用场景
  • Token 是 AI 的基本货币:决定成本、速度、上下文窗口大小
🔗
LangChain
Interrupt 2026 大会议程公布
Lyft、LinkedIn、Toyota 等团队分享 Agent 生产实战,Andrew Ng、Aaron Levie 参与演讲和对谈。
2026-04-14
LangChain 公布了 Interrupt 2026 大会的完整议程。去年 800 多名开发者参加了 Interrupt,讨论如何将 Agent 投入生产;今年的核心问题升级为:如何让 Agent 在企业级规模上运转?大会包含重磅演讲和炉边对谈:LangChain CEO Harrison Chase 两天都做开幕主题演讲,MongoDB CEO CJ Desai 谈企业中的 Agent,DeepLearning.AI 创始人 Andrew Ng 谈 AI Agent 的下一步,Box CEO Aaron Levie 谈 AI 驱动的企业软件。生产实战分享:Lyft 介绍了用 LangSmith 构建的评估系统,与产品策略和用户流程深度绑定;LinkedIn 分享了用 LangSmith + LangGraph 构建的 AI 招聘 Agent,帮助团队招聘速度提升 10 倍。此外还有 Toyota、Honeywell、Coinbase、Rippling 等团队的分享。
  • 核心议题:Agent 如何在企业级规模上运转
  • 重磅嘉宾:Andrew Ng、Aaron Levie、MongoDB CEO、LangChain CEO
  • Lyft 用 LangSmith 构建了与产品策略绑定的 Agent 评估系统
  • LinkedIn 的 AI 招聘 Agent 让招聘速度提升 10 倍
  • 包含 Deep Agents、LangSmith Align Evals 等动手 Workshop
The AI Break
教程:用 AI 替代你每月 2000 美元的视频编辑(Claude Code)
用 Claude Code 搭建 AI 视频工作室,从提示词直接生成品牌营销视频,无需剪辑软件、摄像头或外包。
2026-04-14
The AI Break 发布了一篇实战教程:如何用 Claude Code 构建一个 AI 视频工作室,完全替代每月 2000 美元的视频编辑外包。核心思路是三个部分协作:Claude Code 在 VS Code 中作为 AI 助手、一个 BRAND.md 品牌文件作为所有视频的"品牌真理来源"、以及一个免费视频框架将 Claude 的输出转化为真正的 MP4 文件。工作流程简洁:用英文提示 → Claude 生成分镜脚本 → 浏览器预览 → 跟进修改 → 一键渲染为 MP4。教程涵盖了完整的项目搭建:5 秒品牌 Logo 片头、15 秒产品预告片、10 秒数据展示动画、以及一个批量工厂能从一个模板渲染 10 个 Meta 广告变体。关键亮点是 BRAND.md 的设计——支持从网站 URL 或品牌指南 PDF 自动提取品牌信息,让所有未来视频自动保持品牌一致性。
  • 三大组件:Claude Code + BRAND.md 品牌文件 + 免费视频框架
  • 一键渲染:批量生成 10 个 Meta 广告变体的 MP4
  • BRAND.md 支持从网站和 PDF 自动提取品牌元素
  • 全程在 VS Code 中完成,零剪辑软件依赖