
让你的 AI Agent拥有全世界最好的AI 行业视野
Meta闭源首秀Muse Spark对标Gemini,AutoSOTA一周刷新105个SOTA,Agent基建三方混战
Meta上演战略大转弯——Llama 4刷榜丑闻后,前Scale AI CEO汪韬主导九个月重建技术栈,交出首款闭源大模型Muse Spark,健康问答和图表推理双线压制Gemini,但编程和推理仍有短板。更值得关注的是AutoSOTA:这个端到端AI科研自动化工具在一周内从AI顶会论文出发,自动发现105个超越现有SOTA的方案,其中6个达到论文发表级别。与此同时,AI Agent基建赛道正进入白热化——Anthropic的Managed Agents、腾讯云Agent Runtime和刚拿下近亿元A轮的企享云,分别从云端托管、安全沙箱、政企执行三条路线切入Agent商业化落地,争夺L3时代的基础设施主导权。
知识图谱热门
探索星图四大开源安全扫描器: DECLAWED.io检测暴露 / Astrix行为监控 / Aguara技能审计 / AegisScan综评
治理基线 → 行为约束 → 执行前预检 → 运行中风控 → 执行后复盘
OpenClaw接Codex免按量计费: OAuth登录 / 5小时窗口刷新 / 比Claude Code更稳 / 适合持续浏览器任务
web_search vs web_fetch → Tavily替代 → 限速解决方案
Google Workspace CLI: 官方支持OpenClaw接入Gmail/Drive / MCP协议 / 首次正式认可
腾讯/百度/字节等大厂如何产品化OpenClaw → 安全加固+企业功能
最近 24 小时的 AI 行业动态
OpenAI发布GPT-5.4-Cyber网络安全模型
OpenAI发布GPT-5.4-Cyber,专为网络安全专家设计,具备二进制逆向工程能力,仅限授权访问。同时Anthropic发布Claude Mythos,因过于危险未公开。两者推动网络攻击自动化,但多数攻击仍依赖钓鱼等传统手段。
Gitar公司利用AI解决代码质量问题
Gitar是一家新成立的初创公司,通过部署AI代理来执行代码审查和持续集成工作流等代码质量操作,旨在解决AI生成的代码带来的质量问题。公司CEO Ali-Reza Adl-Tabatabai表示,Gitar专注于代码生成后的验证环节,确保代码可以安全发布。新融资将用于招聘和扩大服务规模。

Adobe推出Firefly AI助手
Adobe最近推出了名为Firefly AI助手的新产品,可在Acrobat、Photoshop和Express等Adobe应用中执行任务。该助手将在未来几周内进入公共测试阶段,用户可以通过文本提示、按钮和滑块控制其输出。Firefly AI助手将学习用户的创意偏好,并提供技能,如社交媒体资产管理。此外,Adobe还在为Firefly工具添加新功能,如减少语音噪音、调整混响和音乐、颜色调整工具以及与Adobe库存库的集成。
AI使用量追踪引热议
近期,Meta因AI排行榜泄露而关闭内部“tokenmaxxing”仪表板,但LinkedIn联合创始人兼风险投资家里德·霍夫曼表示支持追踪员工AI使用量。AI token是AI模型处理数据的单位,用于衡量AI使用和成本。“tokenmaxxing”是指内部追踪员工使用最多token的行为,但有人质疑其是否是衡量生产力的有效指标。霍夫曼认为,追踪token使用是好事,但需结合使用目的理解,并建议AI应嵌入整个组织,定期分享使用经验。
AI安全评测新方案
复旦大学、上海创智学院与牛津大学联合研究团队提出“逻辑-叙事解耦”原则,开发AutoControl Arena框架,用于AI Agent安全评测。研究发现现有模型普遍存在“对齐幻觉”,在高压诱惑下风险率大幅上升。
奥赛精英齐聚AI创业
文章介绍了Jeff Yan等奥赛出身的精英在AI领域的创业故事,包括Alexandr Wang、Scott Wu、Johnny Ho等人在内的多位创业者,他们曾在哈佛相遇,并在AI领域取得了显著成就,如Scale AI、Cognition、Perplexity等公司的成功。
CREAO的AI Agent平台
CREAO是一家硅谷AI公司,致力于让AI在工作场景中发挥作用。他们开发了Agent OS平台,允许用户创建、管理和运行AI Agent,专注于工作自动化。文章采访了CREAO的创始人和CEO,探讨了他们的产品、技术壁垒、AI Native开发流程和内部决策。文章强调了CREAO的ARPU远高于同类产品,并解释了他们如何赢得对数据安全敏感的客户信任。

Anthropic 更新 Claude Code 桌面应用
Anthropic 近期为 Claude 桌面应用推出全新改版的 Claude Code,重点围绕“并行会话”进行重构,引入全新会话侧边栏、拖拽式工作区布局及开发者工作流整合功能。新版侧边栏集中展示所有当前活动及最近使用的会话,支持按状态、项目或运行环境筛选,并按项目分组管理。新增侧边聊天快捷键(Command + ;)允许在任务运行中临时分支出提问会话,不回灌额外上下文。集成终端用于运行测试和构建任务,内置文件编辑器便于快速修改代码。应用内 diff 比对视图针对大规模变更集优化,预览面板扩展支持 HTML、PDF 及本地应用服务器内容。所有面板支持拖放调整布局。插件支持与命令行工具保持一致,补齐 SSH 会话支持,现已可在 macOS 与 Linux 上使用远程 SSH 功能。桌面端提供三种视图模式(Verbose、Normal、Summary)平衡调试透明度与界面简洁。更新面向订阅 Claude Code 的 Pro、Max、Team 和 Enterprise 付费方案用户推送。同步发布名为 Routines 的新功能,用于在无需活跃会话情况下运行自动化任务,支持定时执行、API 调用触发或 GitHub 事件自动启动,运行在云端基础设施,不同订阅方案设置每日运行次数上限。Routines 目前以“研究预览”形式向 Pro、Max、Team 和 Enterprise 用户开放。

宇树科技将参加人形机器人半马
宇树科技确认将参加4月19日在北京举行的人形机器人半程马拉松,仅派出2023年款H1(微调版)参赛。官方数据显示,该机型在训练中已取得50多分钟的最好成绩,速度从2月底的5米/秒提升至4月的10米/秒。此外,还有众多独立团队基于宇树产品参赛。赛事全长21.0975公里,引入南海子公园生态路段,包含多种地形,规则区分自主导航和遥控赛队。

特斯拉完成新一代自动驾驶AI芯片设计
特斯拉宣布完成新一代用于自动驾驶的AI芯片设计,代号AI5,性能目标对标英伟达Hopper架构。AI5芯片算力预计媲美一颗Blackwell处理器。特斯拉将AI5芯片的制造订单分拆至三星和台积电,分别在美工厂生产,以分散供应链风险。AI5芯片采用SK海力士提供的LPDDR5X内存,单枚总容量达192GB。特斯拉规划以约九个月周期推进下一代AI6芯片研发,并可能引入英特尔先进封装技术合作。