AI 日 报
OpenAI发布GPT-5.4:首个具备原生电脑操控能力的通用AI模型
3月6日,OpenAI正式发布GPT-5.4,这是全球首个具备"原生电脑使用"能力的通用大模型。用户现在可以让ChatGPT直接"看"屏幕截图,操控鼠标和键盘完成发邮件、排日程、填表格等任务。在OSWorld-Verified测试中,GPT-5.4以75%的成功率超越人类基准线(72.4%)和竞品Claude Opus 4.6(72.7%)。
核心性能方面,GDPval测试胜率达83%,追平顶尖人类专家;SWE-Bench Pro编程准确率57.7%,刷新编程类基准纪录;FrontierMath数学测试成绩第一。更值得关注的是,GPT-5.4继承了GPT-5.3-Codex的全部编程基因,并新增100万token上下文和原生工具搜索功能,实现推理、编程、操控全链路能力融合。定价方面,标准版输入$2.5/百万token,输出$15/百万token;Pro版输入$30/输出$180每百万token。
中国十部门联合发布AI伦理审查办法:聚焦人类福祉与可控可信
工业和信息化部等十部门近日联合印发《人工智能科技伦理审查与服务办法(试行)》,这是中国首个系统性AI伦理治理框架。办法明确,审查将聚焦三大核心维度:人类福祉(训练数据选择标准、算法合理性)、公平公正(防止偏见歧视、保障决策包容性)、可控可信(风险披露与透明度)。
该文件特别强调"以技术手段防范伦理风险",支持AI伦理审查技术创新,推动高质量数据集有序开源,并探索基于应用场景的风险评估机制。业内人士分析,此举标志着中国AI治理从"原则倡导"进入"制度化落地"阶段,也呼应了今年《政府工作报告》中"完善人工智能治理"的政策导向。
阿里AI战略大调整:通义实验室升级为独立事业部
4月8日,阿里巴巴集团CEO吴泳铭发布内部信,宣布成立阿里巴巴集团技术委员会并出任组长,成员包括周靖人、吴泽明、李飞飞等核心高管。最重要的变化是,通义实验室正式升级为通义大模型事业部,获得更独立的运营权限和资源倾斜。
内部信指出,此次调整的核心目标是"加速AI建设,将技术落到业务中"。此前阿里已明确"用户为先、AI驱动"战略,此次组织升级被外界视为阿里在大模型竞争进入深水区后的战略卡位。值得注意的是,同期公布的Interconnects AI报告显示,阿里云通义千问(Qwen)已占据全球开源模型下载量的50%以上,累计下载量接近10亿次,2026年2月单月更在Hugging Face产生约1.536亿次下载。
DeepSeek V4将于4月下旬发布:首次深度适配国产芯片
据知情人士透露,DeepSeek创始人梁文锋近日在内部会议中确认,新一代旗舰大模型DeepSeek V4将于4月下旬正式发布。这是继DeepSeek-R1引发全球关注后,该团队的又一次重大产品迭代。
核心亮点包括:万亿参数规模、百万级上下文窗口。更具战略意义的是,DeepSeek V4首次实现与华为昇腾等国产芯片的深度适配,标志着中国AI产业在"去CUDA化"道路上迈出关键一步。近期DeepSeek网页端已悄然上线"快速模式"和"专家模式",为新版本发布做铺垫。业界认为,DeepSeek V4将成为检验国产大模型能否真正实现"自主可控"的重要标尺。
Claude企业价值凸显:每用户年化贡献达808美元
AI产品榜发布的2026年3月网站榜单揭示了一个有趣现象:在用户规模上,ChatGPT月活9.61亿是Claude 2350万的40倍;但在商业价值转化上,Claude反而更胜一筹。数据显示,Claude每用户年化贡献高达808美元,是ChatGPT(26美元)的30倍。
Claude的年化营收(ARR)已从2025年底的90亿美元飙升至300亿美元,而OpenAI同期为250亿美元。更关键的是,Anthropic拥有超过1000家年消费超百万美元的企业客户,在企业级AI市场(尤其编程和专业领域)建立了差异化优势。这一数据对比揭示了AI商业化的深层逻辑:用户数量不等于商业价值,高价值垂直场景的深耕可能比流量扩张更具盈利潜力。
OpenAI商业化加速:联手Criteo布局数字广告业务
The Information披露,OpenAI已与全球最大独立需求方平台The Trade Desk(TTD)及法国广告技术公司Criteo展开合作谈判,计划在ChatGPT产品中引入程序化广告。CEO奥特曼此前坚称"抵触广告",如今态度转向"务实应用",反映出AI商业化压力的现实。
据测算,ChatGPT市场份额已从一年前的80%降至约70%,企业级市场更被Claude侵蚀至27%。尽管ChatGPT年化收入突破200亿美元,但2025年上半年实际经营亏损仍达78亿美元。OpenAI计划2026年下半年开始小规模测试广告,2027年全面铺开,预期当年消费者产品收入翻倍至170亿美元。广告定价初步定为每千次展示60美元起,最低投入门槛20万美元。
灵初智能发布Psi-R2:10万小时人类数据训练的具身智能突破
4月10日晚,国内具身智能企业灵初智能正式发布Psi-R2策略模型与Psi-W0世界模型。该系列模型总计使用近10万小时的人类操作数据进行训练,在MolmoSpaces排行榜上登顶,引发行业关注。
Psi-R2定位为高表现力的策略控制模型,Psi-W0则聚焦于构建物理世界的内部表征。两者的协同被视为具身智能"从数据驱动向技能迁移"的关键突破。与传统基于强化学习的方案不同,灵初智能强调"人类示范"在技能习得中的核心作用,试图让机器更好地理解和模仿人类行为模式。
教育部等五部门联合印发"AI+教育"行动计划
教育部联合四部门正式发布《"人工智能+教育"行动计划》,这是继2025年"AI+"战略在制造业、医疗等领域落地后,教育领域的专项政策部署。计划旨在推动AI与教育理念、教学模式、教育治理的深度融合。
政策涵盖智能教学助手开发、教育大数据应用、教师AI素养提升、教育资源均衡化等多个维度。业内人士分析,该计划与此前引发争议的"胚胎多基因筛查"技术形成对照,折射出政策层面对AI在敏感领域应用的审慎态度——医疗AI强调"辅助"而非"替代",教育AI则更侧重于普惠与公平。
月之暗面杨植麟受邀参加国务院经济座谈会
4月10日下午,国务院总理李强主持召开经济形势专家和企业家座谈会。8位发言者中,月之暗面(Kimi)创始人杨植麟作为AI行业代表受邀参加。这位1993年出生的广东汕头人,2023年初创立月之暗面,其推出的Kimi智能助手已成为国内AI应用的重要力量。
杨植麟的入选被外界视为政策层面对AI创业公司地位认可的信号。同期受邀的还有招商局集团、上海数据集团等国企负责人,以及清池资本等投资机构代表,形成"国营+民营+资本"的多元对话格局。
OpenAI CEO奥特曼遭遇死亡威胁:AI安全议题再度升温
据海外媒体报道,当地时间凌晨3点45分,OpenAI CEO山姆·奥特曼在其住所遭到燃烧瓶袭击。嫌疑人(20岁男子)已被逮捕,燃烧瓶偏离房屋未造成人员伤亡。奥特曼罕见发布家人照片,希望劝阻潜在袭击者。
这一事件发生在AI伦理争议持续发酵的背景下。Nature日前发表评论文章,呼吁建立AI战争伦理框架,提出CARE原则(集体利益、授权控制、责任与伦理)。与此同时,《麻省理工科技评论》2026年"十大突破性技术"名单中,"AI陪伴技术普及与风险"首次单独成项,反映出社会对AI负面影响的警觉度正在上升。
📝 整体评论:AI竞争进入"组织战"与"合规战"双轨时代
纵览今日资讯,三个关键趋势浮出水面。
第一,"模型即产品"向"模型即平台"转型加速。 GPT-5.4的原生电脑操控能力、Claude的100万token上下文、DeepSeek V4的国产芯片适配……这些迭代已不再是单纯的性能竞赛,而是各家在争夺"AI操作系统"的定义权。当模型能直接操控电脑、调用工具、管理工作流,它就不再是问答工具,而是数字世界的入口。
第二,中国AI治理进入制度化深水区。 十部门联合发布的伦理审查办法,标志着"先发展后治理"的粗放模式告一段落。从训练数据选择到算法偏见防范,从应用场景评估到风险预警机制,监管框架正在与技术创新同步构建。值得关注的是,这一进程与OpenAI的广告变现、Claude的企业级深耕形成对照——中美两国选择了不同的AI商业化路径。
第三,AI竞争从"技术竞争"演变为"组织竞争"。 阿里通义升格、DeepSeek独立运营、月之暗面创始人进入政策对话……这些信号表明,下一阶段的AI博弈将取决于生态整合能力、政策协调能力与商业化可持续性的综合比拼。奥特曼遭遇的安全威胁、Nature对AI战争伦理的呼吁,都在提醒:技术能力越强,社会治理的挑战越大。
可以预见,2026年下半年,AI行业将迎来更激烈的头部洗牌,而"合规能力"将成为继"模型能力"之后的第二护城河。