OpenAI 买下 Python 工具链,大模型圈的"…
OpenAI 买下 Python 工具链,大模型圈的”基础设施争夺战”正式打响
📅 2026-03-20|约3200字|阅读约8分钟
这周 AI 圈最让我意外的消息,不是又一个”最强模型”发布,而是 OpenAI 宣布收购 Astral——那家做 uv、ruff、ty 的 Python 工具公司。
乍一看跟大模型没关系。但仔细想想,这可能是整个 AI 行业格局演变中最值得关注的信号之一:大模型公司开始把手伸向开发者基础设施。
一、本周大模型动态一览
事件
来源
重要性
OpenAI 收购 Astral(uv/ruff/ty Python 工具链)
OpenAI 官博
⭐⭐⭐⭐⭐
Mistral Small 4(119B MoE)开源发布,三合一能力
HuggingFace + Mistral
⭐⭐⭐⭐⭐
Gemini 3.1 Flash-Lite 发布,$0.25/1M tokens
Google DeepMind
⭐⭐⭐⭐
NVIDIA Nemotron-3 Super 120B 开放权重发布
NVIDIA
⭐⭐⭐⭐
Q ...
一个爸爸,一只狗,和一支改变医学史…
一个爸爸,一只狗,和一支改变医学史的疫苗
核心关键词: AI+医疗、mRNA癌症疫苗、AlphaFold、个性化医疗目标: 公众号文章,科技+情感双线叙事
一只被判了”死刑”的狗,在2024年活了下来。
不是因为顶尖药企砸了数十亿美元研发,不是因为她遇到了天才肿瘤科医生——而是因为她的主人,一个17年机器学习老兵,拿着ChatGPT、AlphaFold和一堆开源工具,把百年医药行业的壁垒,硬生生撬开了一条缝。
这个故事,正在重新定义”普通人”和”医学”之间的边界。
一、Rosie的绝望诊断悉尼科技企业家Paul Wood有一只混血梗犬,名叫Rosie。
2024年,Rosie被确诊为肥大细胞癌——犬类最常见的皮肤恶性肿瘤之一。Paul带着她做化疗、做手术,几万澳元打了水漂,肿瘤纹丝不动。
兽医最终摊牌:带她回家吧,最多还有六个月。
大多数人会在这里画上句号,在悲伤和无奈里度过最后的时光。
但Paul没有。
二、一个门外汉的逆袭计划Paul不是生物学家,不是医生,也没有实验室。但他有一项核心能力:知道如何用AI解决复杂问题。
他做的第一件事,是打开ChatGPT,问了一个最笨也 ...
"智能太便宜了":本周大模型圈,正在…
“智能太便宜了”:本周大模型圈,正在发生一场价格革命
📅 2026-03-13|约5200字|阅读约14分钟
这周 AI 圈有句话在传:**”Intelligence too cheap to meter.”**
说这话的,是国内 AI 公司 MiniMax。他们刚发布了 M2.5,宣称 $1 可以让模型以 100 token/s 的速度持续运行一小时。折算一下,这个价格比很多云服务器还便宜。
与此同时,Google 的 Gemini 3.1 Flash-Lite 在 $0.25/百万 token 的价位上,达到了上一代大模型的顶尖水平;NVIDIA 开源了 120B 参数的 Nemotron-3 Super,架构完全创新;阿里 Qwen3.5 在 HuggingFace 全面霸榜……
一个新的格局正在成形:大模型的智能正在极速商品化。
这意味着什么?未来会发生什么?本周,我们一起来梳理。
一、本周大模型动态一览
事件
发布方
亮点
Claude Sonnet 4.6 上线
Anthropic
接近Opus级智能,Sonnet价格,1M上下文窗口
...
AI Coding 正在进化:本周 GitHub,藏着一…
AI Coding 正在进化:本周 GitHub,藏着一套新玩法
📅 2026-03-09|约4500字|阅读约12分钟
这周打开 GitHub 热榜,我愣了一下。
不是因为某个新模型发布,也不是哪家公司又融了十亿。而是因为热榜上这些项目,隐约在讲同一件事——
AI 不再只是回答问题。它开始”干活”了。
从预测社会走向的群智引擎,到让 AI Coding 助手自动做”设计复查”的 Skill 框架,再到有人用 Bash 从零写出一个 Claude Code 克隆……
这些信号拼在一起,指向的是同一个方向:工具时代已经来了,下一场竞争,是谁能让 AI 更稳、更专、更有用。
以下是本周最值得关注的 5 个项目,逐一拆解。
总览:本周 GitHub 热榜精选
项目
今日新增⭐
一句话描述
MiroFish
+1104
盛大集团孵化,群体智能预测引擎
openai/skills
+612
OpenAI 官方 Codex Skill 目录
learn-claude-code
+566
从 0 手撸 Claude Code,12 章渐进教程
AFFiNE
+ ...
这周AI圈最魔幻的事:OpenAI发了GPT-5.4,…
这周AI圈最魔幻的事:OpenAI发了GPT-5.4,但最大的震动来自阿里
📅 2026-03-06|约5500字|阅读约14分钟
这周大模型圈像是被人扔了两颗手雷。
一颗是明面上的:OpenAI 在3月5日发布了 GPT-5.4,性能碾压 GPT-5.2,Google 也连发 Gemini 3.1 Pro 和 Flash-Lite,两家都在抢”最强模型”的名号。
另一颗是悄悄引爆的:阿里巴巴的 Qwen 团队核心成员集体请辞——就在他们刚刚发布了被业界认为”惊艳”的 Qwen 3.5 系列后不久。
这两件事放在一起,折射出当下 AI 产业的一个深层矛盾:技术的外壳越来越亮,但内部在悄悄地、大规模地重组。
一、本周大模型动态一览
事件
来源
亮点
评分
GPT-5.4 发布
OpenAI
合并 Codex 能力,原生计算机操作,专业工作能力+83%
⭐⭐⭐
Gemini 3.1 Pro 登顶 AI 综合榜
Google DeepMind
同价 Gemini 3 Pro,却在 10 大 benchmark 中领跑 6 项
⭐⭐⭐
Gemini 3.1 Flas ...
2026年了,为什么个人AI助手还是这么难用?
2026年了,为什么个人AI助手还是这么难用?
开头:一个普通人的噩梦上周,我朋友老张跟我抱怨,说他花了整整一个周末想给自己配一个”24小时在线的AI助理”。
不是什么大需求——就是能帮他看看邮件、提醒一下日程、偶尔查个资料、在微信上随时能问到的那种。听起来很简单,对吧?
结果呢?
他先去搜了搜”最强AI助理”,一堆文章说 OpenClaw 牛逼,自托管、可扩展、技术圈都在用。他兴冲冲地跟着教程走,搞了三个小时,发现要装 Node.js、要开服务器端口、要配置环境变量……最后卡在一行报错上,上网找了两小时没解决,默默关掉了电脑。
然后他看到有人说 Kimi Claw 在做云端版,赶紧去申请了一个 Beta 账号。注册成功,登进去,发现功能东一块西一块,不知道哪天某个功能就消失了——因为还在 Beta。
再然后他看到外国人都在用 Lindy,说能帮你处理邮件和日历,生活效率翻倍。他一查:$49.99/月,360人民币。还主要绑 iMessage……他是安卓用户。
到了周日晚上,他什么也没配成,钱也没花,但整个人已经累了一大截。
他问我:”2026年了,AI这么发达,为什么就找不 ...
大模型后训练,究竟在训练什么?
大模型后训练,究竟在训练什么?你有没有想过,ChatGPT、Claude、Qwen 这些 AI 助手,是怎么从”只会预测下一个字”变成”会和你聊天、帮你写代码、拒绝回答有害问题”的?
答案只有两个字:后训练。
今天这篇文章,不讲数学公式,只讲清楚一件事:大模型后训练到底是什么,不同类型的模型又是怎么训练的。
一、先搞清楚:预训练 vs 后训练要理解后训练,先得知道它的前一步——预训练。
打个比方:
预训练,就像一个人从小到大读了几万本书、刷了几十亿网页,学会了语言、积累了海量知识。
但读完书的人,不一定会”做事”——他可能说话啰嗦,可能回答问题前先背一遍原文,可能被人一激就说出不该说的话。
后训练,就是把这个”读了很多书的人”训练成一个”靠谱的助手”的过程。
具体来说:
预训练:用几万亿字的文本,让模型学会”预测下一个词”
后训练:用精心设计的数据和奖励,让模型学会”怎么帮人做事”
预训练决定模型知道多少,后训练决定模型用起来好不好用。
二、后训练的三种主要方法方法一:SFT(监督微调)——给模型示范答案SFT 的全称是 Supervised Fine-Tunin ...
阿里 Qwen 两周连发 5 款模型,这次是认…
阿里 Qwen 两周连发 5 款模型,这次是认真的最近半个月,阿里 Qwen 团队明显加速了——Qwen3.5 从旗舰大模型一路补齐小模型,同时还发布了生图模型、图片编辑模型、安全审核模型,以及翻译专用模型。
一个团队,两周内,五条产品线同时推进。今天我们来把这波发布梳理清楚。
一、Qwen3.5:从 397B 到 0.8B,全尺寸覆盖完成Qwen3.5 是这波发布的主线。
发布时间线:
2026-02-16:发布旗舰版 Qwen3.5-397B-A17B(MoE,激活参数 17B)
2026-02-24:补充中型号 Qwen3.5-122B-A10B、Qwen3.5-35B-A3B、Qwen3.5-27B
2026-03-02:发布小模型 Qwen3.5-9B、4B、2B、0.8B
至此,Qwen3.5 覆盖从 0.8B 到 397B 的完整尺寸谱系,开发者可以按需选择。
Qwen3.5 的四大核心升级:
① 原生多模态融合不是”视觉模块插件”,而是从预训练阶段就在多模态 token 上联合训练,视觉理解与语言推理能力同步提升,超越了此前独立训练的 Qwen3-V ...
阿里 Qwen3.5-27B 实测:270亿参数的"小钢…
阿里 Qwen3.5-27B 实测:270亿参数的”小钢炮”,能在本地跑的顶级开源模型
当大模型开始卷本地部署,27B 参数可能是甜点区。
01 模型简介:不是 MoE,是 Dense阿里在春节后开源了 Qwen3.5 系列的中等规模模型,其中 Qwen3.5-27B 是最受关注的一款。
关键规格:
参数
数值
总参数量
27B(全部激活,非 MoE)
架构
混合注意力(3:1 交替 Gated DeltaNet + 标准全局注意力)
上下文窗口
262K - 1M tokens
开源协议
Apache 2.0
多模态
原生支持(视觉+文本)
与除夕开源的 397B MoE 巨兽不同,27B 是密集模型(Dense)——每次推理全部 270 亿参数都参与计算。这意味着什么?部署门槛大幅降低,但性能依然能打。
02 性能实测:总榜第 8 的开源黑马根据非线智能 ReLE 评测(约 1.5 万题中文场景测试):
核心数据
指标
Qwen3.5-27B
对比上一代 Qwen3-235B-A22B
准确率
72.4%
65.5% (+6.9%)
...
AI Agent 的"地基"正在狂飙:本周 GitHub …
AI Agent 的”地基”正在狂飙:本周 GitHub 热榜,藏着一个统一的野心
📅 2026-03-02|约4500字|阅读约12分钟
这周的 GitHub 热榜,有点像在看一场基建大赛。
没有某个单一的大模型炸场,没有某家公司的发布会刷屏——但如果你把上榜的项目摆在一起,会发现它们都在干同一件事:
把 AI Agent 跑起来所需要的一切,从零开始盖楼。
沙箱、记忆、编排、IDE、最小化原理……这周开发者们集体在做”AI Agent 的基础设施”。这不是巧合,这是一个行业在从”能不能用”进化到”怎么用好”的必经阶段。
一、本周热榜速览
项目
今日新增⭐
一句话描述
alibaba/OpenSandbox
+1179
阿里开源 AI Agent 通用沙箱平台
ruvnet/ruflo
+766
Claude 生态多 Agent 编排框架
moeru-ai/airi
+736
自托管 AI 虚拟伴侣(支持实时语音+游戏)
superset-sh/superset
+389
AI Agent 时代的 IDE,并行跑 ...