Tito Chan Blog

发表于2026-03-20|AI

OpenAI 买下 Python 工具链，大模型圈的”基础设施争夺战”正式打响 📅 2026-03-20｜约3200字｜阅读约8分钟这周 AI 圈最让我意外的消息，不是又一个”最强模型”发布，而是 OpenAI 宣布收购 Astral——那家做 uv、ruff、ty 的 Python 工具公司。乍一看跟大模型没关系。但仔细想想，这可能是整个 AI 行业格局演变中最值得关注的信号之一：大模型公司开始把手伸向开发者基础设施。一、本周大模型动态一览事件来源重要性 OpenAI 收购 Astral（uv/ruff/ty Python 工具链） OpenAI 官博 ⭐⭐⭐⭐⭐ Mistral Small 4（119B MoE）开源发布，三合一能力 HuggingFace + Mistral ⭐⭐⭐⭐⭐ Gemini 3.1 Flash-Lite 发布，$0.25/1M tokens Google DeepMind ⭐⭐⭐⭐ NVIDIA Nemotron-3 Super 120B 开放权重发布 NVIDIA ⭐⭐⭐⭐ Q ...

一个爸爸，一只狗，和一支改变医学史…

发表于2026-03-16|AI

一个爸爸，一只狗，和一支改变医学史的疫苗核心关键词： AI+医疗、mRNA癌症疫苗、AlphaFold、个性化医疗目标：公众号文章，科技+情感双线叙事一只被判了”死刑”的狗，在2024年活了下来。不是因为顶尖药企砸了数十亿美元研发，不是因为她遇到了天才肿瘤科医生——而是因为她的主人，一个17年机器学习老兵，拿着ChatGPT、AlphaFold和一堆开源工具，把百年医药行业的壁垒，硬生生撬开了一条缝。这个故事，正在重新定义”普通人”和”医学”之间的边界。一、Rosie的绝望诊断悉尼科技企业家Paul Wood有一只混血梗犬，名叫Rosie。 2024年，Rosie被确诊为肥大细胞癌——犬类最常见的皮肤恶性肿瘤之一。Paul带着她做化疗、做手术，几万澳元打了水漂，肿瘤纹丝不动。兽医最终摊牌：带她回家吧，最多还有六个月。大多数人会在这里画上句号，在悲伤和无奈里度过最后的时光。但Paul没有。二、一个门外汉的逆袭计划Paul不是生物学家，不是医生，也没有实验室。但他有一项核心能力：知道如何用AI解决复杂问题。他做的第一件事，是打开ChatGPT，问了一个最笨也 ...

"智能太便宜了"：本周大模型圈，正在…

发表于2026-03-13|AI

“智能太便宜了”：本周大模型圈，正在发生一场价格革命 📅 2026-03-13｜约5200字｜阅读约14分钟这周 AI 圈有句话在传：**”Intelligence too cheap to meter.”** 说这话的，是国内 AI 公司 MiniMax。他们刚发布了 M2.5，宣称 $1 可以让模型以 100 token/s 的速度持续运行一小时。折算一下，这个价格比很多云服务器还便宜。与此同时，Google 的 Gemini 3.1 Flash-Lite 在 $0.25/百万 token 的价位上，达到了上一代大模型的顶尖水平；NVIDIA 开源了 120B 参数的 Nemotron-3 Super，架构完全创新；阿里 Qwen3.5 在 HuggingFace 全面霸榜…… 一个新的格局正在成形：大模型的智能正在极速商品化。这意味着什么？未来会发生什么？本周，我们一起来梳理。一、本周大模型动态一览事件发布方亮点 Claude Sonnet 4.6 上线 Anthropic 接近Opus级智能，Sonnet价格，1M上下文窗口 ...

AI Coding 正在进化：本周 GitHub，藏着一…

发表于2026-03-09|AI

AI Coding 正在进化：本周 GitHub，藏着一套新玩法 📅 2026-03-09｜约4500字｜阅读约12分钟这周打开 GitHub 热榜，我愣了一下。不是因为某个新模型发布，也不是哪家公司又融了十亿。而是因为热榜上这些项目，隐约在讲同一件事—— AI 不再只是回答问题。它开始”干活”了。从预测社会走向的群智引擎，到让 AI Coding 助手自动做”设计复查”的 Skill 框架，再到有人用 Bash 从零写出一个 Claude Code 克隆…… 这些信号拼在一起，指向的是同一个方向：工具时代已经来了，下一场竞争，是谁能让 AI 更稳、更专、更有用。以下是本周最值得关注的 5 个项目，逐一拆解。总览：本周 GitHub 热榜精选项目今日新增⭐ 一句话描述 MiroFish +1104 盛大集团孵化，群体智能预测引擎 openai/skills +612 OpenAI 官方 Codex Skill 目录 learn-claude-code +566 从 0 手撸 Claude Code，12 章渐进教程 AFFiNE + ...

这周AI圈最魔幻的事：OpenAI发了GPT-5.4，…

发表于2026-03-06|AI

这周AI圈最魔幻的事：OpenAI发了GPT-5.4，但最大的震动来自阿里 📅 2026-03-06｜约5500字｜阅读约14分钟这周大模型圈像是被人扔了两颗手雷。一颗是明面上的：OpenAI 在3月5日发布了 GPT-5.4，性能碾压 GPT-5.2，Google 也连发 Gemini 3.1 Pro 和 Flash-Lite，两家都在抢”最强模型”的名号。另一颗是悄悄引爆的：阿里巴巴的 Qwen 团队核心成员集体请辞——就在他们刚刚发布了被业界认为”惊艳”的 Qwen 3.5 系列后不久。这两件事放在一起，折射出当下 AI 产业的一个深层矛盾：技术的外壳越来越亮，但内部在悄悄地、大规模地重组。一、本周大模型动态一览事件来源亮点评分 GPT-5.4 发布 OpenAI 合并 Codex 能力，原生计算机操作，专业工作能力+83% ⭐⭐⭐ Gemini 3.1 Pro 登顶 AI 综合榜 Google DeepMind 同价 Gemini 3 Pro，却在 10 大 benchmark 中领跑 6 项 ⭐⭐⭐ Gemini 3.1 Flas ...

2026年了，为什么个人AI助手还是这么难用？

发表于2026-03-05|AI

2026年了，为什么个人AI助手还是这么难用？开头：一个普通人的噩梦上周，我朋友老张跟我抱怨，说他花了整整一个周末想给自己配一个”24小时在线的AI助理”。不是什么大需求——就是能帮他看看邮件、提醒一下日程、偶尔查个资料、在微信上随时能问到的那种。听起来很简单，对吧？结果呢？他先去搜了搜”最强AI助理”，一堆文章说 OpenClaw 牛逼，自托管、可扩展、技术圈都在用。他兴冲冲地跟着教程走，搞了三个小时，发现要装 Node.js、要开服务器端口、要配置环境变量……最后卡在一行报错上，上网找了两小时没解决，默默关掉了电脑。然后他看到有人说 Kimi Claw 在做云端版，赶紧去申请了一个 Beta 账号。注册成功，登进去，发现功能东一块西一块，不知道哪天某个功能就消失了——因为还在 Beta。再然后他看到外国人都在用 Lindy，说能帮你处理邮件和日历，生活效率翻倍。他一查：$49.99/月，360人民币。还主要绑 iMessage……他是安卓用户。到了周日晚上，他什么也没配成，钱也没花，但整个人已经累了一大截。他问我：”2026年了，AI这么发达，为什么就找不 ...

大模型后训练，究竟在训练什么？

发表于2026-03-03|AI

大模型后训练，究竟在训练什么？你有没有想过，ChatGPT、Claude、Qwen 这些 AI 助手，是怎么从”只会预测下一个字”变成”会和你聊天、帮你写代码、拒绝回答有害问题”的？答案只有两个字：后训练。今天这篇文章，不讲数学公式，只讲清楚一件事：大模型后训练到底是什么，不同类型的模型又是怎么训练的。一、先搞清楚：预训练 vs 后训练要理解后训练，先得知道它的前一步——预训练。打个比方：预训练，就像一个人从小到大读了几万本书、刷了几十亿网页，学会了语言、积累了海量知识。但读完书的人，不一定会”做事”——他可能说话啰嗦，可能回答问题前先背一遍原文，可能被人一激就说出不该说的话。后训练，就是把这个”读了很多书的人”训练成一个”靠谱的助手”的过程。具体来说：预训练：用几万亿字的文本，让模型学会”预测下一个词” 后训练：用精心设计的数据和奖励，让模型学会”怎么帮人做事” 预训练决定模型知道多少，后训练决定模型用起来好不好用。二、后训练的三种主要方法方法一：SFT（监督微调）——给模型示范答案SFT 的全称是 Supervised Fine-Tunin ...

阿里 Qwen 两周连发 5 款模型，这次是认…

发表于2026-03-03|AI

阿里 Qwen 两周连发 5 款模型，这次是认真的最近半个月，阿里 Qwen 团队明显加速了——Qwen3.5 从旗舰大模型一路补齐小模型，同时还发布了生图模型、图片编辑模型、安全审核模型，以及翻译专用模型。一个团队，两周内，五条产品线同时推进。今天我们来把这波发布梳理清楚。一、Qwen3.5：从 397B 到 0.8B，全尺寸覆盖完成Qwen3.5 是这波发布的主线。发布时间线： 2026-02-16：发布旗舰版 Qwen3.5-397B-A17B（MoE，激活参数 17B） 2026-02-24：补充中型号 Qwen3.5-122B-A10B、Qwen3.5-35B-A3B、Qwen3.5-27B 2026-03-02：发布小模型 Qwen3.5-9B、4B、2B、0.8B 至此，Qwen3.5 覆盖从 0.8B 到 397B 的完整尺寸谱系，开发者可以按需选择。 Qwen3.5 的四大核心升级： ① 原生多模态融合不是”视觉模块插件”，而是从预训练阶段就在多模态 token 上联合训练，视觉理解与语言推理能力同步提升，超越了此前独立训练的 Qwen3-V ...

阿里 Qwen3.5-27B 实测：270亿参数的"小钢…

发表于2026-03-03|AI

阿里 Qwen3.5-27B 实测：270亿参数的”小钢炮”，能在本地跑的顶级开源模型当大模型开始卷本地部署，27B 参数可能是甜点区。 01 模型简介：不是 MoE，是 Dense阿里在春节后开源了 Qwen3.5 系列的中等规模模型，其中 Qwen3.5-27B 是最受关注的一款。关键规格：参数数值总参数量 27B（全部激活，非 MoE）架构混合注意力（3:1 交替 Gated DeltaNet + 标准全局注意力）上下文窗口 262K - 1M tokens 开源协议 Apache 2.0 多模态原生支持（视觉+文本）与除夕开源的 397B MoE 巨兽不同，27B 是密集模型（Dense）——每次推理全部 270 亿参数都参与计算。这意味着什么？部署门槛大幅降低，但性能依然能打。 02 性能实测：总榜第 8 的开源黑马根据非线智能 ReLE 评测（约 1.5 万题中文场景测试）：核心数据指标 Qwen3.5-27B 对比上一代 Qwen3-235B-A22B 准确率 72.4% 65.5% (+6.9%) ...

AI Agent 的"地基"正在狂飙：本周 GitHub …

发表于2026-03-02|AI

AI Agent 的”地基”正在狂飙：本周 GitHub 热榜，藏着一个统一的野心 📅 2026-03-02｜约4500字｜阅读约12分钟这周的 GitHub 热榜，有点像在看一场基建大赛。没有某个单一的大模型炸场，没有某家公司的发布会刷屏——但如果你把上榜的项目摆在一起，会发现它们都在干同一件事：把 AI Agent 跑起来所需要的一切，从零开始盖楼。沙箱、记忆、编排、IDE、最小化原理……这周开发者们集体在做”AI Agent 的基础设施”。这不是巧合，这是一个行业在从”能不能用”进化到”怎么用好”的必经阶段。一、本周热榜速览项目今日新增⭐ 一句话描述 alibaba/OpenSandbox +1179 阿里开源 AI Agent 通用沙箱平台 ruvnet/ruflo +766 Claude 生态多 Agent 编排框架 moeru-ai/airi +736 自托管 AI 虚拟伴侣（支持实时语音+游戏） superset-sh/superset +389 AI Agent 时代的 IDE，并行跑 ...